الابتكار مع دان: كيف تساعدنا البيانات الضخمة على فهم تغير المناخ؟

ShareTweet about this on TwitterShare on FacebookGoogle+Email to someone

يشكل تغير المناخ تهديداً حقيقياً لكوكبنا وله عواقب مدمّرة بدأت تظهر بالفعل على الصعيد العالمي. ويوضّح الدكتور دانييل دافي، رئيس الحوسبة عالية الأداء في مركز الإدارة الوطنية للملاحة الفضائية والفضاء (NASA) من أجل محاكاة تغير المناخ (NCCS) الدور الأساسي الذي تؤديه البيانات الضخمة في مهمة دراسة تغير المناخ.

يقدم مركز محاكاة تغير المناخ إمكانيات الحوسبة عالية الأداء والتخزين وموارد التوصيل الشبكي بخصوص المشاريع العلمية الكبيرة لوكالة ناسا. ويشمل العديد من هذه المشاريع محاكاة عالمية لطقس الأرض ومناخها. وينتج عن هذه المحاكاة كميات ضخمة من البيانات؛ وهي بيانات بكميات هائلة يصعب على العلماء استعراضها. ولذلك، من المهم على نحو متزايد توفير أساليب جديدة لتحليل مجموعات البيانات الضخمة وعرضها بيانياً من خلال هذه المحاكاة للتوصل إلى فهم أفضل للمسائل العلمية الهامة كتغيّر المناخ.

إن فهم كيفية تغيّر المناخ وآثاره المحتملة على الأرض مسألة بحثية في غاية الأهمية. وإجراء بحوث حول التنبؤات الجوية من شأنه أن يزوّدنا بمعلومات أكثر دقة عن الظواهر الجوية القصوى مثل الأعاصير وأنظمة الحمل الحراري القوية التي يمكن أن تؤدي إلى الأعاصير التي تؤثر بشكل مباشر على الولايات المتحدة الأمريكية وباقي مناطق العالم.

البيانات الضخمة وتغيّر المناخ: كيف يعملان؟

ترتبط البيانات الضخمة ارتباطاً وثيقاً بدراسة تغير المناخ؛ إذ لا يمكن دراسة تغير المناخ فعلاً بدون توفر كميات كبيرة من البيانات.

ويحتضن مرفق مركز محاكاة تغير المناخ لوكالة ناسا مجموعة من الحواسيب تُدعى “Discover supercomputer”. ويتمثل الهدف الرئيسي لهذا النظام في توفير حوسبة عالية الأداء وبيئة التخزين اللازمة للوفاء بمتطلبات المشاريع العلمية التي تضطلع بها وكالة ناسا. ويجري تنفيذ مجموعة متنوعة من المشاريع العلمية المختلفة عبر نظام “Discover” مع استعمال جزء كبير من موارد الحوسبة والتخزين في البحوث المتعلقة بأحوال الطقس والمناخ.

ونظام “Discover” هو حاسوب عالي الأداء مصمم خصيصاً للتطبيقات الكبيرة للغاية والمرتبطة ارتباطاً وثيقاً ببعضها البعض، وهو نظام ترتبط فيه الأجهزة والبرمجيات وتعتمد على بعضها البعض. وعلى الرغم من أن نظام “Discover” لا يُستخدم لجمع البيانات من منصات الاستشعار البعيدة مثل السواتل، فإن العديد من عمليات محاكاة الغلاف الجوي والأرض والمحيطات التي تجري عبر نظام “Discover” تتطلب مدخلات الرصد. والعلماء الذين يستخدمون هذا النظام يستمدون بيانات الرصد باستمرار من جميع أنحاء العالم لاستخدامها كمدخلات في النماذج الخاصة بهم.

ومع ذلك، فتزويد العلماء بكمية كبيرة من البيانات سيكون عديم الجدوى إذا لم يكن بمقدورهم عرضها بيانياً ومقارنتها بطرق مفيدة. وأحد الأمثلة على ذلك الرسوم المتحركة المعززة التي أعدها المكتب العالمي للاستيعاب والنمذجة (GMAO) التابع لوكالة ناسا، والتي تستعمل بيانات الرصد المستمدة من مصادر متعددة للتنبؤ بالأحوال الجوية.

يقوم نظام استيعاب البيانات (DAS) GEOS‑5 للمكتب العالمي للاستيعاب والنمذجة بدمج معلومات الرصد والمعلومات النموذجية لإنتاج أكثر الصور دقة وانسجاماً للغلاف الجوي في أي وقت. وتتجمع أكثر من خمسة ملايين عملية رصد كل ست ساعات، تشمل تقابل بعض المتغيرات كدرجة الحرارة والمياه والرياح والضغط عند السطح والأوزون. وعمليات الرصد التي يتم استيعابها تأتي في ثمانية أنواع رئيسية، يتم في كل منها رصد متغيرات مختلفة من مصادر مختلفة.

معالجة البيانات

تحتاج نماذج تغير المناخ إلى كمية متزايدة دائماً من الموارد الحسابية ومقدار كبير من الذاكرة والنفاذ السريع إلى البيانات. وللوفاء بهذه المتطلبات، يتألف النظام “Discover” من عدة أنواع مختلفة من أجهزة المعالجة: 79 200 وحدة Intel Xeon و28 800 وحدة Intel Phi و103 680 وحدة معالجة بيانية (GPU) NVIDIA CUDA.

ويبلغ مجموع القدرة الحسابية لنظام “Discover” 3,36 petaflops أو 3,694,359,069,327,360 عملية من عمليات النقطة العائمة في كل ثانية. وبغية الحصول على فهم أفضل لهذا الحجم من القدرة الحسابية، سيكون على كل شخص يعيش على سطح الأرض أن يقوم بضرب عددين في كل ثانية لمدة 140 ساعة تقريباً لكي يحقق ما يمكن لنظام “Discover” القيام به في ثانية واحدة.

وبالإضافة إلى القدرة الحسابية، يتمتع نظام “Discover” بمساحة تخزين على القرص تبلغ حوالي 33 بيتابايت. ويبلغ حجم القرص الصلب لحاسوب من‍زلي 1 تيرابايت؛ ومن ثم، يكون نظام “Discover” مجهزاً بما يعادل 33 000 قرص من تلك الأقراص الصلبة. وفي حال استخدام هذا القرص لتخزين الموسيقى، يمكن إنشاء قائمة تستوعب مقاطع موسيقية يمكن الاستماع إليها على مدى 67 000 سنة دون الاستماع إلى نفس الأغنية مرتين.

ويحاول مركز محاكاة تغير المناخ تحديث نظام “Discover” كل سنة. ومع تقادم المخدمات وذاكرة التخزين في نظام “Discover”، يكون من الأفضل في الواقع الاستعاضة عنه بعد أربع أو خمس سنوات بدلاً من مواصلة تشغيل بعض الأجهزة. فعلى سبيل المثال، تم الاستعاضة عن نظام “Discover” لعام 2010 في أواخر 2014 وأوائل 2015 بمجموعة حاسوبية متطورة. وتمَكّن المركز من توفير حوالي ثمانية أضعاف القدرة الحسابية بعد التحديث وذلك ضمن نفس المساحة الأرضية والطاقة وإمكانيات التبريد. وغالباً ما تُستعمل الأجهزة القديمة لأغراض أخرى سواء داخلياً لدعم خدمات أخرى أو في مواقع خارجية مثل الجامعات كجامعة ماريلاند في مقاطعة بالتيمور (UMBC) وجامعة جورج ماسون (GMU).

تمثيل البيانات: تغير المناخ والتنبؤات

تساهم البيانات التي يولدها المركز في إعداد مجموعة متنوعة من الورقات البحثية والسياساتية الرئيسية.

وتسمح هذه البيانات بإجراء مناقشات مستنيرة حول آثار تغير المناخ على كوكبنا ويمكن أن تساعد واضعي السياسات على تطوير استراتيجيات وإجراءات مناسبة استجابةً للتنبؤات المناخية. فعلى سبيل المثال، استُخدمت البيانات في تقارير التقييم تحت رعاية الفريق الحكومي الدولي المعني بتغير المناخ (IPCC). وتقدم محاكاة البيانات التي تم إنتاجها في المركز وعرضها بيانياً استوديو العرض العلمي التابع لوكالة ناسا، مخرجات من نماذج مناخية وُضعت في إطار تقرير التقييم الخامس للفريق الحكومي الدولي، تبين كيف أن درجة الحرارة والهواطل من المتوقع أن تتغير خلال القرن الحادي والعشرين.

https://www.youtube.com/watch?v=d-nI8MByIL8

ونقوم أيضاً بإنتاج إعادة تحليل لتغير المناخ على مدى السنوات الخمس والثلاثين الماضية تُستخدم في مجموعة متنوعة من المشاريع خارج وكالة ناسا.

ويبرز إعصار كاترينا الذي ضرب ساحل الخليج في الولايات المتحدة في 2005، أهمية التنبؤ الدقيق. وعلى الرغم من جسامة الأضرار، كان من الممكن أن يكون الأمر أسوأ بكثير بدون عمليات التنبؤ لتقديم إجراءات إنذار متقدمة وإتاحة الوقت الكافي لعمليات الاستعداد الملائم. وتستضيف الحواسيب الفائقة للمركز حالياً النموذج العالمي للدوران الخاص بالمكتب العالمي للاستيعاب والنمذجة الذي يتميز باستبانة تفوق عشر مرات استبانة تلك المستعملة أثناء إعصار كاترينا مما يسمح بالحصول على نظرة أكثر دقة بشأن الإعصار تساعد على القيام بتقدير أدق لقوته وحجمه. وهذا يعني أن خبراء الأرصاد الجوية لديهم فهم أفضل بالاتجاه الذي يسلكه الإعصار وبالنشاط الجاري بداخله وهذا أمر ضروري لتخطيط الأعمال التحضيرية الناجحة تأهباً لظواهر مناخية بالغة الشدة مثل إعصار كاترينا.

وإضافة إلى ذلك، تستخدم تجارب محاكاة نظام الرصد (OSSE) مخرجات النماذج المناخية العالمية أيضاً لمحاكاة الجيل التالي من منصات الاستشعار عن بُعد التي تقترحها وكالة ناسا. وهذا يزود العلماء والمهندسين بكوكب أرض افتراضي حيث يمكن دراسة فوائد إجراء عمليات رصد جديدة للغلاف الجوي عن بُعد انطلاقاً من الفضاء وذلك قبل حتى إنشاء جهاز استشعار أو ساتل جديد.

بيانات تغيّر المناخ في المستقبل

تمثل البيانات المنتج الأولي لوكالة ناسا. ويمكن لوكالة ناسا أن تقتني السواتل والأدوات والحواسيب وحتى الأشخاص أو الاستغناء عنهم، ولكن البيانات التي تنتجها ولا سيما بيانات رصد الأرض، ستظل قيمتها باقية إلى الأبد. ولذلك، من الضروري أن تتيح وكالة ناسا النفاذ إلى البيانات التي تنتجها ليس فقط للمواقع والعلماء التابعين لها بل وأيضاً للعالم بأسره.

يطرح الحجم الضخم للبيانات المنتَجة تحديات هائلة. وحتى الآن، يصعب على العلماء المعنيين بهذه الأنظمة استخدام هذه البيانات، ويكون الأمر أصعب على من هم خارج وكالة ناسا، إذا ما أرادوا الحصول على البيانات من أجل استخدامها. ولذلك، بدأنا بالنظر في إنشاء نظام تحليل المناخ كخدمة (CAaaS) يجمع بين الحوسبة عالية الأداء والبيانات والسطوح البينية لبرمجة التطبيقات (API) من أجل توفير سطوح بينية لبرامج التحليل تُشغل في الموقع مع البيانات. وبعبارة أخرى، بدلاً من تنزيل ملفات ضخمة من البيانات، يمكن للمستعمل أن يطرح الأسئلة التي تهمه وسيجري تحليلها على أنظمة ناسا. وبعد ذلك ستُعاد نتيجة هذا التحليل إلى المستعمل. ونظراً إلى أن حجم التحليلات الناجمة أصغر من حجم البيانات الأولية اللازمة لتوليدها، فإن هذا النظام سيقلل من كمية البيانات المنقولة عبر تشكيلة متنوعة من الشبكات، بل والأهم من ذلك، يمكن تصميم السطوح البينية لبرمجة التطبيقات بحيث تقلّل إلى حدّ كبير من الاحتكاك بين المستعمل والبيانات.