От редакции
научпоп
программы

Ураганный ИИ: как машинное обучение помогает предсказывать погоду и природные катаклизмы

85
0
30 января 2025
Изображение создано с помощью нейросети
От редакции
научпоп
программы
85
0
30 января 2025
Ураганный ИИ: как машинное обучение помогает предсказывать погоду и природные катаклизмы

Синоптики редко удостаиваются похвалы. О них вспоминают, когда вместо обещанного солнца начинается снегопад или запоздало приходит штормовое предупреждение. Но прохладное отношение к прогнозам погоды вскоре может измениться. Новую весну в этой области связывают с технологиями машинного обучения и перспективным методом прогнозирования — диффузным моделированием. Первые проблески на горизонте уже видны: новейшая модель GenCast способна предсказывать природные ненастья, такие как тайфун, задолго до того, как они станут угрозой для человека.

Изображение создано с помощью нейросети

Метеорология — одна из древнейших прикладных наук, прошедшая путь от гаданий на костях животных и философских гипотез до сложнейших математических моделей. Аристотель в своём трактате «Метеорологика» объяснял образование ураганов влиянием сухого и теплого испарения, которое он называл «пневмой». Сегодня на смену античным мудрецам пришли суперкомпьютеры, способные моделировать атмосферные процессы. Однако даже самые мощные вычислительные системы сталкиваются с «эффектом бабочки», когда малейшее искажение начальных данных может стать причиной масштабных отклонений в прогнозе.

В поисках решения проблемы ученые придумали ансамблевое моделирование (Ensemble Forecasting System, ENS) — процесс, в котором одна модель просчитывается множество раз с небольшими вариациями входных значений. Это позволяет оценить вероятность различных сценариев развития погоды. Подход, основанный на численном прогнозировании погоды (Numerical Weather Prediction, NWP), стал стандартом в ведущих метеорологических организациях, включая Европейский центр среднесрочных прогнозов (ECMWF) с его системой ENS. И равных ему не было, пока не появились нейросети.

В особой атмосфере

Потенциал искусственного интеллекта в метеорологии хорошо иллюстрирует проект Google DeepMind, представленный широкой аудитории в декабре 2024 года. Платформу GenCast построили на технологиях машинного обучения (Machine Learning Weather Prediction, MLWP), и это существенно отличает ее от стандарта. Если традиционные методы используют физические модели для симуляции атмосферы, то GenCast применяет искусственный интеллект для ретроспективного анализа данных и выявления закономерностей. Принципиально отличаются и процессы прогнозирования: численные модели требуют многократных перерасчётов, что весьма затратно, в то время как GenCast осуществляет диффузное моделирование, не требующее таких ресурсоёмких вычислений.

На специализированных чипах Cloud TPUv5 модель от DeepMind генерирует ансамбль из 50 прогнозов на 15 дней вперед всего за восемь минут. Традиционной ENS потребовались бы несколько часов даже для менее долгосрочного прогнозирования.

При сравнительном тестировании GenCast превзошел ансамблевую модель ECMWF в 97.4% случаев из 1320 проверенных сценариев.

Сравнительный эксперимент доказал, что диффузное моделирование не только помогает делать более точные прогнозы, но и эффективно обучает нейросеть: чем больше данных анализирует система, тем точнее она становится, оставаясь устойчивой к изменениям начальных условий.

Cравнения показателей GenCast
В таблице представлены сравнения показателей GenCast и системы на основе ансамблевого моделирования. Данные приведены по различным переменным и восьми уровням давления. Цветовая кодировка: тёмно-синий указывает на преимущество GenCast на 20% по сравнению с ENS, тёмно-красный — на отставание GenCast на 20%, белый — на равную эффективность обеих моделей.
Источник

Прежде чем погрузиться глубже в технологию, уточним, что сам по себе метод диффузного моделирования не нов и давно применяется в генеративных моделях. К примеру, популярные генеративные платформы Stable Diffusion, DALL-E или Midjourney создают с помощью диффузии иллюстрации по текстовому описанию. Однако для прогнозирования погоды диффузное моделирование ранее широко не применяли.

Лавина данных

Как же работает такое моделирование в метеорологии? Принцип схож с таковым у Midjourney, только вместо пошаговых промтов — очень много разнородных климатических данных. Нейросеть GenCast получает многомерный массив информации по каждой переменной (температура, давление, влажность и другие параметры) на 13 вертикальных уровнях атмосферы. К этому массиву намеренно добавляется шум — происходит диффузия данных. Затем специальная архитектура graph-transformer в несколько этапов «очищает» зашумленные данные, преобразуя их в реалистичный прогноз.

На каждом этапе уточнения модель использует механизм внимания. В синоптическом анализе такой механизм крайне важен, так как атмосферные процессы взаимосвязаны: засушливое лето в Индии может усилить половодье в Китае, а извержение вулкана в Исландии — неурожай в Италии.

Значимое инженерное решение GenCast — использование икосаэдральной сетки вместо традиционной широтно-долготной. Поверхность Земли при такой схеме поделена на 41 162 узла, полученных шестикратным измельчением граней икосаэдра. Это решает проблему искажения данных на полюсах, где обычная координатная сетка сильно деформируется.

справка

Что еще важно — благодаря диффузионному подходу каждый прогноз может быть сгенерирован с разными начальными шумовыми паттернами. Это позволяет создавать ансамбли из 50 различных прогнозов, оценивая вероятность разных сценариев развития погоды. При сравнительном тестировании данный метод показал более высокую точность, чем традиционный метод возмущения начальных условий, используемый в системе ENS.

Диффузионный подход к прогнозу погоды
В темной зоне графика показано, как входные данные (X0,X−1) и начальная диффузия Z01 уточняются с помощью нейросети rθ. Данные Z11 — первая итерация уточнений, и этот процесс повторяется N раз. Окончательные данные ZN1 добавляются в качестве остатка к X0 для формирования прогноза на следующем временном шаге X1. Затем этот процесс повторяется авторегрессивно с учётом XT, XT−1, где T=30 раз, и использованием новой начальной выборки шума Z0T.
Источник

Погодная библиотека

Нейросеть GenCast обучена на ERA5 — одном из крупнейших в мире ресурсов математически обработанных метеорологических данных. Европейский центр среднесрочных прогнозов погоды собирал эти сведения с января 1940 года, формируя свой гигантский «дневник климата» MARS. Его объем сегодня превышает 505 петабайт и ежедневно пополняется на 400 терабайт. GenCast освоила «дневник» от современности до 1979 года — наиболее систематизированную его часть. Как показал проведенный после обучения эксперимент, эта «начитанность» помогла ей генерировать качественные двухнедельные прогнозы.

Практический пример эффективности GenCast — прогнозирование тайфуна Хагибис, который обрушился на Японию в октябре 2019 года. Мощный циклон принёс к ее берегам разрушительные наводнения и ураганный ветер. Численные модели тогда смогли предсказать траекторию тайфуна за 4−5 дней до его приближения к суше, но их прогнозы имели серьёзную географическую погрешность — около 100 километров. GenCast в рамках тестирования своей работы просчитала маршрут тайфуна за 15 дней до события с погрешностью в 50 километров.

Модель указала, где тайфун наберёт максимальную силу, смогла учесть взаимодействие струйных течений и изменение давления, которые впоследствии ускорили его движение. На большом временном горизонте (7 дней до удара) она, как и традиционные модели, демонстрировала высокую неопределённость, однако по мере приближения события разброс в прогнозах сокращался, а точность увеличивалась.

Это важное преимущество перед традиционными подходами: GenCast не просто выдаёт усреднённый прогноз, но и позволяет оценить диапазон вероятных исходов, что крайне важно для спасательных служб и властей при подготовке к бедствиям.

«В более широком смысле эта работа демонстрирует, что передовые методы генеративного ИИ способны моделировать чрезвычайно сложные и многомерные процессы во временной динамике с достаточной надежностью для принятия решений в критически важных областях», — подытоживают разработчики в отчете.

Новое течение

Модель GenCast от Google DeepMind ознаменовала приход новой волны интеллектуальных технологий в метеорологию. Однако в этом потоке она далеко не единственная успешная ML-разработка, которая привлекает внимание специалистов. Среди достойных конкурентов — модель FourCastNet от Nvidia.

Она использует глубокие сверточные нейронные сети (Convolutional Neural Networks, CNN) для прогнозирования погодных изменений, представленных в виде последовательности изображений. В отличие от традиционных моделей, она не анализирует числовые данные напрямую, а «смотрит» на погоду как на набор снимков, каждый из которых отображает атмосферные условия в определённый момент времени. Эта модель прогнозирует, как изменяются эти изображения, основываясь на выявленных паттернах.

Как и GenCast, FourCastNet обучена на огромном массиве данных ERA5, но отличается гораздо большей скоростью: она может предсказать изменения на две недели вперёд для 45 тысяч координат Земли всего за несколько секунд. Вот только точность FourCastNet пока уступает GenCast, особенно в сложных прогнозах, таких как предсказание тайфунов или внезапных циклонов.

Другой интересный проект — Pangu-Weather от Huawei. Эта модель, основанная на трансформерах, использует методы, схожие с теми, что применяет GenCast, но с некоторыми отличиями в подходах к обучению. В отличие от многих новых моделей, она доступна бесплатно. Разработчики Huawei сделали акцент на повышение пространственного разрешения и точности краткосрочных прогнозов, что особенно важно в условиях сложной географии — горных регионов или островных архипелагов, где важны локализованные данные.

Проект ClimateLearn представляет собой набор инструментов для решения задач по прогнозированию климата. Разработчики предлагают пакет утилит для базовых операций интеллектуального анализа данных, таких как чтение, объединение и очистка данных, а также запуск алгоритмов машинного обучения.

Родные берега

В России работы по применению искусственного интеллекта в прогнозировании погоды и климата ведутся в разных направлениях. Хотя эта сфера пока заметно уступает по масштабу и финансированию западным проектам, она стремительно развивается благодаря синергии ML-технологий и традиционных метеорологических подходов.

Флагманом российской метеорологической системы остаётся модель ПЛАВ («Прогнозирование локальных атмосферных взаимодействий»), которая в 2023 году была обновлена до версии ПЛАВ10. Это численная модель (NLM), предназначенная для локальных территориальных прогнозов. С её помощью можно добиться разрешения до 0,1 градуса (в отличие от 0,25 у GenCast), что делает её пригодной для очень детализированных прогнозов.

Сейчас российские исследователи активно интегрируют в ПЛАВ элементы искусственного интеллекта. Это позволяет создавать гибридные модели, где нейросети используются для постобработки данных, улучшения локальных прогнозов и минимизации ошибок.

Свой вклад в ИИ-модернизацию работы синоптиков вносит и Центр «ФОБОС». Здесь разрабатываются методы прогнозирования с использованием спутниковых данных. Специалисты центра экспериментируют с технологиями глубокого обучения для анализа облачности, температуры и других атмосферных параметров. ИИ-алгоритмы применяются для обработки изображений со спутников.

Научный фронт

Российские университеты также активно работают в направлении ИИ-прогнозирования изменений климата. В Сколковском институте науки и технологий (Сколтех) функционирует лаборатория анализа данных и искусственного интеллекта, которая разрабатывает модели на основе машинного обучения. В частности, учёные работают над точным прогнозированием опасных погодных явлений, таких как паводки, сильные дожди и снежные бури.

В 2022 году здесь по восьми климатическим и почвенным характеристикам с помощью алгоритма машинного обучения просчитали влияние глобального потепления на разрастание борщевика. Результаты исследования описаны в Nature.

Карта возможного распространения борщевика в 2040—2060 годах на основе модели ученых из Сколтеха.
Источник

На базе российских суперкомпьютеров, таких как «Ломоносов-2», ведутся эксперименты с генеративными моделями, которые применяются для создания сценариев развития погоды в условиях высокой неопределенности.

Все эти проекты имеют свою специфику, но их объединяет одно: стремление выйти за пределы традиционного прогнозирования. Традиционные модели опираются на фундаментальные законы физики — уравнения гидродинамики, термодинамики и молекулярной диффузии, которые описывают поведение атмосферы. ИИ-модели, в отличие от них, анализируют огромные массивы исторических и актуальных данных, выявляя закономерности и паттерны в развитии погодных условий.

Эти модели способны справляться с более сложными нелинейными зависимостями, которые трудно учесть с помощью классических методов. И если традиционные модели прогнозирования достигли пика своей эффективности, то горизонты для ИИ в этой области пока еще не определены.

Наверх
Будь первым, кто оставит комментарий