Метод прогноза преобладающей минимальной и максимальной температуры воздуха, детализированного по территории семи федеральных округов России и республике Беларусь

В 2004 – 2006 г.г. в ГУ «Гидрометцентр России» разработана система численной статистической интерпретации гидродинамических моделей атмосферы для расчета элементов погоды (РЭП). Эта прогностическая технология использует информацию, поступающую в ГРМЦ в коде GRIB. Прогноз рассчитывается для достаточно большого числа точек России (326 точек) и, путем осреднения по территориям федеральных округов, получается прогноз преобладающей температуры воздуха по этим территориям. Этот прогноз размещается на 4-й стр. Ежедневного гидрометеорологического бюллетеня (ЕГМБ) ГУ «Гидрометцентр России». Оперативные испытания метода прогноза проводились в ГУ «Гидрометцентр России» в период с июня 2006 г. по август 2007 г.


Описание прогностического алгоритма
В настоящее время проблема прогноза элементов погоды на средние сроки находится в состоянии интенсивного и успешного развития. Этому способствует, в первую очередь, вслед за появлением мощных суперкомпьютеров, разработка совершенных гидродинамических моделей атмосферы (ГДМА) высокого пространственного разрешения, содержащих достаточный уровень точности параметризации атмосферных процессов подсеточного масштаба. Интервал их успешного интегрирования (по анализу оправдываемости прогнозируемых полей циркуляции) можно оценить, например, для северного полушария в зимний период как 6-7 дней. Несмотря на это, прогностические значения элементов погоды у поверхности Земли, полученные в ходе численного интегрирования ГДМА - “модельный” прогноз погоды - обладает недостаточной оправдываемостью с точки зрения непосредственного использования его в оперативной практике. Это связано, чаще всего, с несовершенством уравнений, решаемых на определенном шаге по времени, относительно искомых элементов погоды для извлечения их из полей основных неизвестных, подвергающихся интегрированию по времени в рамках решения гидродинамической модели. Однако оправдываемость прогноза элементов погоды повышается в случае построения уравнений для выхода из модели на основе статистики. Такая статистическая интерпретация используется в оперативной практике метеорологических центров в сочетании с модельными прогнозами.

Большое распространение в современных методах интерпретации находит математическая статистика - регрессионный анализ (часто в совокупности с дискриминантным) - задача наилучшего представления одной величины (предиктанта) посредством вектора других величин (предикторов); при этом определяется и количественная мера тесноты связи между предикторами и предиктантом. При этом подходе можно осуществить расчет синхронных (статистических) связей между прогностическими полями, полученными по гидродинамической схеме (основными предикторами - левые части переопределенной системы уравнений множественной регрессии) и элементами погоды (предиктантами - правые части уравнений). Именно использование синхронных связей (применимых благодаря хорошей оправдываемости современных ГДМА) и может обусловить успех объективного прогноза элементов погоды.

Для успешной работы системы статистической интерпретации (статистический постпроцессинг) необходимо создание соответствующей базы данных - накопление архива фактических значений прогнозируемых метеорологических элементов в пунктах прогноза, а также архивы полей циркуляции объективного анализа и прогностических полей за длительный период 10-15 лет.

Прогностическая технология РЭП пpедусматpивает полностью адаптивный алгоpитм - самообучающийся на геогpафический pайон пpогнозиpования и текущий синоптический макpопpоцесс.

В рамках создания технологии РЭП в лабоpатоpии сpеднесpочных пpогнозов погоды созданы:
- методология постpоения численных статистических моделей для пpогноза элементов погоды с использованием совpеменных математических алгоpитмов, пpименяемых в ведущих заpубежных метеоцентpах; pазpаботаны метод центpального типиpования синоптических макpопpоцессов, алгоpитм динамического фоpмиpования выбоpок. Эти пpогностические (статистические) модели полностью адаптивны; их постpоение основано на последовательном пpименении дискpиминантного анализа и пошаговых pегpессионных алгоpитмов с динамическим отбоpом пpедиктоpов на каждом этапе;
- создан алгоpитм по усвоению, контpолю и восстановлению данных метео– наблюдений (уpовня II) для их сбоpа и аpхивации в сpеднесpочной пpоблемно-оpиентиpованной базе данных (СПОБД), используемой пpи численной интеpпpетации;
- создана спpавочно-инфоpмационная база (SNOB, SNOBIK) для комплектации и pаспpостpанения пpогностической пpодукции пользователям;
- в pезультате выполнения научных исследований проведено изучение климатического pежима и пpостpанственно-вpеменной стpуктуpы основных метеоэлементов (темпеpатуpы, осадков, облачности, ветpа, влажности и т.д.), позволяющее коppектно осуществить постpоение всех вышеуказанных численных алгоpитмов.

Все эти исследования легли в основу прогностической технологии, реализованной на ЭВМ для выпуска среднесрочного прогноза по территории России минимальной и максимальной температур воздуха. Технология предусматривает возможность формирования выпускаемой продукции по административным и экономическим районам страны, по энергосистемам, бассейнам рек, побережьям морей и т.д. Система связана с метеорологическими телеграфными каналами и осуществляет, кроме прогноза, накопление и поддержание базы данных (уровня II и уровня III), выполняет распространение прогнозов потребителям (в том числе, по каналам связи в республиканские и территориальные управления по гидрометеорологии).


Общая схема прогностического алгоритма

Центральное типирование атмосферных макропроцессов
Статистическая модель строится (автоматически на ЭВМ) заново (выборки формируются динамически) для каждой даты и для каждого пункта прогноза; при этом всегда рассматривается ограниченный географический район, ориентированный таким образом, чтобы пункт прогноза был расположен в его центре. Статистические выборки формируются с упорядочением по аналогичности к текущему макропроцессу, предсказанному гидродинамической схемой.

Непрерывность по территории прогностических полей
Для расчета прогноза создан единый архив метеорологических полей - предикторов и предиктантов - позволяющий решать прогностические уравнения регрессии, удовлетворяя принципу пространственной непрерывности. Непрерывность понимается в том смысле, что двум пунктам, расположенным достаточно близко друг от друга, будут соответствовать матрицы предикторов, отличающиеся одна от другой минимальным значением коэффициента перекоса. При уменьшении расстояния между пунктами прогноза величина перекоса между матрицами, соответствующими этим пунктам, будет также уменьшаться.

Сезонная классификация
При формирования статистических обучающих выборок к рассмотрению привлекаются даты, принадлежащие к тому же скользящему сезонному периоду, к которому принадлежит период прогноза. Интервалы дат, к которым относятся динамически формируемые статистические выборки, составляет около 3-х недель.

Оптимизация заблаговременности архивов (ОЗА), используемых для формирования обучающих выборок
Как известно, для построения обучающих выборок регрессионных моделей используются концепции MOS или PP. Для малой заблаговременности (24-36 ч) концепция MOS имеет несомненные преимущества, так как обучение статистической модели на выборках, состоящих из гидродинамических прогнозов, позволяет учитывать систематические ошибки гидродинамической схемы. Однако, опыт оперативного использования полей гидродинамических прогнозов показывает, что у ГДМА присутствуют наряду с систематическими ошибками ошибки случайного характера; кроме того, сами систематические ошибки приводят в процессе интегрирования модели по времени при разных исходных ситуациях в дальнейшем к несистематическим ошибочным решениям. “Уход” схемы несистематическим образом от развивающегося в действительности атмосферного процесса с заблаговременностью прогноза увеличивается. Таким образом, накапливая архивы гидродинамических прогнозов (например, на 5-е - 7-е сутки), мы заведомо предопределяем обучение на неадекватных связях с несистематической неадекватностью. В этом случае, если мы составляем прогноз элементов погоды по спрогнозированному гидродинамической моделью полю, т.е. рассчитываем статистические связи между архивами гидродинамических прогнозов и предиктантом, использование архива гидродинамических прогнозов для достаточно большой заблаговременности становится неэффективным. Таким образом, становится не полезно использовать “некачественный” архив. Под термином “некачественный” понимается архив, содержащий прогностические поля метеоэлементов с существенно не систематическим характером несоответствия их фактическим полям. Выходом в этом случае является использование архивов объективных анализов или архивов прогнозов, но с меньшей заблаговременностью (MOS-1), так как при этом, с одной стороны, можно частично исключить систематический крен, присутствующий в прогнозах большой заблаговременности, с другой стороны, уменьшая заблаговременность архивов, мы уменьшаем вклад несистематических ошибок.


Численная статистическая модель прогноза

Метод прогноза минимальной и максимальной температуры воздуха по дням до 7 суток по всей территории России
Строится численная статистическая модель, основанная на использовании синхронных прогностических связей. Концепция ОЗА использовалась в случае поступления прогнозов по каналам связи в коде GRIB.
Потенциальными предикторами являются следующие:





Во всех вышеуказанных предикторах при расчете дифференциальных и интегральных операторов в конечно-разностной форме использовались пространственные трафареты различных масштабов, которые могут одновременно участвовать в просеивании.

Мы предполагаем, что имеется достаточно полный набор предсказывающих переменных, относительно которых будет составляться регрессионное уравнение статистической модели для искомого отклика. При этом нам необходимо оптимальным образом удовлетворить двум противоположным по своему характеру требованиям. С одной стороны, включить в модель по возможности больше предикторов, чтобы более надежно определить прогнозируемую величину; с другой стороны, сократить размерность вектора предсказателей, исключив зависимые и малозначимые компоненты и повысив таким образом качество обучения на доступных нам выборках ограниченного объема. В нашей работе применяется шаговый регрессионный метод сокращения Дулиттла. Рассчитывается исходная ковариационная матрица, модифицируемая на последующих шагах, при которых происходит оценка наиболее информативных предикторов. Номера отобранных предикторов последовательно запоминаются; их отбор на каждом шаге сопровождается оценкой дополнительного вклада объяснимой доли дисперсии . При значениях , меньших некоторого заданного, процесс поиска и включения следующих предсказателей заканчивается. Затем для отобранных компонент решением переопределенной системы уравнений множественной регрессии находится искомый вектор коэффициентов регрессии. Этот вектор служит для расчета прогностического значения отклика путем свертки его с вектором оперативных предикторов по этому же списку компонент.

Как уже говорилось выше, численная статистическая модель строится заново для каждой точки и даты прогноза. Кроме основного преимущества, заключающегося в возможности получения прогноза, детализированного по времени и по пространству, адаптивная схема в совокупности с пошаговым просеиванием обладает определенным удобством. Она позволяет включить в комплект исходных предикторов достаточно много (с запасом) физически значимых параметров для разных синоптических макропроцессов или географических районов (например, принадлежность пунктов к различным часовым поясам, орографическим зонам и т.д.). При этом можно не особенно беспокоиться о возможном изменении уровня их значимости, что неизбежно и .в обычных схемах регрессии приводит чаще всего к нежелательным компромиссам. Понятно, что в связи с привязкой информации ГДМА к исходным срокам наблюдения (00, 06, 12, 18), информативность некоторых выбранных нами предсказателей может "плавать" с изменением долготы района прогноза. В построенной нами схеме расчета в этом случае оказавшиеся неинформативными (или зависимыми) предикторы автоматически отстраняются от рассмотрения.

Прогноз осуществляется раздельно для минимальной, максимальной температуры воздуха.


Программная реализация прогностического алгоритма

Вышеописанные алгоритмы реализованы на ЭВМ в виде большого комплекса программ на "ФОРТРАНЕ", содержащих несколько десятков тысяч операторов. Большую часть (40%) программного обеспечения занимают подсистемы подготовки информации. Основные блоки последовательной обработки информации включают в себя:
- блок чтения оперативных данных по срокам и уровням, уровень II (КН-01), уровень III (ECMWF (Reding), UKMO (Exeter) и NCEP США);
- контроль и восстановление данных, сшивка по географическим принадлежностям, формирование наборов для архивов, запись в архивы;
- чтение полей и подготовку временных выборок для статистической обработки процедурами дискриминантного анализа и множественной регрессии с учетом текущей даты;
- подготовку оперативных стеков поочередно различных гидродинамических моделей для построения численных адаптивных статистических моделей и их последовательное решение;
- первый этап прогноза с использованием статистической интерпретации;
- комплексация результатов первого этапа прогнозов с учетом наличия тех или иных гидродинамических прогнозов (для пересчета статистики) к оперативным срокам выдачи продукции;
- формирование окончательных прогностических наборов данных для различных потребителей, их рассылка, запись прогнозов в базу для оценки.

При этом используются следующие проблемно-ориентированные базы данных:
- база оперативных метеоданных циклических наборов;
- база архивных метеорологических данных;
- база климатических метеоданных;
- база оперативных прогнозов погоды для рассылки потребителям, анализа и оценки.

Прогностическая продукция с использованием справочной структуры SNOB комплектуется по различным территориальным спискам и передается в оперативные подразделения ГУ «Гидрометцентр России» и Росгидромета, в УГМС, МосЦГНС и в различные другие организации. Первый ежедневный прогностический цикл технологии РЭП заканчивается к 7.30 ч московского времени.

Технология РЭП впервые дала возможность выпускать оперативные прогнозы преобладающей минимальной и максимальной температуры воздуха, по территории всех Федеральных округов России и по территории Республики Беларусь с заблаговременностью 1–5 суток.


Результаты оперативных испытаний

Методика оценки успешности прогнозов преобладающей минимальной и максимальной температуры воздуха по территории семи Федеральных округов России с их детализацией по географическому признаку (19 районов) и по территории Республики Беларусь с заблаговременностью 1–5 суток предусматривала сравнение прогностических значений температуры воздуха с осредненными значениями фактической температуры по соответствующей территории прогноза. Характеристики успешности прогнозов рассчитывались в рамках функционирующей в настоящее время автоматизированной технологии оценки качества оперативной прогностической продукции ГУ «Гидрометцентр России».

На рисунках 1–5 приведена оправдываемость прогнозов минимальной температуры воздуха (Tmin) отдельно для всех указанных заблаговременностей прогнозов по каждому из 19 выделенных районов (частей Федеральных округов Российской Федерации) на основе технологии РЭП в сравнении с аналогичными синоптическими (4-я страница ежедневного бюллетеня Гидрометцентра России – ЕГМБ) и инерционными прогнозами.

На рисунках 6–10 приведена оправдываемость прогнозов максимальной температуры воздуха (Тmax) отдельно для всех заблаговременностей прогнозов до 5 суток по каждому из 19 выделенных районов (частей Федеральных округов Российской Федерации) на основе технологии РЭП также в сравнении с синоптическими и инерционными прогнозами.

В таблицах  1  и  2  приведены осредненные для всей рассматриваемой территории показатели успешности прогнозов соответственно минимальной и максимальной температуры воздуха с заблаговременностью 1-5 суток в сравнении с аналогичными синоптическими и инерционными прогнозами. Среди показателей успешности показаны абсолютная, систематическая и относительная ошибки прогнозов температуры воздуха, оправдываемость прогнозов с допусками Наставления (Pн %), превышение оправдываемости методического и синоптического прогнозов над инерционным (Pн-Pин %) а также обеспеченность прогнозов с абсолютными ошибками величиной

Из данных таблиц видно, что показатели успешности прогнозов преобладающей минимальной и максимальной температуры воздуха на 1-5 суток по территории Федеральных округов России и по территории Республики Беларусь, выпускаемых на основе технологии РЭП, были несколько лучше (имели меньшие величины абсолютных ошибок и более высокие значения оправдываемости прогнозов) по сравнению с показателями успешности аналогичных прогнозов, составленных/откорректированных синоптиками. Преимущество и существенно лучше показателей успешности инерционных прогнозов.


Рекомендации о внедрении

Центральная методическая комиссия по гидрометеорологическим и гелиогеофизическим прогнозам Росгидромета (ЦМКП) в своем решении от 29 ноября 2007 г. отметила:
- в ГУ «Гидрометцентр России» в инициативном порядке создана и функционирует оперативная технология составления краткосрочного и среднесрочного прогноза температуры воздуха, основанная на реализации программно-технологического комплекса среднесрочного прогноза и использующая статистическую интерпретацию результатов интегрирования гидродинамических моделей атмосферы;
- технология РЭП впервые дала возможность выпускать оперативные прогнозы преобладающей минимальной и максимальной температуры воздуха, по территории всех Федеральных округов России и по территории Республики Беларусь с заблаговременностью 1–5 суток.

ЦМКП рекомендовала ГУ «Гидрометцентр России» внедрить методику краткосрочного и среднесрочного прогнозирования преобладающей температуры воздуха (на основе автоматизированной технологии РЭП) в оперативную практику в качестве основного метода прогноза преобладающей минимальной и максимальной температуры воздуха с заблаговременностью 1-5 суток, детализированной по территории семи Федеральных округов России и по территории Республики Беларусь.


Авторы метода

П.П. Васильев, Е.Л. Васильева
Гидрометцентр России
E-mail: vasilev@mecom.ru
Тел.: 8 (495) 252—23-69


© Методический кабинет Гидрометцентра России