Метод прогноза среднемесячной температуры воздуха и сглаженного хода
среднесуточной температуры воздуха в течение месяца c нулевой
заблаговременностью


В Гидрометцентре России впервые разработан объективный метод прогноза сглаженного хода среднесуточной температуры воздуха в течение месяца на основе нового регрессионно-аналогового метода долгосрочного прогноза среднемесячной температуры воздуха по городам России с нулевой заблаговременностью с использованием статистической интерпретации среднесрочных гидродинамических прогнозов метеорологических величин.

Описание метода (общие сведения)
Схема статистического прогноза средней месячной температуры и сглаженного хода среднесуточной температуры воздуха в течение месяца в пунктах на территории России базируется на концепции совершенного прогноза. При этом в качестве предикторов применяются гидродинамические прогнозы полей метеорологических величин на первую декаду прогностического месяца [11, 12, 15]. Ход работы над данным методом подробно описан в работах [4, 7-10, 13].

Как показано в [6], наиболее инерционной метеорологической величиной является относительный геопотенциал H500, H1000. Однако его использование в качестве предиктора затруднено, поскольку не существует архива относительного геопотенциала достаточной длины и высокого качества. Поэтому в качестве основного предиктора выбран абсолютный геопотенциал H500. Кроме того, в прогностическую схему включены давление на уровне моря (p0) и температура на изобарической поверхности 850гПа (Т850), хорошо коррелированная с приземной температурой воздуха. Ежедневные данные по вышеуказанным величинам взяты из архива Национального центра прогнозирования окружающей среды США (NCEP USA) и представлены в узлах регулярной географической сетки.

Предиктантом является сглаженный ход температуры (Т0) в течение месяца в пунктах на территории России и средняя месячная температура воздуха. Предиктант и предикторы в задаче прогноза используются в сглаженном виде. Сглаживание необходимо для фильтрации ежедневных флуктуаций метеорологических полей, которые со статистической точки зрения представляют собой шум, а из-за сравнительно небольшой выборки метеорологических объектов, размерность их может быть велика. Существенное уменьшение размерности предикторов и предиктантов позволяет устанавливать статистически устойчивые зависимости. Чтобы уменьшить влияние случайных процессов и сократить размерность предиктора, применяется разложение по естественным ортогональным составляющим (е.о.с.) согласно [1]:


где X – ежедневные значения Н500, р0 или Т850 в первой декаде (а также Т0 в течение месяца); Vij – собственные векторы ковариационной матрицы временного хода указанных величин, Yjh – коэффициенты разложения по времени.

Процессы, происходящие в атмосфере над исследуемым районом, даже при одинаковом ходе метеорологических величин в определенной точке не всегда будут близки друг к другу. Необходимо привлечь в качестве предикторов величины, описывающие пространственную изменчивость процессов. Такими могут быть коэффициенты двойного разложения по е.о.с (по времени и пространству). Коэффициенты разложения временного хода предикторов в первой декаде месяца в определенном узле географической сетки и в восьми окружающих его узлах раскладывались по пространственной координате:


где Vhk) – собственные векторы ковариационной матрицы временного хода указанных величин в узле сетки, Wk(xj) – главные компоненты временных коэффициентов разложения в 9 точках, Lhk – коэффициенты двойного разложения по времени и горизонтальным координатам.

Таким образом, предикторы отражали с одной стороны динамику геопотенциала на среднем уровне тропосферы и давления на уровне моря за первую декаду месяца в каждой точке поля, с другой – давали представление о барической ситуации синоптического масштаба.

Сумма первых трех собственных чисел, характеризующая вклад первых трех коэффициентов разложения в общую дисперсию Н500, p0 и Т850 составляли 80-85%.

Ход температуры в течение месяца для всех пунктов представлялся пятью первыми коэффициентами разложения, что позволило описать общую изменчивость на 70-80%.

Аномалии исследуемых величин объединены в одну выборку за последовательные пять декад. Это позволило увеличить объем выборки с 49 до 245 случаев (что заметно повышает устойчивость статистических выводов), а также соблюсти условие нормального статистического распределения для некоторых среднедекадных и среднемесячных величин.


Анализ взаимосвязей между предикторами и предиктантами
Изучение взаимосвязей средней месячной температуры (и хода температуры в течение месяца) в пунктах на территории России и Казахстана с предполагаемыми предикторами из архива Н500, р0 и Т850 проводилось на всей территории Северного полушария. Однако уже предварительный анализ линейных связей продемонстрировал целесообразность использования предикторов только на территории первого и второго естественных синоптических районов. (рисунок 1).

На первом этапе рассчитывались парные и множественные коэффициенты корреляции между средней месячной температурой в пунктах и полями предикторов в первой декаде месяца.

Обнаружены «дальние связи» между исследуемыми величинами. В течение года районы, где отмечаются максимальные значения парной и множественной корреляции, перемещаются в пространстве, причем примерно одинаково для всех исследуемых пунктов.

В теплое полугодие максимальные значения корреляции наблюдаются вблизи исследуемых пунктов (рисунок 1). Исключение составляет район Дальнего Востока, где летом практически отсутствуют взаимосвязи между указанными величинами.

В холодное полугодие отмечаются два ярко выраженных максимума взаимосвязей – один на северо-западе относительно исследуемого пункта, второй – в среднем южнее его. В частности для северной половины европейской территории России (ЕТР) характерно такое положение максимумов корреляции – район Исландской депрессии и район Балканского полуострова (рисунок 2). Для Западной и Восточной Сибири данные максимумы расположены вблизи побережья Северного Ледовитого океана и в районе климатического положения Сибирского антициклона.

В переходные сезоны происходит перестройка полей корреляций. Причем для каждого пункта весной характерно приближение максимума корреляций, расположенного южнее, и обратный процесс осенью. Северный максимум также существует, однако становится заметно слабее. Для поля множественных корреляций по сравнению с полем парных корреляций отмечено более позднее смещение южного максимума к пункту прогноза весной и более раннее его перемещение к югу осенью.

Анализ взаимосвязей хода температуры внутри месяца с параметрами, описывающими декадные изменения Н500, р0 и Т850, оказалось предпочтительнее проводить в режиме скользящего контроля над работой аналого-регрессионной схемы.


Аналого-регрессионная схема прогноза сглаженного хода температуры
в течение месяца

В регрессионной схеме предиктантами являются средняя месячная температура воздуха и пять коэффициентов разложения хода средней суточной температуры в течение месяца по е.о.с. Предикторы отражают с одной стороны динамику геопотенциала на среднем уровне тропосферы и давления на уровне моря за первую декаду месяца и температуры на верхней границе пограничного слоя (коэффициенты разложения временного хода Н500, р0 и Т850) в каждой точке поля, с другой – дают представление о пространственной эволюции барической ситуации синоптического масштаба (коэффициенты двойного разложения хода Н500, р0 и Т850). Динамика данных величин (полей) представлялась тремя коэффициентами либо временного, либо пространственно-временного ортогонального базиса, определяемого методом главных компонентов.

Для прогноза хода температуры внутри месяца использована схема множественной линейной регрессии

где Y – вектор-предиктант, состоящий из коэффициентов разложения временного хода температуры в течение месяца, X – вектор-предиктор, т.е. коэффициенты разложения временного хода (либо двойного разложения) Н500, р0 и Т850 в первой декаде месяца, A’ – вектор-строка коэффициентов регрессии.

Оценка прогнозов на зависимом материале производилась с помощью схемы скользящего контроля, или так называемой «кросс-валидации», которая близка к верхнему пределу оценки качества прогноза на независимом материале. При проведении «кросс-валидации» из выборки исключается первый контрольный случай, по всем оставшимся рассчитываются параметры уравнения регрессии, которые и позволяют рассчитать прогноз исключенного элемента, далее исключается второй, третий и т.д. случаи. Таким образом, дается прогноз всех исключенных элементов. Мерой оценки прогнозов были коэффициенты корреляции r и параметр ρ между прогностическими и фактическими средними месячными аномалиями температуры воздуха, а также фактическими и восстановленными по пяти коэффициентам разложения значениями температуры за каждый день месяца. Оценивалась оправдываемость прогноза (%) при абсолютной ошибке за каждый день δ ≤ 30 и 50 (соответственно Δ3 и Δ5).

Поскольку длина ряда T850 меньше, чем других рядов, для использования T850 в уравнениях регрессии необходимо вводить Т850 в уравнения после нахождения коэффициентов регрессии, соответствующих Н500 и р0. В этом случае коэффициент регрессии, соответствующий Т850, будет находиться не для самой аномалии температуры воздуха, а для ошибки ее прогноза по остальным предикторам в 1962-1994 гг. На первом этапе строится уравнение регрессии для самого длинного ряда, а ошибка регрессии δ1T выводится для дальнейшего предсказания по более коротким рядам. На втором этапе из ошибки δ1T выделяется та часть, которую можно предсказать, используя второй предиктор меньшей длины [2].

Для прогноза оказалось предпочтительнее использовать аналого-регрессионную схему, которая составлялась как для прогноза средней месячной температуры (на основе установленных зависимостей), так и для прогноза хода температуры внутри месяца. Уравнение множественной линейной регрессии решалось после отбора определенного количества аналогов (разного для различных пунктов и сезонов). Фактически это схема кусочно-линейной регрессии.

Для применения кусочно-линейной регрессии наиболее оптимальным оказалось использование в уравнении регрессии трех различных предикторов (три коэффициента разложения Н500, р0 либо Т850 считались за один предиктор). К каждой новой реализации первого предиктора (средней декадной величине или трем коэффициентам при главных компонентах Н500) подбиралась группа аналогов, составляющая около 50% исходной выборки. В качестве меры аналогичности были использованы евклидовы расстояния между исходным и всеми остальными векторами-предикторами. Выстраивались предикторы с учетом увеличения евклидова расстояния между исключенным и архивным предикторами. Евклидово расстояние Dαβ вычислялось по формуле

где Pi – весовой коэффициент i-го признака, Xi(α), Xi(β) – i-й признак объектов α и β. Если признаками являлись средние декадные значения предикторов, то данное выражение вырождалось в сумму по одному индексу, а весовой коэффициент равнялся нулю. Если в качестве признаков рассматривались коэффициенты разложения по е.о.с., то Pi представляли собой величины, обратные собственным числам λi. Это связано с тем, что первое собственное число λ1 обычно в 1,5-2 раза больше второго (λ2), а λ2 в 1,5-2 раза больше λ3. Не вводя весовые коэффициенты, мы теряем часть информации о колебаниях величин предикторов, описываемых вторым и третьим коэффициентами разложения.

Затем отбиралась группа аналогов ко второму предиктору среди уже отобранных. Такие же действия применялись по отношению к третьему предиктору. При этом на каждом шаге число аналогов уменьшалось на 20-30 по сравнению с предыдущим.

Далее на аналоговой выборке решалось уравнение множественной линейной регрессии. По полученным коэффициентам регрессии рассчитывались значения предиктанта (коэффициентов разложения по е.о.с.). Временной ход температуры восстанавливался по коэффициентам разложения.

Оценка ρ прогноза средней месячной температуры в режиме скользящего контроля оказалась в среднем около 0.5 для всех пунктов за исключением района Дальнего Востока, где прогноз по данной методике возможен лишь в холодное полугодие. Такие показатели оправдываемости позволяют применять спрогнозированную среднюю месячную температуру для уточнения прогноза хода температуры.

Прогноз хода температуры также проверялся в «квази-оперативном» режиме. В целом оправдываемость таких прогнозов достаточно высока, однако далеко не всегда хорошо прогнозируется амплитуда колебаний температуры.

При прогнозе хода температуры во всех случаях выявлено несколько (от 5 до 30) комбинаций предикторов с учетом и без учета пространственных сдвигов, на основе которых получены высокие показатели оправдываемости, близкие друг к другу. Поэтому было принято решение использовать все эти комбинации предикторов при проверке прогнозов в «квази-оперативном» (т. е. с применением «кросс-валидации») и оперативном режиме. Полученные по разным наборам предикторов прогнозы осреднялись.

В 2001-2003 гг. схема статистического прогноза хода температуры внутри месяца (T(τ=1,2,...,30)) проверялась на фактическом материале. В качестве исходных данных использовались ансамбли гидродинамических прогнозов, составленных в Гидрометцентре России [11, 12], за исходный срок τ0 и за сроки τ10–12h и τ20–24h. Для восстановления сглаженного хода температуры в течение месяца T(τ=1,...,30) в прогностической схеме применялись как отдельные гидродинамические прогнозы, так и осредненные по ансамблю. Кроме того, для каждого случая рассматривались несколько наилучших наборов предикторов, полученных по расчетам на зависимом материале. Таким образом, прогноз хода температуры представляет собой расширенный ансамбль, рассчитанный по реализациям ансамблевого гидродинамического прогноза и различным комбинациям предикторов.


Результаты оперативных испытаний
Оперативные испытания метода проводились в Гидрометцентре России в период с февраля 2001 г. по январь 2003 г. по следующим городам России: Москва, Санкт-Петербург, Нижний Новгород, Красноярск. Прогнозы составлялись с нулевой заблаговременностью на 30-дневные периоды, начиная с 1, 11 и 21 числа календарного месяца. Успешность прогнозов рассчитывалась путем их сравнения со среднесуточными и среднемесячными сглаженными и не сглаженными фактическими значениями температуры и климатическими нормами за 49-летний период (1946-1994 гг.).

Успешность прогнозов среднесуточной температуры в течение 30-дневных периодов характеризовали средние абсолютные ошибки величиной 2,5-5,0°С. В теплый период года по сравнению с холодным периодом характеристики качества прогнозов оказались несколько лучше. Сравнение прогнозов среднесуточной температуры в течение месяца по данному методу с оперативными прогнозами Гидрометцентра России и климатическими прогнозами в период 2001 г. показало, что рассматриваемый метод в среднем имел преимущество в оправдываемости прогнозов на 5 – 9% и меньшие (на 0,4 – 0,7°С) абсолютные ошибки.

Успешность прогнозов среднемесячных аномалий температуры по указанным городам характеризовали значения ρ, равные 0,28 - 0,39 и величины относительных ошибок от 0,74 до 0,84.Указанные показатели успешности прогнозов среднемесячной температуры воздуха по испытываемому методу близка к успешности оперативных прогнозов Гидрометцентра Росси или несколько ниже ее.

Не отмечено существенных различий в оценках для прогнозов, составленных в начале месяца, с первой или второй декады. Хотя в отдельных случаях несколько лучше оказывались прогнозы, составленные с начала календарного месяца. При сравнении прогнозов со сглаженными фактическими значениями температуры было отмечено уменьшение абсолютных ошибок примерно на 1°С.


Рекомендации к внедрению
Метод долгосрочного прогноза среднемесячной температуры воздуха и сглаженного хода среднесуточной температуры воздуха в течение месяца с нулевой заблаговременностью по городам Российской Федерации был рассмотрен Центральной методической комиссией по гидрометеорологическим прогнозам Росгидромета (ЦМКП) 14 октября 2003 г. Комиссия отметила, что такой метод в Гидрометцентре России разработан впервые. ЦМКП рекомендовала внедрение метода в оперативную практику при прогнозировании среднемесячной аномалии и среднесуточной температуры воздуха на месяц с нулевой заблаговременностью для городов Москва, Санкт-Петербург, Нижний Новгород и Красноярск. Одновременно рекомендовано Гидрометцентру России разработать форму представления потребителям прогноза сглаженного хода среднесуточной температуры воздуха внутри месяца, включая априорные вероятностные характеристики, и с января 2004 г. организовать их эксплуатацию. Предложено реализовать данный метод прогноза для других городов Российской Федерации.


Авторы
Роман Менделевич Вильфанд, vilfand@rhmc.mecom.ru
Владимир Анатольевич Тищенко, tischenko@ rhmc.mecom.ru


© Методический кабинет Гидрометцентра России