Гидрометеорологические исследования и прогнозы. 2024. № 4 (394). С. 90-108

90

DOI: https://doi.org/10.37162/2618-9631-2024-4-90-108

УДК 556.536+519.688+004.8+004.438

Метод долгосрочного прогноза

максимального уровня воды р. Исеть

на основе глубокого обучения

Э.Р. Акмаев, А.В. Романов

Гидрометеорологический научно-исследовательский центр

Российской Федерации, г. Москва, Россия

alexey.romanov@mecom.ru, akmaew1@gmail.com

Выполнен численный анализ применимости алгоритмов глубокого обучения при

разработке метода долгосрочного прогноза максимального уровня воды для трех гид-

рологических постов р. Исеть (Катайск, Шадринск, Мехонское). Детально проанали-

зированы возможности реализации двух архитектур исходной нейросетевой модели

в рамках использования одного и того же набора исходных гидрометеорологических

данных наблюдений. Показано, что переход на новую архитектуру N-HiTS позволяет

увеличить оправдываемость прогноза на валидационной выборке по сравнению с ра-

нее использованной архитектурой TFT. С помощью кросс-валидации получены

оценки классического статистического критерия эффективности разработанного ме-

тода (S/σ), подтверждающие возможность его использования в оперативной практике

для всех трёх анализируемых гидрологических постов. В рамках разработанного ме-

тода прогноза выполнен анализ учёта данных наблюдений за уровнем грунтовых вод

на подземных скважинах системы Роснедра. Показано, что использование таких дан-

ных наблюдений позволяет в ряде случаев существенно повысить эффективность ме-

тода прогноза.

Ключевые слова: долгосрочные гидрологические прогнозы, половодье, уравне-

ние водного баланса, уравнение регрессии, нейронные сети, уровень воды, водный

режим, глубокое машинное обучение

Deep learning long-term method

of maximum water level forecast

of the Iset

E.R. Akmaev, A.V. Romanov

Hydrometeorological Research Center of Russian Federation,

Moscow, Russia

alexey.romanov@mecom.ru, akmaew1@gmail.com

Numerical analysis of using deep learning in the development of long-term method of

maximum water level forecast for several gauging stations of the Iset (Kataysk, Shadrinsk,

Mekhonskoe) has been carried out. The possibilities of implementing two architectures of

neural network model within the framework of using the same set of initial hydrometeor-

ological observation data have been analysed in detail. It is shown that the transition to the

new N-HiTS architecture allows increasing the correctness of the forecast on the validation

sample in comparison with the previously used TFT architecture. Using cross-validation

we obtained estimates of the classical statistical criterion of correctness of the developed

method confirming the possibility of its use in operational practice for all three analysed

Акмаев Э.Р., Романов А.В.

91

gauging stations. Within the framework of the developed forecasting method the analysis

of groundwater level observation data at groundwater wells of the Rosnedra system was

carried out. It is shown that in a number of cases using such observation data allows sig-

nificantly improve the correctness of forecast.

Keywords: hydrological long-term forecasts, flooding, hydrologic equation, regression

equation, neural networks, water level, water regime, deep machine learning

Введение

Совершенствование методов прогнозирования водных ресурсов по-

прежнему является одной из важных задач гидрологии, что обусловлено

необходимостью надежного планирования водохозяйственной деятельно-

сти и своевременного реагирования на возможные бедствия, вызванные

наводнениями или засухами.

При работе с устойчивыми гидрологическими режимами использова-

ние традиционных методов может быть оправдано, однако их применение

ограничено в случае наличия нелинейных зависимостей между исходными

характеристиками и сложных паттернов в данных. В последние годы ак-

тивно развиваются методы глубокого обучения, демонстрирующие пер-

спективные результаты в задачах прогнозирования временных рядов.

В настоящее время физически наиболее обоснованными и широко из-

вестными в мире являются следующие математические модели формиро-

вания речного стока: модель Сакраменто, учитывающая влажность почвы;

комплексная система гидрологического моделирования (HEC-HMS); про-

странственно-распределенная модель водных ресурсов LisFlood, широко

используемая в проекте Европейской Системы Предупреждения о Навод-

нениях; концептуальная модель HBV, использующая данные об осадках и

температуре воздуха [3, 7]. Однако все эти модели используются только

для краткосрочных прогнозов водного режима и к долгосрочным прогно-

зам отношения не имеют. В подавляющем большинстве случаев методы

долгосрочных прогнозов основываются на полуэмпирических подходах,

связанных с использованием уравнения водного баланса и построением ре-

грессионных зависимостей, которые часто не дают желаемого результата.

Более того, все указанные физически обоснованные и эмпирические мо-

дели не всегда эффективны при моделировании сложных нелинейных про-

цессов в гидрологических системах [9]. Переход к разработке метода про-

гноза водного режима с использованием глубокого обучения позволяет в

определенной степени снивелировать это различие при моделировании

сложных нелинейных процессов в гидрологических системах.

В [4] сделана попытка создать методику долгосрочного прогноза мак-

симального уровня воды, используя современные достижения в области

глубокого обучения. В то же время полученные результаты не могут счи-

таться полностью законченными, так как они были выполнены на ограни-

ченной по объему выборке исходных данных и без оценки классических,

принятых в гидрологической практике критериев эффективности метода

92

Гидрометеорологические прогнозы, математическое моделирование

прогноза. Развитие данного подхода предполагало реализацию кросс-вали-

дации для оценки метода прогноза, изменение архитектуры модели, а

также подключение дополнительной исходной гидрометеорологической

информации в сравнении с предыдущим подходом.

2. Область исследования и данные

2.1 Исследуемые водосборы

Для оценки применимости методик на основе глубокого обучения

были выбраны три водпоста р. Исеть (бассейн речной системы р. Тобол),

соответствующие предыдущему исследованию [4] (табл. 1). Режим форми-

рования весеннего половодья по указанным водпостам достаточно одно-

родный по своему виду для всей рассматриваемой территории с некоторым

преобладанием горного рельефа для водпоста Катайск. Тающие снега

являются наиболее важным источником питания поверхностного стока

р. Исеть. В то же время вниз по течению возрастает доля дождевого пита-

ния. Весеннее половодье начинается в первой половине апреля и заканчи-

вается обычно в середине июня. Основные гидрографические характери-

стики по всем трем водпостам приведены в табл. 1 согласно справочным

данным [2].

Таблица 1. Гидрографические характеристики по р. Исеть

Table 1. Hydrographic characteristics of the Iset River

Название

водпоста

(индекс)

GPS

координаты,

градус

Расстояние

от истока,

км

Площадь

водосбора,

км²

Нуль

графика

водпоста, м

Катайск (12123)

56.28 и 62.58

56.08 и 63.63

56.15 и 64.56

220

309

451

12800

23400

52300

86.55

72.82

63.75

Шадринск (12125)

Мехонское (12127)

2.2. Исходные данные

Список исходных переменных и их начальных превращений приве-

ден в табл. 2.

Таким образом, для имеющихся трех водпостов у нас доступны:

• метеорологические признаки, такие как температура воздуха, тем-

пература точки росы, влажность, сумма осадков, средняя скорость ветра,

высота снежного покрова;

• гидрологические признаки: уровень воды, расход воды;

• данные по уровням грунтовых вод.

Итого девять исходных признаков.

Акмаев Э.Р., Романов А.В.

93

Таблица 2. Список исходных переменных, полученных из исходных данных,

и их преобразование

Table 2. Base features from raw data and the processed parameters

Коди-

ровка

Физический

смысл

Расчетная формула

Вход-

ной

признак

at_N_h

at

Температура воздуха

N часов, ºC

−

1

Температура воздуха

среднесуточная, ºC

�

ꢁꢂ_ꢃ_ℎ

+

ꢀ

в течение суток

asd

Среднесуточная высота

снежного покрова, см

−

ws _N_h

Средняя скорость ветра

в срок наблюдения

−

(каждые h часов), м/с

1

awspd

Среднесуточная

скорость ветра, м/с

�

ꢄꢅ_ꢃ_ℎ

+

ꢀ

в течение суток

dpt_N_h

dpt

Температура точки росы

в срок наблюдения, ºC

−

Среднесуточная

температура точки росы,

ºC

1

�

ꢆꢇꢂ_ꢃ_ℎ

+

ꢀ

в течение суток

ps_N_h

Сумма осадков за пе-

риод между сроками

h часов, мм

−

+

−

psbd

Сумма осадков за сутки,

мм

1

�

ꢇꢅ_ꢃ_ℎ

ꢀ

в течение суток

rhp_N_h

Относительная

влажность в срок

наблюдения (h часов), %

−

rhp

Среднесуточная влаж-

ность, от 0.0 до 1.0

1

�

ꢈꢉꢊ_ℎꢋꢌ_ꢃ_ℎ

+

ꢀ ∙ 100

в течение суток

flow

Среднесуточный расход

воды, в м³/сек

−

level

Среднесуточный

уровень воды, см,

над нулем графика

водпоста

+

Уровни грунтовых вод,

см

gw_level*

Примечание. М – количество показаний.

*Значения уровней грунтовых вод использовались в качестве

эксперимента для оценки оправдываемости их применимости.

94

Гидрометеорологические прогнозы, математическое моделирование

2.3. Подготовка исходных данных

Подготовка каждой группы данных включала:

1) приведение данных к единому временному масштабу путем агрега-

ции, учитывая различную частоту исходных измерений;

2) интерполяцию для заполнения пропусков и создания непрерывного

ряда данных;

3) объединение гидрологических и метеорологических признаков.

Для приведения к единому временному масштабу данные агрегирова-

лись по дню с последующим усреднением для всех исходных признаков,

кроме осадков – показания последних суммировались в течение суток. В

качестве интерполяции использовался метод кубической интерполяции,

сохраняющий монотонность данных. Для объединения гидро- и метеоро-

логических признаков данные группировались по дню с усреднением ха-

рактеристик в случае соответствия нескольких метеостанций одному вод-

посту.

Нельзя не отметить необходимость чистки исходных данных. Анализ

используемой выборки выявил наличие аномальных примеров, которые

характеризуются несогласованностью между различными показателями,

например, между уровнями и накопленными осадками и снежным покро-

вом, что указывает на необходимость расширения набора учитываемых пе-

ременных для более полного описания исследуемых процессов. Количе-

ство выявленных аномалий не превышало 5 случаев для каждого из трех

пунктов, при этом общая длина ряда наблюдений составляла не менее

28 лет для каждого пункта. Подобных аномалий для каждого из трех пунк-

тов набиралось до пяти, тем не менее суммарная выборка составляла не

менее 28 лет.

2.4. Разработка признаков

Существенное значение для качества прогноза имеет расширение

набора входных переменных путем разработки дополнительных призна-

ков, которые представлены в табл. 3.

Введенными временными признаками послужили тригонометриче-

ские разложения временного шага (дня), в то время как накопительными

послужили кумулятивные суммы осадков и уровней воды, начинающиеся

с 1 июля каждого года.

3. Методология

3.1. Сбор и подготовка данных

Все исходные данные для проведения численных экспериментов были

представлены ФГБУ «Уральское УГМС» и ФГБУ «Гидрометцентр Рос-

сии». Описание данных, использовавшихся в этой работе, соответствует

описанию, приведенному в [4].

Акмаев Э.Р., Романов А.В.

95

В целях расширения возможностей использования метода глубокого

обучения в работе сделана попытка реализовать эту модель с использова-

нием данных об уровне грунтовых вод. Принципиальным моментом в дан-

ном случае является тот факт, что погрешность измерения уровня грунто-

вых вод сравнима только с погрешностью измерения уровня воды на

водпостах (± 0.07 м) [1]. Это обстоятельство имеет решающее значение, так

как погрешность измерения всех остальных гидрологических характери-

стик, которые мы наблюдаем (или рассчитываем, как в случае с расходом

воды) большая и может достигать 20–25 %.

Таблица 3. Список дополнительно введенных переменных

Table 3. Derived features

Кодировка

Расчетная формула

Входной

признак

Взятие месяца из текущей даты

sin(2*pi*month/12)

−

+

month

month_x

month_y

day

cos(2*pi*month/12)

Взятие дня из текущей даты с начала текущего

года

−

+

sin(2*pi*day/365) | sin(2*pi*day/366),

отсчет начинается от 01.07 каждого года

cos(2*pi*day/365) | cos(2*pi*day/366)

day_x

day_y

отсчет начинается от 01.07 каждого года

ꢎ

cumsum_precip

ꢍꢇ_ꢎ= � psbd_ꢏ

ꢏ=1

где (ꢍꢇ_ꢎ) – кумулятивная сумма осадков на мо-

мент времени ꢂ, а psbd_ꢏ– значение переменной

psbd на временном шаге ꢐ.

+

[

(

)]

Период расчета ꢐ ∈ 01.07. ꢑ, 01.07. ꢑ + 1 ,

где ꢑ – год начала расчета, дата в формате

[день.месяц.год]

ꢎ

cumsum_level

ꢍꢊ_ꢎ= � level_ꢏ

ꢏ=1

где (ꢍꢊ_ꢎ) – кумулятивная сумма уровней воды на

момент времени ꢂ, а level_ꢏ– значение перемен-

ной level на временном шаге ꢐ.

+

[

(

)]

Период расчета ꢐ ∈ 01.07. ꢑ, 01.07. ꢑ + 1 ,

где ꢑ – год начала расчета, дата в формате

[день.месяц.год]

96

Гидрометеорологические прогнозы, математическое моделирование

Следует отметить, что подавляющая часть данных наблюдений об

уровнях грунтовых вод в 80-х годах XX века перешли в ведение сначала

Министерства геологии СССР, а позднее в Роснедра. Изменение системы

доступа к этим данным наблюдений привело к реальной потере глубокого

интереса их использования при разработке современных моделей процес-

сов формирования речного стока для гидрологических прогнозов.

В рамках данной работы по официальному запросу в ФГБУ «Гидро-

спецгеология» получена исходная информацию по уровням грунтовых вод

для пунктов, располагающихся в непосредственной близости от рассмат-

риваемых водпостов р. Исеть (рис. 1).

Рис. 1. Схема расположения пунктов государственной наблюдательной сети

с естественным и слабонарушенным режимом подземных вод (масштаб

1:2 000 000).

Fig. 1. Locations of national monitoring sites with natural and quasi-natural ground-

water regime (scale 1:2 000 000).

Акмаев Э.Р., Романов А.В.

97

3.2. Архитектура модели глубокого обучения

При проведении исследований в качестве ключевого алгоритма была

выбрана модель, реализующая архитектуру N-HiTS [6]. Несмотря на гиб-

кость модели TFT в работе с различной природы входными данными,

используемой в предыдущем исследовании на тех же водосборах, методо-

логия настоящей работы включает применение блочных структур, базиру-

ющихся на многослойных перцептронах (MLP). Так, в модели TFT транс-

формер задействуется исключительно для агрегации признаков, тогда как

их экстракция осуществляется посредством рекуррентных нейронных се-

тей, а именно с помощью LSTM блоков и блоков, аналогичных MLP. Более

того, N-HiTS показывает результаты не хуже, чем архитектуры на основе

трансформеров, такие как Autoformer, Informer и т. д., на классических да-

тасетах вроде ETTm2, Weather [6]. В то время как более простое строение

по сравнению с моделью TFT может способствовать снижению чувстви-

тельности модели к выбору гиперпараметров и улучшению масштабируе-

мости модели.

В архитектуре N-HiTS входные данные проходят через последователь-

ность стеков, где каждый стек специализируется на своем уровне абстрак-

ции данных, при этом внутри блока (составляющей стека) происходит по-

степенное уменьшение размера через слои пулинга

)

ꢒ⁽= MaxPool ꢒ .

ꢓ

( )

(

3.1

)

Затем мы получаем скрытое представление через несколько подряд

идущих полносвязных слоев вместе с функциями активации, закрепленной

за каждым слоем

ℎ = MLP�ꢒ^{( )}�,

ꢓ

(

3.2

)

которое используется для получения значений параметров для обратного

(backcast) θ_ꢔи прямого (forecast) θ_ꢕпрогнозов

(

)

θ_ꢔ= ꢖ ℎ + ꢗ_ꢔ

3.3ꢁ

ꢔ

(

θ_ꢕ= ꢖ ℎ + ꢗ_ꢕ,

3.3ꢗ

ꢕ

последующая интерполяция для восстановления исходных размерностей:

(

)

ꢒ� = interpolate�θ_ꢔ, ꢘ_{ꢏꢙꢓꢚꢎ}�,

3.4ꢁ

(

ꢑ� = interpolate�θ_ꢕ, ꢘ_{ꢛꢚꢎꢓꢚꢎ}�,

3.4ꢗ

где

ꢒ

–

тензор

входных

данных

размерности

[ꢗꢁꢂꢜℎ_ꢅꢐꢝꢉ, ꢘ_{ꢏꢙꢓꢚꢎ}, ꢞꢉꢁꢂꢋꢈꢉꢅ_ꢟꢋꢌ]; ꢀꢘꢠ – связка полносвязных слоев

(многослойный перцептрон) вместе со слоями нормализации батча

и дропаутом; ꢖ и ꢗ_ꢔ– веса и смещение линейного слоя для получения

ꢔ

98

Гидрометеорологические прогнозы, математическое моделирование

параметров для backcast (обратного прогноза); ꢖ и ꢗ_ꢕ– аналогичные ком-

ꢕ

поненты для получения параметров для forecast (прямого прогноза); ꢒ� –

тензор обратного прогноза; ꢑ� – тензор прямого прогноз; ꢐꢟꢂꢉꢈꢇꢡꢊꢁꢂꢉ – слой

интерполяции (использовалась линейная); ꢘ_{ꢏꢙꢓꢚꢎ}– длина входного времен-

ного ряда; ꢘ_{ꢛꢚꢎꢓꢚꢎ}– длина выходного временного ряда.

В каждом стеке входные данные сначала проходят через один или не-

сколько блоков последовательно. Перед этим инициализируется началь-

ный прогноз, который является тензором, заполненным нулями

( )

3.5

ꢢ

ꢣꢎꢤꢥꢦ

= 0.

Каждый блок генерирует обратный прогноз (backcast) и прямой про-

гноз (forecast). Обратный прогноз вычитается из входных данных, создавая

остаток, который передаетс7я следующему блоку, а в конечном счете и

следующему стеку, позволяя последующим структурным компонентам со-

средоточиться на еще необработанных аспектах временного ряда. То есть

для каждого блока в стеке имеем

(

)

ꢨ

( )

для ꢐ = 1. . ꢧ: { ꢒ�, ꢑ� = Block_ꢏꢒ_ꢏ,

ꢨ

ꢢ

ꢣꢎꢤꢥꢦ

= ꢢ

+ ꢑ�,

ꢣꢎꢤꢥꢦ

ꢨ

(

)

ꢒ_ꢏ+1= ꢒ_ꢏ− ꢒ�},

3.6

ꢨ

ꢩ_{ꢣꢎꢤꢥꢦ}= ꢒ_ꢪ.

3.7

Прямые прогнозы блоков суммируются в рамках стека, в то время как

входные данные для каждого последующего блока внутри этого стека

уменьшаются на значение обратного прогноза, а затем все прогнозы стеков

складываются для получения финального результата

ꢫ

ꢑ� = � ꢢ^{( )}

,

ꢣ

( )

3.8

ꢣꢎꢤꢥꢦ

ꢣ=1

где ꢧ – количество блоков в стеке; ꢍ – общее количество стеков; ꢢ

–

ꢣꢎꢤꢥꢦ

(прямой) прогноз стека; ꢩ_{ꢣꢎꢤꢥꢦ}– остаток стека; ꢒ_ꢏ– тензор входных данных

для i-го блока текущего стека; ꢒ� – обратный прогноз i-го блока текущего

ꢨ

стека; ꢑ� – прямой прогноз i-го блока текущего стека.

ꢨ

Благодаря такой архитектуре каждый последующий стек работает с

все более очищенными, гранулированными данными, а интерполяция по-

могает восстановить сигнал после сжатия, которое образуется в результате

операций пулинга, обеспечивая эффективную обработку временных рядов

на разных масштабах. Данный процесс представлен на рис. 2.

На рис. 3 представлена демонстрация прогноза, полученного с помо-

щью этой модели.

Акмаев Э.Р., Романов А.В.

99

Рис. 2. Упрощенная архитектура используемой модели N-HiTS. Слева изоб-

ражена структура стека и блока, справа – представление «в общем». Выходы

каждого блока становятся входами для каждого последующего блока и итого-

вым результатом является сумма прямых прогнозов каждого стека.

Fig. 2. Simplified N-HiTS model architecture. Stack and block structure (left) and

generalized representation (right) of the model. Block outputs serve as inputs for

subsequent blocks, with the final prediction being the sum of direct forecasts from

each stack.

100

Гидрометеорологические прогнозы, математическое моделирование

Рис. 3. Пример работы модели: прогноз гидрографа для Шадринска за 2018

год. По осям координат: Date – дата, Water level (cm) – уровень воды (в см).

Обозначения: Input data – входные данные, Prediction – предсказанные зна-

чения, Actual values – фактические значения.

Fig. 3. Model forecast example for 2018, Shadrinsk case. Axes: Date and Water

level (cm). Legend: Input data, Prediction values, and Actual values.

3.3. Выбор гиперпараметров

В табл. 4 представлены параметры конфигурации модели, полученные

в результате численных экспериментов, которые показали наилучшую эф-

фективность в рамках текущей задачи.

Таблица 4. Параметры архитектуры используемой модели

Table 4. Model architecture parameters

Наименование

Значение

Описание

Количество стеков

stacks_num

4

2

blocks_num

Количество блоков внутри одного стека

mlp_layers_num

Количество полносвязных слоев внутри од-

ного блока

layers_width

dropout

352

Размер скрытого пространства

Значение дропаута

0.03

activation

input_len

output_len

LeakyReLU

180

Выбор функции активации

Длина входных временных рядов

Длина выходного временного ряда

90

Акмаев Э.Р., Романов А.В.

101

Также было экспериментально установлено, что наиболее оптималь-

ной датой начала прогноза является 15 марта каждого года. Дополнительно

использовалось линейное уменьшение параметра скорости обучения. Ги-

перпараметры обучения представлены в табл. 5.

Таблица 5. Гиперпараметры обучения

Table 5. Training hyperparameters

Наименование

Значение

Adam

Описание

optim

Оптимизатор

epochs_num

loss_function

batch_size

lr

60

Количество эпох.

MSE

256

Функция потерь. Использовалась MSE

Размер батча

0.001

0.0005

Параметр скорости обучения

gamma

Финальный множитель начальной скоро-

сти обучения lr, к которому сводится значе-

ние последней на последней эпохе как

ꢊꢈ

ꢕꢏꢙꢤꢬ

= ꢊꢈ ∗ ꢭꢁꢌꢌꢁ

grad_clip

3.5

Граница нормы градиентов

weight_decay

0.000005

Коэффициент L2-регуляризации

4. Проведение экспериментов

4.1. Временные границы

В данном эксперименте использовались временные ряды с 1990 по

2023 год включительно.

4.2. Валидация

В качестве валидационного периода фиксировался временной проме-

жуток с 2018 по 2022 год протяженностью в 5 лет. Использовавшаяся мет-

рика оценки описана в разделе 4.4 «Метрики оценки» – формула 4.1.

4.3. Кросс-валидация

Для более справедливой оценки применимости разработанных мето-

дов была дополнительно проведена кросс-валидация с окном ꢄꢐꢟꢆꢡꢄ_ꢣꢏꢮꢯ

,

равным 5 годам, и пересечением intersection, равным 2 годам. Для каждого

эксперимента:

• фиксируется валидационный интервал начиная с ꢑ₀года и до ꢑ₁=

ꢑ₀+ ꢄꢐꢟꢆꢡꢄ_ꢅꢐꢝꢉ;

• собираются метрики на каждом из подобных интервалов;

102

Гидрометеорологические прогнозы, математическое моделирование

• происходит смещение на величину ꢐꢟꢂꢉꢈꢅꢉꢜꢂꢐꢡꢟ = 2 года вправо и

повторяется эксперимент.

Так как при таком подходе неизбежно появляются дубликаты из-за

наличия пересечения, среди экспериментов для одного и того же года и

региона выбирается наилучший результат значения критерия. Процесс

кросс-валидации графически представлен на рис. 4.

Рис. 4. Графическое представление кросс-валидации. Эксп. {i} обозначает

��

эксперимент i, где ꢐ = 1, ꢃ, N – общее количество экспериментов.

Fig.4. Cross-validation scheme. Exp. {i} denotes an experiment i, where ꢐ = 1, ꢃ

��

and N is the total number of experiments

4.4. Критерии оценки

В этом исследовании использовались следующие критерии оценки:

1) отношение Δ разницы предсказанного и фактического максимумов

к некоторой фиксированной константе, задаваемой для каждого водпоста

для валидационного периода;

2) отношение (S/σ) среднеквадратичной погрешности поверочных про-

гнозов к среднеквадратичной ошибке всего рассматриваемого временного

промежутка для проведения кросс-валидации.

В случае оценки на валидации использовалась метрика

ꢁꢗꢅ �max�ꢑ^ꢱ� − max�ꢑ�^ꢱ��

ꢏ

ꢰ_ꢏ^ꢱ=

,

( )

4.1

ꢰ_д^ꢱ_оп

где ꢲ – водпост; ꢐ – год; ꢑ – временной ряд фактических значений;

ꢑ� – временной ряд прогнозных; ꢰ_д^ꢱ_оп– фиксированная константа для

Акмаев Э.Р., Романов А.В.

103

каждого водпоста ꢲ, которая может быть интерпретирована как макси-

мально допустимая абсолютная разница между максимальным прогноз-

ным значением и максимальным фактическим в пределах рассматривае-

мого горизонта прогноза.

Для оценки оправдываемости использовались следующие отношения:

Δ^j_i∈ [0, 0.4) – отлично;

Δ^j_i∈ [0.4, 0.7) – хорошо;

Δ^j_i∈ [0.7, 1.0) – удовлетворительно;

Δ^j_i∈ [1.0, +∞) – неудовлетворительно.

В частности, при подсчете оправдываемости на валидационной вы-

борке проверялось неравенство Δ^j_i< 1 для каждой пары («год», «вод-

пост»).

В случае кросс-валидации критерием оценки выступало отношение

S/σ, при этом S – средняя квадратичная погрешность поверочных прогно-

зов, вычисляемая по формуле

ꢙ

ꢏ=1

2

∑

( )

ꢑ_ꢏ− ꢑ�

ꢨ

�

( )

4.2

ꢍ =

,

ꢟ − 1

где σ – средняя квадратичная ошибка, посчитанная для n лет; ꢑ_ꢏ, ꢑ� – соот-

ꢨ

ветствующие значения реальных и предсказанных значений. Сама интер-

претация достаточно тривиальна: разброс прогнозов самого метода не дол-

жен приближаться к среднеквадратичной, иначе его применение

нецелесообразно. Считается, что применение методики целесообразно,

если S/σ не более 0.80 [5].

5. Обсуждение и результаты

5.1. Валидация

В данном исследовании проводилась оценка метода прогноза с за-

благовременностью в 90 суток. Результаты оправдываемости по сравне-

нию с ранее использованным методом предоставлены на рис. 5.

Анализ результатов показывает, что модель N-HiTS достигает уровня

точности не ниже, чем лучшие показатели из предыдущих конфигураций

TFT для обоих горизонтов прогнозирования. Примечательно, что ранее для

разных водпостов оптимальная заблаговременность различалась. В частно-

сти, для Катайска была оптимальна модель с заблаговременностью 60 су-

ток, в то время как для Мехонского – 90 суток. Предложенный способ де-

монстрирует результаты лучшие, чем любой из ранее используемых

подходов при максимальной заблаговременности для всех исследуемых

водпостов.

104

Гидрометеорологические прогнозы, математическое моделирование

Рис. 5. Сравнение оправдываемости прогнозов моделей N-HiTS (заблаго-

временность 90 суток, синий) и TFT (заблаговременности 60 и 90 суток, зе-

леный и желтый соответственно) по критерию Δ для валидационного пери-

ода. По оси ординат – доля прогнозов с соотношением (4.1) менее 1, по оси

абсцисс – водпосты. Более высокие значения соответствуют лучшей оправ-

дываемости. N-HiTS демонстрирует наилучшие результаты для всех слу-

чаев.

Fig. 5. Model performance comparison between N-HiTS (90-day lead time, blue)

and TFT (60 and 90-day lead times, green and yellow respectively) using Δ crite-

rion for validation period. Y-axis: proportion of successful forecasts (ratio (4.1)

< 1); X-axis: gauging stations. Higher values indicate better performance, with

N-HiTS showing superior results for all cases.

5.2. Кросс-валидация

Для кросс-валидации была выбрана модель, обеспечивающая

наибольшую эффективность – N-HiTS с горизонтом прогноза в 90 суток. В

результате кросс-валидации для каждого года в выборке имеем значения

максимального фактического и максимального предсказанного уровней в

пределах рассматриваемого горизонта прогноза, которое можно предста-

вить в виде временного ряда, как показано на рис. 6.

Усредненные результаты по каждому отношению S/σ приведены на

рис. 7.

5.3. Влияние использования данных грунтовых вод

Несмотря на наличие исследований о предсказании непосредственно

самих уровней грунтовых вод [8], в работе выполнен анализ учета данных

на подземных скважинах в рамках разработанного метода прогноза макси-

мального уровня воды. Результаты расчетов показывают, что использова-

ние таких данных наблюдений позволяет снизить отношение S/σ для кросс-

валидации по водпосту Шадринск на 0.2 (рис. 8), что существенно улуч-

шает качество разработанного метода прогноза.

Акмаев Э.Р., Романов А.В.

105

Рис. 6. Сопоставление фактического и предсказанного максимальных

уровней на примере Шадринска, “real” – фактичиеский, “pred” – предсказан-

ный. Рассматриваемый горизонт прогноза составляет 90 временных шагов

(суток) и отсчитывается с 15 марта каждого года, внутри которого выбира-

ются максимумы среди фактических и предсказанных значений. По оси

абсцисс – рассматриваемый год, по оси ординат – уровень воды (в см.)

Fig. 6. Comparison of observed and predicted water level values for Shadrinsk

('real' and 'pred' respectively). Forecast horizon is 90 timesteps (days) starting

from March 15 each year, with maxima selected from both observed and pre-

dicted values within this period. X-axis: year; Y-axis: maximum water level (cm)

Рис. 7. Значения отношения S/σ для кросс-валидации. Чем ниже, тем лучше.

Результаты на каждом из исследуемых водосборов удовлетворяет критерию

эффективности применения методики.

Fig. 7. Cross-validation S/σ ratio values. Lower values indicate better perfor-

mance. Results for all studied catchments meet the forecast verification criteria.

106

Гидрометеорологические прогнозы, математическое моделирование

Рис. 8. Значения отношения S/σ для кросс-валидации с использованием дан-

ных уровней грунтовых вод. В случае Шадринска получается понижение мет-

рики на 30 %. В остальных случаях статистически значимого эффекта обна-

ружено не было.

Fig. 8. Cross-validation S/σ ratio values using groundwater level data. For

Shadrinsk, the metric decreased by 30 %. No statistically significant effect was

observed in other cases.

Использование данных по уровням грунтовых вод показало улучше-

ние в 1/3 случаев. Для более глубокого анализа влияния использования

данных наблюдений за уровнем грунтовых вод необходимо существенно

расширить это исследование по большему числу водных объектов.

5.4. Перспективы применения и ограничения метода

Разработанный метод демонстрирует значительный потенциал, позво-

ляя моделировать временной ряд длиной в 90 суток, а относительная гиб-

кость архитектуры позволяет адаптировать модель под различные времен-

ные признаки и временные масштабы. Добавление новых источников

данных, как, например, в случае с уровнями грунтовых вод, способно улуч-

шить показатели эффективности, при этом не требуется существенных из-

менений модели.

Необходимо отметить, что при реализации данного метода нужно учи-

тывать определенные ограничения по исходным данным. Прежде всего

это: 1) требования к качеству входных данных и 2) определенные трудно-

сти с использованием данного подхода при реализации валидации. В то же

Акмаев Э.Р., Романов А.В.

107

время указанные ограничения носят достаточно общий характер практиче-

ски во всех численных методах, использующих гидрометеорологические

данные наблюдений.

Заключение

В результате выполненного исследования была проведена комплекс-

ная оценка разработанного метода долгосрочного прогноза максимального

уровня воды с использованием глубокого обучения на примере нескольких

водпостов р. Исеть. Была проведена оценка перехода на новую архитек-

туру N-HiTS, которая позволила увеличить оправдываемость на валидаци-

онной выборке по сравнению с архитектурой TFT. Результаты работы по-

казали, что метод удовлетворяет критерию S/σ при валидации на

независимых выборках посредством кросс-валидации. В ходе валидации

новая модель показала существенное улучшение оправдываемости прогно-

зов по сравнению с предшествующим аналогом на всех анализируемых

водпостах.

Дополнительно в рамках данной работы была проведена оценка эф-

фективности использования данных грунтовых вод для долгосрочного про-

гноза максимального уровня воды. Анализ результатов демонстрирует по-

ложительную динамику в одной трети случаев, что может быть вызвано

недостаточным количеством водных объектов. Данное обстоятельство ука-

зывает на необходимость дальнейшего исследования и расширения коли-

чества анализируемых водосборов для повышения статистической значи-

мости результатов.

Учитывая результаты настоящей работы, можно утверждать, что при-

менение методов глубокого обучения в задаче прогноза уровней воды

имеет значительные перспективы. Дальнейшие исследования целесооб-

разно направить на расширение исследуемых водосборов, а также приме-

нение методов глубокого обучения для разработки методов прогнозов

водного режима различной заблаговременности (краткосрочные и средне-

срочные).

Авторы выражают благодарность сотрудникам кафедры Прикладной

математики № 31 НИЯУ МИФИ за ценные замечания при рассмотрении

данной работы на семинаре кафедры 23 сентября 2024 года.

Список литературы

1. Постановление Правительства РФ от 16 ноября 2020 г. №1847 "Об утверждении

перечня измерений, относящихся к сфере государственного регулирования обеспечения

единства измерений" (пункт 9.25).

2. Ресурсы поверхностных вод СССР: Гидрологическая изученность. Т. 11. Средний

Урал и Приуралье. Вып. 2. Тобол / под ред. В.В. Николаенко. Л.: Гидрометеоиздат, 1965.

214 c.

3. Романов А.В. Дорожная карта современных гидрологических прогнозов водного ре-

жим // Метеорология и гидрология. 2023. № 12. С. 12-26.

108

Гидрометеорологические прогнозы, математическое моделирование

4. Романов А.В., Акмаев Э.Р., Червоненкис М.А. Глубокие нейронные сети архитек-

туры трансформер в задачах гидрологических прогнозов // Гидрометеорологические иссле-

дования и прогнозы. 2023. № 2 (388). С. 138-155.

5. Бефани Н.Ф., Калинин Г.П. Упражнения и методические разработки по гидрологи-

ческим прогнозам. Л.: Гидрометеоиздат, 1983. C. 390.

6. Challu C. et al. Nhits: Neural hierarchical interpolation for time series forecasting // Pro-

ceedings of the AAAI conference on artificial intelligence. 2023. Vol. 37, no. 6. P. 6989-6997.

7. Devia G.K., Ganasri B.P., Dwarakish G.S. A REVIEW ON HYDROLOGICAL MOD-

ELS // Aquatic Рrocedia. 2015. Vol. 4. P. 1001-1007. http://dx.doi.org/10.1016/

j.aqpro.2015.02.126

8. Khan J. et al. A comprehensive review of conventional, machine leaning, and deep learn-

ing models for groundwater level (GWL) forecasting // Applied Sciences. 2023. Vol. 13, no. 4.

P. 2743.

9. Kratzert F. et al. Toward improved predictions in ungauged basins: Exploiting the power

of machine learning // Water Resources Research. 2019. Vol. 55, no. 12. P. 11344-11354.

References

1. Postanovlenie Pravitel'stva RF ot 16 noyabrya 2020 g. №1847 "Ob utverzhdenii perechnya

izmereniy, otnosyashchihsya k sfere gosudarstvennogo regulirovaniya obespecheniya edinstva iz-

mereniy" (punkt 9.25) [in Russ.].

2. Resursy poverhnostnyh vod SSSR: Gidrologicheskaya izuchennost'. T. 11. Sredniy Ural i

Priural'e. Vyp. 2. Tobol / pod red. V.V. Nikolaenko. Leningrad, Gidrometeoizdat publ., 1965,

214 p. [in Russ.].

3. Romanov A.V. A Roadmap of Modern Hydrological Forecasts of Water Regime. Meteor-

ologiya i Gidrologiya [Russ. Meteorol. Hydrol.], 2023, no. 12, pp. 12-26 [in Russ.].

4. Romanov A.V., Akmaev E.R., Chervonenkis M.A. Deep neural networks of transformer

architecture in problems of hydrological forecasts. Gidrometeorologicheskie issledovaniya i

prognozy [Hydrometeorological Research and Forecasting], 2023, vol. 388, no. 2, pp. 138-155

[in Russ.].

5. Befani N.F., Kalinin G.P. Uprazhneniya i metodicheskie razrabotki po gidrologicheskim

prognozam. Leningrad, Gidrometeoizdat publ., 1983, 390 p. [in Russ.].

6. Challu C. et al. Nhits: Neural hierarchical interpolation for time series forecasting. Pro-

ceedings of the AAAI conference on artificial intelligence. 2023, vol. 37, no. 6, pp. 6989-6997.

7. Devia G.K., Ganasri B.P., Dwarakish G.S. A review on hydrological models. Aquatic

Рrocedia, 2015, vol. 4, pp. 1001-1007. DOI: 10.1016/j.aqpro.2015.02.126.

8. Khan J. et al. A comprehensive review of conventional, machine leaning, and deep learn-

ing models for groundwater level (GWL) forecasting. Applied Sciences, 2023, vol. 13, no. 4,

рр. 2743.

9. Kratzert F. et al. Toward improved predictions in ungauged basins: Exploiting the power

of machine learning. Water Resources Research, 2019, vol. 55, no. 12, pp. 11344-11354.

Поступила 06.11.2024; одобрена после рецензирования 02.12.2024;

принята в печать 10.10.2024.

Submitted 06.11.2024; approved after reviewing 02.12.2024;

accepted for publication 10.10.2024.