Гидрометеорологические исследования и прогнозы. 2024. 4 (394). С. 90-108  
90  
УДК 556.536+519.688+004.8+004.438  
Метод долгосрочного прогноза  
максимального уровня воды р. Исеть  
на основе глубокого обучения  
Э.Р. Акмаев, А.В. Романов  
Гидрометеорологический научно-исследовательский центр  
Российской Федерации, г. Москва, Россия  
Выполнен численный анализ применимости алгоритмов глубокого обучения при  
разработке метода долгосрочного прогноза максимального уровня воды для трех гид-  
рологических постов р. Исеть (Катайск, Шадринск, Мехонское). Детально проанали-  
зированы возможности реализации двух архитектур исходной нейросетевой модели  
в рамках использования одного и того же набора исходных гидрометеорологических  
данных наблюдений. Показано, что переход на новую архитектуру N-HiTS позволяет  
увеличить оправдываемость прогноза на валидационной выборке по сравнению с ра-  
нее использованной архитектурой TFT. С помощью кросс-валидации получены  
оценки классического статистического критерия эффективности разработанного ме-  
тода (S/σ), подтверждающие возможность его использования в оперативной практике  
для всех трёх анализируемых гидрологических постов. В рамках разработанного ме-  
тода прогноза выполнен анализ учёта данных наблюдений за уровнем грунтовых вод  
на подземных скважинах системы Роснедра. Показано, что использование таких дан-  
ных наблюдений позволяет в ряде случаев существенно повысить эффективность ме-  
тода прогноза.  
Ключевые слова: долгосрочные гидрологические прогнозы, половодье, уравне-  
ние водного баланса, уравнение регрессии, нейронные сети, уровень воды, водный  
режим, глубокое машинное обучение  
Deep learning long-term method  
of maximum water level forecast  
of the Iset  
E.R. Akmaev, A.V. Romanov  
Hydrometeorological Research Center of Russian Federation,  
Moscow, Russia  
Numerical analysis of using deep learning in the development of long-term method of  
maximum water level forecast for several gauging stations of the Iset (Kataysk, Shadrinsk,  
Mekhonskoe) has been carried out. The possibilities of implementing two architectures of  
neural network model within the framework of using the same set of initial hydrometeor-  
ological observation data have been analysed in detail. It is shown that the transition to the  
new N-HiTS architecture allows increasing the correctness of the forecast on the validation  
sample in comparison with the previously used TFT architecture. Using cross-validation  
we obtained estimates of the classical statistical criterion of correctness of the developed  
method confirming the possibility of its use in operational practice for all three analysed  
Акмаев Э.Р., Романов А.В.  
91  
gauging stations. Within the framework of the developed forecasting method the analysis  
of groundwater level observation data at groundwater wells of the Rosnedra system was  
carried out. It is shown that in a number of cases using such observation data allows sig-  
nificantly improve the correctness of forecast.  
Keywords: hydrological long-term forecasts, flooding, hydrologic equation, regression  
equation, neural networks, water level, water regime, deep machine learning  
Введение  
Совершенствование методов прогнозирования водных ресурсов по-  
прежнему является одной из важных задач гидрологии, что обусловлено  
необходимостью надежного планирования водохозяйственной деятельно-  
сти и своевременного реагирования на возможные бедствия, вызванные  
наводнениями или засухами.  
При работе с устойчивыми гидрологическими режимами использова-  
ние традиционных методов может быть оправдано, однако их применение  
ограничено в случае наличия нелинейных зависимостей между исходными  
характеристиками и сложных паттернов в данных. В последние годы ак-  
тивно развиваются методы глубокого обучения, демонстрирующие пер-  
спективные результаты в задачах прогнозирования временных рядов.  
В настоящее время физически наиболее обоснованными и широко из-  
вестными в мире являются следующие математические модели формиро-  
вания речного стока: модель Сакраменто, учитывающая влажность почвы;  
комплексная система гидрологического моделирования (HEC-HMS); про-  
странственно-распределенная модель водных ресурсов LisFlood, широко  
используемая в проекте Европейской Системы Предупреждения о Навод-  
нениях; концептуальная модель HBV, использующая данные об осадках и  
температуре воздуха [3, 7]. Однако все эти модели используются только  
для краткосрочных прогнозов водного режима и к долгосрочным прогно-  
зам отношения не имеют. В подавляющем большинстве случаев методы  
долгосрочных прогнозов основываются на полуэмпирических подходах,  
связанных с использованием уравнения водного баланса и построением ре-  
грессионных зависимостей, которые часто не дают желаемого результата.  
Более того, все указанные физически обоснованные и эмпирические мо-  
дели не всегда эффективны при моделировании сложных нелинейных про-  
цессов в гидрологических системах [9]. Переход к разработке метода про-  
гноза водного режима с использованием глубокого обучения позволяет в  
определенной степени снивелировать это различие при моделировании  
сложных нелинейных процессов в гидрологических системах.  
В [4] сделана попытка создать методику долгосрочного прогноза мак-  
симального уровня воды, используя современные достижения в области  
глубокого обучения. В то же время полученные результаты не могут счи-  
таться полностью законченными, так как они были выполнены на ограни-  
ченной по объему выборке исходных данных и без оценки классических,  
принятых в гидрологической практике критериев эффективности метода  
92  
Гидрометеорологические прогнозы, математическое моделирование  
прогноза. Развитие данного подхода предполагало реализацию кросс-вали-  
дации для оценки метода прогноза, изменение архитектуры модели, а  
также подключение дополнительной исходной гидрометеорологической  
информации в сравнении с предыдущим подходом.  
2. Область исследования и данные  
2.1 Исследуемые водосборы  
Для оценки применимости методик на основе глубокого обучения  
были выбраны три водпоста р. Исеть (бассейн речной системы р. Тобол),  
соответствующие предыдущему исследованию [4] (табл. 1). Режим форми-  
рования весеннего половодья по указанным водпостам достаточно одно-  
родный по своему виду для всей рассматриваемой территории с некоторым  
преобладанием горного рельефа для водпоста Катайск. Тающие снега  
являются наиболее важным источником питания поверхностного стока  
р. Исеть. В то же время вниз по течению возрастает доля дождевого пита-  
ния. Весеннее половодье начинается в первой половине апреля и заканчи-  
вается обычно в середине июня. Основные гидрографические характери-  
стики по всем трем водпостам приведены в табл. 1 согласно справочным  
данным [2].  
Таблица 1. Гидрографические характеристики по р. Исеть  
Table 1. Hydrographic characteristics of the Iset River  
Название  
водпоста  
(индекс)  
GPS  
координаты,  
градус  
Расстояние  
от истока,  
км  
Площадь  
водосбора,  
км2  
Нуль  
графика  
водпоста, м  
Катайск (12123)  
56.28 и 62.58  
56.08 и 63.63  
56.15 и 64.56  
220  
309  
451  
12800  
23400  
52300  
86.55  
72.82  
63.75  
Шадринск (12125)  
Мехонское (12127)  
2.2. Исходные данные  
Список исходных переменных и их начальных превращений приве-  
ден в табл. 2.  
Таким образом, для имеющихся трех водпостов у нас доступны:  
метеорологические признаки, такие как температура воздуха, тем-  
пература точки росы, влажность, сумма осадков, средняя скорость ветра,  
высота снежного покрова;  
гидрологические признаки: уровень воды, расход воды;  
данные по уровням грунтовых вод.  
Итого девять исходных признаков.  
Акмаев Э.Р., Романов А.В.  
93  
Таблица 2. Список исходных переменных, полученных из исходных данных,  
и их преобразование  
Table 2. Base features from raw data and the processed parameters  
Коди-  
ровка  
Физический  
смысл  
Расчетная формула  
Вход-  
ной  
признак  
at_N_h  
at  
Температура воздуха  
N часов, ºC  
1
Температура воздуха  
среднесуточная, ºC  
ꢁꢂ__ℎ  
+
+
в течение суток  
asd  
Среднесуточная высота  
снежного покрова, см  
ws _N_h  
Средняя скорость ветра  
в срок наблюдения  
(каждые h часов), м/с  
1
awspd  
Среднесуточная  
скорость ветра, м/с  
ꢄꢅ__ℎ  
+
в течение суток  
dpt_N_h  
dpt  
Температура точки росы  
в срок наблюдения, ºC  
Среднесуточная  
температура точки росы,  
ºC  
1
ꢆꢇꢂ__ℎ  
+
в течение суток  
ps_N_h  
Сумма осадков за пе-  
риод между сроками  
h часов, мм  
+
psbd  
Сумма осадков за сутки,  
мм  
1
ꢇꢅ__ℎ  
в течение суток  
rhp_N_h  
Относительная  
влажность в срок  
наблюдения (h часов), %  
rhp  
Среднесуточная влаж-  
ность, от 0.0 до 1.0  
1
ꢈꢉꢊ_ℎꢋꢌ__ℎ  
+
+
ꢀ ∙ 100  
в течение суток  
flow  
Среднесуточный расход  
воды, в м3/сек  
level  
Среднесуточный  
уровень воды, см,  
над нулем графика  
водпоста  
+
+
Уровни грунтовых вод,  
см  
gw_level*  
Примечание. М количество показаний.  
*Значения уровней грунтовых вод использовались в качестве  
эксперимента для оценки оправдываемости их применимости.  
94  
Гидрометеорологические прогнозы, математическое моделирование  
2.3. Подготовка исходных данных  
Подготовка каждой группы данных включала:  
1) приведение данных к единому временному масштабу путем агрега-  
ции, учитывая различную частоту исходных измерений;  
2) интерполяцию для заполнения пропусков и создания непрерывного  
ряда данных;  
3) объединение гидрологических и метеорологических признаков.  
Для приведения к единому временному масштабу данные агрегирова-  
лись по дню с последующим усреднением для всех исходных признаков,  
кроме осадков показания последних суммировались в течение суток. В  
качестве интерполяции использовался метод кубической интерполяции,  
сохраняющий монотонность данных. Для объединения гидро- и метеоро-  
логических признаков данные группировались по дню с усреднением ха-  
рактеристик в случае соответствия нескольких метеостанций одному вод-  
посту.  
Нельзя не отметить необходимость чистки исходных данных. Анализ  
используемой выборки выявил наличие аномальных примеров, которые  
характеризуются несогласованностью между различными показателями,  
например, между уровнями и накопленными осадками и снежным покро-  
вом, что указывает на необходимость расширения набора учитываемых пе-  
ременных для более полного описания исследуемых процессов. Количе-  
ство выявленных аномалий не превышало 5 случаев для каждого из трех  
пунктов, при этом общая длина ряда наблюдений составляла не менее  
28 лет для каждого пункта. Подобных аномалий для каждого из трех пунк-  
тов набиралось до пяти, тем не менее суммарная выборка составляла не  
менее 28 лет.  
2.4. Разработка признаков  
Существенное значение для качества прогноза имеет расширение  
набора входных переменных путем разработки дополнительных призна-  
ков, которые представлены в табл. 3.  
Введенными временными признаками послужили тригонометриче-  
ские разложения временного шага (дня), в то время как накопительными  
послужили кумулятивные суммы осадков и уровней воды, начинающиеся  
с 1 июля каждого года.  
3. Методология  
3.1. Сбор и подготовка данных  
Все исходные данные для проведения численных экспериментов были  
представлены ФГБУ «Уральское УГМС» и ФГБУ «Гидрометцентр Рос-  
сии». Описание данных, использовавшихся в этой работе, соответствует  
описанию, приведенному в [4].  
Акмаев Э.Р., Романов А.В.  
95  
В целях расширения возможностей использования метода глубокого  
обучения в работе сделана попытка реализовать эту модель с использова-  
нием данных об уровне грунтовых вод. Принципиальным моментом в дан-  
ном случае является тот факт, что погрешность измерения уровня грунто-  
вых вод сравнима только с погрешностью измерения уровня воды на  
водпостах (± 0.07 м) [1]. Это обстоятельство имеет решающее значение, так  
как погрешность измерения всех остальных гидрологических характери-  
стик, которые мы наблюдаем (или рассчитываем, как в случае с расходом  
воды) большая и может достигать 20–25 %.  
Таблица 3. Список дополнительно введенных переменных  
Table 3. Derived features  
Кодировка  
Расчетная формула  
Входной  
признак  
Взятие месяца из текущей даты  
sin(2*pi*month/12)  
+
+
month  
month_x  
month_y  
day  
cos(2*pi*month/12)  
Взятие дня из текущей даты с начала текущего  
года  
+
+
sin(2*pi*day/365) | sin(2*pi*day/366),  
отсчет начинается от 01.07 каждого года  
cos(2*pi*day/365) | cos(2*pi*day/366)  
day_x  
day_y  
отсчет начинается от 01.07 каждого года  
cumsum_precip  
ꢍꢇ= psbdꢏ  
ꢏ=1  
где (ꢍꢇ) кумулятивная сумма осадков на мо-  
мент времени , а psbdзначение переменной  
psbd на временном шаге .  
+
[
(
)]  
Период расчета ꢐ ∈ 01.07. , 01.07. + 1 ,  
где год начала расчета, дата в формате  
[день.месяц.год]  
cumsum_level  
ꢍꢊ= levelꢏ  
ꢏ=1  
где (ꢍꢊ) кумулятивная сумма уровней воды на  
момент времени , а levelзначение перемен-  
ной level на временном шаге .  
+
[
(
)]  
Период расчета ꢐ ∈ 01.07. , 01.07. + 1 ,  
где год начала расчета, дата в формате  
[день.месяц.год]  
96  
Гидрометеорологические прогнозы, математическое моделирование  
Следует отметить, что подавляющая часть данных наблюдений об  
уровнях грунтовых вод в 80-х годах XX века перешли в ведение сначала  
Министерства геологии СССР, а позднее в Роснедра. Изменение системы  
доступа к этим данным наблюдений привело к реальной потере глубокого  
интереса их использования при разработке современных моделей процес-  
сов формирования речного стока для гидрологических прогнозов.  
В рамках данной работы по официальному запросу в ФГБУ «Гидро-  
спецгеология» получена исходная информацию по уровням грунтовых вод  
для пунктов, располагающихся в непосредственной близости от рассмат-  
риваемых водпостов р. Исеть (рис. 1).  
Рис. 1. Схема расположения пунктов государственной наблюдательной сети  
с естественным и слабонарушенным режимом подземных вод (масштаб  
1:2 000 000).  
Fig. 1. Locations of national monitoring sites with natural and quasi-natural ground-  
water regime (scale 1:2 000 000).  
Акмаев Э.Р., Романов А.В.  
97  
3.2. Архитектура модели глубокого обучения  
При проведении исследований в качестве ключевого алгоритма была  
выбрана модель, реализующая архитектуру N-HiTS [6]. Несмотря на гиб-  
кость модели TFT в работе с различной природы входными данными,  
используемой в предыдущем исследовании на тех же водосборах, методо-  
логия настоящей работы включает применение блочных структур, базиру-  
ющихся на многослойных перцептронах (MLP). Так, в модели TFT транс-  
формер задействуется исключительно для агрегации признаков, тогда как  
их экстракция осуществляется посредством рекуррентных нейронных се-  
тей, а именно с помощью LSTM блоков и блоков, аналогичных MLP. Более  
того, N-HiTS показывает результаты не хуже, чем архитектуры на основе  
трансформеров, такие как Autoformer, Informer и т. д., на классических да-  
тасетах вроде ETTm2, Weather [6]. В то время как более простое строение  
по сравнению с моделью TFT может способствовать снижению чувстви-  
тельности модели к выбору гиперпараметров и улучшению масштабируе-  
мости модели.  
В архитектуре N-HiTS входные данные проходят через последователь-  
ность стеков, где каждый стек специализируется на своем уровне абстрак-  
ции данных, при этом внутри блока (составляющей стека) происходит по-  
степенное уменьшение размера через слои пулинга  
)
( = MaxPool .  
( )  
(
3.1  
)
Затем мы получаем скрытое представление через несколько подряд  
идущих полносвязных слоев вместе с функциями активации, закрепленной  
за каждым слоем  
= MLP( ),  
(
3.2  
)
которое используется для получения значений параметров для обратного  
(backcast) θи прямого (forecast) θпрогнозов  
(
)
)
θ= ꢖ ℎ + ꢔ  
3.3ꢁ  
(
θ= ꢖ ℎ + ,  
3.3ꢗ  
последующая интерполяция для восстановления исходных размерностей:  
(
)
)
= interpolateθ, ꢏꢙꢓꢚꢎ,  
3.4ꢁ  
(
= interpolateθ, ꢛꢚꢎꢓꢚꢎ,  
3.4ꢗ  
где  
тензор  
входных  
данных  
размерности  
[ꢗꢁꢂꢜℎ_ꢅꢐꢝꢉ, ꢏꢙꢓꢚꢎ, ꢞꢉꢁꢂꢋꢈꢉꢅ_ꢟꢋꢌ]; ꢀꢘꢠ связка полносвязных слоев  
(многослойный перцептрон) вместе со слоями нормализации батча  
и дропаутом; и веса и смещение линейного слоя для получения  
98  
Гидрометеорологические прогнозы, математическое моделирование  
параметров для backcast (обратного прогноза); и аналогичные ком-  
поненты для получения параметров для forecast (прямого прогноза); –  
тензор обратного прогноза; тензор прямого прогноз; ꢐꢟꢂꢉꢈꢇꢡꢊꢁꢂꢉ слой  
интерполяции (использовалась линейная); ꢏꢙꢓꢚꢎ длина входного времен-  
ного ряда; ꢛꢚꢎꢓꢚꢎ длина выходного временного ряда.  
В каждом стеке входные данные сначала проходят через один или не-  
сколько блоков последовательно. Перед этим инициализируется началь-  
ный прогноз, который является тензором, заполненным нулями  
( )  
3.5  
ꢣꢎꢤꢥꢦ  
= 0.  
Каждый блок генерирует обратный прогноз (backcast) и прямой про-  
гноз (forecast). Обратный прогноз вычитается из входных данных, создавая  
остаток, который передаетс7я следующему блоку, а в конечном счете и  
следующему стеку, позволяя последующим структурным компонентам со-  
средоточиться на еще необработанных аспектах временного ряда. То есть  
для каждого блока в стеке имеем  
(
)
( )  
для ꢐ = 1. . : { , = Block,  
ꢣꢎꢤꢥꢦ  
= ꢢ  
+ ,  
ꢣꢎꢤꢥꢦ  
(
(
)
)
ꢏ+1 = },  
3.6  
ꢣꢎꢤꢥꢦ = .  
3.7  
Прямые прогнозы блоков суммируются в рамках стека, в то время как  
входные данные для каждого последующего блока внутри этого стека  
уменьшаются на значение обратного прогноза, а затем все прогнозы стеков  
складываются для получения финального результата  
= � ꢢ( )  
,
( )  
3.8  
ꢣꢎꢤꢥꢦ  
ꢣ=1  
где количество блоков в стеке; общее количество стеков; ꢢ  
ꢣꢎꢤꢥꢦ  
(прямой) прогноз стека; ꢣꢎꢤꢥꢦ остаток стека; тензор входных данных  
для i-го блока текущего стека; обратный прогноз i-го блока текущего  
стека; прямой прогноз i-го блока текущего стека.  
Благодаря такой архитектуре каждый последующий стек работает с  
все более очищенными, гранулированными данными, а интерполяция по-  
могает восстановить сигнал после сжатия, которое образуется в результате  
операций пулинга, обеспечивая эффективную обработку временных рядов  
на разных масштабах. Данный процесс представлен на рис. 2.  
На рис. 3 представлена демонстрация прогноза, полученного с помо-  
щью этой модели.  
Акмаев Э.Р., Романов А.В.  
99  
Рис. 2. Упрощенная архитектура используемой модели N-HiTS. Слева изоб-  
ражена структура стека и блока, справа представление «в общем». Выходы  
каждого блока становятся входами для каждого последующего блока и итого-  
вым результатом является сумма прямых прогнозов каждого стека.  
Fig. 2. Simplified N-HiTS model architecture. Stack and block structure (left) and  
generalized representation (right) of the model. Block outputs serve as inputs for  
subsequent blocks, with the final prediction being the sum of direct forecasts from  
each stack.  
100  
Гидрометеорологические прогнозы, математическое моделирование  
Рис. 3. Пример работы модели: прогноз гидрографа для Шадринска за 2018  
год. По осям координат: Date дата, Water level (cm) уровень воды (в см).  
Обозначения: Input data входные данные, Prediction предсказанные зна-  
чения, Actual values фактические значения.  
Fig. 3. Model forecast example for 2018, Shadrinsk case. Axes: Date and Water  
level (cm). Legend: Input data, Prediction values, and Actual values.  
3.3. Выбор гиперпараметров  
В табл. 4 представлены параметры конфигурации модели, полученные  
в результате численных экспериментов, которые показали наилучшую эф-  
фективность в рамках текущей задачи.  
Таблица 4. Параметры архитектуры используемой модели  
Table 4. Model architecture parameters  
Наименование  
Значение  
Описание  
Количество стеков  
stacks_num  
4
2
2
blocks_num  
Количество блоков внутри одного стека  
mlp_layers_num  
Количество полносвязных слоев внутри од-  
ного блока  
layers_width  
dropout  
352  
Размер скрытого пространства  
Значение дропаута  
0.03  
activation  
input_len  
output_len  
LeakyReLU  
180  
Выбор функции активации  
Длина входных временных рядов  
Длина выходного временного ряда  
90  
Акмаев Э.Р., Романов А.В.  
101  
Также было экспериментально установлено, что наиболее оптималь-  
ной датой начала прогноза является 15 марта каждого года. Дополнительно  
использовалось линейное уменьшение параметра скорости обучения. Ги-  
перпараметры обучения представлены в табл. 5.  
Таблица 5. Гиперпараметры обучения  
Table 5. Training hyperparameters  
Наименование  
Значение  
Adam  
Описание  
optim  
Оптимизатор  
epochs_num  
loss_function  
batch_size  
lr  
60  
Количество эпох.  
MSE  
256  
Функция потерь. Использовалась MSE  
Размер батча  
0.001  
0.0005  
Параметр скорости обучения  
gamma  
Финальный множитель начальной скоро-  
сти обучения lr, к которому сводится значе-  
ние последней на последней эпохе как  
ꢊꢈ  
ꢕꢏꢙꢤꢬ  
= ꢊꢈ ∗ ꢭꢁꢌꢌꢁ  
grad_clip  
3.5  
Граница нормы градиентов  
weight_decay  
0.000005  
Коэффициент L2-регуляризации  
4. Проведение экспериментов  
4.1. Временные границы  
В данном эксперименте использовались временные ряды с 1990 по  
2023 год включительно.  
4.2. Валидация  
В качестве валидационного периода фиксировался временной проме-  
жуток с 2018 по 2022 год протяженностью в 5 лет. Использовавшаяся мет-  
рика оценки описана в разделе 4.4 «Метрики оценки» формула 4.1.  
4.3. Кросс-валидация  
Для более справедливой оценки применимости разработанных мето-  
дов была дополнительно проведена кросс-валидация с окном ꢄꢐꢟꢆꢡꢄꢣꢏꢮꢯ  
,
равным 5 годам, и пересечением intersection, равным 2 годам. Для каждого  
эксперимента:  
фиксируется валидационный интервал начиная с 0 года и до 1 =  
0 + ꢄꢐꢟꢆꢡꢄ_ꢅꢐꢝꢉ;  
собираются метрики на каждом из подобных интервалов;  
102  
Гидрометеорологические прогнозы, математическое моделирование  
происходит смещение на величину ꢐꢟꢂꢉꢈꢅꢉꢜꢂꢐꢡꢟ = 2 года вправо и  
повторяется эксперимент.  
Так как при таком подходе неизбежно появляются дубликаты из-за  
наличия пересечения, среди экспериментов для одного и того же года и  
региона выбирается наилучший результат значения критерия. Процесс  
кросс-валидации графически представлен на рис. 4.  
Рис. 4. Графическое представление кросс-валидации. Эксп. {i} обозначает  
�����  
эксперимент i, где = 1, , N общее количество экспериментов.  
Fig.4. Cross-validation scheme. Exp. {i} denotes an experiment i, where = 1, ꢃ  
�����  
and N is the total number of experiments  
4.4. Критерии оценки  
В этом исследовании использовались следующие критерии оценки:  
1) отношение Δ разницы предсказанного и фактического максимумов  
к некоторой фиксированной константе, задаваемой для каждого водпоста  
для валидационного периода;  
2) отношение (S/σ) среднеквадратичной погрешности поверочных про-  
гнозов к среднеквадратичной ошибке всего рассматриваемого временного  
промежутка для проведения кросс-валидации.  
В случае оценки на валидации использовалась метрика  
ꢁꢗꢅ maxmax  
=  
,
( )  
4.1  
доп  
где водпост; год; временной ряд фактических значений;  
временной ряд прогнозных; доп фиксированная константа для  
Акмаев Э.Р., Романов А.В.  
103  
каждого водпоста , которая может быть интерпретирована как макси-  
мально допустимая абсолютная разница между максимальным прогноз-  
ным значением и максимальным фактическим в пределах рассматривае-  
мого горизонта прогноза.  
Для оценки оправдываемости использовались следующие отношения:  
Δji [0, 0.4) – отлично;  
Δji [0.4, 0.7) – хорошо;  
Δji [0.7, 1.0) – удовлетворительно;  
Δji [1.0, +∞) неудовлетворительно.  
В частности, при подсчете оправдываемости на валидационной вы-  
борке проверялось неравенство Δji < 1 для каждой пары («год», «вод-  
пост»).  
В случае кросс-валидации критерием оценки выступало отношение  
S/σ, при этом S средняя квадратичная погрешность поверочных прогно-  
зов, вычисляемая по формуле  
ꢏ=1  
2
( )  
�  
( )  
4.2  
=  
,
ꢟ − 1  
где σ средняя квадратичная ошибка, посчитанная для n лет; , соот-  
ветствующие значения реальных и предсказанных значений. Сама интер-  
претация достаточно тривиальна: разброс прогнозов самого метода не дол-  
жен приближаться к среднеквадратичной, иначе его применение  
нецелесообразно. Считается, что применение методики целесообразно,  
если S/σ не более 0.80 [5].  
5. Обсуждение и результаты  
5.1. Валидация  
В данном исследовании проводилась оценка метода прогноза с за-  
благовременностью в 90 суток. Результаты оправдываемости по сравне-  
нию с ранее использованным методом предоставлены на рис. 5.  
Анализ результатов показывает, что модель N-HiTS достигает уровня  
точности не ниже, чем лучшие показатели из предыдущих конфигураций  
TFT для обоих горизонтов прогнозирования. Примечательно, что ранее для  
разных водпостов оптимальная заблаговременность различалась. В частно-  
сти, для Катайска была оптимальна модель с заблаговременностью 60 су-  
ток, в то время как для Мехонского 90 суток. Предложенный способ де-  
монстрирует результаты лучшие, чем любой из ранее используемых  
подходов при максимальной заблаговременности для всех исследуемых  
водпостов.  
104  
Гидрометеорологические прогнозы, математическое моделирование  
Рис. 5. Сравнение оправдываемости прогнозов моделей N-HiTS (заблаго-  
временность 90 суток, синий) и TFT (заблаговременности 60 и 90 суток, зе-  
леный и желтый соответственно) по критерию Δ для валидационного пери-  
ода. По оси ординат доля прогнозов с соотношением (4.1) менее 1, по оси  
абсцисс водпосты. Более высокие значения соответствуют лучшей оправ-  
дываемости. N-HiTS демонстрирует наилучшие результаты для всех слу-  
чаев.  
Fig. 5. Model performance comparison between N-HiTS (90-day lead time, blue)  
and TFT (60 and 90-day lead times, green and yellow respectively) using Δ crite-  
rion for validation period. Y-axis: proportion of successful forecasts (ratio (4.1)  
< 1); X-axis: gauging stations. Higher values indicate better performance, with  
N-HiTS showing superior results for all cases.  
5.2. Кросс-валидация  
Для кросс-валидации была выбрана модель, обеспечивающая  
наибольшую эффективность – N-HiTS с горизонтом прогноза в 90 суток. В  
результате кросс-валидации для каждого года в выборке имеем значения  
максимального фактического и максимального предсказанного уровней в  
пределах рассматриваемого горизонта прогноза, которое можно предста-  
вить в виде временного ряда, как показано на рис. 6.  
Усредненные результаты по каждому отношению S/σ приведены на  
рис. 7.  
5.3. Влияние использования данных грунтовых вод  
Несмотря на наличие исследований о предсказании непосредственно  
самих уровней грунтовых вод [8], в работе выполнен анализ учета данных  
на подземных скважинах в рамках разработанного метода прогноза макси-  
мального уровня воды. Результаты расчетов показывают, что использова-  
ние таких данных наблюдений позволяет снизить отношение S/σ для кросс-  
валидации по водпосту Шадринск на 0.2 (рис. 8), что существенно улуч-  
шает качество разработанного метода прогноза.  
Акмаев Э.Р., Романов А.В.  
105  
Рис. 6. Сопоставление фактического и предсказанного максимальных  
уровней на примере Шадринска, “real” фактичиеский, “pred” предсказан-  
ный. Рассматриваемый горизонт прогноза составляет 90 временных шагов  
(суток) и отсчитывается с 15 марта каждого года, внутри которого выбира-  
ются максимумы среди фактических и предсказанных значений. По оси  
абсцисс рассматриваемый год, по оси ординат уровень воды (в см.)  
Fig. 6. Comparison of observed and predicted water level values for Shadrinsk  
('real' and 'pred' respectively). Forecast horizon is 90 timesteps (days) starting  
from March 15 each year, with maxima selected from both observed and pre-  
dicted values within this period. X-axis: year; Y-axis: maximum water level (cm)  
Рис. 7. Значения отношения S/σ для кросс-валидации. Чем ниже, тем лучше.  
Результаты на каждом из исследуемых водосборов удовлетворяет критерию  
эффективности применения методики.  
Fig. 7. Cross-validation S/σ ratio values. Lower values indicate better perfor-  
mance. Results for all studied catchments meet the forecast verification criteria.  
106  
Гидрометеорологические прогнозы, математическое моделирование  
Рис. 8. Значения отношения S/σ для кросс-валидации с использованием дан-  
ных уровней грунтовых вод. В случае Шадринска получается понижение мет-  
рики на 30 %. В остальных случаях статистически значимого эффекта обна-  
ружено не было.  
Fig. 8. Cross-validation S/σ ratio values using groundwater level data. For  
Shadrinsk, the metric decreased by 30 %. No statistically significant effect was  
observed in other cases.  
Использование данных по уровням грунтовых вод показало улучше-  
ние в 1/3 случаев. Для более глубокого анализа влияния использования  
данных наблюдений за уровнем грунтовых вод необходимо существенно  
расширить это исследование по большему числу водных объектов.  
5.4. Перспективы применения и ограничения метода  
Разработанный метод демонстрирует значительный потенциал, позво-  
ляя моделировать временной ряд длиной в 90 суток, а относительная гиб-  
кость архитектуры позволяет адаптировать модель под различные времен-  
ные признаки и временные масштабы. Добавление новых источников  
данных, как, например, в случае с уровнями грунтовых вод, способно улуч-  
шить показатели эффективности, при этом не требуется существенных из-  
менений модели.  
Необходимо отметить, что при реализации данного метода нужно учи-  
тывать определенные ограничения по исходным данным. Прежде всего  
это: 1) требования к качеству входных данных и 2) определенные трудно-  
сти с использованием данного подхода при реализации валидации. В то же  
Акмаев Э.Р., Романов А.В.  
107  
время указанные ограничения носят достаточно общий характер практиче-  
ски во всех численных методах, использующих гидрометеорологические  
данные наблюдений.  
Заключение  
В результате выполненного исследования была проведена комплекс-  
ная оценка разработанного метода долгосрочного прогноза максимального  
уровня воды с использованием глубокого обучения на примере нескольких  
водпостов р. Исеть. Была проведена оценка перехода на новую архитек-  
туру N-HiTS, которая позволила увеличить оправдываемость на валидаци-  
онной выборке по сравнению с архитектурой TFT. Результаты работы по-  
казали, что метод удовлетворяет критерию S/σ при валидации на  
независимых выборках посредством кросс-валидации. В ходе валидации  
новая модель показала существенное улучшение оправдываемости прогно-  
зов по сравнению с предшествующим аналогом на всех анализируемых  
водпостах.  
Дополнительно в рамках данной работы была проведена оценка эф-  
фективности использования данных грунтовых вод для долгосрочного про-  
гноза максимального уровня воды. Анализ результатов демонстрирует по-  
ложительную динамику в одной трети случаев, что может быть вызвано  
недостаточным количеством водных объектов. Данное обстоятельство ука-  
зывает на необходимость дальнейшего исследования и расширения коли-  
чества анализируемых водосборов для повышения статистической значи-  
мости результатов.  
Учитывая результаты настоящей работы, можно утверждать, что при-  
менение методов глубокого обучения в задаче прогноза уровней воды  
имеет значительные перспективы. Дальнейшие исследования целесооб-  
разно направить на расширение исследуемых водосборов, а также приме-  
нение методов глубокого обучения для разработки методов прогнозов  
водного режима различной заблаговременности (краткосрочные и средне-  
срочные).  
Авторы выражают благодарность сотрудникам кафедры Прикладной  
математики № 31 НИЯУ МИФИ за ценные замечания при рассмотрении  
данной работы на семинаре кафедры 23 сентября 2024 года.  
Список литературы  
1. Постановление Правительства РФ от 16 ноября 2020 г. №1847 "Об утверждении  
перечня измерений, относящихся к сфере государственного регулирования обеспечения  
единства измерений" (пункт 9.25).  
2. Ресурсы поверхностных вод СССР: Гидрологическая изученность. Т. 11. Средний  
Урал и Приуралье. Вып. 2. Тобол / под ред. В.В. Николаенко. Л.: Гидрометеоиздат, 1965.  
214 c.  
3. Романов А.В. Дорожная карта современных гидрологических прогнозов водного ре-  
жим // Метеорология и гидрология. 2023. № 12. С. 12-26.  
108  
Гидрометеорологические прогнозы, математическое моделирование  
4. Романов А.В., Акмаев Э.Р., Червоненкис М.А. Глубокие нейронные сети архитек-  
туры трансформер в задачах гидрологических прогнозов // Гидрометеорологические иссле-  
дования и прогнозы. 2023. № 2 (388). С. 138-155.  
5. Бефани Н.Ф., Калинин Г.П. Упражнения и методические разработки по гидрологи-  
ческим прогнозам. Л.: Гидрометеоиздат, 1983. C. 390.  
6. Challu C. et al. Nhits: Neural hierarchical interpolation for time series forecasting // Pro-  
ceedings of the AAAI conference on artificial intelligence. 2023. Vol. 37, no. 6. P. 6989-6997.  
7. Devia G.K., Ganasri B.P., Dwarakish G.S. A REVIEW ON HYDROLOGICAL MOD-  
ELS // Aquatic Рrocedia. 2015. Vol. 4. P. 1001-1007. http://dx.doi.org/10.1016/  
8. Khan J. et al. A comprehensive review of conventional, machine leaning, and deep learn-  
ing models for groundwater level (GWL) forecasting // Applied Sciences. 2023. Vol. 13, no. 4.  
P. 2743.  
9. Kratzert F. et al. Toward improved predictions in ungauged basins: Exploiting the power  
of machine learning // Water Resources Research. 2019. Vol. 55, no. 12. P. 11344-11354.  
References  
1. Postanovlenie Pravitel'stva RF ot 16 noyabrya 2020 g. №1847 "Ob utverzhdenii perechnya  
izmereniy, otnosyashchihsya k sfere gosudarstvennogo regulirovaniya obespecheniya edinstva iz-  
mereniy" (punkt 9.25) [in Russ.].  
2. Resursy poverhnostnyh vod SSSR: Gidrologicheskaya izuchennost'. T. 11. Sredniy Ural i  
Priural'e. Vyp. 2. Tobol / pod red. V.V. Nikolaenko. Leningrad, Gidrometeoizdat publ., 1965,  
214 p. [in Russ.].  
3. Romanov A.V. A Roadmap of Modern Hydrological Forecasts of Water Regime. Meteor-  
ologiya i Gidrologiya [Russ. Meteorol. Hydrol.], 2023, no. 12, pp. 12-26 [in Russ.].  
4. Romanov A.V., Akmaev E.R., Chervonenkis M.A. Deep neural networks of transformer  
architecture in problems of hydrological forecasts. Gidrometeorologicheskie issledovaniya i  
prognozy [Hydrometeorological Research and Forecasting], 2023, vol. 388, no. 2, pp. 138-155  
[in Russ.].  
5. Befani N.F., Kalinin G.P. Uprazhneniya i metodicheskie razrabotki po gidrologicheskim  
prognozam. Leningrad, Gidrometeoizdat publ., 1983, 390 p. [in Russ.].  
6. Challu C. et al. Nhits: Neural hierarchical interpolation for time series forecasting. Pro-  
ceedings of the AAAI conference on artificial intelligence. 2023, vol. 37, no. 6, pp. 6989-6997.  
7. Devia G.K., Ganasri B.P., Dwarakish G.S. A review on hydrological models. Aquatic  
Рrocedia, 2015, vol. 4, pp. 1001-1007. DOI: 10.1016/j.aqpro.2015.02.126.  
8. Khan J. et al. A comprehensive review of conventional, machine leaning, and deep learn-  
ing models for groundwater level (GWL) forecasting. Applied Sciences, 2023, vol. 13, no. 4,  
рр. 2743.  
9. Kratzert F. et al. Toward improved predictions in ungauged basins: Exploiting the power  
of machine learning. Water Resources Research, 2019, vol. 55, no. 12, pp. 11344-11354.  
Поступила 06.11.2024; одобрена после рецензирования 02.12.2024;  
принята в печать 10.10.2024.  
Submitted 06.11.2024; approved after reviewing 02.12.2024;  
accepted for publication 10.10.2024.