Гидрометеорологические исследования и прогнозы. 2025. 3 (397). С. 77-91  
77  
УДК 551.509.3+004.032.26  
Применение измерений напряженности  
электрического поля атмосферы и методов машинного  
обучения в прогнозировании суточных сумм осадков  
в летние месяцы в городе Нальчик  
А.М. Беккиев, И.Х. Машуков, В.А. Шаповалов  
Высокогорный геофизический институт,  
Кабардино-Балкарская Республика , г. Нальчик, Россия  
Рассматривается актуальная задача краткосрочного прогнозирования суточных  
атмосферных осадков с использованием метеорологической информации и данных,  
полученных на основе измерений напряженности электрического поля атмосферы,  
но без привлечения данных о прошлых значениях осадков. Проведенные исследова-  
ния показали высокую эффективность применения искусственного интеллекта в ре-  
шении поставленной задачи, в частности, таких методов машинного обучения, как  
модели градиентного бустинга, деревья решений, нейронные сети. Данные для ис-  
следования за период с 2020 по 2025 год получены с метеостанции Нальчик (Россия,  
WMO ID 37212) и измерителя напряженности электрического поля EFM-100 уста-  
новленного на крыше здания ФГБУ «ВГИ».  
Ключевые слова: прогноз атмосферных осадков, машинное обучение, градиент-  
ный бустинг, деревья решений, нейронные сети, временные ряды, метеорологические  
данные, спектральный анализ, вейвлет-анализ  
Application of atmospheric electric field  
strength measurements and machine learning methods  
in predicting daily precipitation in the summer months:  
A case study for the city of Nalchik  
A.M. Bekkiev, I.K. Mashukov, V.A. Shapovalov  
High-Mountain Geophysical Institute,  
The paper considers a relevant problem of short-term forecasting of daily precipitation  
using meteorological information and data obtained from measurements of the electric field  
strength of the atmosphere, but without involving data on past precipitation values. The  
studies showed high efficiency of applying artificial intelligence in solving the problem, in  
particular, machine learning methods such as gradient boosting models, decision trees, and  
neural networks. The data for the study over the period from 2020 to 2025 were obtained  
from the Nalchik weather station (Russia, WMO ID 37212) and the EFM-100 electric field  
strength meter installed on the roof of the High-Mountain Geophysical Institute building.  
Keywords: precipitation forecast, machine learning, gradient boosting, decision trees,  
neural networks, time series, meteorological data, spectral analysis, wavelet analysis  
78  
Гидрометеорологические прогнозы, математическое моделирование  
Введение  
Прогнозирование атмосферных осадков критически важно для различ-  
ных отраслей экономики, таких как авиация, сельское хозяйство, городская  
инфраструктура [9], а также для безопасности жизнедеятельности. Можно  
утверждать, что прогноз осадков является одной из ключевых задач метео-  
рологии, имеющей важное значение для управления водными ресурсами  
[2, 7], например, при прогнозировании стока горных рек, предупреждении  
и защите от стихийных бедствий, вызванных гидрологическими опасными  
явлениями и их последствиями [4, 8)], а также для системы мониторинга и  
прогнозирования лесных пожаров [10]. Согласно последнему докладу  
Межправительственной группы экспертов по изменению климата (IPCC),  
наблюдается увеличение интенсивности и частоты экстремальных осадков,  
что связано с повышением температуры и увеличением содержания влаги  
в атмосфере. Это приводит к более частым и интенсивным ливням, навод-  
нениям и другим опасным погодным явлениям, что требует более точной  
и своевременной информации о возможности их возникновения.  
Традиционные методы прогнозирования осадков ‒ это статистические  
модели и численные модели погоды, основанные на математических моде-  
лях атмосферы, радиолокационных и спутниковых данных, они требуют  
значительных вычислительных ресурсов и сталкиваются с трудностями в  
точном прогнозировании осадков из-за сложности атмосферных процессов  
и ограничений в разрешающей способности моделей [11, 18]. Кроме того,  
недостаточная плотность наблюдательной сети, особенно в развиваю-  
щихся странах, таких как страны Африки, усугубляет проблему. Современ-  
ные подходы, использующие методы машинного обучения, позволяют об-  
рабатывать большие объемы данных и выявлять сложные зависимости  
между метеорологическими параметрами и осадками [15, 19]. Например,  
глубокие нейронные сети успешно применяются для краткосрочного и  
среднесрочного прогнозирования, обеспечивая более высокую точность по  
сравнению с традиционными методами [16]. Модель DGMR от компании  
DeepMind, при тех же требованиях к данным, что и модель среднесрочного  
метеорологического прогноза от Европейского центра среднесрочных про-  
гнозов погоды (ECMWF), превосходит существующие методы в прогнози-  
ровании осадков на ближайшие часы.  
При этом выполняемые в последнее время исследования демонстри-  
руют широкий спектр методологических подходов ‒ от классических  
статистических методов и Фурье-анализа до передовых алгоритмов ма-  
шинного обучения и гибридных моделей, что свидетельствует о неослабе-  
вающем спросе на такие прогнозы по различным исходным данным. Так,  
в [6] показано, что комбинированное применение фрактального анализа и  
Фурье-преобразования позволяет эффективно выделять периодические  
компоненты метеорологических рядов для прогнозирования температуры  
и осадков, что даёт прочную математическую основу для дальнейших ис-  
следований. Классические модели временных рядов, такие как ARIMA,  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
79  
в сочетании с анализом трендов также успешно используются для прогноза  
осадков, о чем свидетельствует работа [12] по региону Вади-Шуэйб в Иор-  
дании.  
Среди методов машинного обучения значимое внимание уделяется  
многослойным нейронным сетям, градиентному бустингу и автоэнкоде-  
рам. Например, в [21] продемонстрировано, что нейросетевые модели, обу-  
ченные на многомасштабных данных, существенно повышают точность  
прогноза суточных осадков в тропическом климате Шри-Ланки. В [13] ис-  
пользовался метод градиентного бустинга XGBoost для корректировки  
ошибок численных моделей ECMWF, тем самым было поучено улучшение  
краткосрочного прогноза осадков в различных регионах Китая. Предло-  
женный в [17] сезонно-интегрированный автоэнкодер показал высокую  
устойчивость при краткосрочном прогнозе ежедневных осадков за счёт не-  
линейного сжатия признаков. Гибридные подходы, объединяющие данные  
радиолокационные и дистанционного зондирования с алгоритмами ма-  
шинного обучения, были успешно апробированы в [14, 20].  
Несмотря на эти достижения, в литературе остаётся недостаточно про-  
работанным использование данных измерений напряжённости электриче-  
ского поля атмосферы в сочетании со стандартными метеорологическими  
параметрами, как то приземные температура, давление, влажность. В кон-  
тексте прогнозирования селевой опасности с учетом данных о атмосфер-  
ных осадках авторами [1] акцентировано внимание на фоновых методах с  
учётом электрического поля, показана перспективность включения элек-  
трических параметров при вероятностном прогнозировании экстремаль-  
ных осадков.  
Региональная специфика Северного Кавказа и прилегающих террито-  
рий требует учёта локальных особенностей рельефа и микроклимата. Так,  
в [3] выявлены тенденции смещения максимумов ливневой и грозовой ак-  
тивности на Северном Кавказе, что обусловлено сложным взаимодей-  
ствием атмосферных процессов и топографических факторов. В работе [5]  
продемонстрировано, что нейросетевые модели с учётом региональных  
данных позволяют улучшить точность прогноза в Крымском регионе, что  
свидетельствует о важности адаптации алгоритмов к локальным условиям.  
Между тем для Северного Кавказа, особенно в горных и предгорных реги-  
онах, целостный подход, объединяющий методы машинного обучения и  
метеорологические данные с учётом уникальных электрофизических ха-  
рактеристик атмосферы, может иметь перспективы для прогноза осадков,  
включая диагностику типов осадков и количественное прогнозирование.  
Таким образом, предлагаемое исследование фокусируется на разра-  
ботке гибридной модели, которая объединит непрерывные измерения  
напряжённости электрического поля атмосферы и современные методы  
машинного обучения для прогноза суточных сумм осадков в летний период  
на примере одного наблюдательного пункта. Интеграция электрофизиче-  
ских данных позволит учесть интегральное влияние физических механиз-  
мов конденсации и заряженности частиц в облаках, а адаптация различных  
80  
Гидрометеорологические прогнозы, математическое моделирование  
архитектур машинного обучения под локальные климатические условия  
Северного Кавказа обеспечит высокую точность и надёжность прогноза.  
Новизна данной работы заключается в комплексном использовании дан-  
ных разных типов и разработке алгоритма, способного обрабатывать раз-  
реженные и зашумленные измерения электрического поля в условиях огра-  
ниченного наблюдательного охвата.  
Поэтому, развитие и внедрение методов машинного обучения и спек-  
трального анализа в прогнозирование осадков является актуальной зада-  
чей, способствующей повышению точности прогнозов и обеспечению без-  
опасности населения, что особенно важно в условиях изменяющегося  
климата.  
Материалы и методы  
В исследовании использованы архивные данные метеорологической  
станции аэропорта Нальчик (WMO_ID=37212) за период с 2020 по 2025  
год. Первичный набор включает ежедневные измерения температуры воз-  
духа, атмосферного давления, относительной влажности, скорости и  
направления ветра, а также суточные суммы осадков. Дополнительно при-  
влекались данные о напряжённости атмосферного электрического поля ат-  
мосферы (НЭПА) c прибора измерителя EFM-100 установленного на  
крыше здания ФГБУ «ВГИ». Работа с данными и программирование моде-  
лей производились на языке высокого уровня python.  
Для повышения качества модели произведено расширение исходного  
пространства признаков. Были сформированы лаговые признаки за один,  
два и, соответственно, три предыдущих дня. Выбор временных лагов 1–3  
суток мотивирован физикой атмосферных процессов: облачные структуры  
формируются на фоне медленно эволюционирующей циклонической ак-  
тивности [6, 13], а электрическая нестабильность способна проявляться за  
несколько дней до подхода фронта. Также рассчитаны производные харак-  
теристики с использованием методов спектрального и вейвлет-анализа,  
позволяющих выделять частотные и локальные временные особенности  
сигналов. Эти признаки отражают инерционную динамику атмосферы и  
существенно увеличивают информативность модели при машинном обу-  
чении. То есть целевая переменная ‒ осадки в миллиметрах ‒ прогнозиру-  
ется на основе предшествующих значений метеорологических параметров,  
напряжённости атмосферного электрического поля и производных харак-  
теристик: среднее, максимум, минимум, асимметрия, эксцесс, коэффици-  
ент вариации, время наступления максимума и минимума, интервал между  
максимальным и минимальным значением, интеграл по времени, относи-  
тельный размах (размах отнесенный к среднему), полу-ширина пика, ско-  
рость роста до пика, количество пиков выше 75-го перцентиля, среднее рас-  
стояние между пиками, коэффициент вариации интервалов между пиками,  
энтропия распределения, межквартильный размах, автокорреляция, центр  
масс спектра, ширина спектра, спектральная энтропия, суммарная  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
81  
мощность, соотношение мощности в коротких и длинных диапазонах, до-  
минирующая частота, амплитуда доминирующей частоты, частота второго  
по величине пика, амплитуда второго по величине пика, период доминиру-  
ющей волны, энтропия распределения энергии по масштабам и др. Есть  
еще признаки, учитывающие время: например, номер месяца, номер не-  
дели в году, день недели, синус и косинус дня года. В предположении о  
наличии солнечно-земных связей для исследования рассчитывался такой  
параметр, как продолжительность светового дня.  
Обучение проводилось только на данных с мая по сентябрь каждого  
года с 2020 по 2023 (для фокусировки на тёплый сезон и уменьшения се-  
зонной дисперсии).  
Для повышения качества и воспроизводимости анализа, данные по  
напряжённости электрического поля проходили этапы предобработки,  
включающие медианную фильтрацию по окну в минуту для сглаживания  
шумов, а также восстановление малых пропусков линейной интерполя-  
цией. Балансировка классов для экстремальных осадков не производилась,  
что может влиять на чувствительность метрик при редких явлениях, однако  
именно такое распределение отражает реальные условия оперативного  
прогноза.  
Перед обучением модели все числовые признаки были масштабиро-  
ваны с использованием стандартизатора StandardScaler. Для учёта времен-  
ной структуры данных применена стратегия временной кросс-валидации  
(TimeSeriesSplit), что позволило сохранить временную непрерывность  
между обучающей и валидационной выборками. Оптимизация гиперпара-  
метров моделей проводилась с помощью библиотеки Optuna.  
Протестирован широкий спектр методов искусственного интеллекта.  
Наиболее эффективными оказались ансамблевые методы деревьев реше-  
ний (LightGBM, XGBoost, CatBoost, Random Forest) и глубокие нейронные  
сети (GRU, LSTM, CNN DR RF).  
Ансамбли деревьев решений:  
LightGBM: высокоэффективный алгоритм градиентного бустинга,  
использующий рост деревьев по листьям (leaf-wise), что ускоряет обучение  
и повышает точность;  
CatBoost: устойчивый к переобучению бустинг, обладающий  
встроенной поддержкой категориальных признаков и высокой стабильно-  
стью на разреженных данных;  
XGBoost: регуляризованный градиентный бустинг с гибкой систе-  
мой настройки и устойчивостью к переобучению;  
Random Forest: ансамбль решающих деревьев, обладающий высо-  
кой стабильностью и хорошей интерпретируемостью.  
Глубокие нейросетевые модели:  
GRU (Gated Recurrent Unit): компактная рекуррентная архитектура  
с возможностью моделирования временных зависимостей, требующая  
меньше параметров, чем LSTM;  
82  
Гидрометеорологические прогнозы, математическое моделирование  
LSTM (Long Short-Term Memory): расширенная RNN-модель с дол-  
госрочной памятью, хорошо справляющаяся с сезонными зависимостями;  
CNN DR RF (Dilated Receptive Field CNN): сверточная нейросеть с  
расширенным полем (receptive field) за счёт растущих коэффициентов  
«конволюции с отверстиями» (dilation rate). Позволяет эффективно выяв-  
лять паттерны в временных рядах на различных масштабах.  
Обучение производилось на основе скользящего окна фиксированной  
длины (look-back), с прогнозом целевой переменной (осадков) на следую-  
щий день.  
Ансамблевые методы деревьев решений LightGBM, CatBoost,  
XGBoost и Random Forest были реализованы с использованием стандарт-  
ных API библиотек lightgbm, catboost, xgboost и scikit-learn. В качестве це-  
левой функции, где не указано иначе, использовалась минимизация MAE.  
Все модели обучались на табличных признаках с лагами.  
LightGBM: использован boosting type = "gbdt", рост деревьев —  
leaf-wise. Обучение ускорено за счёт histogram-based binning. Проведена  
настройка num_leaves, min_child_samples, learning_rate и feature_fraction.  
CatBoost: применена схема Ordered Boosting с автокодировкой ка-  
тегориальных признаков. Гиперпараметры ‒ depth, iterations, learning_rate,  
l2_leaf_reg.  
XGBoost: регуляризованный бустинг с параметрами gamma,  
lambda, max_depth. Использована функция потерь reg:squarederror и ранний  
останов (early_stopping_rounds).  
Random Forest: количество деревьев ‒ 500, критерий ‒ MSE. Каж-  
дое дерево обучалось на случайной подвыборке признаков  
(max_features=sqrt), использован bootstrap=True.  
Все нейросетевые архитектуры реализованы с использованием биб-  
лиотеки Keras (TensorFlow backend). Входные данные представляют собой  
тензоры формы (batch_size, sequence_length, num_features), полученные  
скользящим окном размером 3 дня.  
GRU-модель имеет два скрытых слоя с возвратом последователь-  
ностей. Последний слой GRU возвращает единственный выход, поступаю-  
щий на полносвязный выходной слой. Оптимизатор: Adam. Функция по-  
терь: MAE. Регуляризация: Dropout (0.2).  
Архитектура LSTM аналогична GRU, но использует три вентиля ‒  
входной, забывания и выходной.  
CNN DR RF ‒ эта архитектура представляет собой сверточную  
нейросеть с увеличивающимся dilation_rate, что позволяет расширять об-  
ласть восприятия без увеличения глубины модели. После трёх сверточных  
слоёв применяется нормализация, уплощение и плотный выходной слой.  
LayerNormalization стабилизирует динамику градиентов и ускоряет сходи-  
мость. Такой подход особенно эффективен для временных рядов с выра-  
женными шаблонами, где необходим захват как кратко-, так и долгосроч-  
ной зависимости.  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
83  
Оценка качества предсказаний выполнялась на периоде наблюдений  
с 2023 по 2025 год с использованием следующих метрик:  
MAE (Mean Absolute Error) ‒ средняя абсолютная ошибка;  
RMSE (Root Mean Squared Error) ‒ корень из средней квадратичной  
ошибки;  
MAPE (Mean Absolute Percentage Error) ‒ средняя абсолютная про-  
центная ошибка;  
sMAPE (Symmetric MAPE) ‒ симметричная средняя абсолютная  
процентная ошибка;  
Median RE ‒ медианная относительная ошибка.  
Для интерпретации вклада признаков в итоговое предсказание приме-  
нялся метод SHAP (SHapley Additive exPlanations), позволяющий оценить  
влияние каждого входного параметра на результат модели. Следует отме-  
тить, что метод SHAP, используемый для оценки вклада признаков, чув-  
ствителен к мультиколлинеарности и шуму в данных.  
Прогноз оценивается как по всем данным, так и по случаям с осадками  
более 3 мм, что полезно для оценки экстремальных событий.  
Таким образом, результаты предсказаний моделей оценивались по  
средним абсолютным и процентным ошибкам: MAE, RMSE, MAPE и  
sMAPE. Это позволило получить объективную картину точности прогноза  
как в абсолютном выражении, так и относительно наблюдаемых величин.  
Результаты и обсуждение  
На обучающей и валидационной выборке наибольшую точность в про-  
гнозировании суточных осадков продемонстрировала модель LightGBM,  
при этом средняя абсолютная ошибка (MAE) составила около 0,015 мм,  
средняя процентная ошибка (MAPE) порядка 1 %.  
Далее результаты прогноза оценивались на тестовом наборе выделен-  
ном в периоде наблюдений с 2023 по 2025 год и не участвовавшем ни в  
обучающей, ни в валидационной выборке.  
Сравнение результатов строится через столбчатую диаграмму (рис. 1)  
и таблицу (табл. 1), метрики оценки ‒ MAE, RMSE, MAPE, sMAPE, Median  
Relative Error ‒ позволяют охарактеризовать точность как на всем множе-  
стве, так и на подмножестве интенсивных осадков (> 3 мм).  
Сравнительный анализ охватывал модели lgbm, catboost, xgboost,  
randomforest, gru, lstm и гибридную модель cnndrrf, и выполнялся по сле-  
дующим метрикам: MAE (средняя абсолютная ошибка), RMSE (средне-  
квадратичная ошибка), MAPE (средняя абсолютная процентная ошибка),  
sMAPE (симметричная MAPE), а также медианное относительное отклоне-  
ние.  
Общая точность моделей на всех данных (all). Модель CatBoost проде-  
монстрировала наилучшие результаты по метрикам MAE (1.16) и RMSE  
(3.51), что указывает на высокую точность при общей выборке. Она также  
показала умеренные значения MAPE (98.71 %) и sMAPE (136.54 %), что  
важно в условиях высокой изменчивости данных.  
84  
Гидрометеорологические прогнозы, математическое моделирование  
а)  
б)  
Рис. 1. Графики основных метрик, используемых для сравнения получен-  
ных моделей: средняя абсолютная ошибка (MAE) (а); симметричная сред-  
няя абсолютная процентная ошибка (sMAPE), устойчивая к нулям в дан-  
ных (б).  
Fig. 1. Plots of the main metrics used for the comparison of the resulting mod-  
els: Mean Absolute Error (MAE) (a); Symmetric Mean Absolute Percentage  
Error (sMAPE), robust to zero values in the data (б).  
Модель LightGBM оказалась сопоставимой по MAE (1.28) и имела  
чуть более высокую RMSE (3.67), но значительно хуже справлялась с от-  
носительными ошибками (MAPE = 147.85 %).  
Модели xgboost, randomforest, gru, lstm и cnndrrf демонстрировали за-  
метно худшие значения всех метрик, особенно XGBoost и GRU, где наблю-  
даются значительные ошибки (MAPE > 140 %, медианные ошибки дости-  
гают 90–114 %).  
Производительность моделей на данных с интенсивными осадками  
(осадки > 3 мм).  
В сегменте значительных осадков модель LightGBM достигла наилуч-  
ших абсолютных метрик (MAE = 3.59, RMSE = 7.60) и продемонстрировала  
наименьшие значения MAPE (30.33 %) и sMAPE (47.06 %). Медианное  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
85  
отклонение при этом оставалось нулевым, что свидетельствует о стабиль-  
ности прогноза в наиболее критических ситуациях.  
Таблица 1. Метрики для набора данных с признаками на основе НЭПА  
Table 1. Metrics for the dataset with features based on the atmospheric electric  
field strength  
Model  
lgbm  
Subset  
all  
MAE  
1.28  
3.59  
1.16  
3.80  
2.13  
9.66  
2.17  
4.64  
2.78  
10.57  
2.62  
9.22  
2.92  
8.10  
RMSE  
3.67  
MAPE  
147.85  
30.33  
sMAPE Median RE  
137.02  
47.06  
0.00  
0.00  
lgbm  
>3mm  
all  
7.60  
catboost  
catboost  
xgboost  
xgboost  
randomforest  
randomforest  
gru  
3.51  
98.71  
136.54  
55.26  
0.29  
>3mm  
all  
7.67  
32.05  
0.29  
5.24  
82.43  
160.06  
175.05  
144.63  
54.38  
90.61  
94.71  
48.27  
29.14  
114.10  
104.43  
85.91  
88.36  
78.32  
77.39  
>3mm  
all  
11.80  
4.03  
93.05  
238.18  
37.91  
>3mm  
all  
7.66  
5.70  
152.02  
106.12  
141.37  
86.88  
198.89  
199.35  
163.13  
155.98  
154.68  
118.21  
gru  
>3mm  
all  
12.55  
5.20  
lstm  
lstm  
>3mm  
all  
11.44  
4.96  
cnndrrf  
cnndrrf  
225.19  
72.01  
>3mm  
10.50  
Модель CatBoost оказалась близкой по точности (MAE = 3.80, RMSE  
= 7.67), но имела худшие относительные метрики (MAPE = 32.05 %,  
sMAPE = 55.26 %).  
Остальные модели, особенно XGBoost и рекуррентные нейросети  
(GRU, LSTM), показывали неудовлетворительные результаты в этом под-  
множестве ‒ MAPE превышал 86 %, что делает их менее пригодными для  
задач оперативного прогнозирования опасных явлений.  
Модель CNN DR RF, показала конкурентоспособные абсолютные мет-  
рики, но не превосходила LightGBM и CatBoost. При осадках >3 мм, она  
демонстрировала MAE = 8.10 и RMSE = 10.50, а относительные ошибки  
были умеренными (MAPE = 72.01 %, sMAPE = 118.21 %).  
Резкое падение качества на тестовой выборке, более чем в 70 раз по  
MAE, ‒ очень важный результат, который сейчас недостаточно обсужда-  
ется. Это может быть связано с тем, что тестовый период 2023‒2025 гг.  
имел данные по тем или иным причинам, сильно отличающиеся от обуча-  
ющего периода, возможно из-за аномальных погодных условий. Высокие  
значения процентных ошибок MAPE и sMAPE обусловлены большим ко-  
личеством дней с нулевыми или почти нулевыми осадками, и именно по-  
этому для оценки также важны абсолютные метрики ‒ MAE, RMSE.  
Нулевая медианная ошибка у моделей LightGBM на обоих подмноже-  
ствах данных, а также у CatBoost на всех данных, подтверждает их устой-  
чивость к выбросам и делает их предпочтительными в практических при-  
ложениях, особенно в контексте раннего предупреждения.  
86  
Гидрометеорологические прогнозы, математическое моделирование  
Для изучения вклада признаков на основе НЭПА в результативность  
прогноза осадков были выполнены эксперименты с набором данных, где  
эти признаки были исключены. Результаты экспериментов приведены на  
рис. 2 и в табл. 2.  
а)  
)
б)  
Рис. 2. Графики основных метрик для набора данных без признаков на  
основе напряженности электрического поля атмосферы, используемых  
для сравнения полученных моделей: средняя абсолютная ошибка (MAE)  
(а); симметричная средняя абсолютная процентная ошибка (sMAPE),  
устойчивая к нулям в данных (б).  
Fig. 2. Plots of the main metrics for the dataset without features based on the  
atmospheric electric field strength, used for the comparison of the resulting  
models: Mean Absolute Error (MAE) (a); Symmetric Mean Absolute Percentage  
Error (sMAPE), robust to zero values in the data (б).  
Анализ результатов показал, что включение признаков на основе из-  
мерений напряжённости электрического поля атмосферы приводит к ста-  
тистически значимому снижению ошибок прогнозирования. Например,  
для моделей CatBoost и LightGBM средняя абсолютная ошибка (MAE) по  
всей выборке снижается с 2.97 до 1.16 мм и с 3.59 до 1.28 мм  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
87  
соответственно, а аналогичное улучшение отмечается и для других метрик  
(RMSE, MAPE, sMAPE). Для подмножества интенсивных осадков (>3 мм)  
наблюдается аналогичное преимущество: MAE и RMSE для LightGBM  
уменьшаются почти вдвое при добавлении электрических данных. Это сви-  
детельствует о наличии дополнительной прогностической информации,  
вносимой электрическими параметрами, даже несмотря на то, что они не  
всегда входят в топ по SHAP-важности.  
Таблица 2. Метрики для набора данных без признаков на основе НЭПА  
Table 2. Metrics for the dataset without features based on the atmospheric elec-  
tric field strength  
Model  
lgbm  
Subset  
all  
MAE  
3.59  
9.11  
2.97  
9.34  
2.71  
10.94  
3.92  
7.89  
3.01  
11.55  
2.71  
10.09  
2.96  
9.19  
RMSE  
6.13  
MAPE  
356.19  
76.91  
sMAPE  
166.04  
119.33  
159.29  
131.06  
176.51  
185.73  
150.48  
92.20  
Median RE  
116.35  
77.80  
lgbm  
>3mm  
all  
12.11  
5.81  
catboost  
catboost  
xgboost  
xgboost  
randomforest  
randomforest  
gru  
220.91  
75.35  
90.28  
>3mm  
all  
12.17  
6.23  
86.35  
94.94  
96.95  
>3mm  
all  
13.36  
6.25  
96.13  
97.65  
370.83  
57.46  
87.35  
>3mm  
all  
11.47  
6.12  
62.65  
165.39  
106.79  
168.03  
86.94  
200.00  
200.00  
160.69  
156.99  
152.12  
124.03  
122.38  
105.40  
87.11  
gru  
>3mm  
all  
13.76  
5.58  
lstm  
lstm  
>3mm  
all  
12.59  
5.45  
92.03  
cnndrrf  
cnndrrf  
261.29  
73.33  
81.35  
>3mm  
12.02  
81.35  
Таким образом, проведено обучение нескольких моделей машинного  
обучения, среди которых наилучшими показателями точности выделяются  
LightGBM, CatBoost, LSTM.  
Относительная ошибка прогноза осталась небольшой даже в ситуа-  
циях с высоким уровнем осадков, что говорит о способности модели пред-  
сказывать выбросы экстремальные события.  
Использование метода SHAP обеспечивает интерпретируемость мо-  
дели, что важно для практического применения в метеорологии. Характе-  
ристики НЭПА полученные с помощью Фурье и вейвлет-преобразования,  
а также лаги температуры и влажности оказались наиболее значимыми  
признаками, подтверждая их физическую обоснованность в контексте про-  
гноза осадков. Применение лаговых признаков и спектральных характери-  
стик позволяет учитывать как краткосрочные, так и долгосрочные зависи-  
мости в данных, что улучшает точность прогноза. Среди спектральных и  
вейвлет-признаков наибольший вклад в качество прогноза внесли следую-  
щие характеристики: доминирующая частота, спектральная энтропия и  
суммарная мощность в коротковолновой области, а также амплитуда  
88  
Гидрометеорологические прогнозы, математическое моделирование  
второй по величине спектральной компоненты. Это соответствует физиче-  
ской природе осадков, так как характерная частота и вариабельность элек-  
трических сигналов и метеопараметров связаны с фазами развития облач-  
ных структур и фронтальной активностью. При исключении электрических  
данных метрики прогноза ухудшаются, что подтверждает их дополнитель-  
ную информативность и синергетический эффект при совместном исполь-  
зовании с классическими метеопризнаками.  
Полученные результаты подчёркивают потенциал использования ме-  
тодов машинного обучения в оперативном прогнозе осадков.  
Заключение  
В настоящем исследовании была проведена оценка эффективности  
различных моделей машинного обучения и глубокого обучения для про-  
гнозирования осадков.  
Модель LightGBM продемонстрировала наилучшее сочетание точно-  
сти и устойчивости как на всей выборке, так и при фокусе на интенсивных  
осадках. CatBoost также является надёжной альтернативой. Модели на ос-  
нове нейросетей уступают по ряду метрик, что, возможно, связано с огра-  
ниченностью обучающей выборки или их архитектурными особенностями.  
Результаты подтверждают перспективность градиентного бустинга в зада-  
чах прогнозирования осадков при использовании комплексной информа-  
ции.  
В результате проведенного исследования был разработан и апробиро-  
ван подход к краткосрочному прогнозированию суточных осадков на ос-  
нове метеорологических данных и измерений напряженности электриче-  
ского поля с применением методов машинного обучения.  
Полученные значения MAE для лучших моделей (например, CatBoost  
‒ 1.16 мм, LightGBM ‒ 1.28 мм на всей выборке) соответствуют критериям  
высокой точности для оперативного суточного прогноза осадков, согласно  
публикациям [15, 19]. Тем не менее, нейросетевые модели (GRU, LSTM)  
показывают существенно худшие результаты, что указывает на необходи-  
мость дальнейшей оптимизации их архитектур и расширения обучающей  
выборки.  
Анализ важности признаков, проведённый методом SHAP, выявил  
ключевые факторы, влияющие на точность модели, среди которых выделя-  
ются лаговые значения температуры и влажности, а также спектральные  
характеристики временных рядов напряженности поля. Это подтверждает  
эффективность использования таких производных признаков в задачах  
прогнозирования атмосферных явлений.  
Дальнейшее развитие исследований предполагает интеграцию допол-  
нительных данных, например, таких как спутниковые наблюдения и дру-  
гие методы дистанционного зондирования атмосферы, а также использова-  
ние более сложных нейросетевых архитектур, способных учитывать  
одновременно пространственные и временные закономерности.  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
89  
Работа демонстрирует эффективность подхода и может быть полезна  
для анализа возможностей методов искусственного интеллекта в задачах  
краткосрочного прогноза. Её продолжение может быть полезно для опера-  
тивного прогнозирования погоды и принятия решений в различных отрас-  
лях, зависящих от погодных условий, например, для оперативного прогно-  
зирования погодных условий в авиации, сельском хозяйстве и для  
предупреждения чрезвычайных ситуаций, связанных с экстремальными  
осадками.  
Практические результаты работы могут быть использованы для  
оперативного прогноза опасных явлений в регионах с ограниченной  
наблюдательной сетью, а также при внедрении результатов измерений  
онлайн-систем мониторинга электрических параметров атмосферы. Пла-  
нируется расширить спектр анализируемых признаков и протестировать  
разработанный подход на других станциях с различными типами климата.  
В дальнейшем возможно использование методов балансировки классов и  
интеграция данных дистанционного зондирования для повышения точно-  
сти предсказаний экстремальных событий.  
Список литературы  
1. Аджиев А.Х., Кондратьева Н.В., Кумукова О.А., Сейнова И.Б., Богаченко Е.М. Ме-  
тод фонового прогнозирования селевой опасности на Центральном Кавказе и результаты  
его апробирования // Селевые потоки: катастрофы, риск, прогноз, защита. 2008. С. 263-266.  
2. Белякова П.А., Борщ С.В., Христофоров А.В., Юмина Н.М. Вероятностное прогно-  
зирование максимальных расходов и уровней воды и критических осадков на реках Черно-  
морского побережья Кавказа // Труды Гидрометцентра России. 2013. № 349. С. 104-121.  
3. Бисчоков Р.М. Прогнозирование изменений режима атмосферных осадков на Се-  
верном Кавказе // Вестник Курганской ГСХА. 2018. № 1 (25). С. 14-17.  
4. Болгов М.В., Арефьева Е.В. О некоторых вопросах, связанных с прогнозированием  
чрезвычайных ситуаций, вызванных гидрологическими опасными явлениями и их послед-  
ствиями // Научные и образовательные проблемы гражданской защиты. 2017. №. 4 (35).  
С. 102-110.  
5. Лубков А.С., Вышкваркова Е.В., Воскресенская Е.Н. Исследование возможности  
нейросетевого прогнозирования осадков в Крымском регионе // Тезисы докладов междуна-  
родной научно-технической конференций «Системы контроля окружающей среды ‒ 2019»,  
Севастополь, 12‒13 сентября 2019 г. Севастополь: ИПТС, 2019. С. 152.  
6. Митин В.Ю., Аптуков В.Н. Математические модели прогнозирования температуры  
и осадков с использованием фрактального и Фурье-анализа метеорологических рядов //  
Вестник Пермского университета. Серия: Математика. Механика. Информатика. 2024. №. 1  
(64). С. 33-42.  
7. Морейдо В.М., Гарцман Б., Соломатин Д.П., Сучилина З.А. Возможности кратко-  
срочного прогнозирования стока малой реки с использованием методов машинного обуче-  
ния // Гидросфера. Опасные процессы и явления. 2020. Т. 2, №. 4. С. 375-390.  
8. Таланов Е.А. Технология краткосрочного вероятностного прогнозирования павод-  
ков и селевых потоков на основе прогноза количества осадков на 3 и 6 часов // Селевые  
потоки: катастрофы, риск, прогноз, защита. 2016. С. 229-233.  
9. Фрумин Г.Т., Иванов М.Э., Куликова Л.А., Еремина А.В. Подходы к решению про-  
блемы диагноза и прогноза атмосферных осадков в интересах городских служб водоотве-  
дения // Общество. Среда. Развитие (Terra Humana). 2016. №. 2 (39). С. 97-100.  
10. Шайдуллина А.Ф. Сравнительный ретроспективный анализ методов прогнозирова-  
ния лесных пожаров по метеорологическим данным // Проблемы науки. 2016. №. 7 (8).  
С. 23-26.  
90  
Гидрометеорологические прогнозы, математическое моделирование  
11. Яровая Д.А., Посошков В.Л. Параметры атмосферных осадков в Азово-Черномор-  
ском регионе на основе модельных и натурных данных // Морской гидрофизический жур-  
нал. 2017. № 1 (193). С. 11-26.  
12. Balasmeh O. Al, Babbar R., Karmaker T. Trend analysis and ARIMA modeling for fore-  
casting precipitation pattern in Wadi Shueib catchment area in Jordan // Arabian Journal of Geo-  
sciences. 2019. Vol. 12. P. 1-19.  
13. Dong J., Zeng W., Wu L., Huang J., Gaiser T., Srivastava A.K. Enhancing short-term  
forecasting of daily precipitation using numerical weather prediction bias correcting with XGBoost  
in different regions of China // Engineering Applications of Artificial Intelligence. 2023. Vol. 117.  
P. 105579.  
14. Kusiak A., Wei X., Verma A.P., Roz E. Modeling and Prediction of Rainfall Using Radar  
Reflectivity Data: A Data-Mining Approach // IEEE Transactions on Geoscience and Remote  
Sensing. 2013. Vol. 51, no. 4. P. 2337–2342.  
15. Nastos P.T., Paliatsos A.G., Koukouletsos K.V., Larissi I.K., Moustris K.P. Artificial  
neural networks modeling for forecasting the maximum daily total precipitation at Athens, Greece  
// Atmospheric Research. 2014. Vol. 144. P. 141-150.  
16. Partal T., Cigizoglu H.K. Prediction of daily precipitation using wavelet‒neural networks  
// Hydrological sciences journal. 2009. Vol. 54, no. 2.P. 234-246.  
17. Ponnoprat D. Short-term daily precipitation forecasting with seasonally-integrated auto-  
encoder // Applied Soft Computing. 2021. Vol. 102. P. 107083.  
18. Sodoudi S., Noorian A., Geb M., Reimer E. Daily precipitation forecast of ECMWF ver-  
ified over Iran. Theoretical and applied climatology, 2010, Vol. 99, pp. 39-51.  
19. Valipour M., Khoshkam H., Bateni S.M., Jun C. Machine-learning-based short-term fore-  
casting of daily precipitation in different climate regions across the contiguous United States //  
Expert Systems with Applications. 2024. Vol. 238. P. 121907.  
20. Waqas M., Humphries U.W., Hlaing P.T., Wangwongchai A., Dechpichai P. Advance-  
ments in daily precipitation forecasting: a deep dive into daily precipitation forecasting hybrid  
methods in the tropical climate of Thailand // MethodsX. 2024. Vol. 12. P. 102757.  
21. Weerasinghe H.D.P., Premaratne H.L., Sonnadara D.U.J. Performance of neural net-  
works in forecasting daily precipitation using multiple sources // Journal of the National Science  
Foundation of Sri Lanka. 2010. Vol. 38, no. 3. P. 163-170.  
References  
1. Adzhiev A.H., Kondrat'eva N.V., Kumukova O.A., Seynova I.B., Bogachenko E.M. Metod  
fonovogo prognozirovaniya selevoy opasnosti na Central'nom Kavkaze i rezul'taty ego aprobiro-  
vaniya. Selevye potoki: katastrofy, risk, prognoz, zashchita, 2008, pp. 263-266 [in Russ.].  
2. Belyakova P.A., Borsch S.V., Khristoforov A.V., Yumina N.M. Probabilistic forecasting of  
maximal discharges, water levels and critical precipitation for the rivers of the Black sea coast of  
Caucasus. Trudy Gidromettsentra Rossii [Proceedings of the Hydrometcentre of Russia], 2013,  
vol. 349, pp. 104-121 [in Russ.].  
3. Bischokov R.M. Prognozirovanie izmeneniy rezhima atmosfernyh osadkov na Severnom  
Kavkaze. Vestnik Kurganskoy GSKHA, 2018, no. 1 (25), pp. 14-17 [in Russ.].  
4. Bolgov M.V., Aref'eva E.V. O nekotoryh voprosah, svyazannyh s prognozirovaniem chrez-  
vychaynyh situaciy, vyzvannyh gidrologicheskimi opasnymi yavleniyami i ih posledstviyami.  
Nauchnye i obrazovatel'nye problemy grazhdanskoy zashchity, 2017, no. 4 (35), pp. 102-110 [in  
Russ.].  
5. Lubkov A.S., Vyshkvarkova E.V., Voskresenskaya E.N. Issledovanie vozmozhnosti ney-  
rosetevogo prognozirovaniya osadkov v Krymskom regione. Tezisy dokladov mezhdunarodnoy  
nauchno-tekhnicheskoy konferenciy «Sistemy kontrolya okruzhayushchey sredy ‒ 2019», Sevas-  
topol', 12‒13 sentyabrya 2019 g, Sevastopol', IPTS, 2019, 152 p. [in Russ.].  
6. Mitin В. Ю., Aptukov В.Н. Mathematical Models of Temperature and Precipitation Fore-  
casting Using Fractal and Fourier-Analysis of Meteorological Series. Vestnik Permskogo univer-  
siteta. Seriya: Matematika. Mekhanika. Informatika. [Bulletin of Perm University. Mathematics.  
Mechanics. Computer Science], 2024, vol. 64, no. 1, pp. 33-42 [in Russ.]. DOI: 10.17072/1993-  
0550-2024-1-33-42.  
Беккиев А.М., Машуков И.Х., Шаповалов В.А.  
91  
7. Moreido V.M., Gartsman B.I., Solomatine D.P, Suchilina Z.A. Prospects for short-term  
forecasting of river streamflow from small watershed runoff using machine learning methods.  
Gidrosfera. Opasnye processy i yavleniya [Hydrosphere. Hazard processes and phenomena],  
2020, vol. 2, no. 4, pp. 375-390 [in Russ.]. DOI: 10.34753/HS.2020.2.4.375  
8. Talanov E.A. Tekhnologiya kratkosrochnogo veroyatnostnogo prognozirovaniya pa-  
vodkov i selevyh potokov na osnove prognoza kolichestva osadkov na 3 i 6 chasov. Selevye potoki:  
katastrofy, risk, prognoz, zashchita. 2016, pp. 229-233 [in Russ.].  
9. Frumin G.T., Ivanov M.E., Kulikova L.A., Eryomina A.V. Approaches to problem solving  
of diagnosis and forecasting of precipitation for the city services needs. Obshchestvo. Sreda. Razvi-  
tie (Terra Humana) [Society. Environment. Development (TERRA HUMANA)], 2016, vol. 39,  
no. 2, pp. 97-100 [in Russ.].  
10. Shaydullina A.F. Sravnitel'nyy retrospektivnyy analiz metodov prognozirovaniya lesnyh  
pozharov po meteorologicheskim dannym. Problemy nauki [Science problems], 2016, vol. 8,  
no. 7, pp. 23-26 [in Russ.].  
11. Iarovaia D.A. Pososhkov V.L. Parameters of the Azov-Black Sea Region Precipitation  
Based on the Model and Observational Data. Physical Oceanography, 2017, no. 1, pp. 11-24  
[in Russ.]. DOI: 10.22449/1573-160X-2017-1-11-24  
12. Balasmeh O. Al, Babbar R., Karmaker T. Trend analysis and ARIMA modeling for fore-  
casting precipitation pattern in Wadi Shueib catchment area in Jordan. Arabian Journal of Geosci-  
ences, 2019, vol. 12, pp. 1-19.  
13. Dong J., Zeng W., Wu L., Huang J., Gaiser T., Srivastava A.K. Enhancing short-term  
forecasting of daily precipitation using numerical weather prediction bias correcting with XGBoost  
in different regions of China. Engineering Applications of Artificial Intelligence, 2023, vol. 117,  
рр. 105579.  
14. Kusiak A., Wei X., Verma A.P., Roz E. Modeling and Prediction of Rainfall Using Radar  
Reflectivity Data: A Data-Mining Approach. IEEE Transactions on Geoscience and Remote Sens-  
ing, 2013, vol. 51, no. 4, pp. 2337-2342.  
15. Nastos P.T., Paliatsos A.G., Koukouletsos K.V., Larissi I.K., Moustris K.P. Artificial  
neural networks modeling for forecasting the maximum daily total precipitation at Athens, Greece.  
Atmospheric Research, 2014, vol. 144, pp. 141-150.  
16. Partal T., Cigizoglu H.K. Prediction of daily precipitation using wavelet‒neural net-  
works. Hydrological sciences journal, 2009, vol. 54, no. 2, pp. 234-246.  
17. Ponnoprat D. Short-term daily precipitation forecasting with seasonally-integrated auto-  
encoder. Applied Soft Computing, 2021, vol. 102, pp. 107083.  
18. Sodoudi S., Noorian A., Geb M., Reimer E. Daily precipitation forecast of ECMWF ver-  
ified over Iran. Theoretical and Applied Climatology, 2010, vol. 99, pp. 39-51.  
19. Valipour M., Khoshkam H., Bateni S.M., Jun C. Machine-learning-based short-term fore-  
casting of daily precipitation in different climate regions across the contiguous United States. Ex-  
pert Systems with Applications, 2024, vol. 238, pp. 121907.  
20. Waqas M., Humphries U.W., Hlaing P.T., Wangwongchai A., Dechpichai P. Advance-  
ments in daily precipitation forecasting: a deep dive into daily precipitation forecasting hybrid  
methods in the tropical climate of Thailand. MethodsX, 2024, vol. 12, pp. 102757.  
21. Weerasinghe H.D.P., Premaratne H.L., Sonnadara D.U.J. Performance of neural net-  
works in forecasting daily precipitation using multiple sources. Journal of the National Science  
Foundation of Sri Lanka, 2010, vol. 38, no. 3, pp. 163-170.  
Поступила 20.06.2025; одобрена после рецензирования 01.10.2025;  
принята в печать 15.10.2025.  
Submitted 20.06.2025; approved after reviewing 01.10.2025;  
accepted for publication 15.10.2025.