К вопросу подготовки данных геоакустических наблюдений для идентификации пред- и постсейсмических аномалий
- Авторы: Сенкевич Ю.И.1, Мищенко М.А.1
-
Учреждения:
- Институт космофизических исследований и распространения радиоволн ДВО РАН
- Выпуск: Том 49, № 4 (2024)
- Страницы: 125-134
- Раздел: Информационные и вычислительные технологии
- URL: https://journals.rcsi.science/2079-6641/article/view/278333
- DOI: https://doi.org/10.26117/2079-6641-2024-49-4-125-134
- ID: 278333
Цитировать
Полный текст
Аннотация
Предложен метод повышения качества подготовки геофизических данных на примере геоакустических наблюдений для обучения нейронных сетей в рамках решения задачи идентификации пред- и постсейсмических аномалий. Метод основан на преобразовании сигнала геоакустической эмиссии, связанной с деформационными процессами в приповерхностных породах, в трёхмерные изображения. Серия таких изображений несёт информацию о динамике характеристик сигнала. Трёхмерные изображения представляют из себя матрицы, состоящие из векторов распределения выбранных характеристик (спектральных, структурных, статистических и др.). Из серии таких изображений формируется структура — тензор данных, которая подаётся на вход нейронной сети. Из-за влияния внешних факторов (погодных, техногенных) регистрируемый геоакустический сигнал искажается. Поэтому необходимо производить очистку исходных данных. Для этого предлагается использовать нейронную сеть, которая проводит кластеризацию подготовленных изображений и удаляет выбросы в полученных кластерах. Из оставшихся изображений формируется новый тензор, который повторно подвергается очистке. Это продолжается до тех пор, пока в результате кластеризации в выходных данных обнаруживаются выбросы. Применение разработанного метода очистки тензоров на основе технологий искусственного интеллекта позволяет значительно улучшить качество подготовки данных. Подготовленные таким образом данные будут подаваться на вход другой нейронной сети с целью обнаружения общих и отличительных черт, а также закономерностей, скрытых в потоке геоакустических данных. Получаемые результаты будут полезны для исследований в области идентификации и классификации пред- и постсейсмических аномалий в сигналах геоакустической эмиссии, связанных с деформационными процессами в приповерхностных породах в сейсмоактивном регионе.
Полный текст
Введение
Процессы, происходящие в очаге готовящегося землетрясения, вызывают изменение напряженно-деформированного состояния земной коры на значительном удалении от самого очага. Под действием деформационных процессов в приповерхностных породах происходит генерация импульсных акустических сигналов — сигналов геоакустической эмиссии (ГАЭ) [1-3]. Результаты исследований [4-9] показывают, что динамика характеристик сигналов ГАЭ может быть связана с изменениями напряженно-деформированного состояния приповерхностных пород. Таким образом, через обнаружение аномального поведения динамики характеристик сигналов ГАЭ можно опосредовано фиксировать изменения свойств среды при подготовке землетрясений и последующей релаксации остаточных напряжений [10].
Аномалии поведения динамики характеристик геоакустических сигналов можно классифицировать, представляя их в виде изображений и применяя нейронные сети и технологии глубокого обучения для их распознавания. Использование нейронных сетей в обработке геофизических сигналов осложняется их высокой нелинейностью и нестационарностью [11]. Это приводит к появлению большого числа ошибок в ходе обработки и возникновению явления переобучения уже на малом числе эпох обучения сети.
Настоящее исследование посвящено методу очистки геоакустических данных для более качественной классификации аномалий ГАЭ и оценки напряжённо-деформированного состояния приповерхностных пород в условиях постоянно протекающего сейсмо-тектонического процесса в Камчатском регионе.
Средства наблюдения
Регистрация, обработка и анализ сигналов геоакустической эмиссии производится при помощи аппаратно-программного комплекса, состоящего из двух пространственно разнесенных частей: стационарной части и автономной части, расположенной в отдаленном пункте наблюдений. Пространственно-разнесенные части комплекса объединены в единую сеть на основе радиомодемов с антеннами. Структурная схема комплекса представлена на рис. 1.
Рис. 1. Структурная схема аппаратно-программного комплекса.
[Figure 1. Structural scheme of the hardware-software complex.]
Автономная часть комплекса осуществляет измерение геоакустических сигналов приповерхностных осадочных пород, их оцифровку, запись на жесткий диск, подключенный к компьютеру, и дальнейшую передачу данных на стационарную часть. Стационарная часть выполняет прием получаемых данных, их сохранение на дисковом RAID-массиве сервера.
На сервере также происходит подготовка данных (выделение потока импульсов в сигнале, вычисление их характеристик и формирование трехмерных изображений) и их последующий анализ с применением нейронных сетей.
Система регистрации построена на основе пьезокерамического гидрофона, который обеспечивает приём акустического сигнала в диапазоне частот от 0.1 Гц до 10 кГц. Оцифровка регистрируемого сигнала производится с частотой дискретизации 48 кГц при помощи профессиональной звуковой карты M-Audio. Это позволяет регистрировать и записывать акустический сигнал в широком диапазоне частот в стандартном звуковом формате.
Методика подготовки данных
Фрагменты геоакустического сигнала преобразуются в 3D-отображения авторским методом [11]. Каждое отображение несет информацию о динамике выбранных (структурных, статистических, спектральных) характеристик сигнала за определенный период наблюдения. Будем рассматривать полученную серию отображений как множество, которое далее подвергается кластерному анализу. Это позволяет выделить подмножества близких по образу отображений динамики характеристик сигнала на различных фрагментах наблюдения — кластеры. Идентифицированные отображения собираются в тензоры данных для дальнейшей работы в сетях глубокого обучения для оценки напряжённо-деформированного состояния пород и идентификации пред- и постсейсмических аномалий. Для оценки качества обучения нейронной сети строились графики показателей точности классификации и ошибок классификации для обучающей и валидационной выборок.
Для подготовки обучающих тензоров использовался архив данных, полученных в ходе непрерывного мониторинга геоакустической эмиссии с сентября 2016 по декабрь 2019 года в пункте наблюдений «Карымшина». Строились отображения динамики распределения амплитуд геоакустических импульсов за период, равный 3 суткам. Отображения представлялись в формате RGB, размерностью 256×256.
Для обучения нейросети подготовлен набор отображений в сейсмически спокойные периоды и в окрестности сильных землетрясений. Рассматривались землетрясения, произошедшие в период с сентября 2016 по декабрь 2019 года с энергетическим классом Ks не менее 10,0. В региональном сейсмическом каталоге [11, 12] зарегистрировано 981 такое событие. Из них были отобраны землетрясения, для которых выполнялось условие
где RD — радиус зоны Добровольского [13], D — расстояние от пункта наблюдений до гипоцентра землетрясения. Таким образом, было отобрано 31 землетрясение.
Было подготовлено три класса отображений, полученных накануне землетрясений («pred») — 31 отображение, непосредственно после землетрясений («post») — 31 отображение, и в сейсмически спокойный период («fon») — 325 отображений.
Количество данных в классах отличалось на порядок. Поэтому в ходе всех экспериментов выполнялось выравнивание данных с использованием синтетической генерации дополнительных копий. С этой целью применялся метод синтетической неполной избыточной выборки (SMOTE), решающий проблему дисбаланса классов. В результате исходный набор отображений увеличился практически в три раза (963 отображения). Кроме того, отмечая значимость классов «pred» и «post» в целевом обучении, был использован метод весового взвешивания. Для очистки кластеров отображений использовались методы из специализированной библиотеки для машинного обучения scikit-learn [14], реализующие обнаружение выбросов и дубликатов изображений на основе данных кластерного анализа. Значение порога выбросов для всех этапов экспериментов было постоянным и равным 0,90. Примеры получаемых отображений классов «pred», «post», «fon» представлены на рис. 2.
Рис. 2. Пример отображений классов: 0 – «pred», 1 – «fon», 2 – «post»
[Figure 2. Example of class presentation: 0 — «pred», 1 — «fon», 2 — «post».]
Ниже представлены результаты серии экспериментов по обучению нейронной сети типа ResNet с использованием подготовленных тензоров данных с различным уровнем очистки. Структура разработанной сверточной нейронной сети на базе архитектуры ResNet представлена в табл. 1.
Таблица 1
Структура сверточной нейронной сети на базе архитектуры ResNet
[Structure of a convolution neural network based on ResNet architecture]
Layer (type) | Output Shape | Param # | Connected to |
img (InputLayer) | (None, 64, 64, 3) | 0 | – |
layer1 (Conv2D) | (None, 62, 62, 64) | 1,792 | |
layer2 (Conv2D) | (None, 60, 60, 64) | 36,928 | |
maxpooling2d1 | (None, 20, 20, 64) | 0 | |
(MaxPooling2D) |
|
|
|
layer3 (Conv2D) | (None, 20, 20, 64) | 36,928 | |
layer4 (Conv2D) | (None, 20, 20, 64) | 36,928 | |
add2 (Add) | (None, 20, 20, 64) | 0 | |
|
|
| |
layer5 (Conv2D) | (None, 20, 20, 64) | 36,928 | |
layer6 (Conv2D) | (None, 20, 20, 64) | 0 | |
add3 (Add) | (None, 20, 20, 64) | 0 | |
layer7 (Conv2D) | (None, 18, 18, 64) | 36,928 | |
layer8 (Conv2D) | (None, 64) | 0 | |
(GlobalAveragePooling2D) |
|
|
|
layer9 (Dense) | (None, 256) | 16,640 | |
layer10 (Dropout) | (None, 256) | 0 | |
layer11 (Dense) | (None, 3) | 771 |
Глобальные параметры нейросети при обучении составили: шаг движения по выборке — 32, количество итераций обучения — 64; объем валидационной выборки — 30%.
В эксперименте № 1 для подготовки тензора использовались данные без очистки. Так наглядно можно увидеть влияние выбросов на обучение подготовленной свёрточной нейросети. В экспериментах № 2, № 3 и № 4 для подготовки тензора использовались данные, полученные после одного, двух и трех этапов очистки соответственно. Параметры тензоров приведены в табл. 2.
Таблица 2
Описание параметров тензора данных в экспериментах
[Description of data tensor parameters in the experiments]
Класс | Число файлов до очистки | Число файлов после очистки | Размер обучающей выборки | Размер тестовой выборки |
Эксперимент № 1 | ||||
fon | 325 | 325 | 305 | 101 |
post | 31 | 31 | 303 | 98 |
pred | 31 | 31 | 298 | 96 |
Эксперимент № 2 | ||||
fon | 325 | 321 | 235 | 86 |
post | 31 | 28 | 223 | 98 |
pred | 31 | 28 | 216 | 105 |
Эксперимент № 3 | ||||
fon | 321 | 321 | 233 | 88 |
post | 27 | 27 | 214 | 107 |
pred | 27 | 26 | 227 | 94 |
Эксперимент № 4 | ||||
fon | 321 | 321 | 212 | 89 |
post | 27 | 26 | 216 | 98 |
pred | 27 | 27 | 201 | 95 |
Обсуждение результатов
При обучении нейросети без очистки данных (рис. 3, эксперимент № 1) уже на 18 эпохе обучения наступает момент переобучения, что приводит к срыву данного процесса с быстро нарастающей ошибкой на валидационной выборке отображений. При первой же очистке данных (рис. 3, эксперимент № 2) результат обучения заметно улучшается, хотя и наблюдаются остаточные выбросы, порождаемые зашумленными данными.
Рис. 3. Графики обучения сети для четырёх экспериментов. Графики для обучающей выборки — синяя линия, для тестовой выборки – оранжевая.
[Figure 3. Graphs of network training for four experiments. Graphs for the training sampling — blue line, for the test sampling — orange line.]
На 36 эпохе наблюдается срыв процесса обучения нейросети с последующим отказом от обучения. Картина обучения на следующем этапе (рис. 3, эксперимент № 3) становится еще лучше. Срыв обучения наступает только на 46 эпохе, ошибка обучения становится меньше, чем на предыдущем этапе, а дисперсия выбросов заметно уменьшается. Завершение очистки кластеров отображений заканчивается на эксперименте № 4 (рис. 3, эксперимент № 4). Здесь картина обучения становится плавной, а показатели точности распознавания и минимума ошибки достигают наилучших значений. Отказ от обучения не присутствует. На завершение процесса очистки указывает следующий факт. Число отображений в кластерах на очередной итерации не изменяется, что можно принять как простое правило для определения этапа очистки данных.
Заключение
Разработан метод подготовки геоакустических данных для обучения нейронных сетей в рамках решения задачи идентификации пред- и постсейсмических аномалий. В основе метода лежит преобразование геоакустического сигнала в серию трёхмерных изображений, несущую информацию о динамике распределения некоторых характеристик сигнала. Предлагается проводить очистку подготовленных серий изображений путем удаления выбросов, полученных по результатам кластеризации нейронной сетью. Установлено, что для качественной подготовки данных достаточно провести три цикла очистки.
Таким образом, применение технологий искусственного интеллекта для обработки геофизических данных позволяет поднять на новый уровень методы идентификации и классификации обнаруживаемых аномалий характеристик геоакустических сигналов, которые можно связать с влиянием деформационных процессов на приповерхностные осадочные породы.
Об авторах
Юрий Игоревич Сенкевич
Институт космофизических исследований и распространения радиоволн ДВО РАН
Автор, ответственный за переписку.
Email: senkevich@ikir.ru
ORCID iD: 0000-0003-0875-6112
доктор технических наук, доцент, ведущий научный сотрудник лаборатории акустических исследований
Россия, 684034, c. Паратунка, ул. Мирная, д. 7Михаил Александрович Мищенко
Институт космофизических исследований и распространения радиоволн ДВО РАН
Email: senkevich@ikir.ru
ORCID iD: 0000-0003-1958-5830
кандидат физико-математических наук, ведущий научный сотрудник лаборатории акустических исследований
Россия, 684034, c. Паратунка, ул. Мирная, д. 7Список литературы
- Марапулец Ю.В., Шевцов Б.М. Мезомасштабная акустическая эмиссия. Владивосток: Дальнаука, 2012. 126 с.
- Пережогин А. С., Шевцов Б. М.Модели напряженно-деформированного состояния горных пород при подготовке землетрясений и их связь с геоакустическими наблюдениями // Вычислительные технологии, 2009. Т. 14, №3, С. 48–57.
- Марапулец Ю.В. и др. Отклик геоакустической эмиссии на активизацию деформационных процессов при подготовке землетрясений //Тихоокеанская геология, 2012. Т. 31, №6, С. 59–67.
- Моргунов В. А. и др. Геоакустический предвестник Спитакского землетрясения // Вулканология и сейсмология, 1991. №4, С. 104–106.
- Долгих Г.И. и др. Деформационные и акустические предвестники землетрясений // Доклады академии наук, 2007. Т. 413, №1, С. 96–100.
- Салтыков В. А., Кугаенко Ю.А.Развитие приповерхностных зон дилатансии как возможная причина аномалий в параметрах сейсмической эмиссии перед сильными землетрясениями //Тихоокеанская геология, 2012. Т. 31, №1, С. 96–106.
- Gregori G.P., et. al. “Storms of crustal stress” and AE earthquake precursors // Natural Hazards and Earth System Sciences, 2010. vol. 10, no. 2, pp. 319–337.
- Lukovenkova O., Marapulets Yu., Solodchuk A.Adaptive approach to time-frequency analysis of AE signals of rocks // Sensors, 2022. vol. 22, no. 24, pp. 1–13, 9798.
- Gapeev M., Marapulets Y.Modeling Locations with Enhanced Earth’s Crust Deformation during Earthquake Preparation near the Kamchatka Peninsula // Appl. Sci., 2022. vol. 13, no. 1, pp. 1–14, 290.
- Marapulets Y., et al. Sound Range AE as a Tool for Diagnostics of Large Technical and Natural Objects // Sensors, 2023. vol. 23, no. 3, pp. 1–14, 1269.
- Сенкевич Ю.И. и др. Методика выделения информативных признаков в сигналах геоакустической эмиссии // Труды СПИИРАН, 2019. Т. 18, №5, С. 1066–1092 doi: 10.15622/sp.2019.18.5.1066-1092.
- Каталог землетрясений Камчатки и Командорских островов, Камчатский филиал ФИЦ ЕГС РАН,[Электронный ресурс]. URL: http://sdis.emsd.ru/info/earthquakes/catalogue.php (дата обращения: 20.11.24).
- Чеброва А.Ю. и др. Единая информационная система сейсмологических данных в Камчатском филиале ФИЦ ЕГС РАН: принципы организации, основные элементы, ключевые функции //Геофизические исследования, 2020. Т. 21, №3, С. 66–91.
- Добровольский И. П. Математическая теория прогноза и подготовки тектонического землетрясения. М.: ФИЗМАТЛИТ, 2009. 240 с.
- Pedregosa F., et al. Scikit-learn: Machine Learning in Python // Journal of Machine Learning Research, 2011. vol. 12, no. 85, pp. 2825–2830.
Дополнительные файлы
