Вокодер WaveNet в задаче предсказания временного ряда с экстремальными событиями

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

Экстремальными событиями обычно считаются редкие и непредсказуемые события или события, которые сильно отклоняются от типичного поведения. Однако объективные критерии экстремальных событий ещё не определены. Редкость требует некоторых характерных масштабов или временных и пространственных границ, в то время как интенсивность должна отражать способность события вызвать большие изменения. Одним из наиболее ярких примеров экстремальных событий в нейронауке и медицине являются эпилептические припадки [1].

В синтезе речи сети-вокодеры, такие как WaveNet [2], используются для генерации аудиодорожек. Эта модель представляет из себя свёрточную нейронную сеть, представленную как каузальный фильтр, который не смотрит в будущее. Эта особенность вокодера может быть потенциально применима к предсказанию временных рядов. Звуковые временные ряды тоже могут быть рассмотрены как динамическая система, довольно хаотическая, с переключением режимов (например, переход от одной буквы к другой). В таких рядах присутствуют большие отклонения амплитуды, что может быть сравнимо с экстремальным событием. Эта сеть получает r последних временных отсчётов (так называемое рецептивное поле) на вход и предсказывает следующий за ними отсчёт, основываясь на этом рецептивном поле. Структура сети имеет древовидный вид. Расстояние между входами на последующие слои растёт экспоненциально. Это необходимо, потому что рецептивное поле r обычно достаточно большое, порядка тысячи или двух тысяч. И если не увеличивать экспоненциально расстояние между входами, то количество слоёв будет линейно зависеть от r. У рекуррентных нейронных сетей, широко применяемых в задачах предсказания последовательностей, есть следующая проблема: во временных рядах им проще предсказывать очень похожий семпл на последний увиденный для оптимизации функции потерь и тем самым сеть в предсказании может сойтись к моде, а в свёрточной сети выход на моду будет дольше, потому что рецептивное поле достаточно большое: в звуке, например, на нём происходит множество осцилляций и сеть не отдаёт предпочтения какому-либо отсчёту.

Эксперименты были проведены с искусственными данными, сгенерированными системой двух нейронов Хидмарш–Роуз с химической синаптической связью. Мы выбрали суммарный мембранный потенциал как наблюдаемую переменную, основываясь на биологической составляющей этой системы. Описанная система демонстрирует экстремальные события для широкого набора параметров связи. Численный критерий для экстремальных событий выбран аналогично тому, как это было сделано в прошлых исследованиях [3]. Вокодер WaveNet демонстрирует точность 91% и полноту 82% для предсказательной длины, равной ширине экстремального события. Заметим, что полнота в данной задаче более важна, так как она отвечает за те случаи, когда модель предсказывает ложное отсутствие экстремального события.

Полный текст

Экстремальными событиями обычно считаются редкие и непредсказуемые события или события, которые сильно отклоняются от типичного поведения. Однако объективные критерии экстремальных событий ещё не определены. Редкость требует некоторых характерных масштабов или временных и пространственных границ, в то время как интенсивность должна отражать способность события вызвать большие изменения. Одним из наиболее ярких примеров экстремальных событий в нейронауке и медицине являются эпилептические припадки [1].

В синтезе речи сети-вокодеры, такие как WaveNet [2], используются для генерации аудиодорожек. Эта модель представляет из себя свёрточную нейронную сеть, представленную как каузальный фильтр, который не смотрит в будущее. Эта особенность вокодера может быть потенциально применима к предсказанию временных рядов. Звуковые временные ряды тоже могут быть рассмотрены как динамическая система, довольно хаотическая, с переключением режимов (например, переход от одной буквы к другой). В таких рядах присутствуют большие отклонения амплитуды, что может быть сравнимо с экстремальным событием. Эта сеть получает r последних временных отсчётов (так называемое рецептивное поле) на вход и предсказывает следующий за ними отсчёт, основываясь на этом рецептивном поле. Структура сети имеет древовидный вид. Расстояние между входами на последующие слои растёт экспоненциально. Это необходимо, потому что рецептивное поле r обычно достаточно большое, порядка тысячи или двух тысяч. И если не увеличивать экспоненциально расстояние между входами, то количество слоёв будет линейно зависеть от r. У рекуррентных нейронных сетей, широко применяемых в задачах предсказания последовательностей, есть следующая проблема: во временных рядах им проще предсказывать очень похожий семпл на последний увиденный для оптимизации функции потерь и тем самым сеть в предсказании может сойтись к моде, а в свёрточной сети выход на моду будет дольше, потому что рецептивное поле достаточно большое: в звуке, например, на нём происходит множество осцилляций и сеть не отдаёт предпочтения какому-либо отсчёту.

Эксперименты были проведены с искусственными данными, сгенерированными системой двух нейронов Хидмарш–Роуз с химической синаптической связью. Мы выбрали суммарный мембранный потенциал как наблюдаемую переменную, основываясь на биологической составляющей этой системы. Описанная система демонстрирует экстремальные события для широкого набора параметров связи. Численный критерий для экстремальных событий выбран аналогично тому, как это было сделано в прошлых исследованиях [3]. Вокодер WaveNet демонстрирует точность 91% и полноту 82% для предсказательной длины, равной ширине экстремального события. Заметим, что полнота в данной задаче более важна, так как она отвечает за те случаи, когда модель предсказывает ложное отсутствие экстремального события.

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ

Вклад авторов. Все авторы подтверждают соответствие своего авторства международным критериям ICMJE (все авторы внесли существенный вклад в разработку концепции, проведение исследования и подготовку статьи, прочли и одобрили финальную версию перед публикацией).

Источник финансирования. Работа была поддержана грантом Российского научного фонда № 19-72-10128.

Конфликт интересов. Авторы декларируют отсутствие явных и потенциальных конфликтов интересов, связанных с публикацией настоящей статьи.

×

Об авторах

Н. В. Громов

Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского

Автор, ответственный за переписку.
Email: gromov@itmm.unn.ru
Россия, Нижний Новгород

Т. А. Леванова

Национальный исследовательский Нижегородский государственный университет им. Н.И. Лобачевского

Email: gromov@itmm.unn.ru
Россия, Нижний Новгород

Список литературы

  1. Engel Jr.J., Pedley T.A. Generalized convulsive seizures. In: Tassinar C.A., Michelucci R., Shigematsu H., et al., editors. Epilepsy: a comprehensive text-book. 1997.
  2. Van den Oord A., Dieleman D., Zen H., et al. Wavenet: a generative model for raw audio // arXiv. Vol. 1609. P. 03499. doi: 10.48550/arXiv.1609.03499
  3. Gromov N., Gubina E., Levanova T. Loss functions in the prediction of extreme events and chaotic dynamics using machine learning approach. In: Proceedings of the Fourth International Conference Neurotechnologies and Neurointerfaces (CNN); 2022 Sept 14–16; Kaliningrad, Russian Federation. Kaliningrad, 2022. P. 46–50. doi: 10.1109/CNN56452.2022.9912515

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

© Эко-Вектор, 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».