Brain response to sound motion-onset in human
- Authors: Shestopalova L.B.1, Semenova V.V.1, Petropavlovskaia E.A.1
-
Affiliations:
- Pavlov Institute of Physiology, Russian Academy of Sciences
- Issue: Vol 55, No 3 (2024)
- Pages: 22-44
- Section: Articles
- URL: https://journals.rcsi.science/0301-1798/article/view/268440
- DOI: https://doi.org/10.31857/S0301179824030022
- EDN: https://elibrary.ru/BBNUMN
- ID: 268440
Cite item
Full Text
Abstract
This review comprehensively examines the features of the motion-specific brain response produced by human hearing system, the so-called motion-onset response (MOR). We discuss the interpretations of this component of auditory evoked potentials, its dependence on velocity and direction of sound motion and on various spatial characteristics of sound stimuli. We review the studies of event-related oscillations underlying the MOR which have shown that gradual sound motion causes the phase alignment of the delta-alpha range to the motion onset. We also consider the influence of audio-visual integration on motion processing. The MOR component as a correlate of the processes of spatial integration can provide new information about an early pre-conscious activation of brain structures that facilitates orientation and adaptation of a person to a changing acoustic environment.
Full Text
ВВЕДЕНИЕ
Естественная акустическая среда, окружающая человека, содержит множество движущихся источников звука. Слуховое восприятие движения чрезвычайно важно для безопасности и правильной ориентации, поэтому оно издавна являлось предметом изучения в области нейрофизиологии. Неоднократно подтверждалось наличие кортикальных и субкортикальных областей, избирательно активируемых движущимися звуковыми стимулами: методами нейровизуализации – у человека [18, 21, 44–46, 51, 65, 68, 116], а также при изучении активности одиночных нейронов у животных [10, 11, 109, 113]. Исследования методами ЭЭГ и МЭГ также выявили выраженные кортикальные ответы, связанные с движением [12, 20, 30, 56, 118].
Обработка информации о движении звука происходит на основе оценки длительности звучания и расстояния, пройденного источником звука [32]. Неподвижные и движущиеся звуковые сигналы вызывают разные реакции, которые выявляются при помощи ЭЭГ и других методик визуализации мозговой активности. Однако не всегда понятно, отражают ли эти различия в реакциях специфическую чувствительность к движению или, скорее, чувствительность к более общим изменениям в местоположении звука. Существование специализированных чувствительных к движению механизмов в слуховой системе являлось предметом давней дискуссии [43] и до сих пор остается открытым вопросом [25]. По одной из версий, восприятие движения слуховой системой основано на локализации последовательных положений источника звука (“моментальных снимках”), интегрируемых во времени; этот механизм не требует чувствительности к движению как таковому [90]. Другие психофизические исследования указывают на существование специализированных нейрональных механизмов восприятия движения и подчеркивают важность контекста, т.е. недавней истории стимуляции, для восприятия скорости длящегося во времени или в пространстве источника звука. Считается, что процесс восприятия функционирует скорее как интегратор утечки (leaky integrator), чем как генератор “мгновенных снимков” [25, 69, 101, 102].
В исследованиях электрических реакций мозга на движущиеся звуковые стимулы на протяжении многих десятилетий сохранялось важное методологическое ограничение. Суть его состояла в том, что традиционно применявшиеся стимулы начинали перемещаться сразу после включения, и вследствие этого вызванные потенциалы содержали ответ на движение, перекрывающийся с ответом на включение, и разделить эти ответы не представлялось возможным. Решением этой проблемы стало применение парадигмы “отсроченного движения”, предполагающей разнесение во времени момента включения сигнала и момента начала движения. Этот прием позволил исследовать вызванный ответ на движение (motion-onset response, MOR) отдельно от неспецифического ответа на включение звука и вызвал всплеск публикаций по нейрональной обработке движения, которым и посвящен настоящий обзор. В последующих разделах обзора будут рассмотрены общие свойства потенциала MOR и его интерпретация. Отдельное внимание будет уделено исследованиям ритмической активности мозга, лежащей в основе MOR.
ПОЛУЧЕНИЕ MOR И ЕГО ИНТЕРПРЕТАЦИЯ
Первые попытки исследовать отдельно суммарный потенциал, вызванный изменением пространственных признаков, отставленным во времени относительно включения стимула, были сделаны финскими группами Sams и соавт. [96] и Mäkelä, McEvoy [74]. Движение звуковых образов моделировалось в работе Sams и соавт. [96] при помощи мгновенного изменения межушных различий по времени (∆T) в середине стимула, а в работе Mäkelä, McEvoy [74] – путем введения в середину стимула амплитудно-модулированных участков разной длительности. Регистрация суммарных магнитоэнцефалографических потенциалов (МЭГ) позволила обеим группам авторов получить четко выраженные ответы на начало движения, которые не перекрывались с ответами на включение и имели латентность 100–130 мс от начала движения. Фактически этими авторами была разработана парадигма отсроченного движения, хотя она и не получила в их работах такого названия.
Впоследствии парадигма отсроченного движения была усовершенствована при переходе к регистрации ЭЭГ и вызванных потенциалов (ВП). Длительность начального фрагмента, имеющего постоянные межушные различия и моделирующего неподвижный звуковой образ, была увеличена от 300 мс [74, 96] до 750 мс (рис. 1) [3] и до 1000 мс [67]. Это позволило еще лучше разделить во времени неспецифический ВП на включение и ВП на начало движения, так что ВП на включение развивался и возвращался к базовой линии до начала развития ответа на начало движения.
Рис. 1. Вызванные потенциалы на включение и на движение стимула [3]. Вертикальным пунктиром обозначены моменты включения (0) и начала движения (0д). Эффект движения создавался за счет линейного либо мгновенного изменения DT на 660 мкс. Контрольными стимулами служили сигналы из основного эксперимента, предъявленные диотически. По оси ординат – амплитуда ответа (мкВ). Негативность вверх.
Влияние длительности начального фрагмента на время реакции в задачах обнаружения начала движения и различения направления движения было систематически изучено психофизическими методами [34]. В условиях свободного звукового поля источник звука перемещался со скоростью 20, 40 или 80 град/с, а длительность начального фрагмента составляла 0, 200, 500 или 1000 мс. Увеличение длительности начального фрагмента способствовало уменьшению времени реакции, и чем медленнее было движение, тем более длительный начальный фрагмент требовался для его значимого снижения. Опираясь на эти данные, в последующих работах исследователи выбирали начальные участки отсроченного движения длительностью не менее 700 мс.
Термин “motion onset response” (MOR) и названия его компонентов вошли в употребление, начиная с основополагающей работы [67]. В этом исследовании движение стимула создавалось за счет значительного изменения ∆T (на 1000 мкс) в течение короткого промежутка времени (150 мс). Для анализа ответа на начало движения вызванный потенциал приводили к базовой линии по участку длительностью 200 мс непосредственно перед моментом изменения ∆T, и этому приему следовали все последующие работы. MOR отличался структурно и топографически от ВП на включение звука и состоял из раннего негативного компонента (“change”-N1, cN1) и позднего позитивного колебания (“change”-P2, cP2). Скальповое распределение cN1 имело максимум в области вертекса, поэтому анализ ответа проводили прежде всего в отведении Cz. Латентность волны cN1 составила 140 мс после начала движения, а компонент cP2 был представлен двумя пиками на 228 мс и 322 мс. Следует отметить, что удвоение пиков cP2 впоследствии в литературе не встречалось.
Интерпретации MOR связывали в первую очередь с явлением адаптации популяций нейронов, чувствительных к положению источника звука при формировании реакции на звуковой стимул с отсроченным началом движения. Явление адаптации в пространственном слухе было исследовано в ряде психофизических и электрофизиологических работ [33, 34, 39, 40, 93–95]. С точки зрения формирования MOR важно, что наличие предваряющего стационарного участка в сигнале приводило к более быстрому обнаружению движения, причем время обнаружения уменьшалось с увеличением длительности стационарного участка [33]. Об этом же свидетельствуют результаты психофизического исследования Семеновой и соавт. [7]: зависимость величины минимального различимого угла движения (minimum audible movement angle, МАМА) от скорости стимула, полученная в этой работе, имела значительно меньший наклон, чем аналогичные зависимости, приведенные в работах со стимулами без предварительного стационарного участка [25]. Соответственно, оптимальное время интеграции, полученное Семеновой и соавт. [7], также оказалось меньше известных из литературы величин [2].
В работе Getzmann, Lewald влияние адаптации на кортикальную обработку движения изучалось в двух условиях: предваряющий начало движения стимул (адаптер) располагался либо неподвижно по средней линии головы (центральный адаптер), либо состоял из разбросанных в пространстве фрагментов [39]. Было показано, что наихудшее психофизическое различение движения и наиболее низкая амплитуда потенциала MOR наблюдаются в случае, когда пространственное расположение траектории движения перекрывается с областью расположения фрагментов адаптера. И наоборот, движение различается наиболее эффективно, когда положение стационарного адаптера совпадает с началом траектории движения. Авторы предполагают, что в момент начала движения звука популяции нейронов, настроенные на латеральные положения стимула и не участвовавшие в обработке центрального адаптера, оказываются вовлечены в обработку движения. Это приводит к увеличению амплитуды ответа за счет вклада нейронов, ранее не подвергшихся действию адаптирующего сигнала. Таким образом, как субъективные, так и объективные показатели свидетельствуют о повышении чувствительности к движению в результате предшествующего действия неподвижного звукового стимула.
ЗАВИСИМОСТЬ MOR ОТ СКОРОСТИ И НАПРАВЛЕНИЯ
Принципиально важное свойство потенциала MOR – его зависимость от скорости движения стимула. Для создания набора скоростей Getzmann применил передаточные функции головы (head-related transfer function, HRTF) [34]. После начального фрагмента (центральное положение, 700 мс) стимулы перемещались на 90 град влево или вправо от центра за 250, 500 или 1000 мс, что соответствовало скоростям 360, 180 или 90 град/с. Неподвижный фрагмент в конце стимула длился 500 мс. Чем выше была скорость стимула, тем более выраженным и ранним был потенциал MOR, причем значимый эффект скорости был обнаружен и для амплитуды, и для латентности обоих его основных компонентов (cN1 и cP2). Ранний позитивный компонент cP1 от скорости не зависел. Аналогичная зависимость MOR от скорости движения была получена при создании пространственных эффектов за счет линейных изменений ∆T [8, 9, 7, 103–105].
На рис. 2 приведены потенциалы MOR, полученные в нашем недавнем исследовании [104]. Широкий диапазон скоростей позволил уточнить характер зависимости амплитуды компонентов cN1 и cP2 от скорости движения. В то время как амплитуда волны cN1 увеличивалась постепенно и практически линейно, начиная с самой низкой скорости, амплитуда cP2 демонстрировала более медленный рост. В диапазоне умеренных скоростей амплитуда cP2 увеличивалась очень незначительно, и только движение со скоростью 360 град/с вызывало заметно больший ответ. Аналогичная закономерность прослеживается и для латентностей обоих компонентов.
Рис. 2. Гранд-усредненные вызванные ответы на начало движения [105]. Эффект движения создавался за счет линейного изменения DT на 800 мкс за 1000, 600, 375 или 250 мс, что соответствовало расчетным скоростям, указанным на рисунке. По оси абсцисс – время от начала стимула (мс). По оси ординат – амплитуда ответа (мкВ). Негативность вверх.
Граничные условия получения MOR, связанные с его формированием при медленном движении, будут рассмотрены в предпоследнем разделе обзора.
Еще один важный фактор, от которого может зависеть MOR, – это направление движения. В работе Magezi и Krumbholz регистрировали ответ на мгновенные изменения ∆T на 250 мкс или на 500 мкс, моделировавшие смещение звукового образа либо влево от средней линии, либо в обратном направлении – от периферии к центру [71]. Величина компонентов cN1 и (в меньшей степени) cP2 оказалась больше в случае смещения стимула от средней линии к периферии. Авторы интерпретировали эти результаты как подтверждение модели оппонентных каналов (opponent-channel theory), описывающей представление пространства в слуховой коре.
Далее систематическое исследование фактора направления было проведено в условиях свободного звукового поля [39]. В этом эксперименте неподвижные начальные участки сигналов располагались слева и справа от средней линии под углом ±44 град, а движение было направлено от них к центру или к периферии. При анализе реакций мозга на разные направления движения становится актуальным сравнение ответов, регистрируемых от левого и правого полушария. В работе Getzmann с этой целью были вычислены среднеквадратические амплитуды cN1 и cP2 при усреднении по симметричным кластерам электродов обоих полушарий [35]. Было обнаружено, что контралатеральное преобладание волны cN1 зависело от положения начальной точки движения. Когда начало движения располагалось слева, величина cN1 была больше в правом полушарии, а когда движение начиналось справа, то ситуация была иной: движение к периферии вызывало больший ответ левого полушария, а движение к центру – симметричный ответ обоих полушарий. Компонент cP2 демонстрировал контралатеральность направлению движения, независимо от положения начальной точки.
Совокупность данных относительно влияния скорости и направления движения на компоненты MOR согласуется с концепцией последовательных стадий обработки сигнала слуховой системой, возникшей еще при использовании сигналов, у которых начало движения совпадало с включением. В рамках этой концепции изначально было предложено два временных периода обработки звукового стимула: начальная фаза может соответствовать интеграции базовых акустических признаков сигнала, а следующая фаза может быть связана с распознаванием направления движения [30]. Затем при интерпретации компонентов MOR была высказана точка зрения, что cN1 и cP2 отражают разные уровни слуховой обработки: cN1 кодирует начальное положение стимула (в левой или правой полусфере) и латерализован в противоположном полушарии, а cP2 кодирует направление движения и демонстрирует контралатеральность относительно направления [35]. Показано также, что избирательная адаптация к направлению движения влияла на амплитуду cN1, но не на амплитуду cP2 [47]. По мнению авторов, это указывает на связь предполагаемых нейрональных детекторов движения именно с компонентом cN1. Таким образом, обобщение всех данных приводит к заключению, что компонент cN1 является показателем как первичной оценки пространственных характеристик звука, так и малейших изменений его положения, тогда как компонент cP2 является частью следующего этапа обработки информации о движении.
MOR ДЛЯ РАЗНЫХ ПРОСТРАНСТВЕННЫХ ПРИЗНАКОВ
За последние полтора десятилетия ответ на начало движения был описан при использовании различных пространственных признаков, определяющих положение источника звука в горизонтальной плоскости: межушная задержка, ΔT [8, 9, 71, 103, 104]; межушные различия по времени и интенсивности, ΔT и ΔI [14]; передаточные функции головы [14, 47, 48]; в свободном звуковом поле [35, 39, 40, 49, 64, 97]. Прямое сравнение характеристик MOR в разных условиях стимуляции проведено в работе Getzmann, Lewald [37]. Авторы использовали четыре вида стимуляции: 1) линейные изменения ΔT 2) линейные изменения ΔI 3) виртуальное движение, созданное при помощи фильтров HRTF, 4) движение в свободном поле за счет последовательного переключения 45 динамиков в горизонтальной плоскости. Временная структура стимулов была одинаковой: начальный стационарный участок длительностью 700 мс был расположен по средней линии, и далее движение влево или вправо продолжалось 500 мс. Скорость движения составляла 180 град/с.
Латентность основных компонентов MOR оказалась значительно меньше в случаях движения в свободном поле и виртуального движения, чем в случае изменений отдельных признаков (ΔT или ΔI). В то же время величина MOR была гораздо больше при предъявлении сигналов в свободном поле, чем при всех трех способах дихотической стимуляции (рис. 3). Авторы делают вывод, что обработка движения в свободном поле (и в меньшей степени – виртуального движения) активирует дополнительные процессы в коре мозга, по сравнению с обработкой изменения отдельных бинауральных признаков.
Рис. 3. Потенциалы MOR для разных локализационных признаков по [37] (с изменениями). Вверху – схема стимулов с отсроченным движением. По оси ординат – угловое положение стимула (град). Внизу – гранд-усредненные ответы в отведении Cz. По оси абсцисс – время относительно включения сигнала. По оси ординат – амплитуда ответа (мкВ). Негативность вниз.
Амплитуды и латентности компонентов MOR, приведенные в работах, использовавших разные локализационные признаки, собраны вместе на рис. 4. Несмотря на различия в условиях стимуляции, в совокупности разных исследований отчетливо прослеживается рост амплитуды и снижение латентности cN1 и cP2 с увеличением скорости движения. Вместе с тем очевидно, что латентность является более устойчивой характеристикой MOR, чем амплитуда. Амплитуды суммарных ответов могут сильно зависеть от способа измерения. Так, в работе Altmann и соавт. (2017) (маркеры номер 4 на рис. 4) движение стимула создавали за счет однонаправленных изменений ΔT и ΔI, а потенциал MOR получали как разностную кривую, вычитая ответ на неподвижный сигнал из ответа на движущийся [14]. Пиковые амплитуды и латентности MOR в разных условиях сравнивали с помощью “метода складного ножа” (jackknife procedure). В результате амплитуды MOR оказались значительно ниже, чем у большинства других авторов, а латентности тем не менее вполне укладываются в общую закономерность.
Рис. 4. Амплитуда и латентность компонентов MOR как функция скорости движения стимула, по данным разных авторов. Стимулы перемещались влево или вправо от средней линии головы. Значения амплитуд cN1 и cP2 (вверху) приведены в разном масштабе по оси ординат (мкВ). Разными маркерами обозначены разные условия звуковой стимуляции. Ромбы – дихотическая стимуляция с межушными различиями по времени (ΔT) и/или интенсивности (ΔI), кружки – виртуальное движение (фильтры HRTF), крестики – свободное звуковое поле. Маркеры соединены сплошной линией в случаях, когда результаты получены в одной и той же работе. 1 – Семенова и др., 2022 (ΔT); 2 – Getzmann, Lewald, 2010a (ΔT); 3 – Getzmann, Lewald, 2010a (ΔI); 4 – Altmann et al., 2017 (ΔT и ΔI); 5 – Krumbholz et al., 2007 (ΔT); 6 – Getzmann, 2009 (HRTF); 7 – Getzmann, Lewald, 2010a (HRTF); 8 – Grzeschik et al., 2010 (HRTF); 9 – Getzmann, Lewald, 2012 (свободное поле); 10 – Getzmann, Lewald, 2010a (свободное поле).
Примечательно, что в упомянутой работе регистрировали также суммарный ответ на стимулы с противоположными сбалансированными (cue-traded) изменениями ΔT и ΔI, создававшими ощущение неподвижного звукового образа [14]. Авторам удалось зарегистрировать основные компоненты MOR при отсутствии воспринимаемого движения, и это может указывать на независимые процессы обработки ΔT и ΔI на уровне генерации MOR. Однако возможна и другая интерпретация: не исключено, что противоположные изменения ΔT и ΔI вызывают ощущение увеличения пространственной протяженности звукового образа, и именно это слуховое событие вызывает генерацию потенциала, связанного с изменением сигнала.
В связи с этим интересна работа, в которой авторы также регистрировали суммарный потенциал на изменение пространственной протяженности звука в условиях дихотической стимуляции [81]. Мгновенное изменение сигнала с бинаурально синфазного на бинаурально противофазный происходило в середине посылки амплитудно-модулированного тона с частотой несущей 750 Гц, 1000 Гц или 1250 Гц. Это событие вызывало ВП с латентностью 130–160 мс в вертексном отведении. Авторы ставили задачу поиска корреляций между характеристиками ВП и проявлениями пространственного освобождения от маскировки, выявленными в психофизическом эксперименте у той же группы испытуемых. Корреляции оказались достоверны, поэтому авторы сделали вывод, что ВП на пространственные изменения стимула можно считать надежным предиктором помехоустойчивости слуха. В контексте настоящего обзора важен сам факт формирования суммарного потенциала, структурно соответствующего MOR, при резком изменении пространственной протяженности, даже в отсутствие определенного направления и скорости.
Наконец, помимо бинауральных признаков, определяющих азимутальное движение, слуховая система успешно обрабатывает и монауральные признаки, с помощью которых определяется положение источника звука по вертикали. Getzmann и Lewald исследовали MOR, вызванный движением в вертикальной плоскости, создавая эффект движения с помощью последовательного переключения динамиков, подающих широкополосные шумовые посылки (0.25–20 кГц) [38]. Центральный динамик располагался на расстоянии 1.5 м от головы слушателя прямо перед ним, что соответствовало 0 град азимута и 0 град элевации. Движение источника звука (133 град/с) было направлено влево или вправо от центра в горизонтальной плоскости, либо вверх или вниз от центра в медиальной плоскости. Угловое смещение составляло ±30 град по азимуту и ±31 град элевации. Авторы получили практически идентичные потенциалы MOR для горизонтального и вертикального движения, без существенных различий в латентности компонентов MOR и в их топографии. Ответы мало отличались от описанных ранее для движения, созданного за счет изменения ΔT [67]. Универсальный характер MOR свидетельствует о том, что лежащие в основе MOR нейрональные процессы практически не зависят от вида локализационных признаков. Предположительно, MOR формируется на более высоком уровне обработки сигнала, когда бинауральные и монауральные признаки интегрируются в единый пространственный код. Этот вывод согласуется с данными фМРТ, согласно которым горизонтальное и вертикальное движение активирует общую билатеральную нейрональную сеть в области planum temporale, включающую верхнетеменную и премоторную кору [84].
Обобщение функционального значения MOR было предложено Getzmann, Lewald [40] в ходе обсуждения данных о формировании MOR в реакции на плавное движение, мгновенное перемещение и пространственно рассеянный звук (scattered sound) в свободном поле. Авторы предложили рассматривать MOR как обобщенный нейрофизиологический коррелят обработки изменения пространственного положения, вне зависимости от типа звукового стимула, и назвать его “ответ на пространственное изменение” (spatial change response, SCR). Хотя это название пока не стало общепринятым термином, оно верно отражает суть реакции. Можно рассматривать MOR как частный случай “комплекса акустических изменений” (acoustic change complex, ACC). ACC возникает в ответ на изменения интенсивности, частоты или спектральных признаков в пределах продолжающегося стимула. Он отражает активацию новых нейрональных элементов при одновременной деактивации других и свидетельствует о кодировании потенциально различимой новой информации на кортикальном уровне [75–77, 79]. MOR фактически представляет собой разновидность ACC, связанную исключительно с пространственными признаками стимула.
MOR И ВНИМАНИЕ
Традиционный режим стимуляции для получения MOR – пассивное прослушивание, при котором испытуемый игнорирует звуковой поток и фокусирует внимание на задании в зрительной модальности: просмотр видео [66], фиксация взора [35, 40], различение изображений [47, 48], чтение книги [104]. Применяется также режим случайного чередования активных и пассивных эпох в пределах одной серии. В этом случае во время активных эпох (после предупреждающего сигнала) испытуемые выполняют задачу по пространственному различению, а во время пассивных – просто слушают сигналы [34, 37].
Целенаправленное исследование влияния внимания на суммарные потенциалы, вызванные стимулами с отсроченным движением, проведено в трех работах [8, 9, 64]. В эксперименте Kreitewolf и соавт. в каждой эпохе вначале предъявлялся стимул (шумовая посылка) с отсроченным движением, состоящий из двух фрагментов: неподвижного и движущегося [64]. Затем последовательно предъявлялись два неподвижных тестовых тона, которые могли различаться по высоте и местоположению. Фокусировка внимания слушателей соответствовала двум условиям: либо они должны были определить, совпадало ли положение тестовых стимулов с началом и концом траектории движения, либо игнорировать движение и определить, совпадали ли тестовые тоны между собой по высоте. Эти два условия предъявлялись в разных блоках. Как показало исследование, реакция на включение стимула практически не зависела от направленности внимания, в то время как MOR был больше при фиксации внимания на движении (главным образом в интервале компонента cP2). Дополнительная активация имела источник в дорсофронтальной области, которая предположительно является частью дорсального пути слуховой обработки. Кроме того, фокусировка внимания на движении звука приводила к увеличению латентности cP2, при отсутствии достоверного эффекта для латентности cN1.
В работе Шестопаловой и соавт. условия фокусировки внимания были совершенно другими: испытуемые либо игнорировали звуковую стимуляцию (пассивные условия), читая книгу, либо сосредотачивали внимание на пространственном положении звуковых сигналов и через секунду после окончания стимула отмечали начало и конец траектории на графическом планшете (активные условия) [8]. Согласно полученным данным, амплитуда реакции на включение в отведении Cz возрастала в разных сериях в среднем на 70% у N1 и на 40% у P2. В работе Kreitewolf и соавт. (2011) такого прироста не наблюдалось [64]. Вероятно, расхождение связано с различиями в характере переключения внимания: в эксперименте Крайтвольфа внимание слушателей было постоянно фиксировано на звуковой стимуляции, и менялась только его направленность (на движение или на высоту звука). Поэтому включение звука всегда представляло собой акустическое событие одинаковой значимости, и реакция на него не изменялась при переключении внимания. В эксперименте Шестопаловой и соавт. внимание испытуемых привлекалось либо к зрительной, либо к слуховой задаче, поэтому эффект смены модальности сильно проявлялся именно в реакции на включение звука.
Что касается эффекта внимания для потенциала MOR, то, по данным Шестопаловой и соавт. прирост амплитуды в активных условиях по сравнению с пассивными составил 23% для cN1 и 33% для cP2 при одновременном росте латентности от 154±3 мс до 170±8 мс у cN1 и от 236±3 мс до 257±8 мс у cP2 [8]. Привлечение внимания вызывало широко распространенное по скальпу увеличение амплитуды MOR во временном интервале между cN1 и cP2, ближе к позитивному компоненту, что вполне соотносится с результатами Крайтвольфа и соавт. (см. выше). Такое “промежуточное” (между cN1 и cP2) временнóе положение эффекта привлечения внимания объясняет тот факт, что при сравнении пиковых величин MOR эффект может быть чрезвычайно слабым. Помимо временного аспекта, отмечены характерные пространственные черты эффекта привлечения внимания, а именно большая распространенность по скальпу и большая выраженность эффекта внимания при перемещении стимулов в правую сторону.
Работа Шестопаловой и соавт. [9] является продолжением исследования 2016 года. Экспериментальные условия были такими же, но группа испытуемых увеличена до 13 человек, а предварительная обработка записей ЭЭГ проводилась с применением метода анализа независимых компонент (ICA). Кроме того, измеряли не пиковые, а средние амплитуды MOR в отведении Cz в окне шириной 50 мс, центрированном на пиках компонентов cN1 и cP2 гранд-усредненного потенциала. Результаты эксперимента показали, что средние амплитуды и пиковые латентности компонентов cN1 и cP2 не зависели от направленности внимания, очевидно иллюстрируя известное наблюдение, что слабый эффект, полученный на небольшой выборке (в работе 2016 г. [8] – 8 человек), может быть полностью нивелирован при ее увеличении.
В то же время подтвердился значимый эффект внимания, связанный с изменением формы MOR в интервале между пиками cN1 и cP2 и наблюдавшийся между 160 и 250 мс после начала движения стимула. Активная локализация вызывала больший ответ на нисходящей ветви компонента cN1, причем с увеличением скорости интервал достоверности эффекта внимания сдвигался во времени, вместе с положением соответствующего компонента: 190–240 мс для медленного движения, 175–235 мс для быстрого движения и 150–220 мс для мгновенного смещения. Следовательно, имел место зависящий от скорости эффект внимания в средней части MOR при отсутствии эффекта в области пиков. Интервал достоверности эффекта внимания оказался значительно более ранним, чем в работе Kreitewolf и соавт. (2011) [64]. Вероятно, это связано с тем, что Kreitewolf с соавторами использовали два активных условия, различавшихся только направленностью внимания (на движение либо на высоту сигнала), а в нашей работе активной локализации противопоставлялось пассивное прослушивание, что и повлекло более общие изменения работы мозга при переключении внимания.
Подводя итог, следует отметить, что направленность внимания оказывает довольно слабое влияние на потенциал MOR по сравнению с ответом на включение сигнала, и это влияние проявляется главным образом в изменении формы потенциала, а не в характеристиках его пиков. Ключевым моментом в этом отношении является выбор заданий, которые ставятся перед испытуемыми в том или ином эксперименте. Эффект внимания проявляется тем раньше, чем больше различия между условиями, связанными с вниманием, и чем быстрее движется стимул.
В работе Шестопаловой и соавт. исследовалась также ритмическая нейрональная активность отдельных эпох, связанная с активным и пассивным прослушиванием движущихся стимулов [9]. Эти аспекты эффекта внимания будут подробно рассмотрены в следующем разделе обзора.
РЕОРГАНИЗАЦИЯ РИТМИЧЕСКОЙ АКТИВНОСТИ, ЛЕЖАЩАЯ В ОСНОВЕ MOR
Потенциал MOR, как и любой вызванный суммарный ответ, не представляет собой исчерпывающую характеристику процессов сенсорной обработки, поскольку отражает только когерентную часть колебательной активности распределенных популяций нейронов. При решении локализационных задач генерируется разнообразная (не только когерентная) ритмическая активность, которая к настоящему времени изучена мало. Связанную со стимулом колебательную активность принято подразделять на индуцированную (induced) и вызванную (evoked). Индуцированная активность коррелирует со стимуляцией, но не имеет четкой фазовой привязки к началу стимула, в то время как вызванная активность строго синхронизирована по фазе с моментами начала слуховых событий в каждой эпохе [54]. В общем случае формирование вызванного ответа на любое слуховое событие происходит при сочетании трех процессов: 1) фазовой подстройки продолжающихся мозговых ритмов; 2) генерации вызванной активности; 3) фазовой подстройки вызванных колебаний [61].
Базовая концепция, лежащая в основе колебательной модели мозговой активности, основана на предположении, что исходно равномерное фазовое распределение на множестве эпох ЭЭГ может смениться распределением с преобладающим значением фазы в течение короткого времени после стимуляции [73]. Синхронизированная с событием подстройка фазы (phase resetting, phase alignment) оценивается по величине фазовой когерентности отдельных эпох (inter-trial phase coherence, ITC) [72]. Важно, что ITC является независимым от амплитуды колебаний показателем, и поэтому она способна выявить фазовое согласование даже очень слабых колебаний. Другой показатель динамики ЭЭГ отражает изменения спектральной мощности, связанные с экспериментальными событиями, и носит название “вызванное спектральное возмущение” (event-related spectral perturbation, ERSP) [72].
Колебания, лежащие в основе реакции на движение звука (MOR), исследованы в двух работах Шестопаловой и соавт. [9, 104]. Стимулы соответствовали парадигме отсроченного движения, созданного за счет изменений ∆T, и состояли из трех фрагментов низкочастотного шума, следующих друг за другом без пауз. Вначале звучал неподвижный фрагмент длительностью 1000 мс, затем следовал участок движения 200 или 400 мс, и в конце – снова неподвижный фрагмент 800 или 600 мс. Также использовался стимул той же длительности (2000 мс) с мгновенным изменением ∆T, приходившимся на его середину. Помимо суммарного потенциала, в этих работах измеряли фазовую подстройку (ITC) к моментам включения сигнала и начала его движения. Спектральное возмущение (ERSP) оценивали по отдельным эпохам анализа, получая “полное ERSP” (total ERSP), содержащее как вызванную, так и индуцированную активность, а также по суммарному потенциалу, получая “вызванное ERSP” (evoked ERSP), в котором отражена только когерентная вызванная активность, сохраняющаяся после усреднения по эпохам. Анализировалось влияние скорости движения стимула и направленности внимания слушателей на компоненты MOR, а также на фазовую когерентность отдельных эпох, полное спектральное возмущение и спектральное возмущение ВП.
Частотно-временное разложение суммарного ответа (рис. 5, вверху) показало, что движение стимула активизирует несколько иную колебательную активность, чем включение стимула. В частности, мощность дельта-ритмов в интервале между 1000 и 1500 мс была меньше, чем между 0 и 500 мс, и соотношение частот при формировании MOR было сдвинуто в сторону тета-альфа-полос, по сравнению с реакцией на включение. Однако, спектральные характеристики отдельных эпох (рис. 5, посередине) показали, что дельта-колебания также проявляют чувствительность к движению стимула.
Рис. 5. Частотно-временное представление реакций на быстрое и мгновенное перемещение стимула (усреднение по 24 фронто-центральным отведениям) [104] (с изменениями). Верхняя панель: спектральное возмущение ВП (вызванное ERSP). Средняя панель: спектральное возмущение отдельных эпох (полное ERSP). Градиентные шкалы верхней и средней панели показывают мощность ERSP, выраженную в дБ. Нижняя панель: фазовая когерентность отдельных эпох (ITC). Градиентная шкала показывает величину ITC в относительных единицах. Стрелками отмечены момент включения стимула и момент начала изменения межушных различий ΔT.
В условиях пассивного прослушивания три вида спектральных показателей различались по характеру зависимости от скорости стимула (рис. 6). Наиболее выраженная зависимость от скорости наблюдалась у фазовой когерентности и спектрального возмущения ВП, отражающего активность с высокой степенью фазовой подстройки к моменту начала движения. Спектральная мощность отдельных эпох, или полное спектральное возмущение, практически не возрастала вплоть до самого быстрого (мгновенного) перемещения стимула, а значит, плавное движение не индуцировало новых колебаний. В целом, фазовая когерентность колебаний дельта-альфа-диапазона возрастала с увеличением скорости движения так же, как амплитуда волн cN1 и cP2 MOR. Поэтому степень фазовой когерентности дельта-альфа-колебаний было предложено рассматривать в качестве нейрофизиологического коррелята процессов слуховой обработки движения [104].
Рис. 6. Колебательные ответы на начало движения как функция скорости стимула [104] (с изменениями). Частотно-временные представления реакций усреднены в четырех диапазонах частот ЭЭГ. Для приведения спектральных величин к соизмеримым единицам измерения было выполнено z-преобразование. По оси ординат – относительные единицы. По оси абсцисс – скорость стимулов в категориальном представлении: 1 – неподвижный, 2 – медленный, 3 – быстрый, 4 – мгновенное перемещение. Вертикальные черточки показывают стандартную ошибку среднего.
Принципиальным является вопрос о механизме воздействия движущегося стимула на колебательную активность: происходит ли только усиление продолжающихся колебаний, которые уже присутствовали в реакции на неподвижный участок стимула, или же имеет место подстройка фазы либо генерация дополнительных колебаний строго после начала движения. Поскольку исследование не выявило увеличения полного ERSP при медленном и быстром движении, механизмы усиления колебаний или генерации дополнительных представляются маловероятными. Следовательно, обработка умеренных скоростей связана в основном с фазовой подстройкой продолжающихся колебаний [104].
Несколько иные механизмы активизировались при мгновенном перемещении стимула. Оно дополнительно индуцировало слабо когерентные тета-альфа-колебания, которые вносили вклад в формирование потенциала MOR. Таким образом, генерация MOR в широком диапазоне скоростей преимущественно определяется фазовой подстройкой колебаний к моменту начала движения, а при мгновенной перемене положения могут генерироваться дополнительные колебания тета-альфа частот.
Следует подчеркнуть, что зависимость полного ERSP от скорости имела сходный характер для колебаний дельта-, тета- и нижней альфа-полосы, поэтому было бы неправильно проводить функциональные различия между медленными ритмами, вовлеченными в обработку движения. Наши результаты говорят скорее в пользу представлений о “медленных колебаниях” как единой нейрональной основе сенсорных процессов [117].
В условиях активной локализации испытуемые сосредоточивали свое внимание на пространственных свойствах стимула. Из всех спектральных показателей, самое сильное влияние активная локализация оказала на полное ERSP. В дельта-тета -диапазоне наблюдалось значительное усиление полного ERSP при всех скоростях, длящееся с момента начала движения до конца эпохи (см. рис. 2 в работе [9]). Альфа-частоты демонстрировали аналогичное усиление, но оно продолжалось не более 500 мс после начала движения, поскольку в активных условиях усиление компенсировалось за счет подавления мю-ритмов, связанных с подготовкой отсроченного двигательного ответа. Кроме того, в активных условиях зависимость мощности дельта- и тета-колебаний от скорости была выражена сильнее, чем в пассивных, о чем свидетельствует наклон кривых полного ERSP (см. рис. 4 в работе [9]). Эти результаты указывают на генерацию индуцированной дельта-тета-активности при выполнении локализационного задания.
Аналогичного эффекта для вызванной мощности и для ITC практически не наблюдалось. Рост фазовой когерентности обнаружен только в дельта-полосе. Как было сказано в предыдущем разделе обзора, влияние направленности внимания на параметры MOR заключается в изменении его формы в интервале между пиками cN1 и cP2. Частотные характеристики потенциала MOR имеют максимальную мощность в диапазоне от тета- до нижних альфа-частот. В этом диапазоне привлечение внимания к стимуляции не приводило ни к изменению вызванного ERSP, ни к дополнительной фазовой подстройке в момент начала движения. Можно предположить, что к искажению формы вызванных потенциалов могло приводить наложение активности связанных с вниманием нейрональных сетей, не синхронизированной или слабо синхронизированной со слуховыми событиями.
Усиление спектральной мощности и когерентности при активной локализации максимально выражено в диапазоне дельта-частот, которые не вносят значительного вклада в MOR. Концентрация эффекта внимания в дельта-полосе может отчасти объясняться синхронизацией активности слуховой системы с ритмами использованной звуковой стимуляции. Согласно многочисленным данным, именно дельта-колебания играют основную функциональную роль в механизмах временнóго предсказания в ходе слухового восприятия [14, 50, 121].
ТОПОГРАФИЯ MOR И ЕГО ИСТОЧНИКОВ
Топография суммарного потенциала MOR описана в нескольких работах. В самом первом исследовании Krumbholz и соавт. оценивали латерализацию ответа при помощи вычисления источников, основанного на моделировании эквивалентных токовых диполей методом BESA (Brain Electrical Source Analysis, v5.1) [67]. Для каждого из полушарий мозга было вычислено по два эквивалентных диполя и соответствующих им потенциала, характеризующих ответы на движение влево и вправо от центра. Обнаружено контралатеральное доминирование реакции, более выраженное для движения влево, чем вправо. Авторы отмечают значительную разницу в латентности компонента cN1 между ипси- и контралатеральным диполем: при движении влево латентность пика cN1 правого (контралатерального) диполя была на 18.7 мс меньше, чем у ипсилатерального диполя. При движении вправо также наблюдалась аналогичная разница латентностей, но она составляла всего 6.1 мс. По предположению авторов, большая часть ипсилатерального ответа на движение влево может поступать из контралатерального (правого) полушария через мозолистое тело. Обобщая полученные результаты и опубликованные ранее данные фМРТ [65], авторы делают вывод, что потенциал MOR получает относительно небольшой вклад активности первичной слуховой коры и генерируется в основном вторичными (nonprimary) слуховыми зонами, расположенными позади областей, чувствительных к высоте звука [17, 115]. При этом стимулы, движущиеся справа, вызывают реакцию обоих полушарий мозга, а движущиеся слева – в основном правого (контралатерального) полушария [66].
В следующей работе Getzmann [34] выполнил топографический анализ компонентов cN1 и cP2 методом картирования плотности тока (scalp current densities, SCD [84]), позволяющим получить более высокое разрешение пиков, чем традиционное картирование потенциала. Распределение SCD вычисляли в моменты времени, соответствующие среднеквадратическим максимумам cN1 и cP2, и на его основе оценивали соотношение величин реакции полушарий мозга. Измерение потенциала MOR, вызванного движением влево и вправо, выявило контралатеральность кортикальной обработки движения: cN1 и cP2 были более выражены в полушарии, контралатеральном направлению движения, по сравнению с ипсилатеральным. Важный результат состоял также в том, что межполушарная асимметрия зависела от скорости стимула. При быстром движении фронто-центральная и теменная активация были сильнее в контралатеральном полушарии. При средней скорости только движение влево вызывало контралатеральное преобладание ответа, а при движении вправо реакция была билатерально симметричной. В случае медленного движения наблюдалось доминирование реакции правого полушария.
Несмотря на то, что в работе Krumbholz и соавт. [67] движение создавалось за счет изменений ΔT, а Getzmann [34] применял передаточные функции головы (HRTF), существенных различий в латерализации MOR между этими исследованиями не было. Строго говоря, напрямую сравнивать результаты этих работ невозможно, так как топография ответа оценивалась в них разными алгоритмами. Поэтому представляет специальный интерес анализ топографии MOR в упоминавшейся выше работе Getzmann, Lewald [37], в которой были использованы четыре вида пространственных признаков: линейные изменения ∆T или ∆I, виртуальное движение на основе фильтров HRTF и движение в свободном поле. Межполушарную асимметрию оценивали по среднеквадратическому максимуму активности левого и правого полушария (по 24 отведения ЭЭГ в каждом).
При всех видах стимуляции, компонент cN1 характеризовался сильной негативностью в билатеральных фронто-центральных областях. В дополнение к контралатеральному преобладанию cN1 [34, 67], была выявлена более сильная активация в правом полушарии, в особенности при движении влево. Важно, что усиление правосторонней активации наблюдалось только при движении в свободном поле и за счет передаточной функции головы. Авторы предполагают, что в этих ситуациях пространственно обогащенные стимулы (по сравнению с изменениями только ∆T или ∆I) могут активировать правосторонние нейрональные сети, связанные с непроизвольным вниманием и отражающие надмодальные аспекты пространственного восприятия. Распределение волны cP2 соответствовало фронто-центральной позитивности и билатеральной височно-теменной негативности. В отличие от cN1, контралатеральное доминирование cP2 выявлено только для изменений ∆T и ∆I, т.е. в случае “обедненных” пространственных признаков. В то же время, начало виртуального движения (фильтры HRTF) вызывало правостороннюю асимметрию cP2. Движение в свободном поле в равной степени активировало оба полушария.
Несмотря на различия, связанные с особенностями стимуляции, в целом латерализация потенциала MOR соответствует так называемой “модели игнорирования” (neglect model), описывающей различия в степени контралатеральности между левой и правой слуховой корой [111]. Согласно этой модели, правое полушарие реагирует на звуковые сигналы с левой и с правой стороны, создавая глобальное представление акустического пространства, тогда как левое полушарие реагирует в большей степени на сигналы, поступающие из контралатеральной (правой) стороны пространства. Достоверность модели игнорирования была подтверждена как для неподвижных сигналов [28, 57, 93], так и для движения [22, 67, 100, 104].
К настоящему времени значительно меньше известно о латерализации нейрональных ритмов, составляющих основу слуховой обработки движения. Как было сказано в предыдущем разделе, частотно-временное представление вызванной слуховой активности характеризуется четкой подстройкой фазы колебаний в тета-альфа-диапазоне частот. Исследование фазовой синхронизации при осознанном восприятии неподвижных стимулов [55], а также построение динамических каузальных моделей кортикальных сетей, активируемых в слуховом пространственном эксперименте в режиме odd-ball [29], показали применимость модели игнорирования для описания межполушарной асимметрии.
Целенаправленное исследование латерализации колебательных реакций, вызванных движением звука, было предпринято в исследовании Шестопаловой и соавт. [103]. В этой работе оценивали полное спектральное возмущение (ERSP) и фазовую подстройку (ITC), а также суммарные потенциалы в реакциях левого и правого полушарий мозга на движение звуковых стимулов влево и вправо. Поскольку межполушарная асимметрия подвержена влиянию внимания, применялись два экспериментальных условия: активная локализация стимулов с использованием графического планшета и пассивное прослушивание тех же стимулов при чтении книги. Стимулы с отсроченным движением были те же, что и в работе [104], описанной в предыдущем разделе.
Спектральное возмущение (ERSP) правого полушария было больше, чем левого, в широком диапазоне частот; однако только в дельта-тета-полосе правосторонняя асимметрия ERSP была связана со слуховыми событиями (включение сигнала и начало движения). Асимметрия дельта-тета-ритмов была более выражена в условиях активной локализации, что может быть связано с активацией правополушарных нейронных сетей, связанных с вниманием [37]. Правостороннее доминирование альфа- и бета-ритмов наблюдалось на всем протяжении эпохи анализа и было сильнее в пассивных условиях, поэтому его можно интерпретировать как проявление неоднократно описанной большей вовлеченности правого полушария в предсознательную обработку слуховых стимулов [18, 23, 46, 80, 112, 119, 120].
В работе [103] была исследована топография компонентов MOR. Она не зависела от скорости стимулов и соответствовала “модели игнорирования”: суммарные реакции левого полушария были больше в случае контралатерального движения, а MOR правого полушария не зависел от направления. Интересно, что в работах Getzmann и Lewald [37–40] вообще не наблюдалось различий в степени контралатеральности потенциала MOR левого и правого полушарий.
Латерализация фазовой подстройки (ITC) также характеризовалась большей контралатеральностью реакций левого полушария [103]. При этом дельта-колебания обоих полушарий демонстрировали большие величины ITC в реакции на движение вправо. Примечательно, что фазовая подстройка тета-ритмов левого полушария была сильнее для правостороннего движения, тогда как в правом полушарии наблюдался достаточно быстрый (порядка 200 мс) переход от ипси- к контралатеральному доминированию тета-ритмов. Такая динамика ITC указывает на то, что слуховая обработка движения вызывает динамическую перестройку нейрональных ансамблей в течение времени, необходимого для анализа смещения стимула.
MOR КАК КОРРЕЛЯТ ПРОЦЕССОВ ИНТЕГРАЦИИ ПРОСТРАНСТВЕННОЙ ИНФОРМАЦИИ
Важным аспектом изучения MOR является его связь с психофизическими показателями обнаружения движения и пространственной разрешающей способности слуха, а именно – минимальным различимым углом (minimum audible angle, MAA) для неподвижных сигналов и минимальным различимым углом движения (minimum audible movement angle, MAMA) для движущихся. Установлено, что характеристики потенциала MOR тесно коррелируют с временем реакции при субъективном различении движущихся сигналов [34, 37]. Вместе с тем наблюдается важное ограничение: потенциал MOR регистрируется при движении стимула со скоростями не ниже 60 град/с [34, 37, 39, 47, 48, 67], тогда как на психофизическом уровне человек способен различать гораздо более медленное движение [13, 24, 25, 36, 42, 52, 92, 99]. Эти различия могут объясняться соотношением временного интервала, который требуется для формирования вызванного ответа, и времени, за которое звуковой сигнал проходит расстояние, соответствующее минимально различимому углу для движущихся стимулов (MAМA).
Совокупность работ по локализации звуковых стимулов свидетельствует, что с ростом скорости движения MAMA линейно возрастает, и при этом время обнаружения движения источника звука, определяемое как время достижения MAMA, с увеличением скорости сокращается [2, 6, 26, 42, 86]. В основе ухудшения пространственной остроты слуховой системы с ростом скорости стимула лежит ее инерционность, т.е. свойство обнаруживать смещение источника звука не мгновенно, а лишь по прошествии некоторого промежутка времени, необходимого для интеграции акустической информации. Имеющиеся в литературе значения времени интеграции для слуховой системы человека варьируют в широких пределах, в зависимости от способа его оценки и от вида звуковой стимуляции. При изучении граничных условий возникновения ощущения движения время интеграции составляло 80–150 мс [1, 2], а при определении пространственной разрешающей способности слуха (МАМА) этот временной промежуток достигал нескольких сотен миллисекунд [25, 26, 91].
В подробном исследовании пространственной разрешающей способности слуховой системы человека в горизонтальной плоскости Chandler и Grantham впервые предложили критерий минимального времени интеграции, опирающийся на линейную связь величин МАМА и скорости движения стимула [26]. Авторы оценивали время, необходимое для достижения оптимального пространственного разрешения (MIT, Minimal Integration Time), по длительности сигнала, при которой величина МАМА достигает значения, превышающего величину МАА на 25%. Используя движущиеся сигналы без отсроченного начала, Chandler и Grantham получили величины MIT в несколько сотен миллисекунд.
Парадигма отсроченного начала движения применялась в работах Семеновой с соавт. [6] и Шестопаловой с соавт. [105]. Авторами этих работ был предложен иной способ расчета оптимального времени интеграции, основанный на линейной регрессии величин МАМА (в единицах углового смещения) и времени достижения МАМА (в миллисекундах) для набора из семи скоростей. В результате получена оценка окна интеграции, характеризующего процесс анализа динамической пространственной информации. Нижняя граница этого временного окна, представляющая собой минимальное время определения направления мгновенного перемещения стимула, составила 8–10 мс. Независящее от скорости оптимальное время интеграции движения звука составило 35–40 мс. По мнению авторов, окно интеграции не следует понимать как строго фиксированный временной промежуток между минимальным и оптимальным временем интеграции. Окно временной интеграции является динамической характеристикой, изменяющейся в зависимости от индивидуальных особенностей человека и пространственных характеристик звука.
В комплексных исследованиях Семеновой [7] и Шестопаловой с соавт. [105], посвященных параллельной электрофизиологической и психофизической оценке окна интеграции на одной и той же выборке слушателей, среди прочего проверяли предположение о том, что латентность MOR может быть объективным показателем процессов временнóго интегрирования пространственной информации, происходящего в слуховой системе в ходе восприятия движущихся стимулов. Было показано, что латентность компонентов MOR-ответа, также как и пороговое время определения направления движения, обратно пропорциональны скорости движения и могут быть аппроксимированы гиперболическими функциями (рис. 7). Асимптоты этих функций указывают нижний предел времени, необходимого для накопления пространственно-динамической информации и формирования ответа.
Рис. 7. Латентность компонентов потенциала MOR и время достижения MAMA в зависимости от скорости движения звукового стимула [7]. Левая ось ординат – латентность (мс), правая ось ординат – время достижения МАМА (время определения направления смещения звука, мс); по оси абсцисс – скорость движения. Черные маркеры – латентности компонентов cN1 и cP2. Белые маркеры с черной обводкой – данные работы Shestopalova at al. (2021). Серым цветом маркированы данные психофизического эксперимента (7 скоростей движения).
В ходе активной локализации перед слушателями ставилась задача определить направление движения стимула (влево или вправо от центра). Предельное минимальное время интеграции, т.е. время, необходимое для определения направления мгновенного перемещения стимула, составило около 8 мс (серый пунктир на рис. 7). Оптимальное время интеграции акустической информации о движении было определено как время, достаточное для того, чтобы звуковые стимулы прошли траекторию, на 25% превышающую минимальный угол смещения. Оно составило около 35 мс.
При формировании вызванного потенциала нижний предел латентности компонента cN1 соответствовал предельно высокой скорости (черный пунктир на рис. 7), т.е. мгновенному перемещению стимула. Этот предел составил 137 мс, что на 37 мс больше латентности ответа на включение (компонент N1). Аналогичная разница в латентности между пиками cN1 и N1 (46 мс) была обнаружена ранее в работе Krumbholz и соавт. (2007) [67]. Авторы использовали высокую скорость движения (около 600 град/с), моделируемую путем постепенного нарастания ∆T от 0 до ±1000 мкс в течение 150 мс. Прямые измерения компонента cN1, вызванного мгновенным смещением звука, показали, что его пик приходится на 140 мс [40] или на 133 мс [104]. Таким образом, измерения латентности cN1 позволили предположить, что информация о быстром движении накапливается примерно на 37 мс дольше, чем информация о включении звукового сигнала, которая не требует бинауральной обработки. Дополнительное время накопления бинауральной информации при формировании потенциала MOR (37 мс) хорошо соотносится с величиной окна интеграции пространственной информации в задаче активной локализации (35 мс), а также со временем запаздывания локализации (40 мс), вычисленным по смещениям воспринимаемого положения начала траектории стимула [4].
Амплитуда cN1, как и функция времени определения направления в психофизическом эксперименте, демонстрировала экспоненциальное снижение. Это объясняет, почему не удается зарегистрировать MOR при медленном движении (при скоростях ниже 60 град/с). Медленные стимулы достигают МАМА за время, превосходящее 35 мс (рис.7, серые маркеры), и их смещение оказывается слишком незначительным и плавным для формирования MOR. Количественных данных относительно минимальных угловых смещений, которые могут вызвать MOR, в литературе недостаточно. В единственной работе, напрямую сравнивающей величину МАА и пороговое смещение, достаточное для формирования вызванного ответа при стимуляции в свободном поле, получены значения 2 град для МАА и 10 град для вызванного ответа [31]. Возможно, механизмы формирования MOR действительно обладают худшим пространственным разрешением, чем осознанная локализация стимулов. Это предположение требует дальнейшей экспериментальной проверки.
ВЫЗВАННЫЕ ПОТЕНЦИАЛЫ ПРИ АУДИОВИЗУАЛЬНОМ ВЗАИМОДЕЙСТВИИ
В повседневных ситуациях человеческое восприятие чаще всего является мультисенсорным. Звуковые сигналы часто (хотя и не всегда) исходят от объектов, находящихся в поле зрения. Задача мозга – совместить информацию, поступающую от слуховой системы, имеющей относительно низкое пространственное разрешение, но действующей во всех направлениях, с данными от зрительной системы, гораздо более точной, но ограниченной полем зрения. Межсенсорные (кросс-модальные) взаимодействия, происходящие на субкортикальном и кортикальном уровнях, создают условия для формирования целостного представления об объектах внешнего мира. Важный аспект интерпретации таких взаимодействий состоит в том, возникают ли они на перцептивном уровне обработки стимулов, или же претерпевают пост-перцептивные изменения и завершаются на уровне принятия решений1. В современной литературе преобладает мнение, что аудиовизуальная интеграция является распределенным процессом и реализуется параллельно в гетеромодальных областях мозга и в первичных специализированных сенсорных зонах. Поздние этапы межсенсорных взаимодействий, происходящие за пределами первичных зон, могут зависеть от внимания и поэтому не считаются сугубо предсознательным процессом [27, 60, 62]. Если рассмотреть иерархию структур мозга, вовлеченных в обработку сенсорной информации, то межсенсорные взаимодействия наблюдаются тем чаще, чем более высокий этап восприятия реализуется в данной структуре [108].
Явления аудиовизуальной интеграции в пространственной и во временной области достаточно подробно исследовались психофизическими методами [89]. Имеются немногочисленные свидетельства межсенсорных взаимодействий на предсознательном уровне, полученные при регистрации негативности рассогласования (mismatch negativity, MMN) в экспериментах с разделением слуховых потоков [87, 88]. Эти исследования были направлены на интеграцию неподвижных стимулов.
Вместе с тем в последние десятилетия отмечается рост интереса к межсенсорным взаимодействиям при восприятии движения [108]. Свидетельства аудиовизуальной интеграции движения на перцептивном уровне получены в исследованиях межсенсорного динамического захвата (crossmodal dynamic capture) [106, 107]. Этот феномен характеризует влияние стимула одной модальности на восприятие движения в другой модальности. Авторы показали, что различение направления движения источника звука заметно улучшалось, если движущиеся зрительные стимулы предъявлялись синхронно со звуковыми из того же положения; при рассинхронизации слуховых и зрительных стимулов слуховое различение движения ухудшалось до случайного уровня. При этом величина динамического захвата для движущихся стимулов намного превосходила ту, которую можно было бы ожидать, исходя исключительно из статического захвата. Эти результаты предполагают, что связанные с движением межсенсорные взаимодействия основываются на обработке движения per se, а не только на отдельных признаках, таких как местоположение или временная структура стимула. Аналогичный вывод получен в эксперименте с различением скорости звуковых стимулов в режиме двухальтернативного выбора при одновременном предъявлении движущихся зрительных стимулов: воспринимаемая скорость звукового образа зависела от скорости зрительного движения [70].
В целом слуховое восприятие движения подвержено влиянию различных признаков одновременно предъявляемого зрительного движения, таких как направление, плавность и скорость. Результаты психофизических исследований свидетельствуют, что межсенсорное связывание процессов обработки движения может происходить уже на ранних этапах восприятия, прежде чем вступают в действие эффекты, связанные с принятием решений. Однако электрическая активность мозга, обеспечивающая восприятие единого движущегося объекта как результата аудиовизуальной интеграции, все еще находится на начальном этапе изучения.
В зрительной модальности достаточно давно были описаны суммарные потенциалы (visual evoked potentials, VEPs), вызванные движением стимула. В большинстве работ использовались стимулы, содержащие паттерн, который начинал перемещаться после стационарного предъявления, достаточного для угасания ответа на включение [53]. Зрительное движение вызывает суммарные ответы в затылочных и затылочно-височных отведениях (motion VEPs), и эти ответы содержат компоненты P1 с латентностью 100–130 мс и N2 с латентностью 150–200 мс после начала движения [16, 83, 98]. В параметрах VEP отражаются важнейшие свойства механизмов зрительной обработки движения: чувствительность к направлению и эффект последействия движения, неразрывно связанный с процессами адаптации. Показателем обработки движения считается затылочно-височный негативный компонент N2, образованный суперпозицией “истинного” ответа на движение и активности нейрональных сетей, чувствительных к изменениям освещенности [78].
Motion VEPs могут быть вызваны сменой направления движения (как резкой, так и синусоидальной), а также остановкой движения. Латентность VEP сокращается, а амплитуда растет при увеличении скорости зрительного стимула [53]. По данным Patzwahl и Zanker, величина и латентность VEP на начало движения определялись степенью пространственной динамики стимула (“силой движения”), которая моделировалась его пространственной когерентностью [82]. Впоследствии было показано, что увеличение скорости движения приводит к сокращению не только латентности VEP на начало движения, но и времени реакции в задаче обнаружения движения, причем оба показателя могут быть аппроксимированы одной и той же отрицательной степенной функцией [63]. Авторы высказали предположение, что обнаружение движения происходит после того, как вызванный ответ достигает определенной критической величины.
Регистрация суммарных потенциалов в условиях аудиовизуального взаимодействия выполнена в очень ограниченном количестве работ. Исследование слуховых и зрительных ВП показало, что внимание к определенному направлению движения в одной модальности влияет на обработку движения в другой модальности [19]. Авторы сделали вывод, что направление движения играет важнейшую роль в связывании информации обеих модальностей, причем связывание происходит уже через 200 мс после начала стимула. Проявление аудиовизуального захвата на предсознательном этапе сенсорной обработки было продемонстрировано путем регистрации MMN. В этой работе была применена парадигма, в которой межсенсорное взаимодействие приводит к тому, что слуховые девианты становятся перцептивно идентичными стандартам, и генерация MMN подавляется [110]. Раннее влияние зрительного движения на обработку слухового движения было также обнаружено в эксперименте с отсроченным началом движения [41]. Аудиовизуальная интеграция наблюдалась уже через 170 мс после начала движения (компонент cN1 MOR) при регистрации активности первичной слуховой коры и задней верхней височной извилины.
Аудиовизуальная стимуляция неоднократно применялась для изучения эффекта последействия, возникающего в результате межсенсорной адаптации. Grzeschik и соавт. (2016) изучали эффект последействия зрительного движения на вызванные движением потенциалы зрительной и слуховой модальности (VEP и MOR) [49]. Временная структура зрительных и слуховых тестовых стимулов была одинаковой. Зрительный адаптер перемещался либо в том же направлении, что и тестовый стимул, либо в противоположном. Дирекциональная специфичность эффекта последействия обнаружена только в пределах одной модальности (зрительной): амплитуды компонентов cN2 и cP2 VEP при адаптации в одном и том же направлении были меньше, чем при адаптации в противоположном направлении. Что же касается межсенсорной адаптации, то эффект последействия наблюдался только для раннего компонента cP1 MOR, и он не зависел от направления движения адаптера. Основные компоненты MOR не отражали зрительную адаптацию процессов слуховой обработки движения.
Заметный эффект последействия слуховых адаптеров на VEP, вызванные кажущимся зрительным движением, описан в работе группы Kaya и соавт. [59]. Впоследствии было показано, что существует функциональная связь между аудиовизуальными взаимодействиями на ранних этапах сенсорной обработки и временем реакции, измеренным психофизическими методами. Тем самым подтверждается принципиально важная роль ранних межсенсорных взаимодействий для осознанного восприятия [58]. В целом регистрация VEP и MOR представляет собой эффективный инструмент изучения временной динамики процессов межсенсорной интеграции, особенно на ранних этапах формирования единого представления о движущемся объекте.
ЗАКЛЮЧЕНИЕ
Анализ имеющейся литературы позволяет выделить следующие важные свойства потенциала MOR: 1) амплитуда MOR растет со скоростью движения стимула; 2) латентность MOR обратно пропорциональна скорости движения; 3) MOR отражает обработку разных видов локализационных признаков, в том числе движения по вертикали и изменений пространственной протяженности звукового образа; 4) направленность внимания оказывает довольно слабое влияние на потенциал MOR по сравнению с ответом на включение сигнала. Эффект внимания проявляется главным образом в увеличении амплитуды MOR в интервале между пиками cN1 и cP2, т.е. в изменении формы потенциала.
Исследования реорганизации колебательной активности, лежащей в основе MOR, показали, что плавное движение звука вызывает подстройку фазы колебаний дельта-альфа-диапазона к моменту начала движения. Можно предположить, что в ансамбле чувствительных к локализационным изменениям нейронов имеются субпопуляции с различными окнами временной интеграции, активируемые стимулами разных скоростей. Различия временных параметров фазовой подстройки в разных субпопуляциях могут быть причиной сильной зависимости волны cN1 от скорости. Для подтверждения многообразия временных окон интеграции в ансамбле чувствительных к ∆T нейронов требуются целенаправленные исследования.
Несмотря на обширные данные об отражении кортикальной обработки движения в потенциале MOR, наличие специализированных чувствительных к движению механизмов в слуховой системе не получило ни подтверждения, ни опровержения. Парадигма отсроченного начала движения сама по себе не дает возможности разграничить вклад движения как отдельного признака и изменения положения звукового стимула в формирование компонентов MOR. Очевидно, потенциал MOR возникает задолго до того, как звук достигает конечной точки своей траектории, поэтому реальные значения пространственного сдвига, отраженные в компонентах потенциала MOR, нельзя измерить напрямую. Пространственное окно интеграции, характеризующее механизмы формирования MOR, может стать предметом дальнейших исследований.
До сих пор не получил окончательного решения вопрос о том, есть ли взаимосвязь между топографическим распределением MOR и скоростью стимула, или же с ростом скорости увеличивается только сила ответа, без изменения положения фокуса активности. Наконец, по-прежнему представляет интерес получение MOR в условиях стимуляции в свободном звуковом поле, позволяющей моделировать движение в трехмерном пространстве, в тишине и в присутствии других звуковых и зрительных стимулов. Анализ параметров MOR в таких условиях может дать новые сведения об активации мозговых структур, которые уже на раннем предсознательном этапе обеспечивают ориентацию человека в пространстве и его адаптацию к изменяющейся акустической среде.
ИСТОЧНИКИ ФИНАНСИРОВАНИЯ
Работа выполнена при поддержке Госпрограммы 47 ГП “Научно-технологическое развитие Российской Федерации” (2019–2030).
_________________________
1 Например, испытуемые могут непреднамеренно путать модальность целевого стимула и дистрактора, и давать ответ на зрительное движение вместо слухового, или наоборот [114].
Сокращения: MOR – motion-onset response, ACC – acoustic change complex, МАМА – минимальный различимый угол движения (minimum audible movement angle), ВП – вызванные потенциалы, ЭЭГ – электроэнцефалография, МЭГ – магнитоэнцефалография, МРТ – магнитно-резонансная томография.
About the authors
L. B. Shestopalova
Pavlov Institute of Physiology, Russian Academy of Sciences
Author for correspondence.
Email: shestopalovalb@infran.ru
Russian Federation, 199034, St. Petersburg
V. V. Semenova
Pavlov Institute of Physiology, Russian Academy of Sciences
Email: shestopalovalb@infran.ru
Russian Federation, 199034, St. Petersburg
E. A. Petropavlovskaia
Pavlov Institute of Physiology, Russian Academy of Sciences
Email: shestopalovalb@infran.ru
Russian Federation, 199034, St. Petersburg
References
- Альтман Я.А. Локализация движущегося источника звука. Л.: Наука, 1983. 176 с.
- Альтман Я.А. Пространственный слух. СПб.: Институт физиологии им. И.П. Павлова РАН, 2011. 311 с.
- Варфоломеев А.Л., Старостина Л.В. Слуховые вызванные потенциалы человека при иллюзорном движении звукового образа // Российский физиологический журнал им.Сеченова. 2006. Т. 92. № 9. С. 1046–1057.
- Петропавловская Е.А., Шестопалова Л.Б., Вайтулевич С.Ф. Проявления инерционности слуховой системы при локализации движущихся звуковых образов малой длительности // Физиология человека. 2010. Т. 36. № 4. С. 1–10.
- Семенова В.В. Окно интеграции про-странственной слуховой информации у человека: электрофизиологические и психофизические аспекты восприятия: дис. ... канд. биол. наук. СПб.: Институт физиологии им. И.П. Павлова РАН, 2022. 118 с.
- Семенова В.В., Шестопалова Л.Б., Петропавловская Е.А., Никитин Н.И. Константы восприятия отсроченного движения звуковых стимулов // Успехи физиологических наук. 2020. Т. 51. № 2. С. 55–67. https://doi.org/10.31857/S0301179820020095
- Семенова В.В., Шестопалова Л.Б., Петропавловская Е.А., Саликова Д.А., Никитин Н.И. Латентность вызванного потенциала как показатель интегрирования акустической информации о движении звука // Физиология человека. 2022. Т.48. № 4. С. 57–68. https://doi.org/10.31857/S0131164622040105
- Шестопалова Л.Б., Петропавловская Е.А., Семенова В.В., Никитин Н.И. Вызванные потенциалы на звуковые стимулы с отсроченным началом движения в условиях активного и пассивного прослушивания // Журнал высшей нервной деятельности. 2016. Т. 66. № 5. С. 565–578. https://doi.org/10.7868/S0044467716050099
- Шестопалова Л.Б., Петропавловская Е.А., Семенова В.В., Никитин Н.И. Ритмическая активность мозга человека, связанная с движением звуковых стимулов // ЖВНД. 2020. Т. 70. № 5. С. 616–634. https://doi.org/10.31857/S0044467720050111.
- Ahissar M., Ahissar E., Bregman H., Vaadia E. Encoding of sound-source location and movement: Activity of single neurons and interactions between adjacent neurons in the monkey auditory cortex // Journal of Neurophysiology. 1992. V. 67. P. 203–215. https://doi.org/ 10.1152/jn.1992.67.1.203
- Altman J.A. Are there neurons detecting direction of sound source motion? // Experimental Neurology. 1968. V. 22. P. 13–25. https://doi.org/10.1016/0014-4886(68)90016-2
- Altman, J.A., Vaitulevich S.Ph. Auditory image movement in evoked potentials // Electroencephalography and Clinical Neurophysiology. 1990. V. 75. № 4. P. 323–333. https://doi.org/10.1016/0013-4694(90)90110-6
- Altman J.A., Viskov O.V. Discrimination of perceived movement velocity for fused auditory image in dichotic stimulation // The Journal of the Acoustical Society of America. 1977. V. 61. № 3. P. 816–819. https://doi.org/10.1016/0013-4694(90)90110-6
- Altmann C.F., Ueda R., Bucher B. et. al. Trading of dynamic interaural time and level difference cues and its effect on the auditory motion-onset response measured with electroencephalography // NeuroImage. 2017. V. 159. P. 185–194. https://doi.org/10.1016/j.neuroimage.2017.07.055
- Arnal L.H., Giraud A.L. Cortical oscillations and sensory predictions // Trends Cogn. Sci. 2012. V. 16. № 7. P. 390–398. https://doi.org/10.1016/j.tics.2012.05.003
- Bach M., Ullrich D. Motion adaptation governs the shape of motion-evoked cortical potentials // Vision Res. 1994. V. 34. P. 1541–1547. https://doi.org/10.1016/0042-6989(94)90111-2
- Barrett D.J.K., Hall D.A. Response preferences for “what” and “where” in human non-primary auditory cortex // Neuroimage. 2006. V. 32. P. 968–977. https://doi.org/10.1016/j.neuroimage.2006.03.050
- Baumgart F., Gaschler-Markefski B., Woldorff M.G., Heinze H.J., Schleich H. A movement-sensitive area in auditory cortex // Nature. 1999. V. 400. P. 724–726. https://doi.org/10.1038/23390
- Beer A.L., Röder B. Attending to visual or auditory motion affects perception within and across modalities: an event-related potential study // Eur J Neurosci. 2005. V. 21. № 4. P. 1116–30. https://doi.org/10.1111/j.1460-9568.2005.03927.x
- Bidet-Caulet A., Bertrand O. Dynamics of a temporo-fronto-parietal network during sustained spatial or spectral auditory processing // Journal of Cognitive Neuroscience. 2005. V. 17. № 11. P. 1691–1703. https://doi.org/10.1162/089892905774589244
- Bremmer F., Schlack A., Shah N.J. et al. Polymodal motion processing in posterior parietal and premotor cortex: a human fMRI study strongly implies equivalencies between humans and monkeys // Neuron. 2001. V. 29. № 1. P. 287–296. https://doi.org/10.1016/s0896-6273(01)00198-2
- Briley P.M., Kitterick P.T., Summerfield A.Q. Evidence for Opponent Process Analysis of Sound Source Location in Humans // J. Assoc. Res. Otolaryngol. 2013. V. 14. № 1. P. 83–101. https://doi.org/10.1007/s10162-012-0356-x
- Brunetti M., Belardinelli P., Caulo M. et al. Human brain activation during passive listening to sounds from different locations: an fMRI and MEG study // Hum. Brain Mapp. V. 2005. № 26. P. 251–261. https://doi.org/10.1002/hbm.20164
- Carlile S., Best V. Discrimination of sound source velocity by human listeners // The Journal of the Acoustical Society of America. 2002. V. 111. № 26. P. 1026–1035. https://doi.org/10.1121/1.1436067
- Carlile S., Leung J. The perception of Auditory motion // Trends in Hearing. 2016. V. 20. P. 1–19. https://doi.org/10.1177/2331216516644254
- Chandler D.W., Grantham D.W. Minimum audible movement angle in the horizontal plane as a function of stimulus frequency and bandwidth, source azimuth, and velocity // The Journal of Acoustical Society of America. 1992. V. 91. № 3. P. 1624–1636. https://doi.org/10.1121/1.402443
- Chaplin T.A., Rosa M.G.P., Lui L.L. Auditory and Visual Motion Processing and Integration in the Primate Cerebral Cortex // Front. Neural Circuits. 2018. V. 12. № 93. https://doi.org/10.3389/fncir.2018.00093
- Deouell L.Y., Bentin S., Giard M.H. Mismatch negativity in dichotic listening: evidence for interhemispheric differences and multiple generators // Psychophysiology. 1998. V. 35. P. 355–365.
- Dietz M.J., Friston K.J., Mattingley J.B., Roepstorff A., Garrido M.I. Effective connectivity reveals right-hemisphere dominance in audiospatial perception: implications for models of spatial neglect // J. Neurosci. 2014. V. 34. № 14. P. 5003–5011. https://doi org/10.1523%2FJNEUROSCI.3765-13.2014
- Ducommun C.Y., Murray M.M., Thut G. et al. Segregated processing of auditory motion and auditory location: an ERP mapping study // NeuroImage. 2002. V. 16. P. 76–88. https://doi.org/10.1006/nimg.2002.1062
- Fan Z.-T., Zhao Z.-H., Sharma M. et. al. Acoustic change complex evoked by horizontal sound location change in young adults with normal hearing // Frontiers in Neuroscience. 2022. V. 16. № 908989. https://doi.org/10.3389/fnins.2022.908989
- Freeman C. A., Leung J., Wufong E. et. al. Discrimination Contours for Moving Sounds Reveal Duration and Distance Cues Dominate Auditory Speed Perception // PLoS ONE. V. 9. № 7. e102864. https://doi.org/10.1371/journal.pone.0102864
- Getzmann S. Effects of velocity and motion-onset delay on detection and discrimination of sound motion // Hearing Research. 2008. V. 246. P. 44–51. https://doi.org/10.1016/j.heares.2008.09.007
- Getzmann S. Effect of auditory motion velocity on reaction time and cortical processes // Neuropsychologia. 2009. V. 47. P. 2625–2633.
- Getzmann S. Auditory motion perception: onset position and motion direction are encoded in discrete processing stages // European Journal of Neuroscience. 2011. V. 33. P. 1339–1350. https://doi.org/10.1111/j.1460-9568.2011.07617.x
- Getzmann S., Lewald J., Guski R. Representational momentum in spatial hearing // Perception. 2004. V. 33. P. 591–600. https://doi.org/10.1068/p5093
- Getzmann S., Lewald J. Effects of natural versus artificial spatial cues on electrophysiological correlates of auditory motion // Hearing Research. 2010a. V. 259. P. 44–54. https://doi.org/10.1016/j.heares.2009.09.021
- Getzmann S., Lewald J. Shared cortical systems for processing of horizontal and vertical sound motion // J. Neurophysiol. 2010b. V. 103. P. 1896–1904. http://dx.doi.org/10.1152/jn.00333.2009
- Getzmann S., Lewald J. The effect of spatial adaptation on auditory motion processing // Hearing Research. 2011. V. 272. № 1–2. P. 21–29. https://doi.org/10.1016/j.heares.2010.11.005
- Getzmann S., Lewald J. Cortical processing of change in sound location: Smooth motion versus discontinuous displacement // Brain Research. 2012. V. 1466. P. 119–127. https://doi.org/10.1016/j.brainres.2012.05.033
- Getzmann S., Lewald J. Modulation of Auditory Motion Processing by Visual Motion // Journal of Psychophysiology. 2014. V. 28. P. 82–100. https://doi.org/10.1027/0269-8803/a000113
- Grantham D.W. Detection and discrimination of simulated motion of auditory targets in the horizontal plane // The Journal of the Acoustical Society of America. 1986. V. 79. № 6. P. 1939–1949. https://doi.org/10.1121/1.393201
- Grantham D.W. Auditory motion perception: Snapshots revisited // Binaural and spatial hearing in real and virtual environments / Eds. R.H. Gilkey, T.R. Anderson. Mahwah, NJ: Lawrence Erlbaum Associates, 1997. P. 295–313.
- Griffiths T.D., Bench C.J., Frackowiak R.S.J. Human cortical areas selectively activated by apparent sound motion // Current Biology. 1994. V. 4. P. 892–895. https://doi.org/10.1016/s0960-9822(00)00198-6
- Griffiths T.D., Green G.G., Rees A., Rees G. Human brain areas involved in the analysis of auditory movement // Human Brain Mapping. 2000. V. 9. P. 72–80. https://doi.org/10.1002/(sici)1097-0193(200002)9:2%3C72::aid-hbm2%3E3.0.co;2-9
- Griffiths T.D., Rees G., Rees A. et al. Right parietal cortex is involved in the perception of sound movement in humans // Nature Neuroscience. 1998. V. 1. P. 74–79. https://doi.org/10.1038/276
- Grzeschik R., Böckmann-Barthel M., Mühler R., Hoffmann M.B. Motion-onset auditory-evoked potentials critically depend on history // Experimental Brain Research. 2010. V. 203. P. 159–168. https://doi.org/10.1007/s00221-010-2221-7
- Grzeschik R., Böckmann-Barthel M., Mühler R., Verhey J.L., Hoffmann, M.B. Direction-specific adaptation of motion-onset auditory evoked potentials // European Journal of Neuroscience. 2013. V. 38. P. 2557–2565. https://doi.org/10.1111/ejn.12264
- Grzeschik R., Lewald J., Verhey J.L., Hoffmann M.B., Getzmann S. Absence of direction-specific cross-modal visual-auditory adaptation in motion-onset ERPs // European Journal of Neuroscience. 2016. V. 43. № 1. P. 66–77. https://doi.org/10.1111/ejn.13102
- Haegens S., Golumbic E.Z. Rhythmic facilitation of sensory processing: A critical review // Neurosci. Biobehav. Rev. 2018. V. 86, P. 150–165. https://doi.org/10.1016/j.neubiorev.2017.12.002.
- Hall D.A., Hart H.C., Johnsrude I.S. Relationships between human auditory cortical structure and function // Audiology and Neuro-Otology. 2003. V. 8. № 1. P. 1–18. https://doi.org/10.1159/000067894
- Harris J.D., & Sergeant R.L. Monaural-binaural minimum audible angles for a moving sound source // Journal of Speech and Hearing Research. 1971. V. 14. P. 618–629. https://doi.org/10.1044/jshr.1403.618
- Heinrich S.P. A primer on motion visual evoked potentials // Documenta Ophthalmologica. 2007. V. 114. P. 83–105. https://doi.org/10.1007/s10633-006-9043-8
- Herrmann C.S., Grigutsch M., Busch N.A. EEG oscillations and wavelet analysis // Event-related potentials: а methods handbook / Ed. T.C. Handy. Cambridge, London: MIT Press, 2005. P. 229–259.
- Huang S., Chang W.-T., Belliveau J.W., Hämäläinen M., Ahveninen J. Lateralized parietotemporal oscillatory phase synchronization during auditory selective attention // Neuroimage. 2014. V. 86. P. 461–469. https://doi.org/10.1016/j.neuroimage.2013.10.043
- Jerger J., Estes R. Asymmetry in event-related potentials to simulated auditory motion in children, young adults, and seniors // Journal of the American Academy of Audiology. 2002. V. 13. № 1. P. 1–13.
- Kaiser J., Lutzenberger W., Preissl H., Ackermann H., Birbaumer N. Right-hemisphere dominance for the processing of sound-source lateralization // J. Neurosci. 2000. V. 20. P. 6631–6639. https://doi.org/10.1523/JNEUROSCI.20-17-06631.2000
- Kaya U., Kafaligonul H. Audiovisual interactions in speeded discrimination of a visual event // Psychophysiology. 2021. V. 58. № 4. e13777. https://doi.org/10.1111/psyp.13777
- Kaya U., Yildirim F.Z., Kafaligonul H. The involvement of centralized and distributed processes in sub-second time interval adaptation: an ERP investigation of apparent motion // EJN. 2017. V. 46. № 8. P. 2325–2338. https://doi.org/10.1111/ejn.13691.
- Kayser C., Petkov C.I., Remedios R., Logothetis N.K. Multisensory Influences on Auditory Processing: Perspectives from fMRI and Electrophysiology // The Neural Bases of Multisensory processes / Eds. M.M. Murray, M.T. Wallace. Boca Raton, London, N.Y.: CRC press, 2012. P. 99–114.
- Klimesch W., Sauseng P., Hanslmayr S., Gruber W., Freunberger R. Event-related phase reorganization may explain evoked neural dynamics // Neurosci. Biobehav. Rev. 2007. V. 31. P. 1003–1016. http://doi.org/10.1016/j.neubiorev.2007.03.005.
- Koelewijn T., Bronkhorst A., Theeuwes J. Attention and the multiple stages of multisensory integration: A review of audiovisual studies // Acta Psychologica. 2010. V. 134. P. 372–384. https://doi.org/10.1016/j.actpsy.2010.03.010
- Kreegipuu К., Allik J. Detection of motion onset and offset: reaction time and visual evoked potential analysis // Psychological Research. 2007. V. 71. № 6. P. 703–708. https://doi.org/10.1007/s00426-006-0059-1
- Kreitewolf J., Lewald J., Getzmann S. Effect of attention on cortical processing of sound motion: An EEG study // NeuroImage. 2011. V. 54. P. 2340–2349. https://doi.org/10.1016/j.neuroimage.2010.10.031
- Krumbholz K., Schönwiesner M., Rübsamen R. et.al. Hierarchical processing of sound location and motion in the human brainstem and planum temporale // Eur. J. Neurosci. 2005. V. 21. P. 230–238. https://doi.org/10.1111/j.1460-9568.2004.03836.x
- Krumbholz K., Schönwiesner M., von Cramon D.Y. et.al. Representation of interaural temporal information from left and right auditory space in the human planum temporale and inferior parietal lobe // Cerebral Cortex. 2005. V. 15. P. 317–324. https://doi.org/10.1093/cercor/bhh133
- Krumbholz K., Hewson-Stoate N., Schönwiesner M. Cortical response to auditory motion suggests an asymmetry in the reliance on inter-hemispheric connections between the left and right auditory cortices // J. Neurophysiol. 2007. V. 97. P. 1649–1655. https://doi.org/10.1152/jn.00560.2006
- Lewis J.W., Beauchamp M.S., DeYoe E.A. A comparison of visual and auditory motion processing in human cerebral cortex // Cerebral Cortex. 2000. V. 10. № 9. P. 873–88. https://doi.org/10.1093/cercor/10.9.873
- Locke S.M., Leung J., Carlile S. Sensitivity to Auditory Velocity Contrast // Scientific Reports. 2016. V. 6. № 27725. https://doi.org/10.1038/srep27725.
- López-Moliner J., Soto-Faraco S. Vision affects how fast we hear sounds move // Journal of Vision. 2007. V. 7. № 12. P. 1–7. https://doi.org/10.1167/7.12.6
- Magezi D.A., Krumbholz K. Evidence for opponent channel coding of interaural time differences in human auditory cortex // J. Neurophysiol. 2010. V. 104. № 4. P. 1997–2007. https://doi.org/10.1152/jn.00424.2009
- Makeig S., Debener S., Onton J., Delorme A. Mining event-related brain dynamics // Trends Cogn. Sci. 2004. V. 8. № 5. P. 204–210. http://doi.org/10.1016/j.tics.2004.03.008
- Makeig S., Westerfield M., Jung T.-P. et al. Dynamic brain sources of visual evoked responses // Science. 2002. V. 295. P. 690–694. https://doi.org/10.1126/science.1066168
- Mäkelä J.P., McEvoy L. Auditory evoked fields to illusory sound source movements // Exp. Brain Res. 1996. V. 110. P. 446–454. https://doi.org/10.1007/BF00229144
- Martin B.A., Boothroyd A. Cortical, auditory, event-related potentials in response to periodic and aperiodic stimuli with the same spectral envelope // Ear Hear. 1999. V. 20. № 1. P. 33–44. https://doi.org/10.1097/00003446-199902000-00004
- Martin B.A., Boothroyd A. Cortical, auditory, evoked potentials in response to changes of spectrum and amplitude // J. Acoust. Soc. Am. 2000. V. 107. P. 2155–2161. https://doi.org/10.1121/1.428556
- Martin B.A., Boothroyd A., Ali D., Leach-Berth T. Stimulus presentation strategies for eliciting the acoustic change complex: increasing efficiency // Ear Hear. 2010. V. 31. № 3. P. 356–366. https://doi.org/10.1097/AUD.0b013e3181ce6355
- Maurer J.P., Bach M. Isolating motion responses in visual evoked potentials by pre-adapting flicker-sensitive mechanisms // Exp. Brain Res. 2003. V. 151. P. 536–541. https://doi.org/10.1007/s00221-003-1509-2
- Ostroff J.M., Martin B.A., Boothroyd A. Cortical evoked response to acoustic change within a syllable // Ear Hear. 1998. V. 19. P. 290–297. https://doi.org/10.1097/00003446-199808000-00004
- Palomäki K., Alku P., Mäkinen V., May P., Tiitinen H. Sound localization in the human brain: neuromagnetic observations // NeuroReport. 2000. V. 11. P. 1535–1538.
- Papesh M.A., Folmer R.L., Gallun F.J. Cortical Measures of Binaural Processing Predict Spatial Release from Masking Performance // Front. Hum. Neurosci. 2017. V. 11. № 124. https://doi.org/10.3389/fnhum.2017.00124.
- Patzwahl D.R., Zanker J.M. Mechanisms of human motion perception: combining evidence from evoked potentials, behavioural performance and computational modeling // European Journal of Neuroscience. 2000. V. 12. P. 273–282. https://doi.org/10.1046/j.1460-9568.2000.00885.x
- Patzwahl D.R., Zanker J.M., Altenmüller E.O. Cortical potentials reflecting motion processing in humans // Vis. Neurosci. 1994. V. 11. P. 1135–1147. https://doi.org/10.1017/s0952523800006945
- Pavani F., Macaluso E., Warren J.D., Driver J., Griffiths T.D. A common cortical substrate activated by horizontal and vertical sound movement in the human brain // Curr. Biol. 2002. V. 12. P. 1584–1590. https://doi.org/10.1016/S0960-9822(02)01143-0
- Perrin F., Pernier J., Bertrand O., Echallier J.F. Spherical splines for scalp potential and current density mapping // Electroencephalography and Clinical Neurophysiology. 1989. V. 72. P. 184–187.
- Perrott D.R., Musicant A. Rotating tones and binaural beats // Journal of the Acoustical Society of America. 1977. V. 61. № 5. P. 1288–1292. https://doi.org/10.1121/1.381430
- Rahne T., Böckmann M., von Specht H., Sussman E.S. Visual cues can modulate integration and segregation of objects in auditory scene analysis // Brain Res. 2007. V. 1144. P. 127–135. https://doi.org/10.1016/j.brainres.2007.01.074
- Rahne T., Böckmann-Barthel M. Visual cues release the temporal coherence of auditory objects in auditory scene analysis // Brain Res. 2009. V. 1300. P. 125–134. https://doi.org/10.1016/j.brainres.2009.08.086.
- Recanzone G.H. Interactions of auditory and visual stimuli in space and time // Hear. Res. 2009. V. 258. P. 89–99. https://doi.org/10.1016/j.heares.2009.04.009.
- Roggerone V., Vacher J., Tarlao C. et al. Auditory motion perception emerges from successive sound localizations integrated over time // Sci. Rep. 2019. V. 9. № 16437. https://doi.org/10.1038/s41598-019-52742-0
- Saberi K., Hafter E.R. Experiments on Auditory Motion Discrimination // Binaural and spatial hearing in real and virtual environments / Eds. R.H. Gilkey, T.R. Anderson. Mahwah, NJ: Lawrence Erlbaum Associates, 1997. P. 315–329.
- Saberi K., Perrott D.R. Minimum audible movement angles as a function of sound source trajectory // Journal of the Acoustical Society of America. 1990. V. 88. № 6. P. 2639–2644. https://doi.org/10.1121/1.399984
- Salminen N.H., May P.J.C., Alku P., Tiitinen H. A Population Rate Code of Auditory Space in the Human Cortex // PLoS ONE. 2009. V. 4. № 10. e7600. https://doi.org/10.1371/journal.pone.0007600
- Salminen N.H., Tiitinen H., Miettinen I., Alku P., May P.J. Asymmetrical representation of auditory space in human cortex // Brain.Res. 2010. V. 1306. P. 93–99. https://doi.org/10.1016/j.brainres.2009.09.095
- Salminen N.H., Tiitinen H., May P.J.C. Auditory spatial processing in the human cortex // Neuroscientist. 2012. V. 18. № 6. P. 602–612. https://doi.org/10.1177/1073858411434209
- Sams M., Hämäläinen M., Hari R., McEvoy L. Human auditory cortical mechanisms of sound lateralization: I. Interaural time differences within sound // Hear. Res. 1993. V. 67. № 1–2. P. 89–97. https://doi.org/10.1016/0378-5955(93)90236-t
- Sarrou M., Schmitz P.M., Hamm N., Rübsamen R. Sound frequency affects the auditory motion-onset response in humans // Experimental Brain Research. 2018. V. 236. P. 2713–2726. https://doi.org/10.1007/s00221-018-5329-9
- Schlykowa L., van Dijk B.W., Ehrenstein W.H. Motion-onset visual-evoked potentials as a function of retinal eccentricity in man // Cognit. Brain Res. 1993. V. 1. P. 169–174. https://doi.org/10.1016/0926-6410(93)90024-y
- Schmiedchen K., Freigang C., Rübsamen R., Richter N. A comparison of visual and auditory representational momentum in spatial tasks // Attention, Perception, & Psychophysics. 2013. V. 75. № 7. P. 1507–1519. https://doi.org/10.3758/s13414-013-0495-0
- Schönwiesner M., Krumbholz K., Rübsamen R., Fink G.R., von Cramon D.Y. Hemispheric asymmetry for auditory processing in the human auditory brainstem, thalamus, and cortex // Cereb.Cortex. 2007. V. 17. P. 492–499. https://doi.org/10.1093/cercor/bhj165
- Senna, I., Parise C. V., Ernst M. O. Hearing in slow motion: Humans underestimate the speed of moving sounds // Sci. Rep. 2015. V. 5. № 14054. https://doi.org/10.1038/srep14054
- Senna I., Parise C.V., Ernst M.O. Modulation frequency as a cue for auditory speed perception // Proc. R. Sci. 2017. V. 284. № 20170673. http://dx.doi.org/10.1098/rspb.2017.0673
- Shestopalova L.B., Petropavlovskaia E.A., Semenova V.V., Nikitin N.I. Lateralization of brain responses to auditory motion: A study using single-trial analysis // Neuroscience Res. 2021а. V. 162. P. 31–44. https://doi.org/10.1016/j.neures.2020.01.007
- Shestopalova L.B., Petropavlovskaia E.A., Semenova V.V., Nikitin N.I. Brain Oscillations evoked by sound motion // Brain Research. 2021b. V. 1752. № 147232. https://doi.org/10.1016/j.brainres.2020.147232
- Shestopalova L.B., Petropavlovskaia E.A., Salikova D.A., Semenova V.V. Temporal integration of sound motion: Motion-onset response and perception // Hearing Research. 2024. V. 441. № 108922. https://doi.org/10.1016/j.heares.2023.108922
- Soto-Faraco S., Kingstone A., Spence C. Multisensory contributions to the perception of motion // Neuropsychologia. 2003. V. 41. P. 1847–1862. https://doi.org/10.1016/s0028-3932(03)00185-4
- Soto-Faraco S., Spence C., Kingstone A. Crossmodal dynamic capture: congruency effects in the perception of motion across sensory modalities // J. Exp. Psychol. Hum. Perform. Percept. 2004. V. 30. № 2. P. 330–345. https://doi.org/10.1037/0096-1523.30.2.330
- Soto-Faraco S., Väljamäe A. Multisensory Interactions during Motion Perception // The Neural Bases of Multisensory processes / Eds. M.M. Murray, M.T. Wallace. Boca Raton, London, N.Y.: CRC press, 2012. P. 583–602.
- Spitzer M.W., Semple M.N. Interaural phase coding in auditory midbrain: influence of dynamic stimulus features // Science. 1991. V. 254. № 5032. P. 721–724. https://doi.org/10.1126/science.1948053
- Stekelenburg J.J. & Vroomen J. Neural correlates of audiovisual motion capture // Experimental Brain Research. 2009. V. 198. P. 383–390.
- Teshiba T.M., Ling J., Ruhl D.A. et.al. Evoked and intrinsic asymmetries during auditory attention: implications for the contralateral and neglect models of functioning // Cereb. Cortex. 2013. V. 23. № 3. P. 560–569. https://doi.org/ 10.1093/cercor/bhs039
- Tiitinen H., Salminen N.H., Palomäki K. et.al. Neuromagnetic recordings reveal the temporal dynamics of auditory spatial processing in the human cortex // Neurosci. Lett. 2006. V. 396. P. 17–22. https://doi.org/10.1016/j.neulet.2005.11.018
- Toronchuk J.M., Stumpf E., Cynader M.S. Auditory cortex neurons sensitive to correlates of auditory motion: underlying mechanisms // Experimental Brain Research. 1992. V. 88. P. 169–180. https://doi.org/10.1007/BF02259138
- Vroomen J., de Gelder B. Visual motion influences the contingent auditory motion aftereffect // Psychol. Sci. 2003. V. 14. № 4. P. 357–361. https://doi.org/10.1111/1467-9280.24431
- Warren J.D., Griffiths T.D. Distinct mechanisms for processing spatial sequences and pitch sequences in the human auditory brain // J. Neuroscience. 2003. V. 23. № 13. P. 5799–5804. https://doi.org/10.1523/JNEUROSCI.23-13-05799.2003
- Warren J.D., Zielinski B.A., Green G.G., Rauschecker J.P., Griffiths T.D. Perception of sound-source motion by the human brain // Neuron. 2002. V. 34. № 1. P. 139–148. https://doi.org/10.1016/s0896-6273(02)00637-2
- Weisz N., Obleser J. Synchronisation signatures in the listening brain: a perspective from non-invasive neuroelectrophysiology // Hear. Res. 2014. V. 307. P. 16–28. http://doi.org/10.1016/j.heares.2013.07.009
- Xiang J., Chuang S., Wilson D. et.al. Sound motion evoked magnetic fields // Electroencephalography and Clinical Neurophysiology. 2002. V. 113. P. 1–9. https://doi.org/10.1016/s1388-2457(01)00709-x
- Zatorre R.J., Mondor T.A., Evans A.C. Auditory attention to space and frequency activates similar cerebral systems // NeuroImage. 1999. V. 10. № 5. P. 544–554. https://doi.org/10.1006/nimg.1999.0491
- Zatorre R.J., Bouffard M., Ahad P., Belin P. Where is ‘where’ in the human auditory cortex? // Nat. Neurosci. 2002. V. 5. № 9. P. 905–909. https://doi.org/10.1038/nn904
- Zoefel B., ten Oever S., Sack A.T. The Involvement of Endogenous Neural Oscillations in the Processing of Rhythmic Input: More Than a Regular Repetition of Evoked Neural Responses // Front. Neurosci. 2018. V. 12. № 95. https://doi.org/10.3389/fnins.2018.00095
Supplementary files
