Локализация (акустика)

Под локализацией относится к обнаружению направления и расстояния на источнике звука в качестве локализации звука и расстояния слуха , то есть локализация направления и локализация расстояния . Это означает, что локализация - это пассивный процесс, в отличие от локализации , который описывает активный процесс, в котором поведение передаваемого сигнала используется для локализации (например, сонар или эхолокация у животных ).

Обозначение трех уровней
вверху: 1-й горизонтальный уровень (поперечный уровень)
 средний: 2-й средний уровень (сагиттальный уровень)
внизу: 3-й фронтальный уровень

Локализация источников звука является результатом как бинаурального (бинаурального) слуха - в горизонтальной плоскости - так и монофонического (монофонического) слуха - в срединной плоскости . В этой статье описывается локализация источников звука у человека. У животных также играют роль другие эффекты (например, влияние движений ушей).

Принцип локализации в пространстве

На картинке показаны возможные уровни, которые можно использовать для локализации источника звука в комнате. Однако для точной локализации требуется только следующая информация:

  • угол падения в полуплоскости
  • угол падения в полной плоскости
  • расстояние

С помощью первых двух деталей можно охватить все пространство под углом (поворот полуплоскости на угол с полной плоскостью). Это также соответствует взаимодействию механизмов, которые слух использует для локализации источников звука.

В зависимости от механизмов, которые слух использует для локализации, необходимо различать следующие категории (полуплоскость, полноплоскость и дистанция):

  • Определение бокового направления падения звука.
    Для этого, слух оценивает временные различия и различия уровней между двумя ушами . Это различает направления влево, прямо и вправо. Эти механизмы слуха не могут различать переднюю и заднюю части ( прямое движение вперед не означает здесь переднее ). Угол падения для всей горизонтальной плоскости не может быть определен слухом с помощью этих механизмов.
  • Определение срединного направления падения звука в срединной плоскости .
    Для этого слух оценивает резонансы внешнего уха . Различают переднюю, верхнюю, заднюю и нижнюю части, но не правую и левую.
  • Расстояние до источника звука.
    Для этого слух оценивает образцы отражений и тембры по памяти.

Телесный угол, под которым падает звук, можно определить с помощью первых двух механизмов, а расстояние - с помощью последнего механизма.

В слухе нет прямых механизмов оценки направления падения во фронтальной плоскости. Источники звука во фронтальной плоскости локализуются за счет комбинации механизмов горизонтального угла падения и средней плоскости.

Определение бокового направления падения: влево, прямо, вправо

Чтобы определить направление падения сбоку (звук влево, прямо, вправо), слух оценивает следующую информацию как ушные сигналы :

  • Разница во времени между двумя ушами как межуральная разница во времени (ITD)
    Звук из правого уха достигает правого уха раньше, чем из левого уха. ITD max = 0,63 мс.
    Различают
  • Оценка частотно-зависимой разницы уровней ( разницы уровней) между двумя ушами ( Interaural Level Difference , ILD)
    Звук справа имеет более высокий уровень в правом ухе, чем в левом, потому что голова затеняет сигнал в левом ухе. Эти различия уровней сильно зависят от частоты и увеличиваются с увеличением частоты.

В случае низких частот ниже примерно 800  Гц , в первую очередь оцениваются различия во времени прохождения (фазовые задержки), в случае высоких частот выше примерно 1600 Гц, прежде всего, оцениваются различия в уровнях. Между ними есть область пересечения, в которой оба механизма играют роль. На качество определения направления это не влияет.

Оценка на низких частотах

На низких частотах ниже 800 Гц размеры головы с расстоянием d = 21,5 см от уха до уха, что соответствует разнице во времени прохождения в 632 мкс, меньше половины длины волны звука. Разница в уровнях настолько мала, что не позволяет произвести точную оценку. Частоты ниже 80 Гц больше не могут быть локализованы в их направлении.

Оценка на высоких частотах

На высоких частотах выше 1600 Гц размеры головы больше длины волны звука. Здесь слух уже не может четко определить направление по задержкам фазы. С другой стороны, разница уровней становится больше, что также оценивается слухом.

Кроме того, оценивается время групповой задержки между обоими ушами (даже на более высоких частотах) : это означает, что если звук начинается снова, направление может быть определено по задержке начала звука между обоими ушами. Этот механизм особенно важен в реверберирующей среде. Когда звук используется, есть короткий период времени, в течение которого прямой звук уже достигает слушателя, но не отражается. Слух использует этот период начального временного интервала ( английский начальный временной интервал задержки , ITDG ) для определения направления и поддерживает обнаруженное направление до тех пор, пока в результате отражений невозможно четкое определение направления.

Эти механизмы не могут отличить переднюю часть от задней. Соответственно, эти механизмы не могут охватывать всю горизонтальную плоскость.

Определение направления падения в средней плоскости: спереди / сзади и сверху / снизу

Человеческое наружное ухо, т.е. предсердие и начало слухового прохода , выступать в качестве направленных фильтров. В структуре ушной раковины в срединной плоскости возбуждаются различные резонансы в зависимости от направления падения звука . Это означает, что каждое из этих направлений (вперед, вверх, назад, вниз) имеет разную картину резонанса. Частотная характеристика уха становится настолько направленно определенные шаблоны отпечатаны, которые оценены системой уха мозга ( направление-определения полос ).

Эти паттерны частотной характеристики индивидуальны и зависят от формы и размера вашей ушной раковины. Если через наушники воспроизводится звук, который улавливается другой головой с другими ушными раковинами, направление в средней плоскости уже не может быть без проблем распознаваться. Пример: преобладающая задняя локализация записей искусственной головы и « локализация в голове » (ICL).

Определение расстояния от источника звука

Определение расстояния до источника звука у людей возможно лишь в ограниченной степени. Например, резкие перепады уровней (например, при шепоте в ухо) и особые резонансные паттерны ушной раковины на близком расстоянии служат индикаторами для определения расстояния на близком расстоянии.

Для восприятия расстояния может использоваться следующая информация:

Частотный спектр
В воздухе высокие частоты ослабляются сильнее, чем низкие. Следовательно, чем дальше находится источник звука, тем он приглушен - отсутствуют высокочастотные составляющие. Для звуков с известным спектром (например, речи) это можно использовать для оценки расстояния.
объем
Более удаленные источники звука имеют меньшую громкость, чем более близкие. Этот аспект особенно важен для знакомых источников звука, например говорящих людей.
Двигаться
Подобно зрительной системе, существует также явление параллакса движения со звуком: если слушатель движется, более близкие стационарные источники звука перемещаются мимо него быстрее, чем более удаленные.
Звуковые отражения
Два типа звука достигают наших ушей в помещениях: основной звук исходит непосредственно от источника звука. Вторичный или отраженный звук возникает из-за отражения звука от источника звука на стенах. Расстояние до источника звука можно оценить по отношению первичного звука к отраженному.
Начальный промежуток времени
Начальное время разрыва это время между приходом прямого звука и прибытием первого сильного отражения. Источники звука производят сильное впечатление в комнате, если начальный промежуток времени большой, а звук в помещении имеет низкий уровень по сравнению с прямым сигналом. Они производят впечатление отдаленного, если начальный промежуток времени короткий или отсутствует, а уровень звука в помещении высокий по сравнению с прямым сигналом.

Обработка сигналов

Человеческое ухо локализует источники звука в так называемых частотных группах . Зона прослушивания разделена примерно на 24 частотные группы, каждая шириной 1 бар или 100 мэл . Чтобы определить направление, компоненты сигнала в группе частот оцениваются вместе.

Слух может выделять звуковые сигналы локализованного источника звука из окружающего шума. Например, слух может концентрироваться на одном говорящем, когда другие выступают одновременно.

Эта способность, также известная как эффект коктейльной вечеринки, означает, что шумы с других направлений, которые могут мешать восприятию желаемого источника звука, воспринимаются как сильно ослабленные. Обработка слухового сигнала позволяет улучшить отношение сигнал / шум примерно на 9–15  дБ . Мешающие шумы с других сторон слышны только на половину или треть громкости, чем они есть на самом деле.

Локализация в закрытых помещениях

В закрытых помещениях на слух влияет не только звук со стороны источника звука , но и звук, отраженный от стен . Однако для определения направления ухом оценивается только первый поступающий прямой звук, а не отраженный звук, поступающий позже ( закон фронта первой волны ). Это позволяет правильно определить источник звука.

Для этого слух оценивает сильные временные изменения громкости в разных частотных группах. Если есть резкое увеличение громкости в одной или нескольких частотных группах, очень вероятно, что это прямой звук от источника звука, который запускается или сигнал которого меняет свои свойства. Этот короткий промежуток времени используется слухом для определения направления (а также для определения громкости).

Отражения, приходящие позже, больше не так сильно увеличивают громкость в затронутых частотных группах, поэтому здесь не определяется новое направление.

Как только направление было распознано, оно используется как направление источника звука до тех пор, пока новое направление не может быть снова определено из-за большего увеличения громкости (см. Эффект Франссена ).

Технические приложения

стереофония

Stereofonie делает использование принципов локализации , используемых звуки формируется из нескольких источников звука , так что они дают впечатление на слушатель, источник звука помещается в другом месте ( источник фантомного ).

С акустической стереофонического в стерео треугольника , расположение фантома звуковых источников на акустической базе будут локализованы и указаны в направлении от звукового события как отклонение в процентах от центра. Частотно- нейтральные межканальные различия уровней и межканальные различия времени прохождения приводят к смещаемым фантомным источникам звука за счет кумулятивной локализации . При стереофонии громкоговорителей следует избегать спектральных различий - это частотно-зависимые различия уровней, поскольку они приводят к обесцвечиванию звука, когда звук падает сбоку.
При воспроизведении стереофонического громкоговорителя 100%, что соответствует отклонению на 30 ° от направления громкоговорителя, разнице уровней приблизительно Δ L = 18 дБ (от 16 до 20 дБ) и разнице времени прохождения приблизительно Δ t = 1,5 мс для направление звукового события (1 мс для высоких частот, 2 мс для басов). Разница уровня стереофонические производит наибольшую локализацию резкость .

При прослушивании через наушники используются бинауральные записи звука для создания фантомных источников звука .

Другое использование

Принципы локализации используются в вооруженных силах с направленными слушателями.

литература

  • Дитер Стотц: Компьютерные аудио и видео технологии . 2-е издание. Springer, 2011 г., ISBN 978-3-642-23252-7 .

Смотри тоже

веб ссылки