[1] [2] [3] [4] [5]

ВРЕМЕННЫЕ ЭФФЕКТЫ В ОБЛАСТИ СЛУХА

До сих пор мы имели дело главным образом со звуками достаточно большой длительности, полагая, что изменения последней не имеют большого значения. Теперь мы должны более подробно изучить данный вопрос с точки зрения временных характеристик в области слуха.

Интегрирование по времени. Акустическая энергия сама по себе не возбуждает слухового механизма. Для того чтобы вызвать определенный эффект, энергия должна расходоваться в течение некоторого отрезка времени. Поэтому мы можем ожидать, что процесс возбуждения должен быть связан с некоторым видом аккумуляции возбуждения. В этой связи возникает вопрос: каковы законы, управляющие этой аккумуляцией? Одним из основных методов, применяющихся при решении данного вопроса, является определение зависимости между длительностью звука и интенсивностью, которой он должен обладать для того, чтобы достигнуть абсолютного порога. Данный метод применялся Хью (1946), Гарнером (1947), Миллером (1948) и де Ври (1948).

На основании полученных ими результатов, частично показанных на фиг. 30, видно, что (в пределах изученного) с увеличением длительности звука порог уменьшается.

Фиг. 30. Интегрирование по времени у абсолютного порога.
Кривые показывают уменьшение энергии порога по мере увеличения длительности акустического стимула.

Если бы мы подвергли рассмотрению только кривую в 4000 гц, (см фиг.30), можно было бы построить гипотезу в отношении того, что слуховой механизм просто интегрирует мощность стимула и что порог, выраженный в виде интеграла мощности по времени, то есть энергия, является постоянным:

It = const,

I - интенсивность, a t - длительность. Согласно данной гипотезе, все кривые должны пойти вниз так, что уменьшение интенсивности на одну логарифмическую единицу (10 дб) будет соответствовать увеличению длительности на одну логарифмическую единицу, а мы видим, что наклон кривой шума составляет около 8 дб на каждую логарифмическую единицу длительности. Вторая трудность заключается в том, что кривая для 250 гц выпрямляется, вместо того чтобы подниматься вверх налево по мере уменьшения длительности. И, наконец, как подсказывает здравый смысл, все кривые должны выпрямляться вместо спуска вниз направо, если мы делаем длительность стимула достаточно большой.

В силу сказанного мы должны изменить гипотезу простого интегрирования. Имеется бесконечно большое число возможных вариаций, две из которых рассматривались для порога маскировки Гарнером и Миллером (1947). Первую мы можем назвать гипотезой "входного исключения". Вкратце она заключается в том, что постоянная составляющая энергии стимула Iо исключается из процесса возбуждения и не интегрируется. Поэтому функция порога выражается следующим образом:

(I-Io)t = const.

Вторая вариация представляет собой слуховую аналогию статистической теории зрительной чувствительности Крознера (1940). Эта формулировка подводит, однако, к предположению, настолько близкому к упомянутому, что данные не позволяют провести между ними четкого разграничения. Как это часто бывает, обе гипотезы достаточно надежны, но ни одна из них не является безусловно правильной.

Фиг. 31. Разностный порог интенсивности как функция длительности добавленного приращения.
DІ/І является отношением приращения звукового давления к нормальному звуковому давлению. Приращения длительностью 0,5 сек легко выявляются как более продолжительные, а более короткие по длительности требуют большей интенсивности. Светлыми и черными кружками обозначены результаты двух испытуемых (по Миллеру и Гарнеру, 1944).

До сих пор у нас нет еще ясного представления о разнице между кривой шума и кривой тона в 4000 гц. Можно только сказать, что процесс аккумуляции подвергается влиянию ширины полосы акустического сигнала. С другой стороны, своеобразное поведение кривой частоты 250 гц объяснимо. В то время когда длительность тона уменьшается, энергия распределяется по шкале частот. Некоторая часть данной энергии приходится на такой участок частот, в котором слуховая чувствительность будет значительно выше, чем она бывает при 250 гц. Данное обстоятельство повышает слышимость тона и делает кривую менее пологой при короткой длительности. От длительности зависит не только абсолютный порог, но и порог маскировки (Гарнер, 1947), а также разностные пороги тонов (Миллер и Гарнер, 1944). Зависимость между разностным порогом интенсивности и длительностью приращения, добавленного к постоянному тону, показана на фиг. 31. Разностный порог для частоты также становится больше, поскольку длительность приращения сокращается.

Повышение и понижение громкости. Когда мы воспринимаем на слух короткий звук, мы слышим, что громкость его быстро возрастает, достигает максимума и затем уменьшается. Проблема определения ощущения во времени интересовала нескольких исследователей (Мезгер, 1932; Рэлофс, 1939, Бутендейк и Мейстерс, 1942), но измерение громкости через небольшие промежутки времени оказалось очень затруднительным.

Тем не менее оказалось возможным ответить более точно на этот вопрос в терминах слухового стимула. Как следует изменять интенсивность тона, чтобы компенсировать изменения его длительности? Сколько должен длиться звук до того, как он приобретет максимальную громкость? Насколько медленно можно выключать звук и все-таки иметь резкое его завершение? Бекеши (1933), Лифшиц (1933) и Мансон (1947) изучали эти вопросы с тональными стимулами, а Миллер (1948), воспользовавшись однородным спектром белого шума, чтобы избежать проблемы "загрязненности" коротких тонов, исследовал эти вопросы на всплесках шума.

Бекеши обнаружил, что для обеспечения постоянства коротких тонов он должен заменить интенсивности I длительностью t согласно правилу log I = -k log t + c. Однако после того, как длительность тона с частотой 800 гц достигла 180 мсек, громкость более не возрастала. Используя тоны с частотой 125, 1000 и 5650 гц, Мансон добился величины критической длительности, составляющей 250 мсек.

Результаты, полученные Миллером (фиг. 32), показывают, что критическая длительность белого шума зависит до некоторой степени от интенсивности, но величина ее меньше, чем величина для звуков, по данным Бекеши и Мансона. Путем изучения ответных слуховых реакций двух испытуемых (с отсутствующими слуховыми косточками и мышцами, которыми обычно они прикреплены), Миллер имел возможность показать, что зависимость от интенсивности нельзя объяснить сокращением мышц среднего уха.

Фиг. 32. Кривые равной громкости для белого шума как функции длительности стимула.
Звуковое давление коротких всплесков шума, каждый из которых равен по громкости стандартному всплеску (1,0 сек), изображено на графике как функция длительности короткого всплеска. Пунктирная кривая показывает самую короткую длительность, для которой громкость независима от продолжительности (по Миллеру, 1948).

Метод, применяемый для изучения снижения слуховой чувствительности, заключался в выключении звука или шума при варьируемой степени резкости этого выключения и определении наибольшей скорости снижения чувствительности, различимой от мгновенного прекращения. Результаты, полученные как Бекеши, так и Миллером, совпадают в оценке того, что длина отрезка времени, требуемая для исчезновения ощущения независимо от интенсивности звука, приблизительно постоянна. Шум исчезает в продолжение половины того периода времени, который требуется для исчезновения тона. Один путь объяснения исчезновения ощущения, как интенсивного, так и слабого, - это допустить, что отдельные элементы слуховой системы работают параллельно, а не последовательно. Поэтому, исключая разницу между латентным периодом и скоростью проводимости, для начала возбуждения всех элементов или прекращения его после начала потребуется не больше времени, чем для активизации или прекращения возбуждения одного элемента.

Причины того, почему шум исчезает быстрее тона, не совсем ясны, но, вероятно, это объясняется тем, что шум возбуждает в основном всю слуховую систему, в то время как тон - только часть ее. Когда тон выключается, возбуждение идет на убыль в той части системы, которая была возбуждена, но следы его могут в течение некоторого времени оставаться.

Разумно предположить, что эти следы выступают на фоне нейтрального возбуждения, то есть в состоянии покоя невозбужденной ткани. Когда шум выключается, то исчезает и фон, с которым контрастируют следы.

С вопросом увеличения и исчезновения слуховой чувствительности тесно связан вопрос громкости коротких импульсов. Этот вопрос изучался Штейделем (1933), который определял (по данным опроса испытуемых) громкость щелчков (потрескивание), вызываемых электрическими импульсами различной формы и величины и подаваемых с выхода репродуктора.

Фиг. 33. Отношение между уровнем громкости понижающегося по экспоненте импульса и его постоянной времени.
Уровень громкости определяется как уровень чувствительности в децибелах над порогом тона с частотой 1000гц, имеющего такую же громкость (из Стивенса и Дэвиса, 1938; по данным Штейделя, 1933).

Результаты Штейделя показаны на фиг. 33. Постоянная времени импульса Т представляет собой отрезок времени, соответствующий уменьшению амплитуды по экспоненте до величины, равной 1/е (около 37%) от своей первоначальной амплитуды.

Фиг. 34. Отношение между уровнем громкости повышающегося по экспоненте импульса и его постоянной времени (отрезок времени, требуемый для того, чтобы амплитуда импульса достигла приблизительно 63% своего конечного значения).
По мере того как постоянная времени увеличивается более 0,3 мсек, импульс увеличивается незначительно, поскольку медленно повышающийся импульс (большая постоянная времени) имеет наибольшую концентрацию энергии при очень низких частотах, к которым слуховой механизм является нечувствительным (из Стивенса и Дэвиса, 1938; по данным Бюрка, Котовского и Лихте, 1935).

Штейдель расценивал полученные им результаты как показатель того, что существенной частью щелчка (или треска) являются первые 0,3 сек и что громкость щелчка пропорциональна интегралу давления для всего временного интервала. Бюрк, Котовский и Лихте (1935) определяли спектр щелчков Штейделя и нашли, что можно полагаться на его результаты так же, как и на результаты, полученные при исследовании щелчков других форм (фиг. 34), учитывая распределение энергии стимула скорее по частоте, чем во времени. Позже Гарнер (1947а) использовал этот подход для объяснения явления слышимости и громкости прерываемых тонов. Таким образом, до сих пор не было успешных попыток регулировать громкость как функцию одновременно частоты и времени. Высота звука коротких тонов. Поскольку длительность синусоидального тона увеличивается от 2-3 мсек до 0,5 сек и больше, можно вычленить три стадии его субъективно воспринимаемого качества. Эти стадии описаны Бюрком, Котовским и Лихте (1935), а также Доути и Гарнером (1947) так: I стадия - испытуемый слышит только треск; II стадия - звук, похожий на щелчок (треск) с характерным тональным свойством, и III стадия, в которой различимы треск при включении и треск при выключении тональной части с установившейся высотой звука в промежутках.

Фиг. 35. Изображение коротких сегментов синусоидальной звуковой волны в координатах интенсивность - частота - время.
Данные изображения соответствуют тому, что было показано на фиг. 4. Визуальное представление об изображении полностью аналогично слуховому впечатлению, полученному при прослушивании трех стимулов.

Чтобы уяснить характер стимулов на этих трех стадиях, следует подумать о коротком тоне в терминах соотношения интенсивность - частота - время.

Из изображения, представленного схематически на фиг. 35, видно, что концентрация энергии по частоте, несомненно, зависит от длительности синусоидального сегмента. В верхних двух диаграммах энергия распределяется по шкале частот настолько рассеянно, что для слуховой системы нет основания судить о высоте звука. В средней диаграмме, однако, имеется очень заметная концентрация энергии на частоте 3000 гц. В нижней диаграмме концентрация почти такая же четкая, как и для чистого тона. При оценке стимула с этой точки зрения мы видим, что все указанное полностью соответствует тому, что слышит испытуемый.

Доути и Гарнер определили величину самой короткой длительности, при которой испытуемый может заметить "высоту треска", и наибольшую длительность, при которой испытуемый слышит "высоту тона". Пороги длительности, определенные при умеренно высокой интенсивности, показаны на фиг. 36. При более низких интенсивностях порогов величина длительности будет несколько больше.

Фиг. 36. Пороги длительности для двух степеней "высоты" как функции частоты.
На частоте ниже 1000 гц необходимо услышать два или три периода волны, чтобы определить преобладающую высоту звука, в то время как на частотах свыше 1000 гц порог представляет собой не фиксированное число периодов, а фиксированную продолженность во времени (по Доути и Гарнеру, 1947).

Монауральное детектирование фазовых различий. Ответственность за утверждение того, что испытуемый "не может воспринять фазу", часто приписывают Гельмгольцу. Действительно, в своей работе "Ощущение тона" Гельмогольц писал, что "качество музыкальности сложного тона зависит полностью от количества и относительной силы его парциальных простых тонов, а ни в коем случае не от их фазовых различий". Но Гельмгольц говорит также и следующее: "Мы не смогли охватить в своих экспериментах немузыкальные тона с их верхними парциальными тонами по шкале частот, следовательно, остается пока не выясненным, являются ли важными для этих диссонансных тонов фазовые различия. Последующее теоретическое рассмотрение, возможно, и позволит ответить на данный вопрос положительно". Это небольшое замечание из приведенного (последнего) утверждения было высказано пионерами в области изучения слуха, за исключением Кёнига. При ошибочной ссылке на авторитет Гельмгольца теория "фазовой глухоты" была полностью принята (см. Боринг, 1942).

Насколько безосновательной оказалась данная теория, видно из того факта, что фазовые различия представляют собой просто временные различия. Когда мы сдвигаем фазы отдельных компонентов сложной волны, они либо опережают, либо отстают по времени. В настоящее время на основании повседневного опыта мы видим, что слуховая система способна регистрировать эти временные различия и, следовательно, не является полностью "фазово-глухой". Для окончательного доказательства мы можем снова рассмотреть белый шум и единичный импульс на фиг. 1. Оба звука имеют "плоский" спектр. Единственная разница наблюдается в одной из фаз: компоненты белого шума различной частоты образуют свои фазовые углы беспорядочно, в то время как все частотные компоненты единичного импульса достигают своей максимальной амплитуды при времени а=0, перекрывая друг друга во всякое иное время. В результате мы слышим белый шум как звук "шшш...", а единичный импульс как "пт".

Мэйтес и Миллер (1947) изучали большое разнообразие стимулов специально для выделения фазовых эффектов при монауральном восприятии. В одном из экспериментов они использовали стимул типа, показанного на фиг. 37. В каждой паре изображенных контуров заметная разница в форме колебаний объясняется полностью различиями в фазе; амплитудно-частотное изображение идентично. Тем не менее имелись заметные различия в ощущениях, вызванных стимулами. Колебание, характеризуемое более широкими флуктуациями огибающей, звучало резко. При прослушивании второго колебания испытуемые заметили отчетливое уменьшение резкости. Они также сообщали, что "очевидное ощущение высоты звука" заметно улучшилось.

Фиг. 37. Возбуждения, используемые для мензурального различения фазовых изменений.
Оба члена каждой пары колебаний имеют одинаковые амплитудно-частотные характеристики. Каждое колебание состоит из трех компонентов, 1000 - f, 1000 и 1000 + f, где f определяется как "сигнальная частота". Единственное различие между членами каждой пары заключается в том, что один компонент (1000 колебаний) имеет один фазовый угол, а в другом угол сдвинут на 90°. Этот фазовый сдвиг произведет очевидное различие субъективного звука. Верхние звуки грубее и ниже по высоте, чем нижние (по Мейтесу и Миллеру, 1947).

Мэйтес и Миллер обнаружили несколько других пар образцов стимулов, отличавшихся только по фазе, но вполне различимых на слух. Для монауральных фазовых эффектов необходимы три условия: первое - важные компоненты стимула должны быть близки по частоте (как думал Гельм-Гольц), второе - не должно быть слишком большого числа компонентов и третье - фазовые изменения должны отчетливо сказаться на форме огибающей колебания.

ЛОКАЛИЗАЦИЯ ЗВУКА

До сих пор мы сосредоточивали свое внимание на так называемом "монотическом" и "диетическом" */"Monotic" - стимул, сообщаемый только в одно ухо; "diotic" - один и тот же стимул, направленный в оба уха./ типе слуха. Теперь, однако, мы должны принять во внимание то, что система слуха имеет два входных канала. "Дихотический стимул" */"Dichotic" - различные стимулы на два уха. Бинауральное возбуждение может быть дихотическим в отношении нескольких характеристик или одной, например дихотическим по фазе, но диотическим по максимальной амплитуде и частоте./ особенно тесно связан с пространственной локализацией звуков.

Локализация источников звука. Стивене и Ньюмэн (1934, 1936а) отметили, что большинство ранних работ по локализации звука (см. Боринг, 1942) имело тот недостаток, что испытуемый находился в комнате с реверберацией и поэтому воспринимал звуки со всех сторон независимо от места расположения источника звука. Они делали попытки избавиться от действия отражения, для чего испытуемый помещался на сиденье, возвышающемся над крышей здания. Звук исходил из репродуктора, помещенного на конце вращающейся балки на уровне ушей испытуемого. Репродуктор всегда устанавливался справа от испытуемого, и положения его менялись через 15° по азимуту. Средняя погрешность двух испытуемых воспроизведена на фиг. 38, А. Указанная цифра, в которой не учтена путаница между симметричным расположением в передних и задних квадратах, показывает, что погрешность, связанная с локализацией, увеличивается с возрастанием частоты стимула до 3000 гц и затем значительно уменьшается для тона с частотой 10 000 гц.

Фиг. 38. Ошибки, допущенные при определении места расположения звукового источника в горизонтальной плоскости.
На графике А показана средняя погрешность для различных тональных частот. Кружки и крестики обозначают различные серии наблюдений над чистыми тонами. Треугольниками обозначены "нечистые" тона. На графике В показан процент ошибочных данных в переднем и заднем квадратах (по Стивенсу и Ньюмэну, 1936).

Несовпадающие (ошибочные) данные, полученные при расположении источника впереди и сзади испытуемого, показаны на фиг. 38,Б. Вид обеих кривых подтверждает наблюдения Рейли (1907), Хорнбостеля и Вертгеймера (1920) в том отношении, что имеется две основы для локализации: одна для высокочастотных тонов и другая для низкочастотных.

Чистый тон, исходящий из источника справа от испытуемого, проходит более короткий путь до правого уха испытуемого, чем до левого. Следовательно, звуковое давление в каналах обоих ушей отличается друг от друга по фазе (или по времени прибытия данной фазы) и по максимальной амплитуде. Разница в амплитуде бывает значительной только при больших частотах, поскольку голова и ушная раковина действуют в качестве барьеров при высоких частотах более эффективно, чем при низких. Фазовые различия, как мы увидим, выявляются только при низких частотах. Поэтому можно заключить, что один механизм локализации звука (чистого тона) действует на основе данных интенсивности, а другой - на основе данных времени.

Когда физический звук сложен, каждый частотный компонент имеет как характерную бинауральную фазовую разность, так и характерное бинауральное отношение максимальных амплитуд. Более того, нельзя быть уверенным в том, что при сложном стимуле фазовый эффект ограничивается низкими частотами. Поэтому неудивительно, что сложные звуки локализуются легче, чем чистые тоны.

Данные интенсивности. Для изучения механизма звуковой локализации полезно отделить изменения по интенсивности от изменений во времени и исследовать их отдельно. Прежде всего можно определить, насколько звук должен быть более интенсивным для одного уха и затем для второго, до того как испытуемый заметит сдвиг в кажущемся источнике тона. Эптон (1936) и Форд (1942) определили этот разностный порог для тона в 800 гц и нашли, что он изменялся как функция интенсивности тона. Дифференциальная дихотическая чувствительность была наивысшей в пределах между 70 и 100 дб выше порога; на этих уровнях едва заметное различие составляло приблизительно 1 дб, что вдвое больше мензурального по интенсивности, определяемой по Ризу. Когда разница между значениями интенсивности выходит за пределы порога, то кажущийся источник звуковой волны двигается дальше в сторону расположения источника звука с большей интенсивностью. Согласно правилу, которого приблизительно придерживаются в данном случае, угол, измеряемый от средней линии, пропорционален логарифму отношения максимальной амплитуды (Стюарт, 1920, 1922, 1930, 1932).

Данные времени (фаза и время вхождения звука). Для определения отношения между фазовой бинауральной разностью и восприятием тонов проводились многочисленные опыты, но результаты пока спорны. Однако данные последних опытов совпадают в части ограничения значимости бинауральной фазы для чистых тонов до частот ниже 1500 гц или в ином случае - ниже 2000 гц (Лэнгмюр и др., 1944; Xирш, 1948а, с). Тон имеет тенденцию к локализации в направлении той стороны, к которой движется ведущая по фазе волна. Степень латерализации (бокового направления) возрастает с увеличением бинауральной фазовой разности до тех пор, пока звук не локализуется в одном ухе. Стюарт (1920, 1922) отметил, что угол отклонения от середины пропорционален бинауральной фазовой разности. Используя в качестве стимула тон с частотой 100 гц, Моне и Вуа (1946) обнаружили, что порог для бинауральной фазовой разности составлял менее 3° (разность времени 100 мксек) для лиц, практиковавшихся в определении местоположения самолетов по слуху. При применении щелчков и импульсов в качестве стимулов отмеченная бинауральная временная разность даже меньше, чем для низкочастотных тонов (Хорнбостел и Вертгеймер, 1920; Бине, 1927; Баллах, Ньюмэн и Розенцвейг, 1949).

Результаты, полученные при последних экспериментах, показаны на фиг. 39,А. Из графика видно, что, когда бинауральная разность во времени равняется нулю, испытуемый может иметь тенденцию к локализации звука в одной стороне, но временная разность в 30-40 мксек явно преобладает в статистическом смысле над его слухом. Если разность во времени увеличивается до 2-3 мсек, то испытуемый слышит двойной щелчок (треск), а более значительные временное разности дают два щелчка с различной локализацией.

Фиг. 39. Влияние бинауральной разности во времени на локализацию импульсивных звуков.
Если единичный импульс направлен в одно ухо несколько раньше второго, он локализуется в сторону предшествующего стимула, как показано на графике А. Если стимул усложняется добавлением второго временнбго импульса дихотического колебания после интервала 1 мсек (В), то он воспринимается как одинарный щелчок (треск) и локализация звукового изображения определяется до некоторой степени второй разностью во времени, но в основном первой (С) (по Баллаху, Ньюмэну и Розенцвейгу, 1949).

Слух испытуемого, находящегося в комнате.с реверберацией, возбуждается не только звуковой волной, направленной прямо на него от источника звука, но также и отражением звука от стен. Единичный импульс у источника превращается в целый ряд парных импульсов в ушах слушающего, причем каждая пара имеет свое собственное значение бинауральной разности во времени. То, что происходит в подобных случаях, исследовалось Бекеши (1930), Ленгмюром и др. (1944), а также Валлахом, Ньюмэном и Розенцвейгом (1949). Результаты их исследований можно суммировать путем описания двух эффектов. Первый - одинаковые импульсивные звуки сливаются в одно слуховое ощущение, если они следуют друг за другом с небольшими промежутками. Второй - первая волна, достигшая ушей слушающего, стремится "захватить" механизм локализации раньше. Для примера рассмотрите положение стимула, схематически показанного на фиг. 39,В. Две пары односекундных колебаний представлены бинауральной разностью во времени для первой и второй пары и интервала между этими парами. Если интервал составляет более 2-3 мсек (и если разности во времени значительно короче интервал а), то испытуемый сообщает, что он слышит два щелчка. Если интервал сделать короче, то два щелчка сольются в двойной щелчок (или треск), а затем в одинарный щелчок, месторасположение которого будет приблизительно там, где находился первый щелчок в то время, когда были слышны два щелчка с более продолжительными интервалами. Превалирование первой пары колебаний над второй при определении лока-лизации показано на фиг. 39,С, где видно, какую величину должна иметь бинауральная разность во времени для нейтрализации второй бинауральной разности во времени, заданной величины и обратного знака. Наличие слияния и "предшествия" позволяют считать, что источники звука локализованы правильно, даже при наличии отражения звука.

Экстернализация. В экспериментах, в которых влияние данных интенсивности и времени разделено, необходимо направлять два тона отдельно к обоим ушам. Для этой цели обычно используются наушники. Интересно отметить, что тоны при этом локализуются внутри головы или очень близко к голове, что совершенно не похоже на локализацию при передаче звука по воздуху из фактического источника. Баллах (1938, 1939, 1940) предложил свою теорию, согласно которой экстернализация звука в последнем случае объясняется тем, что при движении головы испытуемого бинауральная фаза и отношения интенсивности могут изменяться, в то время как в лабораторных условиях это исключено (наушники двигаются вместе с головой), а следовательно, и не имеется сопутствующих изменений в акустическом стимуле.

Верхнее положение источника звука. Если бы звуки могли локализоваться в левом и правом направлениях только в горизонтальном плане, мы бы не смогли получать никаких чувственных данных, кроме только что указанных, а именно данных по интенсивности и временной зависимости. Но звуки могут также локализоваться и по направлению вверх. Проблема, однако, заключается в том, что, когда источник звука и голова испытуемого неподвижны, данные о высоте очень бедны. Для определения угла подъема испытуемый должен поворачивать голову. Баллах (1939) указал, что движения головы позволяют (при исключении зрения) получить чувственные данные, на основе которых можно судить о высоте, в то же время это дает представление о пространственном расположении звука. Он же обнаружил, что если источник звука вращался бы вместе с головой испытуемого в горизонтальном плане, то испытуемый сообщал бы, что звук идет сверху. Он установил, что единственное местонахождение источника звука, для которого горизонтальные повороты головы обычно не производят никаких изменений бинауральной фазы и интенсивности, - это положение звука прямо вверху и, возможно, прямо внизу. Таким образом, получается, что механизмом локализации звука учитываются не только слуховые данные, но и данные других чувственных систем.

Стереофоническая звуковая локализация. Попытки увеличить естественность воспроизведения звука привели к экспериментам с двух канальной звуковой передачей и стереофоническому воспроизведению звука. Идея простейшей двухканальной схемы заключалась в записи звуков двумя микрофонами, помещенными в таком же положении, как уши испытуемого (искусственного). Когда эти звуки направляются к удаленному от этого места испытуемому и поступают к нему через наушники, последний получает точно такую же звуковую картину, какая имелась бы в том случае, если бы он был на месте искусственного испытуемого. Эффект получается убедительным настолько, что если мимо манекена кто-то пройдет в подбитых гвоздями башмаках, то испытуемый невольно подбирает ноги, чтобы на них не наступили. Если для преобразования звука используются громкоговорители, то в данном случае проблема будет более сложной. Установлено, что можно достичь вполне естественного воспроизведения звука путем его записи посредством двух или более микрофонов и при последующем воспроизведеции двумя или более громкоговорителями (Штейнберг и Сноу, 1934; де Бо, 1940).

ДРУГИЕ БИНАУРАЛЬНЫЕ ЭФФЕКТЫ

Бинауральное суммирование при абсолютном пороге. Вопрос о бинауральном суммировании - независимо от того, является ли бинауральный порог более низким, чем монауральный, - задавался в течение многих лет, но ответы на него были сомнительны. Тарченов, Прейер и Кёртинг (см. Xирш, 1948а) каждый в отдельности считали, что двумя ушами они могут слышать звуки, которые неуловимы каждым ухом в отдельности. Но на стороне отрицательного ответа был авторитет Фехнера, Штумпфа и Хорнбостеля. Сивиан и Уайт (1933) исходили в своем решении из сравнения результатов измерений двух испытуемых (весьма шаткая основа), а именно из того, что полученная ими кривая для мензурального минимального слухового поля (см. фиг. 5) полностью совпадала с бинауральным минимальным слуховым полем.

Когда мы обращаемся к недавним экспериментам (Геидж, 1932; Хью, 1938; Коссэ и Шавассэ, 1942а; Шоу, Ньюмэн и Поллак, 1948), мы находим, что авторы подчеркивают основной довод (первоначально упомянутый Урбанчичем в 1893г.) для отклонения существовавшего ранее мнения. Эти эксперименты ясно показывают, что бинауральный порог для чистых тонов, выраженный в терминах звукового давления, сообщаемого барабанной перепонке, будет ниже, чем монауральный порог. Они также показали, однако, что если два монауральных порога не являются почти равными, то разница между бинауральным порогом и порогом для более чувствительного уха очень невелика. Поскольку два уха среднего испытуемого разнятся по чувствительности приблизительно на 6 дб, то величина фактически определенной бинауральной суммы (около 1 дб) представляет собой примерно то, чего можно ожидать на основе точного суммирования энергии. Если бы случилось найти человека, уши которого были бы чувствительными в одинаковой мере (или если при предъявлении звукового стимула мы смогли бы искусственно уравнять эту чувствительность, снизив чувствительность одного уха), мы обнаружили бы, что бинауральный порог будет около 3 дб ниже, чем монауральный. И еще пример суммирования энергии: испытуемый только что начинает различать звук независимо от того, направляем ли мы всю акустическую энергию в одно ухо или делим ее поровну между двумя. Хью определил, что фактически правило справедливо для неравного раздела общей акустической энергии, но данные Поллака (1948) указывают на то, что как для тона в 1000 гц, так и для белого шума бинауральное суммирование дает несколько меньший показатель, чем следует ожидать согласно гипотезе о суммировании энергии.

Бинауральный разностный порог по сравнению с монауральным разностным порогом. Бинауральный разностный порог несколько меньше, чем монауральный. Согласно одному из объяснений превосходство бинаурального слуха относится за счет того, что можно назвать биназуральным добавлением, то есть: 1) оба уха постоянно меняются по чувствительности; 2) иногда правое ухо воспринимает звуки более остро, иногда - левое; 3) центральная нервная система реагирует на более четкий из двух поступающих сигнзлов.

Объяснение, которое можно назвать количественным, сформулировано Крозье, который рассматривает системы чувствительности с точки зрения решения статистических проблем, для которых определение значения разностного порога сводится к проблеме определения разности, достигающей предусмотренного уровня статистического значения. По его мнению, два уха лучше, чем одно, поскольку при двух ушах образец (полученный от нервных элементов) вдвое больше. Так как удвоение образца делит обычную ошибку на v2 (1,4142...), то разности, которые будут невелики с точки зрения статистического значения для монауральной системы, будут значительны для бинауральной. Фактически бинауральный разностный порог для интенсивности будет около 3 дб ниже, чем монауральный разностный порог (Эптони Xолвэи, 1937). Поскольку 3 дб соответствуют отношению по напряжению, равному v2 (1,4142...), то полученный результат будет как раз таким, какого следует ожидать по теории статистики.

Бинауральное суммирование громкости. Ранние исследовзния, проведенные Сибеком, Махом, Фехнером и Доком (Xирш, 1948), указывали на то, что для обоих ушей тоны звучат громче, чем для одного, и что бинауральное суммирование громкости более очевидно, чем бинауральное суммирование абсолютного порога. Однако, эти наблюдения не имели большого успеха по сравнению с авторитетным утверждением Штумпфа, относительно того, что большая ясность, полнота и громкость бинауральных звуков приводит к иллюзии большей громкости. Утверждение Штумпфа не оспаривалось до 1929 г., то есть до того времени, когда Бекеши высказал логичную мысль, заключающуюся в том, что если громкость является субъективной реакцией испытуемого, то она должна включать элементы иллюзии. Бекеши сделал соответствующий подбор монаурально-бинауральной громкости и получил количественное подтверждение своей мысли относительно суммирования (фиг. 40).

Фиг. 40. Бинауральное суммирование громкости.
Два тона одинакового звукового давления (один воздействует на одно ухо, другой - на другое) звучат так же громко, как один монауральный тон относительного звукового давления, показанного по оси ординат. По оси абсцисс выражено отношение между частотами двух тонов. Уровни их ощущения составляют 40 дб (из Стивенса и Дэвиса, 1938; по данным Бекеши, 1929).

Мы видим, что для обеспечения максимального суммирования сообщаемые в два уха тоны должны иметь одинаковую частоту. Это совершенно противоположно тому, что наблюдается в случае монаурального суммирования громкости, когда два тона, направляемые в одно и то же ухо, должны значительно отличаться по частоте, если их громкость должна суммироваться.

В своих экспериментах Флетчер и Мансон (1933), а также Коссэ и Шавассэ (19425) при различной монауральной интенсивности определяли, насколько монауральный тон может быть слабее бинаурального и все же иметь одинаковую с ним громкость. Результаты этих экспериментов не совсем ясны, но несомненно то, что результат бинаурального суммирования возрастает с уровнем интенсивности, по меньшей мере до 60 дб. Независимо от уровня интенсивности Флетчер и Мансон установили, что тон, слышимый бинаурально, кажется вдвое громче тона, воспринимаемого монаурально.

Бинауральная фаза и маскировка. Мы видели, что если приходится отличать звук от тишины, то два уха лучше, чем одно. Справедливо ли это для случая, когда мы должны услышать сигнал на фоне шума? При исследовании этого вопроса Хирш (1948) сообщал тон сначала одному уху, а затем обоим, но в продолжение всего времени оставлял маскирующий шум в обоих ушах. К своему удивлению, он обнаружил, что при испытаниях с интенсивными низкочастотными тонами два уха оказались слабее одного - слабее почти на 7 дб. Это явление было им названо "бинауральной задержкой", поскольку оказалось, что при сообщении тона второму уху создался процесс, который до некоторой степени являлся помехой уже действующему процессу.

Как показано на фиг. 41, бинауральная задержка происходит только тогда, когда действующий тон низок по частоте и когда маскирующий шум имеет высокую интенсивность. В других условиях наблюдается некоторая степень бинауралыюго суммирования.

Фиг. 41. Бинауральное суммирование и задержка.
Бинауральная задержка происходит только при тонах с частотой 250 и 1000 гц и в присутствии довольно сильного маскирующего шума. Маскирующий шум во всех случаях подается бинаурально (по Xиршу, 1948).

Подобные же исследования, проливающие свет на бинауральную задержку Хирша, более или менее последовательно изложены в работе Лэнгмюра и др. (1944) по бинауральным влияниям в звуковой локализации. Было установлено, что различение тона на фоне беспорядочного шума зависит от бинауральных фазовых отношений тона и шума. Когда шум сообщается так, что он заставляет колебаться две барабанные перепонки вместе внутрь к центру головы и вместе обратно, то шум звучит так, как если бы в центре головы находился плотный шар; тон в данном случае будет более всего слышим тогда, когда он в значительной мере дихотичен по фазе, с локализацией (субъективно) в одной стороне шара.

С другой стороны, если шум, сообщаемый одному уху, имеет обращенную полярность, так что обе барабанные перепонки двигаются вместе вправо, а затем влево, он звучит рассеянно и его тон лучше всего слышен тогда, когда он диотичен по фазе и, следовательно, имеет центральную локализацию.

Хирш (1948с) разработал функции, связывающие слуховое различение и бинауральную фазу, и установил, что в определенных условиях смена соотношений бинауральной фазы может сдвинуть порог маскировки на 14 дб. Его результаты приведены на фиг. 42.

Фиг. 42. Влияние бинауральных фазовых соотношений на бинауральное суммирование и задержку.
По оси ординат - соотношение между мензуральным и бинауральным порогами маскировки для частот чистых
тонов, указанных по оси абсцисс. Маскировка производилась белым шумом на уровне звукового давления 59 дб над
0,0002 дин/кв.см. Раз-ность фаз тонов Ft, подаваемых в оба уха, составляла 0°, а иногда - 180°. Формы колебаний
шума были иногда в обоих ушах одинаковы ( Fh=0°), иногда вправо вверх в одном ухе и "вверх дном" вниз - в другом
( Fh=180°). Таким образом, имелись четыре различных бинауральных фазовых соотношения и соответствующие
им четыре различные кривые бинаурального суммирования или задержки (по Xиршу, 1948).

Очевидность того, что бинауральные отношения играют столь значительную роль при определении маскировки, совершенно опровергает утверждение, согласно которому маскировка является по природе своей исключительно периферической. Очевидно, маскировка ни в коем случае не может полностью определяться процессами в улитке, ибо действия, происходящие в центральной нервной системе, близ или вдали точки слияния двух афферентных путей, оказывают большое влияние на степень точности, с которой общий процесс возбуждения может быть проанализирован по составным частям.

Бинауральные фазовые соотношения оказывают свое влияние также и на громкость. Хирш и Поллак (1948) нашли, что громкость тона, слышимого на фоне интенсивного шума, будет значительно больше, если тон и шум имеют противоположные бинауральные фазовые отношения, чем в том случае, если последние одинаковы. Однако при тишине бинауральная фаза не оказывает никакого влияния ни на громкость, ни на абсолютный порог (Хирш, 1948)

Бинауральное несоответствие высоты звука - diplacusis. Отологи давно знакомы с состоянием слуха, известным под названием diplacusis binauralis, при котором пациент при раздражении его правого уха чистым тоном слышит одну высоту звука, а при раздражении тем же самым тоном левого уха - слышит другую высоту звука. Однако на ранние наблюдения Либермана и Ревеша (1914) не обращали должного внимания и в течение многих лет не понимали, что умеренная степень бинаурального несоответствия высоты звука является скорее правилом, чем исключением. Diplacusis измеряется путем определения того, сколько должно быть изменений частоты стимула при переключении тона из одного уха в другое, чтобы держать высоту звука постоянной. Типовые данные Стивенса и Игана (1941) показаны на фиг. 43.

Фиг. 43. Diplacusis "нормального" испытуемого: частота сообщаемого левому уху тона должна изменяться, чтобы подобрать высоту звука левого уха к высоте звука правого уха.
По оси ординат - процентное изменение требуемой частоты (из Моргана, 1943; по данным Стивенса и Игана, 1941).

Величина diplacusis зависит от интенсивности стимула, то есть она уменьшается по мере повышения интенсивности. Diplacusis проявляется наиболее ясно после того, как одно ухо было подвергнуто интенсивному раздражению. Дэвис и др. (1944) обнаружили наличие несоответствия высоты звука до целой октавы у испытуемых, которые в течение нескольких минут подвергались воздействию тонов от 130 до 15056, исходная интенсивность 0,0002 дин/кв.см. Иногда звук, слышимый ухом, имеет не одну высоту, а две, из которых одна выше, а другая ниже высоты звука, слышимого ухом без предварительного стимула. Рюде и Фэррер (1945, 1946, 1947) установили, что высота звука имеет тенденцию к сдвигу вверх, если частота тона предварительного стимула ниже 4000 гц, и вниз, если частота тона предварительного стимула выше 4000 гц.

Стороннику теории "места" diplacusis дает в руки прекрасные аргументы против теорий "частоты" в области слуха. Если поддерживать то мнение, что высота звука зависит от частоты колебания нервных волокон, необходимо будет объяснить, каким образом "частота" нервов не совпадает с частотой стимула; придется отвергнуть мнение о синхронности между акустическим стимулом и чувствительностью нервов. Что касается теории "места", то явления, связанные с diplacusis, почти полностью находят свое объяснение. Необходимо только допустить, что небольшая часть основного механизма нечувствительна, например, в результате предварительного возбуждения. При сообщении слабого тонального стимула, который обычно возбуждает нервные волокна, иннервирующие данный участок, никакой реакции не происходит. При повышении интенсивности нервные волокна, иннервирующие соседний участок, возбуждаются до того, как достигаются верхние пороги для волокон этого участка. Соседние волокна производят высоту звука, характерную для этого "места" и, следовательно, несколько отличающуюся от высоты звука, обычно ассоциируемой с частотой стимула.

ТЕОРИЯ СЛУХА

Основными задачами теории слуха являются: 1) объяснение психофизики слуха в соответствии с понятиями слухового механизма и нейрофизиологии, 2) обсуждение вопросов слуха в соответствующем месте общей теории связи, 3) обеспечение количественной оценки ответных реакций на слуховой стимул. В данной главе мы в основном концентрировали свое внимание на последней из указанных задач. Первая и вторая задачи являются темой следующих глав. Насколько же близко мы подошли к возможности количественного анализа слуха? Можно ли здесь начать с данных, полученных при работе с испытуемым в условиях воздействия акустического стимула, и использовать эти данные для определения слухового восприятия или реакции испытуемого? Можно ли представить слуховые процессы математическими значениями? Иногда можно, но с большой степенью приближения. Если стимул простой или очень похож на тот стимул, в отношении которого у нас имеется опыт, мы можем воспользоваться эмпирически вычисленными зависимостями и предсказать, например, громкость в сонах и высоту звука в мелах. Расчеты, связанные с таким предсказанием, по общему мнению, примитивны, но это только начало.

Следующий вопрос заключается в том, каким образом следует поступать, когда акустический стимул, с которым мы имеем дело, сложен и не изучен. Должны ли мы производить эмпирические испытания с этими новыми звуками и им подобными, или мы можем исходить из имеющихся данных, основанных на простых стимулах? Этот вопрос ставит нас перед большим затруднением при изучении психологии, поскольку при подсчете целого трудно исходить из отдельных компонентов, когда вся рассматриваемая система не является линейной. Мы должны, следовательно, разбить сложные стимулы на известные компоненты для получения от них ожидаемой реакции и затем уже подойти к вопросу предсказания для сложных стимулов путем суммирования ответных реакций отдельных компонентов. Затруднение заключается в том, что мы не можем учесть линейного прироста, поскольку мы имеем дело с нелинейным механизмом. Мы должны принять во внимание возможность взаимодействия между компонентами, для определения которого нет других путей, помимо эксперимента. Мы должны признать, что, за исключением немногих случаев (например, громкость сложных тонов, маскировка), в которых взаимодействие довольно тщательно изучено, мы все еще не свели психоакустику к символам (количественным измерениям).

Это признание не должно нас обескураживать, поскольку оно свидетельствует о зрелости наших суждений по вопросу необходимости расчетов. То, с чем мы должны столкнуться, фактически выглядит следующим образом: экспериментальное исследование всего бесконечно большого числа акустических стимулов, которые когда-либо окажутся интересными, явно неосуществимо. Мы должны уметь предсказать сложное, основываясь на изучении простого, и уметь обобщать отдельные компоненты. Логически первым шагом при этом должен быть правильный выбор основных компонентов, следующим шагом - изучение их взаимодействия.

Для определения правильных основных компонентов действительно потребуется большая работа по изучению упомянутого взаимодействия.

Синусоиды, несмотря на их математическое удобство, вероятно, не подойдут для этой цели, так как в области слуха большую роль играют изменения случайного характера. Может случиться, что подходящими "строительными блоками" окажутся снижающиеся на экспоненте осевые линии такого типа, какой показан на фиг. 4, или импульсы с огибающими, имеющими форму кривой нормального распределения. Во всяком случае, как указывалось в последних разделах главы, мы уже проделали большую работу с чистыми тонами, которая характерна для раннего периода исследований в области слуха. Вероятно, в противовес этому мы теперь приступили к изучению "излюбленного" раздражителя - белого шума, наиболее сложного из всех звуков. Для того чтобы проводить расчеты в психоакустике, мы должны проделать огромную работу в области взаимодействия - работу по простому сочетанию простых компонентов, - с тем чтобы иметь возможность изучить законы взаимодействия.

[1] [2] [3] [4] [5]