Добавил:
kiopkiopkiop18@yandex.ru Вовсе не секретарь, но почту проверяю Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2 курс / Нормальная физиология / Физиология_речи_Восприятие_речи_человеком_Чистович_Л_А_

.pdf
Скачиваний:
1
Добавлен:
24.03.2024
Размер:
13.47 Mб
Скачать

результаты оказались весьма близкими к тем, которые ранее на­ блюдались для согласных. Из рис. 4.7 видно, что на функции раз­ личения имеется отчетливый пик, соответствующий границе между

Рис. 4.6. Субъективные расстояния между парами гласных ^^принадле­

жащими к одной и той же фонемной категории (стимулы 4—9 на рис. 4.5, А). По [1И].

По оси абсцисс — номера стимулов ху в соответствии с рис. 4.5, А; по оси ординат— субъек­

тивное расстояние в баллах. Параметром кривых 1—6 является номер стимула х^(соответственно г—4, 5, 6, 7, 8, 9). Вверх от горизонтальной прямой отложено субъективное рас­ стояние для пар стимулов с j > г, вниз — для пар ci > j.

Рис. 4.7. Сравнение функций идентификации (Л) и различения (£) синтети­

 

ческих гласных. По [2вв].

По оси абсцисс — частота

синтетических гласных; по оси ординат — относительное

число ответов [е](А) и относительное число случаев, в которых данный стимул отличался от остальных (Б).

фонемами [i] и [е]. Различение стимулов, лежащих внутри фонем­ ной категории, оказывается плохим.

Итак, полученные данные позволяют сделать вывод, что мно­ жество субъективных образов гласных также является дискрет­ ным.

4.4. НАБОР ПСИХОЛОГИЧЕСКИХ ФОНЕМ

Сокращение информации, обеспечиваемое перехо­ дом к фонемному описанию, зависит, естественно, от числа иден­ тифицируемых при восприятии фонем.

В работах [16, 32] была предпринята попытка выяснить, сколько классов гласных идентифицирует в русской речи носитель рус­ ского языка. Испытуемым предъявлялись изолированные рус-

б Физиология речи

81

ские гласные, вырезанные из записей естественной речи. От ис­ пытуемых требовалось обозначать услышанные гласные русскими или латинскими буквами с добавлением в случае необходимости диакритических знаков. Ответы испытуемых показали, что число идентифицируемых ими классов гласных звуков гораздо больше числа лингвистических русских гласных: совершенно надежно можно утверждать, что гласные между твердыми и гласные между мягкими согласными относятся испытуемыми к разным звуковым типам.

Сходные результаты были получены в работе [489]. Оказалось, что испытуемые-американцы способны идентифицировать огуб­ ленные гласные переднего ряда, хотя они и отсутствуют в англий­ ском языке как самостоятельные лингвистические фонемы.

Выделяемые при восприятии классы звуков были названы психологическими фонемами. Естественно думать, что психоло­ гические фонемы соответствуют неперекрывающимся областям в пространстве акустических признаков сигнала. Легко заметить, что фонемы, определенные согласно критериям московской фоно­ логической школы, не отвечают этому требованию. Первые глас­ ные в словах вода и валун акустически не различаются, вместе

стем предполагается, что они представляют разные фонемы. Вышеприведенные данные позволяют без всякого риска утвер­

ждать, что число психологических фонем превышает число лин­ гвистических фонем любого языка, однако неясно, как велико это превышение.

Следует заметить, что существование каких-то минимальных единиц восприятия, аналогичных по функции психологическим фонемам (аллофонов, звукотипов), допускается во многих моделях восприятия речи [215 491, 527]. Однако авторы этих моделей счи­ тают, что на более высоких уровнях восприятия эти единицы каким-то образом трансформируются в лингвистические фонемы. Следует подчеркнуть, что в пользу существования такой транс­ формации нельзя привести ни одного веского довода.

4.5. ФОНЕМНАЯ КЛАССИФИКАЦИЯ

Для описания связи между речевым сигналом и фонемным решением необходимо указать признаки сигнала, на основе которых осуществляется классификация, и решающие правила. Единственный способ указания признаков заключается в описании алгоритмов (процедур) обработки сигналов, обеспе­ чивающих выделение и измерение этих признаков. Пока при­ знаки остаются неизвестными, — а ситуация сейчас именно та­ кова, — исследователи вынуждены использовать следующую стра­ тегию постепенного приближения к истине. Сначала на основании каких-то априорных сведений, например полученных при исследо­ вании речеобразования, выбирается некоторый условный набор признаков. Далее синтезируется множество стимулов, различа­

82

ющихся по этим признакам, и эти стимулы предъявляются испы­ туемым для фонемной классификации. Результатом эксперимента является установление фонемных границ в пространстве априорно выбранных условных признаков. Аналитическое описание фонем­ ных границ дает решающие функции, определенные, естественно, также в терминах этих условных признаков.

Эти фонемные границы (решающие функции) являются про­ межуточным результатом, позволяющим дальше проверять и уточнять сами гипотезы о природе признаков, а также исследо­ вать некоторые общие характеристики фонемного классификатора (постоянство правил или наличие динамической подстройки и т. д.).

Необходимо подчеркнуть, что все фонемные границы, имею­ щиеся сейчас в литературе по восприятию речи, являются услов­ ными в том смысле, как было определено выше. Непосредствен­ ная их полезность для автоматического распознавания речи пока весьма проблематична, так как трудно надеяться на то, что ис­ следователю так повезло, что он выбрал в качестве условных признаков именно те признаки, которые выделяет в сигнале слухо­ вая система человека.

4.5.1. ФОНЕМНЫЕ ГРАНИЦЫ СТАЦИОНАРНЫХ ГЛАСНЫХ В ПРОСТРАНСТВЕ ЧАСТОТ ФОРМАНТ

Попытки определить фонемные области стационар­ ных гласных в пространстве частот формант стимулов предпри­ нимались рядом исследователей на материале разных языков

]208, 306 337, 364, 458, 505]

На рис. 4.8 приведены данные, полученные для русских ис­ пытуемых. Граница между гласными Ц] и [е] была определена методом активного поиска в экспериментах с двухформантными синтетическими гласными [107]. Частота второй форманты в пре­ делах каждого данного измерения была фиксированной (при­ нимала одно из значений, указанных по оси F2); испытуемые, управляя частотой F1, искали на слух то ее значение, которое соответствовало границе между [i] и [е].

Три другие границы на рис. 4.8 были найдены в эксперименте по идентификации четырехформантых синтезированных гласных методом форсированного выбора [129]. Испытуемым предъявля­ лись два набора стимулов, различавшихся лишь фиксированными значениями частот F3 и Fi (2660 и 3500 Гц для первого и 3540 и 4000 Гц для второго набора). Частоты F1 и Р2 этих стимулов изменялись в широком диапазоне (470—920 Гц и 800—2070 Гц соответственно) логарифмически равными шагами (Д7?=0.1 F). Точки и крестики на рис. 4.8 представляют разные наборы стиму­ лов и соответствуют условию равновероятности выбора соседних фонем. Видно, что границы в плоскости F^^ практически не за­ висят от значений частот третьей и четвертой форманты.

83

Рис. 4.8 показывает, что три фонемных границы из четырех аппроксимируются вертикальными или горизонтальными пря­ мыми линиями. Это означает, что решения о фонемах могут при­ ниматься на основе измерения единственного параметра — час­ тоты Fx или F2.

Этот факт можно рассматривать как подтверждение правиль­ ности распространенной гипотезы о том, что слуховая система выделяет в гласных какие-то приз­ наки, или совпадающие с частотами формант, или близкие к ним (подроб­

ное обсуждение этого вопроса

см.

в

главе 10).

 

 

Более сложной оказалась граница

между областями гласных [а] и

[е].

В

данном случае возможной

ап­

проксимацией этой границы явля­

ется

уравнение

lg/^—0.5 lg/’2 = 1.3,

т. е.

указанная

граница является

функцией частот обеих формант. Дан-

Рис. 4.8. Границы между синтетическими гласными в плоскости По [313].

По оси абсцисс — частота первой форманты; по оси ординат — частота второй форманты. Осталь­ ные обозначения см. в тексте.

ные, полученные на испытуемых чехах, шведах и поляках [208’ 306, 337], подтверждают этот факт и, кроме того, указывают на то, что аналитическое выражение границы между [а] и [е] может иметь более простой вид: —lg/’2=const. Это означает, что в качестве решающего правила может использоваться постоянство разности значений Fx и F2 по логарифмической шкале.

Очевидно, что исследование различения гласных [а] и [е] является наиболее перспективным для понимания принципов обработки спектральной информации.

4.5.2. ОБЛАСТЬ НЕОПРЕДЕЛЕННОСТИ И КОНТЕКСТУАЛЬНЫЕ ВЛИЯНИЯ ПРИ ВОСПРИЯТИИ ГЛАСНЫХ

Фонемная граница соответствует значениям пара­ метров стимула, при которых две соседние фонемы выбираются с равной вероятностью. Интервал значений параметров стимула, заключенный между 0.25 и 0.75 ответов (данной фонемой) на функ­ ции идентификации, называется областью неопределенности.

Экспериментально показано, что время (задержка) двигатель­ ной реакции, связанное с принятием фонемного решения (на­

84

жатие на кнопку, запись буквы и т. д.), закономерно возрастает внутри области неопределенности и достигает максимума на фонем­ ной границе [86 213 492]. Этот факт указывает на то, что для описа­ ния перехода от акустических (слуховых) параметров стимула к фонемам недостаточно «знать» фонемные границы (решающие правила) в пространстве указанных параметров: необходимо еще допустить существование некоторых промежуточных переменных (сигналов), отражающих величину «сходства» с фонемой (см. об­ суждение в [152 158]).

Можно думать, что в экспериментах по идентификации изо­ лированных гласных фонемная интерпретация «неопределенного» стимула зависит в основном от значений функций сходства с со­ седними фонемами. Если же неопределенный гласный предъяв­ ляется в некотором контексте, то логично ожидать, что фонемное решение о нем будет определяться преимущественно другими, «определенными» фонемами.

В работе [115] было показано, что при пересадке синтезирован­ ного фонетически неопределенного гласного в естественные слоги СГС, предъявлявшиеся изолированно или в составе слов и фраз, оценка фонемного качества гласного зависит от окружающих согласных: например, стимул с параметрами 2?1=320 Гц и F2= =1420 Гц в окружении твердых согласных чаще интерпретируется как [i], в окружении мягких согласных — как [и].

Эффекты подобного рода получили в литературе название кон­ текстуальных влияний. Хотя основной интерес представляют контекстуальные влияния в связной речи — внутри слова и пред­ ложения, — анализ механизмов контекстуальных влияний в этой ситуации оказывается очень сложным, так как один и тот же контекстуальный эффект может достигаться под действием раз­ ных факторов. Априорно можно предполагать, что к числу таких факторов относится, например, разрешение неопределенности на уровнях анализа смысла, сравнение запомненной информации (значений сходства с фонемами) о соседних гласных в последо­ вательности, изменения состояния самого фонемного классифи­ катора под действием предшествующего стимула, т. е. эффекты последействия, и т. д.

По этой причине исследования сейчас ограничиваются в ос­ новном значительно более простой экспериментальной ситуацией, когда влияющий стимул предшествует тестирующему и отделен от него достаточно большой паузой. Ответ о тестирующем стимуле дается сразу же после его предъявления.

В ряде работ [86 210 265, звз] было продемонстрировано два эффекта последствия — эффект контраста и эффект ассимиляции (уподобления). Эти эффекты удобно описывать, используя понятия среднего и текущего значения фонемной границы. Если, например, влияющий стимул находится справа от среднего значения фонем­ ной границы, то эффект контраста проявится в том, что текущее значение границы после предъявления влияющего стимула уста­

85

новится правее среднего ее значения. Эффект ассимиляции в этом случае будет, наоборот, заключаться в том, что текущее значе­ ние границы установится левее среднего ее значения.

Данные работы [31°] говорят о том, что эффект контраста и эффект ассимиляции связаны . с разными уровнями обработки сигнала. В эксперименте [21°] испытуемым предъявлялась для идентификации ([и] или [о]) случайная последовательность все­ возможных пар стимулов, параметры которых указаны в подписи к рис. 4.9. Полученные данные позволяют судить о положении границы между фонемами [и] и [о] в зависимости от решения о фо­ немной принадлежности влияющего стимула (первого стимула

каждой пары) и положения его на шкале параметров. На рис. 4.9 показаны гра­ ницы, вычисленные при условии, что

влияющий стимул

был

опознан

как

[о] (прямая 7) и

как [и]

(прямая

2).

Рис. 4.9. Положение фонемной границы между гласными [и] и [о], вычисленной по данным для второго стимула в паре, при идентифика­ ции обоих стимулов пары. По [21°].

По горизонтали отложен номер первого стимула в паре, по вертикали — номер второго стимула в паре (приведены только стимулы в пограничной между [и] и [о] области). Пря­ мая 1 аппроксимирует положение границы в случае, когда первый стимул в парах прини­ мался за [о], прямая 2 — когда первый стимул принимался за [и]. Стрелка указывает среднее положение границы. Ниже приведены номера и частоты формант (в Гц) стимулов

 

(Стимул

1 соответствует

[и],

стимул

11 — [о]):

 

 

1

2

3

4

5

6

7

8

9

10

11

F2

250

207

284

301

318

335

352

309

380

403

420

750

760

770

780

700

800

810

820

830

840

850

F3

2400

2420

2440

2460

2480

2500

2520

2540

2560

2580

2600

Обе прямые свидетельствуют о наличии эффекта контраста: по­ вышение формантных частот влияющего стимула приводит к со­ ответствующему сдвигу границы между [и] и [о]. Тот факт, что положение фонемной границы изменяется под влиянием физи­ чески разных стимулов, опознаваемых как одна и та же фонема, говорит о том, что эффект контраста определяется акустическими параметрами гласных стимулов.

Разница между прямыми 1 и 2 в области влияния стимулов 5, 6 и 7 на рис. 4.9 демонстрирует эффект ассимиляции. Действи­ тельно, если влияющий стимул 7 был опознан как [и], то фонем­ ная граница устанавливалась таким образом, что неопределен­ ные стимулы 6 и 7 из тестирующего множества также воспринима­ лись как [и]. Если же влияющий стимул 7 принимался за [о], то тестирующие стимулы 6 и 7 также воспринимались как [о]. Это свидетельствует о том, что в отличие от эффекта контраста эффект ассимиляции определяется фонемным решением о влия­ ющем стимуле,

86

Существенно отметить, что эффект последействия типа кон­ траста наблюдался также в такой ситуации, когда влияющими стимулами были гласные [и] и [о], а тестирующими стимулами — гласные, воспринимаемые как [i] и [е] [91]. Было обнаружено, что фонемная граница по Ft между гласными [i] и [е], определенная методом активного поиска, существенно ниже, когда тестирую­ щий (переменный) стимул следует за [и], чем когда он следует за [о]. Это подтверждает, что эффект контраста определяется акустическими параметрами стимулов и действует на уровне об­ наружения отдельных признаков (в данном случае — частот формант).

4.5.3. ДЕТЕКТОРЫ ПРИЗНАКОВ СОГЛАСНЫХ

Наиболее популярными экспериментальными моде­ лями, используемыми при исследовании восприятия согласных, являются наборы стимулов СГ, различающихся по «времени на­ чала голоса» (рис. 4.2), и наборы стимулов СГ, различающихся по характеру быстрых переходов второй и третьей форманты.

Первый набор используется для определения фонемной гра­ ницы между глухими и звонкими начальными взрывными соглас­ ными, второй набор — для определения фонемных границ между взрывными согласными, различающимися по месту образования.

Популярность указанных стимулов определяется тем, что фонематически полезная информация заключена в этом случае или в последовательности акустических явлений, или в харак­ тере быстрых изменений спектра во времени. Для извлечения этой информации необходимы явно другие методы обработки сигнала, чем те, которые предполагаются для случая стационарных глас­ ных [483]. Можно считать, что эти стимулы, с одной стороны, и стационарные гласные, с другой, представляют собой как бы две крайние ситуации, с которыми встречается человек при класси­ фикации речевых сигналов. Исследование фонемной идентифика­ ции такого типа стимулов в обычных экспериментальных условиях (разные стимулы следуют с паузами друг за другом) не обнару­ живало эффектов последействия типа контраста [2661.

Одпако за последние два года выяснилось, что такие эффекты можно получить, если использовать длительное (многократное) предъявление влияющего стимула [179, 186' 222’ 231> 243]. В качестве примера можно привести описание методики, примененной Купе­ ром [222], и полученные им результаты. В эксперименте Купера использовался ряд синтезированных слогов типа СГ с гласным [оз], различавшихся по исходным значениям и направлению пере­ ходов F2 и F3 на начальном участке гласного длительностью в 40 мс. При идентификации этих стимулов группой испытуемыхамериканцев было получено три фонемных категории, соответству­ ющих слогам с билабиальным [Ьл], альвеолярным [dae] и веляр­

87

ным [gee] согласными. На рис. 4.10, А показано расположение указанных областей согласных у одного из испытуемых.

После этого проводился эксперимент по идентификации в при­ сутствии влияющих стимулов. Как и в первом опыте, испытуе­ мые слушали случайную последовательность исходных стимулов, каждый из которых надо было й^ентифицировать с одним из трех

Рис. 4.10. Функции идентификации синтетических слогов, различающихся по направлению переходов F2 и F3, полученные в условиях влияния пред­ шествующих стимулов. По [222].

По оси абсцисс — номер стимула; по оси ординат — относительное число ответов [Ъ], [d]n Cgl. На А: функции идентификации Слогов (Ьэг], [d&j и [gde] в отсутствии контекста.

На Б, В, Г: функции идентификации тех же слогов при использовании в качестве пред­ шествующего стимула соответственно слогов [Ьж], [<1жЗ и [gae].

указанных согласных. Но в этом случае предъявлению серии

из

четырех тестирующих стимулов предшествовало многократное

(90

раз в течение минуты) предъявление влияющего стимула.

В

качестве последнего использовались (в разных сериях про­

слушиваний) слоги [Ьт], [d к] и [gee], взятые из исходного набора стимулов и идентифицированные в качестве таковых в 100% случаев. Рис. 4.10, Б, В, Г показывает функции идентификации, полученные у одного из испытуемых под влиянием вышеназван­ ных предшествующих стимулов. Видно, что предъявление влия­ ющих стимулов привело к сдвигу фонемных границ по принципу контраста. Эти данные были подтверждены в -экспериментах

88

ио различению стимулов в присутствии влияющих стимулов. Максимумы на функциях различения, полученных в этих усло­ виях, хорошо совпадают с положением границ, найденных при иден­ тификации стимулов в тех же условиях.

Обнаруженный эффект последействия получил название «селек­ тивной адаптации». Он сразу же привлек к себе большое внимание исследователей. Варьируя характеристики влияющих и тестиру­ ющих стимулов, можно попытаться выяснить, с какими уровнями обработки сигнала связан этот эффект.

Предполагается, что эффект селективной адаптации действует на уровне обнаружителей (детекторов) признаков согласных и вызывается утомлением детекторов, происходящим из-за много­ кратного предъявления одного и того же стимула. Это, очевидно, означает, что выходом классификатора согласных являются не фо­ немы, а признаки, т. е. имеются, например, детекторы звонкостиглухости, работающие независимо от места или способа образова­ ния согласных, или детекторы места образования, работающие независимо от того, глухие или звонкие согласные подаются на его вход.

Доказательством такого представления является тот факт, что в экспериментах [222] сдвиг границы между областями [Ь] и [d] происходил не только под действием влияющего стимула [Ьае], но и под действием стимула [р\«], согласный которого совпадает с [Ь.и] по месту образования. Точно так же в работе [2431 граница

между согласными [d] и [th], различающимися по признаку звонкости-глухости, смещалась при использовании в качестве

влияющих стимулов слогов с согласными [Ь] и [ph].

При предположении детекторов психологических (дифферен­ циальных) признаков встает вопрос о том, имеются ли универ­ сальные детекторы, работающие во всей частотной области, или существует множество детекторов каких-то акустических при­ знаков. Первое допущение означает, что если, например, рассмат­ ривать признак места образования, то детектор этого признака сработает одинаково при предъявлении слогов [di] и [du], соглас­ ные в которых различаются акустически. Имеются указания [185], что это допущение неверно.

Вопрос о том, какие акустические признаки могут измеряться при восприятии согласных, пока не решен. Например, имеются данные, что информация о месте образования согласных содер­ жится в формантных переходах (см. главу 12). Это может озна­ чать, что в локальных частотных областях существуют измерители (детекторы), реагирующие на направление изменения частоты. Решение о признаке — месте образования согласного принима­ ется в результате суммирования данных таких детекторов. С дру­ гой стороны, можно представить, что в качестве самостоятельных параметров выделяются частоты формант и что имеются схемы, измеряющие направление изменения этих переменных. В экс-

89

Имеющиеся в литературе данные позволяют представить, что из анализа просодической информации, содержащейся в речевом сигнале, могут быть получены следующие важные для понимания смысла сообщения сведения.

1.Прежде всего сведения, необходимые для установления коли­ чества слов в высказывании, их выделения и опознавания, т. е. для морфологического анализа*. Эти сведения могут быть полу­ чены из анализа ритмической структуры высказывания и рас­ пределения пограничных сигналов в нем. Поскольку ритм речи есть упорядоченное чередование выделенных и невыделенных элементов (слогов), часть задачи решается выяснением места (номера) выделенного слога (ударного) в последовательности слогов, описывающей данный речевой сигнал.

2.Сведения, существенные для синтаксического анализа вы­

сказывания, т. е. для установления отношений между словами

внем.

3.Данные об особенностях конкретного процесса речевого общения: является ли высказывание запросом или сообщением информации, какой именно информации, как относится говоря­ щий к сообщаемой им или ему информации и т. д. Так, пред­ ложение Мама мыла Маню?, реализованное в виде высказывания, может иметь, в зависимости от ситуации, несколько разных смыс­ лов: Кто же мыл Маню? Кого мыла мама? Мыла ли уже мама

Маню?

Очень важно отметить, что параметры речевого сигнала, используемые для передачи просодической информации, и п р о- содические признаки речи, по всей вероятности, не одно и то же. Здесь нам кажется уместной аналогия с диффе­ ренциальными признаками фонем. Так, частота форманты, будучи параметром речевого сигнала, может нести информацию и о фо­ неме, и об особенностях диктора, а возможно, и просодическую информацию. Но дифференциальный признак фонемы — это ре­ зультат сравнения измеренной в сигнале частоты форманты с не­ которым пороговым значением, т. е. уже не только сам параметр, но и определенное решающее правило.

Соответственно этому и просодические признаки появляются в результате применения некоторых решающих правил к пара­ метрам речевого сигнала. Естественно, что при таком определе­ нии одни и те же параметры сигнала могут быть источником не только просодической информации, но и сведений об эмоцио­ нальном и даже физическом состоянии диктора [зэ], которые, строго говоря, к просодической информации не относятся, так как не являются смыслоразличительными. Для этого достаточно использовать разные решающие правила применительно к одним и тем же параметрам.

Ясно также, что такие физические параметры речевого акусти­ ческого сигнала, как частота основного тона, длительность и ин­ тенсивность звуков и речевой темп — общепризнанные источники

92

Соседние файлы в папке Нормальная физиология