Студент-лингвист готовит материалы для исследования. Он будет произносить слова из первого столбца (даны в транскрипционной записи) и просить участников эксперимента записать их на слух. Перед вами таблица, которую студент подготовил для записи полученных результатов; названия некоторых заголовков скрыты. Данные в столбцах, обозначенных буквой «В», студент вписал в таблицу до начала эксперимента.
| А | Б | |||
| В | эксперимент | В | эксперимент | |
| [гот] | 36 | 47901 | ||
| [гр’ип] | 375 | 725 | ||
| [грус’т’] | 1296 | 28 | ||
| [пас] | 482 | 85 | ||
| [рот] | 12528 | 4070 | ||
| [сток] | 151 | 213 | ||
Задание 1. Какие заголовки мы заменили обозначениями А, Б и В?
Задание 2. Какие числа экспериментатор будет записывать в столбец «эксперимент»?
Задание 3. Научный руководитель студента посчитал, что слова [паро́к], [туш], [б’ес] и [бант] для использования в эксперименте не подходят. Объясните его решение.
Задание 4. Приведите примеры нескольких слов, подходящих для этого эксперимента.
Подумайте, почему слова в первом столбце даны в транскрипционной, а не орфографической записи.
Для этого эксперимента студент подготовил существительные-омофоны (пишущиеся по-разному, а произносящиеся одинаково), различающиеся только звонкостью последнего согласного: он собирается исследовать, в каких случаях участники эксперимента чаще запишут эти слова с глухими согласными, а в каких — со звонкими, и как это связано с частотностью соответствующих слов в корпусе текстов. Например, слово гот встретилось в Национальном корпусе русского языка 36 раз, а слово год — 47 901 раз; слово грипп — 375 раз, а слово гриб — 725 раз, слово грусть — 1296 раз, а слово груздь — 28 раз; и так далее.
Отсюда ответ на Задание 1:
А — глухая согласная фонема на конце
Б — звонкая согласная фонема на конце
В — число вхождений в корпусе текстов
Ответы «число употреблений слова в интернете» или «в литературе» также считаются верными.
В столбце «эксперимент» при этом должно быть отражено, сколько участников эксперимента записали соответствующее слово с глухой или звонкой фонемой на конце (ответ на Задание 2).
Для ответа на следующие вопросы важно как можно точнее описать, что объединяет слова, данные в условии. Их можно определить следующими признаками:
Попробуем разобраться, чем научному руководителю студента не понравились слова из Задания 3:
[паро́к] — (1) двусложное слово; (2) помимо слов порог и порок, существует ещё и третье слово парок (уменьшительное от пар);
[туш] — нет омофонов-существительных, различающихся глухим/звонким согласным на конце (туш/тушь — другое различие, тужь — глагол);
[б’ес] — один из омофонов (без) не существительное, а предлог;
[бант] — один из омофонов (банд) не в начальной форме.
Для ответа на Задание 4 подходят любые слова, соответствующие описанию выше (односложные существительные в начальной форме, омофоны различаются только глухой/звонкой согласной фонемой на конце). Примеры:
[лук]: лук — луг
[сток]: сток — стог
[плот]: плот — плод
Лингвистический эксперимент — один из важнейших инструментов науки о языке. Как и в других науках, эксперименты в лингвистике предоставляют доказательную базу для гипотез об устройстве языка, позволяют доказать или опровергнуть их математическими методами.
Экспериментальная лингвистика — относительно молодая область науки. В прошлом лингвисты зачастую ограничивались собственной языковой интуицией относительно, например, суждений о приемлемости конкретных синтаксических конструкций. Так, в синтаксической литературе множество раз цитировалось утверждение, что вопрос с тремя неизвестными типа Кто что где купил? в английском языке звучит естественнее, чем аналогичный вопрос с двумя неизвестными — Кто что купил? Попытки объяснения этого феномена легли в основу нескольких теорий, прежде чем выяснилось, что экспериментальные данные не подтверждают это эмпирическое утверждение.
Важно понимать, что сам лингвист-исследователь в вынесении суждений не является «независимым наблюдателем». Во-первых, он может подсознательно склоняться к суждениям, подтверждающим желаемую теорию. Во-вторых, каждый из нас является носителем собственного идиолекта, поэтому необходимо убедиться, что теория не построена на особенностях идиолекта исследователя, не свойственных большинству носителей языка (а если лингвист не является носителем исследуемого языка, такая проверка тем более необходима). В-третьих, возможно вы сталкивались с ситуацией, когда, задумавшись о написании какого-либо слова, вы испытываете тем больше сомнений, чем дольше думаете о нём. То же зачастую происходит с учёными — глаз «замыливается» и больше не способен оценить лингвистический пример так, как это сделал бы обычный носитель. Чтобы избежать искажений, вызванных чрезмерными размышлениями, во многих лингвистических экспериментах время ограничено — например, по 2 секунды на оценку каждого предложения.
Как же выглядят лингвистические эксперименты? Одним из самых распространённых видов эксперимента являются уже упомянутые эксперименты на оценку приемлемости слов, словосочетаний или предложений (рис. 1). С похожим дизайном вы могли сталкиваться в психологических тестах с вопросами вида «Оцените, насколько хорошо вас описывает следующее утверждение от 1 до 5». В случае лингвистических экспериментов по шкале для каждого примера нужно выставить оценку приемлемости или грамматичности. Выглядит это так:

Во многих экспериментах перед испытуемыми стоит задание ответить на поставленный вопрос. Такой вопрос может быть связан, например, с разрешением синтаксической неоднозначности. В серии экспериментов на сложноподчинённые предложения с относительными придаточными (Fedorova & Yanovich 2006; Федорова 2008) участникам предъявлялись неоднозначные предложения вида Преступник застрелил служанку актрисы, которая стояла на балконе, где придаточное может относиться как к главному имени («служанка стояла на балконе», так называемое раннее закрытие), так и к зависимому («актриса стояла на балконе», позднее закрытие). После каждого предложения участникам был задан вопрос вида Кто стоял на балконе? Известно, что носители некоторых языков предпочитают позднее закрытие, а других — раннее. Также на результаты могут влиять разные факторы, например объём рабочей памяти испытуемых или длина придаточных предложений — именно влияние таких факторов исследовалось в упомянутой серии экспериментов.
Отдельно среди экспериментов с ответами на вопрос можно выделить задания на принятие лексического решения (lexical decision task, рис. 2). Такие эксперименты используются в исследованиях в области фонологии, например для выяснения предпочтительности носителями языка одних сочетаний звуков перед другими. Для этой цели можно использовать и метод оценок по шкале, но есть риск получить одинаково низкие оценки для всех несуществующих слов, к тому же абстрактное задание оценки несуществующих слов подразумевает значительное когнитивное усилие для испытуемых. В экспериментах с принятием лексического решения задание испытуемого заключается в том, чтобы для каждого слова определить, существует ли оно в языке или является выдуманным:

Рис. 2. Пример задания на принятие лексического решения. Источник: Visual lexical decision task (Experiment guide)
Характеристики несуществующих слов можно варьировать в зависимости от задач эксперимента. При этом интересующим показателем являются не только ошибочные отнесения выдуманных слов к настоящим, но и время, которое испытуемый потратил на принятие решения (чем «приемлемее» несуществующее слово, тем дольше колеблется испытуемый).
Другой метод, в котором время выполнения задания является главным измеряемым, — чтение с саморегуляцией скорости (рис. 3). Участник эксперимента читает предложение, которое предъявляется ему по одному слову — при этом остальные слова заменены звёздочками или прочерками (либо слова выводятся по очереди в центре экрана). Время, затраченное на прочтение каждого слова, автоматически учитывается программой. Таким образом можно отследить, на каких словах испытуемый задерживается дольше, а какие, напротив, почти мгновенно пропускает.

Рис. 3. Пример задания на чтение с саморегуляцией скорости на немецком языке (исследование Института мультилингвизма Потсдамского университета). Источник: S. Lago, A. Stutter Garcia & C. Felser (2019). The role of native and non-native grammars in the comprehension of possessive pronouns // Second Language Research, 35(3), 319–349

Рис. 4. Задание из оригинального теста Джин Глисон. В эксперименте использовалось также много других псевдослов, но именно «ваг» получил особую популярность.
Помимо ответа на вопрос, участнику эксперимента может быть предъявлено задание вставить пропущенное слово. Дизайн с заполнением пропусков использует знаменитый Wug test. Этот тест, созданный в 1958 году американской исследовательницей детской речи Джин Глисон (Jean Berko Gleason), исследует усвоение детьми правил словоизменения. Глисон установила, что даже очень маленькие дети способны образовать форму множественного числа от слова, которое никогда не слышали (например, форму wugs от выдуманного слова wug). Для этого она использовала задания вида «Это ваг. Вот ещё один. Теперь их двое. Здесь два ____» (рис. 4). При этом на более ранней стадии речевого развития способность образования таких форм распространяется только на знакомые слова: это значит, что сначала дети запоминают услышанные пары ед. ч. — мн. ч., а через какое-то время могут извлечь из них закономерности и распространить на новые слова.
У экспериментальных исследований детской речи есть своя специфика: задания должны быть не слишком долгими, не слишком сложными и не слишком скучными. Например, метод извлечения суждений о приемлемости для детских экспериментов не подходит. Желательно, чтобы эксперимент был похож на игру, поэтому в исследованиях с детьми часто используются задания на разыгрывание сцен. Так, в эксперименте на понимание сложноподчинённых предложений с придаточными времени (Федорова 2005) участники передвигали по игровому полю фигурки животных, следуя инструкциям вида «Перед тем, как шагнёт заяц, шагнёт медведь» или «Тигр шагнёт после того, как шагнёт жираф». При подсчёте результатов учитывалось количество ошибок: в предложениях, где порядок упоминания персонажей не совпадает с порядком их продвижения по полю, ошибок было больше.
Все рассмотренные выше экспериментальные методы имеют несложную реализацию: такие эксперименты легко программируются на компьютере, а для заданий на разыгрывание сцен может быть достаточно нескольких простых предметов. Но для некоторых исследовательских задач этих средств оказывается недостаточно — тогда на помощь приходит специальное лабораторное оборудование.
Например, оно необходимо в исследованиях усвоения языка детьми на доречевых стадиях развития ребёнка. С младенцами от полугода до года проводятся эксперименты с обусловленными поворотами головы (the head-turn preference procedure, рис. 5). Ребёнок сидит на коленях у матери в шумо- и светоизолированной камере — чтобы исключить отвлекающие факторы. За пределами камеры находится экспериментатор-наблюдатель, который может видеть всё происходящее. На стенах камеры справа и слева от ребёнка установлено по динамику, а на стене перед ним — лампочка, которую включают, чтобы привлечь его внимание. Затем включается один из динамиков, и наблюдатель засекает время, в течение которого голова ребёнка повёрнута к работающему динамику. Как только ребёнок теряет интерес, процедура повторяется, и так несколько раз. Звуковые дорожки в таких экспериментах обычно представляют собой монотонное повторение последовательностей слогов. Так, в одном из экспериментов, посвящённом восприятию младенцами ритмических структур (Höhle et al. 2009), динамики транслировали ямбическую («габА, габА, габА...») или хореическую («гАба, гАба, гАба...») последовательности слогов. При этом немецкие младенцы демонстрировали предпочтение хореической структуры, а французские — нет.
Рис. 5. Эксперимент с обусловленными поворотами головы. Источник: Headturn experimental setting
Можно ли провести эксперимент с младенцами, которые слишком малы чтобы сидеть и даже чтобы поворачивать голову? Как это ни удивительно, да: провести эксперимент с ребёнком можно уже в первый день его жизни. Для этого используется методика высокоамплитудного сосания, основанная на том, что когда младенец слышит новые для него звуки, он совершает более частые сосательные движения (рис. 6). Так было установлено, что новорождённые уже способны различать женские и мужские голоса, выделять голос матери среди других женских и, главное, по-разному реагировать на звуки родного и неродного языков.

Рис. 6. Эксперимент с четырёхмесячным младенцем с помощью методики высокоамплитудного сосания. Источник: P. D. Eimas (1985). The perception of speech in early infancy // Scientific American, 252(1), 46–53
Одним из крупнейших направлений лабораторных исследований является метод регистрации движений глаз, или айтрекинг — он представлен как различными методами (стационарные айтрекеры, мобильные айтрекеры-очки, электроокулография), так и различными направлениями исследований, далеко не только лингвистическими. Подробно об айтрекинге и его применении в лингвистике можно прочитать в послесловии к задаче «На первый взгляд».
Методы, представленные выше, дают опосредованное представление о языковых процессах в человеческом мозге — мы можем судить об их устройстве на основании поведения испытуемых. Для непосредственного доступа к мозговой активности в лингвистических экспериментах используются электроэнцефалография (ЭЭГ) и магнитно-резонансная томография (МРТ). Эти методы особенно важны при исследовании афазий — речевых нарушений, возникающих при поражениях мозга от травм, инсультов, воспалительных процессов и некоторых психических заболеваний (см. послесловия к задачам «Центр Брока» и «Опять двойка»). Исследования методами ЭЭГ и МРТ являются одними из наиболее сложных в лингвистике: для их проведения необходимо дорогостоящее оборудование, которое может себе позволить не каждый университет.

Рис. 7. Электромагнитный артикулограф. Источник: Electromagnetic Articulography
Другим примером подобного оборудования является электромагнитная артикулография — метод, позволяющий регистрировать положение органов ротовой полости во время речи (рис. 7, 8). На языке (обычно в нескольких местах), верхней и нижней губах, иногда также в уголке рта устанавливаются специальные датчики. Индукционные катушки, расположенные над головой испытуемого, создают электромагнитное поле, которое вызывает ток в датчиках и позволяет зарегистрировать движение органов артикуляции. Метод используется в исследованиях в области фонологии, патологии речи, а также в медицине для изучения дисфагий (расстройств глотания).

Рис. 8. Результат работы электромагнитного артикулографа — 3D изображение органов ротовой полости во время пения строчки Happy birthday to you. Источник: About articulography
Несмотря на разнообразие методов, принципы организации эксперимента для них во многом общие. Как же устроен лингвистический эксперимент?
В любом лингвистическом эксперименте есть независимые и зависимые переменные. Независимая переменная — фактор, которым исследователь манипулирует в эксперименте, чтобы на выходе сравнить результаты при разных его значениях. Независимыми переменными могут быть характеристики слова или предложения: частота встречаемости в корпусе, тип синтаксической структуры и т. д. Зависимые переменные — это характеристики наблюдаемого результата: оценка приемлемости, время выполнения задания, показатели используемого оборудования.
Задание. Определите зависимые и независимые переменные в экспериментах, описанных выше:
1) эксперимент на обработку сложноподчинённых предложений с относительными придаточными («Преступник застрелил служанку актрисы, которая стояла на балконе»);
2) эксперимент на обработку сложноподчинённых предложений с придаточными времени («Перед тем, как шагнёт заяц, шагнёт медведь»);
3) эксперимент на восприятие ритмических структур («гАба» vs. «габА»).
| Независимые переменные | Зависимые переменные | |
| 1 | Объём рабочей памяти испытуемых или длина придаточных предложений | Ответ на вопрос (выбор раннего или позднего закрытия) |
| 2 | Синтаксическая конструкция, порядок упоминания персонажей | Количество ошибок при разыгрывании сцен |
| 3 | Ритмическая структура (ямб или хорей) | Длительность обусловленных поворотов головы |
У каждой независимой переменной может быть несколько значений (уровней) — так, независимая переменная «ритмическая структура» в эксперименте с обусловленными поворотами головы имела значения «ямб» и «хорей». Экспериментальные стимулы конструируют блоками: каждый блок содержит все возможные комбинации уровней независимых переменных — такие комбинации называют условиями. Вот пример дизайна эксперимента «2х2» (первый блок приведён целиком):
| Предложение-стимул | Независимые переменные | Условие | |
| Позиция местоимения | Позиция придаточного | ||
| Макс получил в подарок «Лего», когда ему исполнилось 4 года. | Придаточное предложение | В конце предложения | 1А |
| Он получил в подарок «Лего», когда Максу исполнилось 4 года. | Главное предложение | В конце предложения | 1Б |
| Когда ему исполнилось 4 года, Макс получил в подарок «Лего». | Придаточное предложение | В начале предложения | 1В |
| Когда Максу исполнилось 4 года, он получил в подарок «Лего». | Главное предложение | В начале предложения | 1Г |
| Джон увидел огромное чёрное насекомое, когда он проснулся. | Придаточное предложение | В конце предложения | 2А |
| и т. д. | |||
Классический эксперимент строится по правилу латинского квадрата: создаётся несколько экспериментальных листов (каждый испытуемый получает только один лист), и стимулы распределяются по ним таким образом, чтобы на каждый лист попадал только один элемент из каждого блока. Это обеспечивается последовательным смещением условий при распределении стимулов по листам:
| Лист 1 | Лист 2 | Лист 3 | Лист 4 |
| 1А | 1Б | 1В | 1Г |
| 2Б | 2В | 2Г | 2А |
| 3В | 3Г | 3А | 3Б |
| 4Г | 4А | 4Б | 4В |
| и т. д. | |||
Стимулы из одного блока не помещают на один лист для того, чтобы испытуемый не «заподозрил», что именно тестируется в эксперименте. Как правило, особенно в синтаксических экспериментах, исследуемое явление предполагается маскировать для получения более чистого результата. Для этой же цели служат филлеры (в классическом дизайне составляют две трети от всех стимулов в эксперименте) — отвлекающие предложения, не содержащие исследуемого явления. Например, для эксперимента, представленного выше — как вы могли догадаться, он посвящён обработке личных местоимений, — подошёл бы филлер «Когда Джейн сделала уроки, было уже темно». Он не содержит личного местоимения, но внешне похож на остальные предложения эксперимента.
Филлеры служат и другой цели — убедиться в языковой компетенции испытуемого. Если испытуемый не владеет в нужной мере языком, выполняет задания невнимательно, устал, то его результаты могут исказить общую картину результатов эксперимента. Для этого может существовать порог ошибок в филлерах (обычно 10–15%), при непрохождении которого результаты участника исключаются из выборки. Похожую функцию выполняют контрольные задания. Они могут быть не выделяющимися среди других заданий эксперимента — например, в экспериментах с оценкой приемлемости всегда есть контрольные грамматичные и контрольные неграмматичные предложения, — а могут быть обозначены как форма контроля: например, после оценки каждых 10 предложений испытуемому может быть предъявлен вопрос на внимательность.
При наличии у испытуемого собственного опыта в создании и прохождении лингвистических экспериментов филлеры и другие способы замаскировать истинный предмет интереса исследователя не всегда достигают своей цели. Поэтому для многих лингвистических экспериментов стараются набирать испытуемых только среди не-лингвистов. Существует несколько исследований, сравнивающих результаты лингвистов и «наивных носителей» в экспериментах с оценкой приемлемости, не пришедших к единому выводу: как в том, есть ли в результатах этих групп значимые различия, так и в том, являются ли лингвисты идеальными испытуемыми для таких экспериментов, или, наоборот, выбирать их в качестве испытуемых нежелательно. Хорошим тоном считается по крайней мере собирать данные о наличии у испытуемых лингвистического образования в анкете перед началом эксперимента.
Отбор испытуемых — ответственная часть подготовки эксперимента; от того, насколько качественно организован этот процесс, зависит качество результата и его воспроизводимость. Критерии отбора стоит чётко формулировать до его начала: возраст, образование, наличие или отсутствие нарушений речи, слуха, зрения, уровень владения языками. В зависимости от задач можно запланировать повторение эксперимента в той же группе испытуемых через определённые промежутки времени (от нескольких недель до нескольких лет). Такие исследования называются лонгитюдными и используются в изучении усвоения языка или патологий речи.
Если после прочтения этого текста вы захотели стать участником лингвистического эксперимента, есть несколько способов это сделать. Онлайн-эксперименты часто размещаются исследователями на специальных платформах, где за выполнение заданий можно получить небольшое вознаграждение: Amazon Mechanical Turk, Prolific, Sona Systems и других. Для русскоязычных пользователей крупнейшей платформой такого формата является Яндекс.Толока. Если вам интересны лабораторные эксперименты, попробуйте узнать, нет ли лингвистических лабораторий в вашем городе. Например, Центр языка и мозга при НИУ ВШЭ в Москве регулярно набирает испытуемых для участия в экспериментах.
Литература:
1. Byers-Heinlein, K. (2014). High amplitude sucking procedure // P. J. Brooks, V. Kempe (eds.) Encyclopaedia of Language Development. Thousand Oakes: Sage. P. 263–264.
2. Fedorova, Olga V., and Igor S. Yanovich (2006). Early preferences in relative clause attachment in Russian: The effect of working memory differences. In: James E. Lavine, Steven Franks, Mila Tasseva-Kurktchieva, and Hana Filip (eds.), Formal Approaches to Slavic Linguistics. The Princeton Meeting 2005. Ann Arbor: Michigan Slavic Publications, 113–28.
3. Gibson, E., & Fedorenko, E. (2010). Weak quantitative standards in linguistics research. Trends in cognitive sciences, 14(6), 233–234.
4. Gleason, J. B. (2019). The Wug Test. Larchwood Press.
5. Gor, V. (2021). Topics in Experimental Linguistics (Lecture slides). Course at V-NYI Winter Institute, St. Petersburg.
6. Höhle, B., Bijeljac-Babic, R., Herold, B., Weissenborn, J., & Nazzi, T. (2009). Language specific prosodic preferences during the first half year of life: Evidence from German and French infants. Infant Behavior and Development, 32(3), 262–274.
7. Введение в науку о языке. А. Е. Кибрик и др. (2019). Под ред. О. В. Федоровой и С. Г. Татевосова. М.: Буки Веди, 672.
8. Проблематика и методики экспериментального синтаксиса // Русские острова в свете экспериментальных данных (2021). Под ред. Е. А. Лютиковой и А. А. Герасимовой. М.: Буки Веди, 412.
9. Федорова, О. В. (2005). Перед или после: что проще? (понимание сложноподчиненных предложений с придаточными времени). Вопросы языкознания, (6), 44–58.
10. Федорова, О. В. (2008). Основы экспериментальной психолингвистики: принципы организации эксперимента. М.: Спутник, 23.
11. Федорова, О. В. (2010). Основы экспериментальной психолингвистики: рабочая память и понимание речи. М.: Спутник, 72.
12. Федорова, О. В. (2013). Об экспериментальном синтаксисе и о синтаксическом эксперименте в языкознании. Вопросы языкознания, (1), 3.
Эксперимент, по мотивам которого создана задача, является частью серии исследований по распознаванию словоформ в условиях отсутствия контекста, снимающего неоднозначность. В естественной коммуникации при столкновении с неоднозначностью — фонетической (омофоны), синтаксической, референциальной (к какому слову отсылает местоимение) — именно контекст помогает распознать речь так, как это было задумано говорящим. Однако в ряде случаев это невозможно, и тогда в дело вступают другие факторы, помогающие разрешению неоднозначности. Главным из них является частотность: более частотные словоформы являются более вероятными кандидатами на распознавание.
Именно так звучала гипотеза эксперимента: «При наличии нескольких единиц, в равной степени соответствующих входному сигналу и допускающихся существующим контекстом, преимущество в процессе конкуренции получает та из них, которая является наиболее частотной».
В задаче эксперимент представлен в упрощённой версии. На самом деле в нём использовалось четыре группы омофонов:
1) Лексические омофоны, представленные существительными в форме именительного падежа единственного числа, в которых омофония является следствием оглушения последнего согласного: рог — рок, маг — мак и т. д. Эта группа омофонов представлена в задаче.
2) Грамматические омофоны, представленные, во-первых, глаголами прошедшего времени единственного числа с безударным окончанием: стоило — стоила, сломалось — сломалась и т. д.
3) Вторая группа грамматических омофонов — словоформы, которые могут быть интерпретированы как наречия и краткие прилагательные среднего рода или как краткие прилагательные женского рода: ужасно — ужасна, заботливо — заботлива.
4) Третья группа грамматических омофонов — формы глаголов третьего лица настоящего времени с безударным окончанием: возит — возят, ссорится — ссорятся и т. д.
Грамматические омофоны были включены в эксперимент не только потому, что в русском языке их больше, но и потому, что в лингвистической литературе нет единого мнения о стратегиях разрешении неоднозначности для таких слов. В частности, нет согласия по поводу того, в каком виде слова представлены в словаре слушающего: как словоформы (конкретные грамматические формы слов) или как лексемы (совокупности форм и значений, объединяющие разные словоформы одного слова). Авторы исследования отталкиваются от гипотезы, что основной единицей словаря слушающего в русском языке является именно словоформа.
Задание эксперимента представляло собой письменную фиксацию услышанных стимулов: одной группе испытуемых предлагалось записать слова как в диктанте, другой — составить и записать предложение с услышанным словом. Все испытуемые являлись наивными носителями языка, то есть не имели лингвистического или филологического образования. После окончания эксперимента участников спрашивали, догадались ли они о наличии нескольких интерпретаций у предъявленных стимулов. Ни один из них не заметил, что множественные интерпретации существовали у всех слов в эксперименте — в основном испытуемые догадывались о возможности нескольких интерпретаций только у лексических омофонов.
Естественно предположить, что помимо частотности в задании такого типа на ответы испытуемых может влиять и другой фактор — соответствие фонетической и орфографической репрезентаций слова. В этом случае омофоны, написание которых в большей степени опирается на фонетический принцип орфографии (то есть графический облик которых ближе к звучанию), будут выбираться испытуемыми чаще, чем их конкуренты, написание которых требует знания и применения орфографических правил, например запись конечных глухих согласных буквами, обозначающими соответствующие им звонкие. Особый интерес в эксперименте представляли пары омофонов, в которых омофон, орфографическая запись которого ближе к произношению, является менее частотным, чем второй омофон данной пары. Они позволяют проверить, что влияет на разрешение неоднозначности больше — частотность омофонов или близость их орфографической записи к звучанию.
Результаты эксперимента показали, что прежде всего при выборе словоформы слушающие действительно опирались на частотность. При этом стратегия выбора словоформы, написание которой в большей степени соответствует звучанию, также присутствовала, хотя и не являлась преобладающей. В среднем не менее чем 7 стимулов из 22 испытуемые записывали в соответствии с фонетическим принципом орфографии, а не с частотностью.
Объяснения результатов содержат несколько видов частотности, на которую могли опираться испытуемые в своих ответах. Помимо частотности словоформ, для грамматических омофонов это могла быть и частотность грамматических классов, то есть то, насколько часто встречаются подобные грамматические формы. В некоторых парах частотность омофонов в конкретной паре не совпадала с частотностью грамматического класса в целом — испытуемые могли опираться на любую из них. Кроме того, авторы высказывают предположение о ещё одной возможной стратегии — опоре на количество потенциальных контекстов, возможное для каждого из омофонов. Это наблюдение подкрепляется результатами распознавания омофонов из второй группы, особенно форм глаголов, заканчивающихся на [ас’]. При этом значимым может быть не только количество возможных контекстов, но и их частотность. Например, словосочетание дверь закрылась является самым частотным сочетанием для омофонов закрылось — закрылась по данным НКРЯ. При составлении фраз со стимулом [закры́лъc’] большинство испытуемых выбрали именно форму женского рода.
Результаты эксперимента свидетельствуют о том, что единицами словаря слушающего применительно к русскому языку являются словоформы. Они соединены многочисленными связями, сила которых зависит от частотности самих словоформ, их грамматических классов, а также от контекстов, в которых они употребляются. В условиях отсутствия контекста, снимающего неоднозначность, эти характеристики ложатся в основу стратегий выбора предпочтительной интерпретации.
Литература:
1. Риехакайнен, Е. И. (2016). Восприятие русской устной речи: контекст + частотность. Федеральное государственное бюджетное образовательное учреждение высшего образования «Санкт-Петербургский государственный университет».
Задача использовалась на олимпиаде НИУ ВШЭ по русскому языку «Высшая проба» в 2021 году.
Автор задачи — Арсений Анисимов
Автор послесловий — Юлия Панченко




Рис. 1. Отрывок из эксперимента на извлечение суждений о приемлемости. Источник: A. White & K. Rawlins (2020). Frequency, acceptability, and selection: A case study of clause-embedding // Glossa: a journal of general linguistics 5(1): 105.