Когда я прихожу на свадьбу, я плачу не от того, что вижу жениха и невесту в окружении родных и друзей и представляю, какой долгий путь предстоит пройти новобрачным. Слезы выступают у меня на глазах только тогда, когда начинает играть музыка. И в кино, когда герои воссоединяются после тяжелого испытания, меня трогает опять-таки музыка.
Я говорил, что она представляет собой организованный набор звуков, но одной организованности недостаточно, должен быть еще и элемент неожиданности, иначе музыка получится эмоционально плоской, словно написанной роботом. Ее ценность для нас основана на нашей способности понимать ее структуру — в разговорных или жестовых языках подобной структурой является грамматика — и предсказывать, что будет дальше. Зная, чего мы хотим от музыки, композиторы наполняют ее эмоциями, а затем сознательно либо удовлетворяют эти ожидания, либо нет. Трепет, мурашки и слезы, которые вызывает у нас музыка, — результат искусной манипуляции, выполненной композитором и исполнителями.
Пожалуй, самая распространенная иллюзия, своего рода салонный фокус, в западной классической музыке — ложная каденция. Каденция — это последовательность аккордов, которая вызывает отчетливые ожидания, а затем закрывается, как правило, разрешением, доставляющим слушателю удовольствие. В ложной каденции композитор снова и снова повторяет одну и ту же последовательность аккордов, пока наконец не убедит нас, что в конце мы получим то, чего ожидаем, а затем в последний момент включает неожиданный аккорд — в пределах заданной тональности, однако с четким ощущением, что все еще не закончилось, то есть аккорд с неполным разрешением. Гайдн настолько часто использует ложную каденцию, что кажется одержимым. Перри Кук сравнил ложную каденцию с цирковым фокусом: иллюзионисты вначале создают ожидания, а затем обманывают их, и вы не знаете, как и когда это произойдет. Композиторы делают то же самое. Песня «For No One» («Ни для кого») группы The Beatles заканчивается на неустойчивом аккорде доминанты (аккорде пятой ступени в заданной тональности си мажор), и мы ждем разрешения, которого так и не дождемся, по крайней мере в этой песне. А следующая за ней композиция в альбоме Revolver («Револьвер») начинается на целый тон ниже того аккорда, который мы ожидали услышать (в ля мажоре), что дает неполное разрешение (в си мажор), вызывая некое среднее ощущение между удивлением и освобождением.
Создание ожиданий, а затем манипулирование ими — сама сущность музыки, и есть бесчисленные способы это сделать. Группа Steely Dan, например, играет, по сути, блюз (у композиций блюзовая структура и последовательности аккордов), добавляя к аккордам необычные гармонии, из-за чего они звучат совершенно не блюзово, как песня «Chain Lightning» («Цепная молния»). Майлз Дэвис и Джон Колтрейн сделали карьеру на регармонизированных блюзовых последовательностях, придав им новое звучание — отчасти хорошо знакомое нам, отчасти кажущееся экзотическим. В сольном альбоме Kamakiriad («Камакириад») Дональда Фейгена из группы Steely Dan есть одна композиция с блюзовыми или фанковыми ритмами, в которой мы ожидаем стандартной блюзовой последовательности аккордов, но первые полторы минуты песня звучит всего на одном аккорде и никуда не двигается с этой гармонической позиции. В песне Ареты Франклин «Chain of Fools» («Цепь одураченных») вообще всего один аккорд.
В «Yesterday» («Вчера») основная мелодическая фраза длится семь тактов. The Beatles удивляют нас, нарушая одно из основных ожиданий от популярной музыки — что фраза продлится четыре или восемь тактов (почти во всех песнях в поп- и рок-музыке музыкальные идеи делятся на фразы именно такой длины). В песне «I Want You / She’s So Heavy» («Я хочу тебя / С ней так трудно») The Beatles разрушают ожидания, исполняя гипнотическую повторяющуюся концовку, которая кажется бесконечной. Основываясь на своем опыте прослушивания рок-музыки, мы ждем, что песня завершится плавно, с классическим эффектом затухания. А музыканты берут и резко ее обрывают — даже не на середине фразы, а на середине ноты!
Carpenters нарушают ожидания, используя нехарактерный для жанра тембр. Пожалуй, это последняя группа, от которой мы ждем перегруженной электрогитары, однако она используется в песне «Please Mr. Postman» («Пожалуйста, господин почтальон») и в некоторых других. The Rolling Stones — одна из самых жестких рок-групп в мире в свое время — всего за несколько лет до этого проделала обратный трюк, использовав скрипки, например, их можно слышать в песне «As Tears Go By» («Пока льются слезы»). Когда Van Halen были самой новой и самой классной группой в мире, они удивили поклонников, исполнив хэви-метал-версию старой и не очень популярной песни «You Really Got Me» («Ты просто покорила меня») авторства The Kinks.
Музыканты часто нарушают ожидания и с точки зрения ритма. Стандартный фокус в электрик-блюзе состоит в том, что музыка ускоряется, набирает обороты, а затем вся группа резко замолкает и свою партию продолжает только вокалист или соло-гитарист, как, например, в песнях «Pride and Joy» («Гордость и радость») Стиви Рэя Вона, «Hound Dog» («Гончая собака») Элвиса Пресли или «One Way Out» («Единственный выход») группы The Allman Brothers Band. Классический финал электрик-блюзовой песни — еще один подобный пример. Две или три минуты она заряжается устойчивым ритмом, а потом — бам! По аккордам кажется, что вот-вот наступит неизбежное разрешение, но, вместо того чтобы мчаться к нему на полной скорости, музыканты вдруг начинают играть в два раза медленнее.
Группа Creedence Clearwater Revival наносит двойной удар по нашим ожиданиям: в «Lookin’ Out My Back Door» («Выглядывая за дверь на задний двор») музыканты сначала замедляются — а такая «неожиданная» концовка к моменту выхода песни стала уже вполне привычной, — после чего ломают ожидания снова, возвращаясь к изначальному темпу и в нем завершая композицию.
Группа The Police построила карьеру на разрушении ожиданий в плане ритма. Стандартный ритмический рисунок в рок-музыке строится на сильных первой и третьей долях (их обозначает удар бас-бочки) и бэкбите с ударами по малому барабану на вторую и четвертую доли. Регги (наиболее яркий представитель жанра — Боб Марли) по ощущениям в два раза медленнее рока, потому что бас-бочка и малый барабан звучат вдвое реже при той же длительности музыкальной фразы. Основной ритм регги характеризуется синкопированной гитарой, то есть она звучит в промежутках между долями, которые мы считаем: раз — и — два — и — три — и — четыре — и. Так как ударные отбивают ритм не на каждую долю, а через одну, музыка приобретает некоторую леность, а синкопа придает ей ощущение движения, направляет ее вперед. Police соединили регги с роком и создали совершенно новое звучание, которое одновременно удовлетворяет одни ожидания от ритма и разрушает другие. Стинг часто исполнял на бас-гитаре новаторские партии, избегая клише рок-музыки, при котором басист играет на сильную долю или синхронно с бас-бочкой. Как сказал мне Рэнди Джексон, судья телешоу American Idol и один из лучших сессионных басистов, еще в 1980-х годах, когда мы работали в одной студии звукозаписи, басовые партии Стинга не похожи ни на чьи и не вписались бы ни в одну чужую песню. В композиции «Spirits in the Material World» («Духи в материальном мире») из альбома Ghost in the Machine («Призрак в машине») эти фокусы с ритмом доходят до такой крайности, что уже трудно сказать, где там сильная доля.
Современные композиторы вроде Арнольда Шёнберга и вовсе отошли от идеи ожиданий. Гаммы, которые они использовали, лишают нас представления о разрешении и тонике, создавая иллюзию того, что музыка вообще не может «вернуться домой» и так и остается дрейфовать в пространстве, — это своего рода метафора экзистенциализма XX века, или же композиторам хотелось творить наперекор канонам. Такого рода гаммы по-прежнему используются в кино, когда нам показывают чей-то сон, для создания образа неземного мира, а также в сценах под водой или в открытом космосе для передачи ощущения невесомости.
Такие характеристики музыки непосредственно в мозге не представлены, по крайней мере на начальных стадиях обработки. Мозг конструирует свою версию реальности, основанную лишь частично на том, что есть на самом деле, а частично на том, как он интерпретирует звуки, которые мы слышим, в зависимости от их роли в усвоенной нами музыкальной системе. Аналогично мы интерпретируем и речь окружающих. В слове «кошка», как и в его буквах по отдельности, нет ничего присущего самой кошке. Тому, что этот набор звуков означает домашнее животное, мы научились. Точно так же мы усвоили определенные сочетания нот и ожидаем, что они будут сочетаться именно так и в дальнейшем. Когда мы думаем, что звуки определенной высоты и тембра должны соединяться или следовать друг за другом, мы основываемся на статистическом анализе того, что слышали раньше. Нам придется отказаться от соблазнительной идеи, будто в мозге хранится точное и строго изоморфное представление о мире. В какой-то степени он содержит и информацию, искаженную в результате восприятия, и иллюзии, а кроме того, он сам создает связи между разрозненными элементами. Он строит для нас собственную реальность, богатую, сложную и прекрасную. Основным доказательством этой точки зрения служит простой факт, что световые волны в мире различаются только одной характеристикой — длиной волны, а наш мозг при этом рассматривает цвет как двумерное понятие (цветовой круг описан на с. 50). То же и с высотой звука: из одномерного континуума молекул, колеблющихся с разной скоростью, мозг выстраивает богатое многомерное пространство звуков разной высоты с тремя, четырьмя или даже пятью измерениями (согласно некоторым моделям). Если наш мозг достраивает столько измерений к тому, что на самом деле существует в мире, это может объяснить нашу глубокую реакцию на правильно построенные и умело объединенные звуки.
Когда когнитивисты говорят об ожиданиях и их нарушении, имеется в виду событие, противоречащее тому, которое было бы разумно предсказать. Очевидно, что мы многое знаем о разных стандартных ситуациях. В жизни мы то и дело оказываемся в обстоятельствах, различающихся лишь в деталях, и часто эти детали незначительны. Один из примеров — обучение чтению. Системы нашего мозга, отвечающие за извлечение характеристик, научились распознавать неизменные качества букв алфавита, и, если мы не будем пристально разглядывать текст, мы не заметим таких деталей, как, например, шрифт. Несмотря на то, что поверхностные детали различаются, все эти слова легко узнать, как и отдельные буквы в них. Да, читать предложения, где используются несколько шрифтов, не очень приятно, а кроме того, если каждое слово набрано по-своему, мы, конечно, это заметим, — но суть в том, что наш мозг занят распознаванием знаков вроде буквы «а», а не шрифтов.
В обработке мозгом стандартных ситуаций важно то, что он извлекает из них элементы, общие для множества случаев, и складывает их в единую структуру. Эта структура называется схемой. В схему буквы «а» входит описание ее формы и, вероятно, набор воспоминаний о других таких же буквах, которые мы видели и которые отличались написанием. Схемы обеспечивают нам необходимую информацию для множества частных случаев повседневного взаимодействия с миром. Например, мы уже много раз отмечали чьи-то дни рождения, и у нас есть общее представление о том, что у таких праздников общего, то есть схема. Конечно, схема дня рождения будет отличаться в разных культурах (как и музыка) и у людей разных возрастов. Схема формирует у нас четкие ожидания, а также дает понимание того, какие из этих ожиданий гибкие, а какие нет. Мы можем составить список того, что мы ожидаем от дня рождения. Нас не удивит, если реализуются не все из них, но чем меньше пунктов выполняется, тем менее типичным кажется праздник. По идее, там должны быть:
Если это будет праздник для восьмилетнего ребенка, мы также можем ожидать, что увидим там детские развлечения и анимацию, но никак не односолодовый виски. Все перечисленное в той или иной мере отражает нашу схему празднования дней рождения.
Музыкальные схемы у нас тоже есть, и формироваться они начинают еще в утробе матери, а затем дорабатываются, корректируются и иным образом дополняются каждый раз, когда мы слушаем музыку. Наша схема для западной музыки включает неявное знание гамм, которые там используются. Вот почему индийская или пакистанская музыка, например, звучит для нас странно, когда мы слышим ее впервые. Индийцам и пакистанцам она странной не кажется, а еще не кажется странной младенцам (по крайней мере, она звучит для них не более странно, чем любая другая). Это может показаться очевидным, но музыка кажется нам необычной лишь в силу несоответствия тому, что мы научились воспринимать как музыку. К пяти годам дети приучаются распознавать последовательности аккордов в своей музыкальной культуре — у них формируются схемы.
У нас также есть схемы для разных музыкальных жанров и стилей. Стиль — всего лишь синоним повторяемости. В нашей схеме для концерта Лоуренса Уэлка есть аккордеоны, но никак не перегруженные электрогитары, а вот схема для концерта Metallica устроена наоборот. Схема диксиленда на уличном фестивале включает притопывание, зажигательные ритмы, и, если только музыканты не шутят (и не играют на похоронах), мы не ожидаем услышать в этом контексте мрачную музыку. Схемы делают нашу память эффективнее. Как слушатели мы узнаем то, что уже слышали, и можем определить, где именно — в том же произведении или в другом. Прослушивание музыки, согласно теоретику Юджину Нармуру, требует способности удерживать в памяти только что прозвучавшие ноты и знания других музыкальных произведений, близких по стилю к тому, что мы сейчас слышим. Эти последние воспоминания не обязательно будут столь же яркими и подробными, как представление о только что сыгранных нотах, но они необходимы для того, чтобы поместить произведение, которое мы слышим сейчас, в какой-то контекст.
Среди основных схем, которые мы выстраиваем, есть словарь жанров и стилей, а также эпох (например, музыка 1970-х звучит иначе, чем музыка 1930-х), ритмов, последовательностей аккордов, представление о структуре фраз (сколько тактов содержится в одной фразе), длительности песен и о том, какие ноты за какими обычно следуют. Ранее я упоминал, что у стандартной популярной песни одна фраза длится четыре или восемь тактов, и это тоже элемент схемы, которую мы вынесли из популярных песен конца XX века. Мы тысячи раз слышали тысячи песен и, даже сами того не сознавая, включили такую структуру фраз в список «правил», касающихся известной нам музыки. Когда в песне «Yesterday» («Вчера») звучит фраза на семь тактов, это нас удивляет. Несмотря на то что мы слышали «Yesterday» тысячу или даже десять тысяч раз, она нам все еще интересна, потому что по-прежнему разрушает нашу схему, наши ожидания, которые укоренились в нас гораздо прочнее, чем память об этой конкретной композиции. Песни, которые мы слышим раз за разом на протяжении многих лет, продолжают играть с нашими ожиданиями и всегда хоть немного удивляют нас. Steely Dan, The Beatles, Рахманинов и Майлз Дэвис — вот лишь небольшой список музыкантов, от которых, как говорится, никогда не устанешь, и причина во многом кроется в том, о чем я говорил выше.
Мелодия — один из основных способов, с помощью которых композиторы управляют нашими ожиданиями. Теоретики музыки установили принцип, представляющий собой заполнение промежутка. Если мелодия делает большой скачок вверх или вниз, то следующая нота должна изменить направление. В типичной мелодии много повышений и понижений, и она шагает по соседним нотам в гамме. Если мелодия совершает большой скачок, теоретики говорят, что она стремится вернуться туда, откуда скакнула вверх или вниз. Другими словами, наш мозг ожидает, что это было лишь временное явление и что следующие ноты приблизят нас к изначальной точке, или гармоническому «дому».
В песне «Over the Rainbow» («Над радугой») мелодия начинается с одного из самых больших скачков, которые мы только слышали в жизни, — на целую октаву. Это сильное нарушение схемы, и потому композитор вознаграждает и успокаивает нас, поворачивая к «дому», но не возвращаясь в него: мелодия и правда понижается, но лишь на одну ступень гаммы, и тем самым создает напряжение. Третья нота этой мелодии заполняет промежуток. То же самое Стинг проделывает в песне «Roxanne» («Роксана»): совершает скачок примерно на пол-октавы (на чистую кварту) и пропевает первый слог имени Roxanne, а затем мелодия снова понижается и заполняет промежуток.
То же самое происходит в адажио кантабиле из Патетической сонаты Бетховена. Основная тема повышается и переходит от до (в тональности ля-бемоль это третья ступень) к ля-бемоль, которая на октаву выше тоники, или «дома», а затем повышается до си-бемоль. Теперь, когда мы поднялись от «дома» на октаву и целый тон, у нас есть один путь — обратно «домой». Бетховен и правда совершает скачок на квинту вниз и приземляется на ноте ми-бемоль, расположенной на квинту выше тоники. Чтобы отсрочить разрешение — а Бетховен всегда искусно создавал напряжение, — вместо того чтобы совершить нисходящее движение к тонике, он снова от нее уходит. Задумав скачок с высокой си-бемоль на ми-бемоль, Бетховен противопоставил две схемы: схему разрешения в тонику и схему заполнения промежутка. Уходя от тоники, он заполняет промежуток, созданный при скачке вниз, и попадает примерно в его середину. Когда Бетховен наконец возвращает нас «домой» спустя два такта, разрешение кажется нам еще слаще и приятнее.
Теперь рассмотрим, как Бетховен играет с ожиданиями от мелодии в основной теме последней части Девятой симфонии (оды «К радости»). Вот ее ноты:
ми — ми — фа — соль — соль — фа — ми — ре — до — до — ре — ми — ми — ре — ре.
(Если вам сложно следить за нотами, попробуйте пропеть словами: «Радость, пламя неземное, райский дух, слетевший к нам...)
Основная мелодия — просто ноты гаммы! И это самая известная, тысячи раз переслушанная и наиболее часто используемая последовательность нот, какую только можно найти в западной музыке! Но Бетховену удается сделать ее интересной, потому что он нарушает наши ожидания. Мелодия начинается с необычной ноты и необычной нотой заканчивается. Композитор начинает с третьей ступени гаммы (как это было в Патетической сонате), а не с тоники, а затем постепенно повышает мелодию, двигаясь то выше, то ниже. Когда он наконец приходит в тонику — самую устойчивую ноту, он не задерживается в ней, а снова повышает мелодию до той ноты, с которой мы начали, и затем опять спускается вниз, и мы ожидаем, что мелодия снова войдет в тонику, но этого не происходит. Он останавливается на ре, второй ступени гаммы. Произведение должно разрешиться в тонике, но Бетховен держит нас там, где мы меньше всего ожидаем оказаться. Затем он снова повторяет весь мотив и только во второй раз оправдывает наши ожидания. Но теперь они еще более интересны из-за неоднозначности: мы, как Люси, которая ждет Чарли Брауна1, задаемся вопросом, не отнимет ли он у нас мячик разрешения в последний момент.
* * *
Что мы знаем о нейронной основе музыкальных ожиданий и эмоций? Если мы признаем, что мозг конструирует свою версию реальности, мы должны отвергнуть мысль о том, что у него есть точное и строго изоморфное представление о мире. Итак, как именно в нейронах мозга отражается окружающий нас мир? Мозг представляет музыку и все остальное в мире с точки зрения ментальных или нейрональных кодов. Нейробиологи пытаются расшифровать их и понять их структуру, а также то, как они преобразуются в переживания. Когнитивные психологи хотят понять эти коды на несколько более высоком уровне — не с точки зрения активности нейронов, а общих принципов.
Способ, с помощью которого компьютер сохраняет изображение, в принципе аналогичен нейрональному коду. Фотография на жестком диске хранится не в том же виде, что в бабушкином фотоальбоме. Когда вы открываете альбом, вы можете вынуть оттуда снимок, перевернуть вверх ногами, отдать другу — то есть он представляет собой физический объект. Это фотография, а не изображение фотографии. На компьютере же фотография, как и другая информация, хранится в файле, состоящем лишь из нулей и единиц — двоичного кода.
Если вы когда-нибудь открывали на компьютере поврежденный файл или если почтовая программа неправильно загружала вложение, то вместо ожидаемого вы, вероятно, видели какую-то тарабарщину: целые строки непонятных символов, закорючек, букв и цифр — примерно так в комиксах обозначают ругательства. (Эти символы представляют собой своего рода промежуточный шестнадцатеричный код, который сам преобразуется в нули и единицы, но промежуточная стадия не так важна для понимания аналогии.) В простейшем примере с черно-белой фотографией можно представить, что единица обозначает черную точку в определенном месте изображения, а ноль — отсутствие черной точки, или белую точку. Довольно легко изобразить простую геометрическую фигуру с помощью нулей и единиц, только они не смогут сами выстроиться, например, в треугольник, а будут идти в один ряд, компьютер же интерпретирует их с помощью набора инструкций (то есть понимает, к какой точке в пространстве относится каждая цифра). Если бы вы научились читать такие файлы, то смогли бы расшифровать код и определить, какое изображение в нем содержится. С цветными фотографиями ситуация значительно сложнее, но принцип используется тот же. Люди, которые постоянно работают с графическими файлами, могут посмотреть на поток нулей и единиц и что-то сказать о фотографии — скорее всего, они не определят, человек там изображен или лошадь, зато поймут, как много там красного или серого, насколько остры углы и т. п. Они научились читать код, в котором зашифрована картинка.
Аудиофайлы тоже хранятся в двоичном формате — в последовательности нулей и единиц. Цифры 0 и 1 представляют собой наличие или отсутствие какого-либо звука в определенном отрезке спектра частот. В зависимости от места в файле определенная последовательность нулей и единиц укажет, играет сейчас бас-бочка или флейта-пикколо.
В случаях, которые я сейчас описал, компьютер с помощью кода представляет обычные визуальные и звуковые объекты. Их можно разложить на мельчайшие составляющие — пиксели у изображения, синусоидальные волны определенной частоты и амплитуды у звука, — и эти составляющие переводятся в код. Конечно, у компьютера (мозга) есть много замысловатых программ (операций) для того, чтобы легко расшифровывать закодированную информацию. Большинству из нас вообще не нужно думать ни о каком коде. Мы сканируем фотографию или записываем песню на жесткий диск, а когда хотим увидеть или услышать свой файл, то просто щелкаем по нему дважды, и он открывается в своей изначальной форме. Это иллюзия, ставшая возможной благодаря многослойному шифрованию и объединению информации — процессам, которых мы даже не видим. Вот на что похож нейрональный код. Миллионы нейронов активируются с разной частотой и разной интенсивностью, и все это без нашего ведома. Мы не чувствуем, как они функционируют. Мы не знаем, как их ускорить или замедлить, как побыстрее включить их, когда садимся с утра за работу, с трудом продирая глаза, и как их выключить, чтобы заснуть.
Много лет назад мы с другом Перри Куком с изумлением прочли статью о человеке, который по одному взгляду на грампластинку мог определить, какое на ней музыкальное произведение, не читая этикетку и рассматривая лишь канавки на виниле. Неужели он запомнил их расположение? Мы с Перри достали несколько старых пластинок и нашли некоторые закономерности. Канавки содержат код, который считывается иглой. У низких нот широкие канавки, а у высоких — узкие, и игла проигрывателя смещается тысячи раз в секунду, чтобы захватить весь ландшафт внутри канавки. Если бы человек хорошо знал множество музыкальных произведений, он мог бы охарактеризовать их по количеству низких нот (в рэпе их много, а в барочных концертах — нет), понять, насколько те длительные или краткие (представьте себе джазовый свинг с шагающим басом и сравните с фанком, где на басу играют слэпом), и научиться определять их форму на виниле. Да, способности того парня необыкновенны, но их можно объяснить.
Мы каждый день встречаем людей, наделенных даром расшифровки звуковой информации: это механик, который по шуму автомобильного двигателя способен определить, вызвана проблема засоренными форсунками или соскочившим приводом ГРМ; это врач, который, послушав сердце, понимает, есть ли у вас аритмия; это музыкант, который по одному только звучанию может отличить альт от скрипки или кларнет в строе си-бемоль от кларнета в строе ми-бемоль. Во всех подобных случаях важную роль играет тембр, который помогает расшифровать код.
Как нам расшифровать нейрональные коды и научиться их интерпретировать? Некоторые нейробиологи начинают с изучения нейронов и их характеристик — что их активирует, как быстро и каков их рефрактерный период (то есть сколько времени им нужно восстанавливаться после активации). Мы изучаем то, как нейроны взаимодействуют друг с другом и какую роль нейромедиаторы играют в передаче информации в мозге. На этом уровне анализа большая часть знаний заключается в общих принципах. Например, мы пока мало знаем о нейрохимии музыки, однако в пятой главе я расскажу о некоторых новых удивительных результатах в этой области, полученных в моей лаборатории.
Но отвлечемся на минутку. Нейроны являются основными клетками головного мозга. Еще они есть в спинном мозге и периферической нервной системе. Активировать нейрон может какой-то внешний стимул, например когда звук определенной частоты возбуждает базилярную мембрану, а та, в свою очередь, передает сигнал нейронам в слуховой коре, отвечающим за определение частоты. Вопреки тому, что нам было известно сотню лет назад, нейроны в мозге на самом деле не соприкасаются. Между ними есть пространство, называемое синапсом. Когда мы говорим, что нейрон активируется, мы имеем в виду, что он отправляет электрический сигнал, вызывающий высвобождение нейромедиатора. Нейромедиаторы — это химические вещества, которые перемещаются по всему мозгу и связываются с рецепторами на нейронах. Рецепторы и нейромедиаторы можно рассматривать как замки и ключи соответственно. Когда нейрон активируется, нейромедиатор отправляется от него через синапс к другому нейрону, и, когда он находит нужный замок и соединяется с ним, активируется второй нейрон. Не все ключи подходят ко всем замкам; есть определенные замки (рецепторы), которые предназначены для приема только определенных нейромедиаторов.
Как правило, нейромедиаторы либо активируют принимающий нейрон, либо не дают ему активироваться. Затем они поглощаются в процессе, называемом обратным захватом; в противном случае нейромедиаторы продолжали бы стимулировать нейрон или подавлять его активацию.
Некоторые нейромедиаторы используются по всей нервной системе, а другие — только в определенных областях мозга и только определенными типами нейронов. Серотонин вырабатывается в стволе мозга и связан с регуляцией настроения и сна. Такие антидепрессанты, как «Прозак» и «Золофт», известны под названием селективных ингибиторов обратного захвата серотонина (СИОЗС), поскольку они ингибируют (тормозят) процесс, позволяя тому серотонину, который уже есть, действовать в течение более длительного периода. Точный механизм, благодаря которому ингибиторы обратного захвата серотонина облегчают депрессию, обсессивно-компульсивное расстройство, а также нарушения настроения и сна, пока нам неизвестен. Дофамин выделяется прилежащим ядром и участвует в регуляции настроения и координации движений. Он широко известен как часть системы удовольствия и вознаграждения мозга. Когда наркоманы употребляют наркотик, а игроманы выигрывают — и даже когда шокоголики получают какао, у них высвобождается именно этот медиатор. Роль дофамина, как и важная роль прилежащего ядра, в удовольствии от музыки оставалась неизвестной до 2005 года.
Когнитивная нейронаука за последнее десятилетие сделала большой скачок в понимании этих процессов. Теперь нам гораздо больше известно о том, как работают нейроны, как они взаимодействуют друг с другом, как формируют сети и как организм создает их по инструкциям, заложенным в генах. Одним из выводов о работе мозга на макроуровне является популярное представление о специализации полушарий, то есть о том, что его левая и правая половины выполняют различные когнитивные функции. Это, безусловно, так, но, как и в случае с большей частью научных знаний, проникших в массовую культуру, суть явления гораздо сложнее.
Начнем с того, что исследование, на котором основан такой вывод, проводилось на правшах. По ряду причин, пока не совсем ясных, организация мозга у левшей (а это примерно 5–10% населения) и амбидекстров иногда такая же, как и у правшей, но чаще она другая. Отличия могут заключаться в простом зеркальном отражении функций, когда те меняются полушариями. Однако во многих случаях отличия иные, и они пока недостаточно задокументированы. Таким образом, любые обобщения об асимметрии полушарий применимы к большинству людей, у которых ведущая рука — правая, но не ко всем людям.
Считается, что у писателей, предпринимателей и инженеров ведущее полушарие — левое, а у художников, танцоров и музыкантов — правое. Популярное представление о том, что левое полушарие является аналитическим, а правое — творческим, не лишено смысла, однако оно чрезмерно упрощенное. На самом деле обе части мозга выполняют аналитические операции и обе занимаются абстрактным мышлением. Все эти виды деятельности требуют координации полушарий, и лишь некоторые из задействованных в них конкретных функций явно латерализованы.
Обработка речи в основном локализована в левом полушарии, однако некоторые ее общие аспекты, такие как интонация, акцент и высота голоса, чаще нарушаются после повреждения правого полушария. Способность отличать вопрос от утверждения или сарказм от искреннего выражения чувств нередко основывается на латерализованных нелингвистических сигналах правого полушария, в совокупности называемых просодией. Возникает естественный вопрос, характерна ли подобная асимметрия для взаимодействия мозга с музыкой и происходит ли большая часть ее обработки с правой стороны. Известно множество примеров, когда люди с повреждениями левого полушария мозга утрачивали способность говорить, но при этом сохраняли музыкальную функцию, но есть и обратные случаи. Следовательно, музыка и речь, возможно, задействуют некоторые перекрывающиеся сети нейронов, но тем не менее не могут использовать буквально одни и те же структуры мозга.
Локальные характеристики устной речи, такие как способность отличать одни ее звуки от других, по-видимому, латерализованы в левом полушарии. Мы обнаружили подобную латерализацию и в обработке мозгом музыки. Общий контур мелодии — ее мелодическая форма, не включающая интервалы, — обрабатывается в правом полушарии, там же локализована и способность тонко различать ноты, находящиеся близко друг к другу по высоте. В соответствии с языковыми функциями левое полушарие участвует в наименовании характеристик музыки, например названия песни, исполнителя, инструмента или музыкального интервала. Музыканты, когда играют правой рукой или читают ноты из правого зрительного поля2, используют для этого левое полушарие, так как оно отвечает за движения правой половины тела. Есть также новые доказательства того, что отслеживание развития музыкальной темы — размышления о тональности, гамме и о том, есть ли у музыкального произведения смысл, — латерализуется в левой лобной доле.
По-видимому, обучение музыке приводит к некоторому смещению ее обработки из правого (образного) полушария в левое (логическое), поскольку музыканты учатся говорить — и, возможно, думать — о музыке в лингвистических терминах. И похоже, что при нормальном развитии мозга проявляется еще большая специализация полушарий: дети демонстрируют меньшую латерализацию обработки музыки, чем взрослые, независимо от того, музыканты они или нет.
Лучше всего начать изучать музыкальные ожидания мозга с рассмотрения того, как мы отслеживаем последовательность аккордов. Самое важное отличие музыки от изобразительного искусства в том, что она проявляется во времени. Ноты звучат последовательно и заставляют нас, то есть наш мозг и разум, делать предположения о том, что будет дальше. Эти предположения — существенная часть музыкальных ожиданий. Но как изучить их нейрональную основу?
При активации нейронов возникает слабый электрический ток, и его можно измерить с помощью соответствующего оборудования, которое позволит понять, когда и как часто нейроны активируются. Такое исследование называется электроэнцефалограммой, или ЭЭГ. На коже головы безболезненно закрепляются электроды, подобно тому как к пальцу, запястью или груди прикрепляют монитор сердечного ритма. Электроэнцефалограмма чрезвычайно чувствительна к времени разряда нейронов и может отслеживать их активность с точностью до 1/1000 секунды (одной миллисекунды). Но у нее есть некоторые ограничения. По ЭЭГ нельзя определить, какие нейромедиаторы высвобождаются при активации нейронов — возбуждающие, тормозные или модулирующие (например, серотонин или дофамин, которые влияют на поведение других нейронов). Поскольку электрическая сигнатура разряда одного нейрона относительно слаба, ЭЭГ улавливает активацию не отдельных нейронов, а больших групп, причем происходящую синхронно3.
У ЭЭГ ограничено и пространственное разрешение, то есть способность сообщать нам местоположение активирующихся нейронов из-за явления, которое можно описать обратной задачей для уравнения Пуассона. Представьте себе, что вы стоите на футбольном стадионе с большим полупрозрачным куполом и светите на его внутреннюю поверхность фонариком. В то же самое время я смотрю на этот купол снаружи, и мне нужно определить, где именно вы находитесь. Вы можете стоять в любой точке футбольного поля и светить в центр купола, но ваше местоположение не повлияет на то, что я увижу, — я буду наблюдать одно и то же. Могут немного различаться угол падения и яркость света, но любое предположение, которое я сделаю о том, где вы находитесь, останется лишь предположением. А если свет фонарика, прежде чем дойти до купола, отразится от нескольких зеркал и других поверхностей, я запутаюсь еще больше. То же касается и электрических сигналов в мозге, которые генерируют различные источники, — они могут располагаться на поверхности или глубоко в бороздах (желобках) мозга и отражаться от борозд, прежде чем достигнуть электрода на поверхности головы. Тем не менее ЭЭГ оказалась полезна для понимания музыкального поведения, потому что музыка развивается во времени, а у ЭЭГ лучшее временное разрешение из всех инструментов для изучения человеческого мозга.
Несколько экспериментов, проведенных Стефаном Кёльшем, Анджелой Фридеричи и их коллегами, позволили нам узнать о сетях нейронов, участвующих в понимании музыкальной структуры. Во время эксперимента воспроизводятся последовательности аккордов, которые либо разрешаются стандартным способом, согласно схеме, либо заканчиваются неожиданными сочетаниями нот. После начала звучания аккорда электрическая активность в мозге, связанная с музыкальной структурой, наблюдается в течение 150–400 мс, а активность, связанная с музыкальным смыслом, возникает примерно через 100–150 мс. Структурная обработка, то есть восприятие музыкального синтаксиса, локализована в лобных долях обоих полушарий в областях, близких и частично совпадающих с теми, которые обрабатывают синтаксис речи, таких как зона Брока, и проявляется независимо от наличия музыкального образования у слушателей. Области, участвующие в музыкальной семантике, то есть в ассоциировании последовательности нот с ее значением, по-видимому, находятся в задней части височной доли с обеих сторон, рядом с областью Вернике.
Музыкальная система, по-видимому, функционирует независимо от языковой, о чем свидетельствуют многочисленные исследования пациентов, которые в результате повреждения мозга утрачивают только одну из этих способностей, но не обе сразу. Самый известный случай — история Клайва Уиринга, музыканта и дирижера, у которого повреждения мозга наступили в результате герпетического энцефалита. Как сообщил невролог Оливер Сакс, Клайв утратил большую часть автобиографической памяти, кроме музыкальных воспоминаний. Сообщалось и о других случаях, когда пациент больше не мог обрабатывать музыку, но при этом сохранял языковые способности и воспоминания. Когда у Равеля отказали некоторые части коры левого полушария, он утратил чувство высоты звука, не потеряв, однако, чувства тембра, и этот недостаток вдохновил его на создание «Болеро» — пьесы, где во всей красе предстают именно вариации в тембре. Короче говоря, музыка и речь действительно задействуют некоторые общие нейрональные ресурсы, но при этом идут каждая своим путем. Тесное соседство зон обработки музыки и речи в височных долях, а также их частичное перекрытие позволяют предположить, что сети нейронов, которые задействуются для обработки музыки и языка, скорее всего, изначально нераздельны. Затем получение человеком опыта и нормальное развитие дифференцируют функции этих двух очень похожих популяций нейронов. Достаточно вспомнить о том, что младенцы в самом раннем возрасте считаются синестетами. По-видимому, они неспособны различать сигналы, поступающие от разных органов чувств, и воспринимают мир как своего рода психоделический союз всех чувств. Младенцы могут ощущать цифру 5 как красную, вкус сыра чеддер как ре-бемоль, а запах роз как треугольники.
В процессе развития в связанности нейронов формируются различия, поскольку некоторые связи отсекаются. Кластер нейронов, одинаково реагировавший на зрительные образы, звуки, вкусы, прикосновения и запахи, распадается на специализированные сети. Вероятно, тем же образом у всех нас возникают сети, отвечающие за восприятие музыки и речи, — в одних и тех же областях мозга и с участием одних и тех же систем нейронов. По мере развития ребенка и получения им нового опыта постепенно формируются свои пути для восприятия музыки, свои — для речевой деятельности. Они могут совместно использовать некоторые общие ресурсы, и Ани Патель выдвинул наиболее выдающуюся гипотезу, затрагивающую эту тему, — гипотезу об общих ресурсах синтаксической интеграции (SSIRH).
Как и я, мой коллега и друг Винод Менон, специалист по системной нейронауке из Медицинской школы Стэнфордского университета, заинтересовался возможностью использовать точные данные, полученные в лабораториях Кёльша и Фридеричи, для убедительного доказательства гипотезы Пателя. В исследовании нам пришлось использовать другой метод изучения мозга, поскольку пространственное разрешение ЭЭГ недостаточно для определения области мозга, связанной с музыкальным синтаксисом.
Так как гемоглобин крови обладает слабым магнитным свойством, изменения в кровотоке можно проследить с помощью магнитно-резонансной томографии, или МРТ: гигантский электромагнит показывает различия в магнитных свойствах, которые, в свою очередь, могут рассказать нам о том, куда в организме поступает кровь в любой конкретный момент. Интересно, что исследования по разработке первых МРТ-сканеров вела британская компания EMI и финансировались они в значительной степени из прибыли от продажи пластинок The Beatles, так что песню «Want to Hold Your Hand»(«Я хочу держать себя за руку») вполне можно было бы назвать «Я хочу сканировать твой мозг». Так как нейронам для выживания необходим кислород, а кровь переносит насыщенный кислородом гемоглобин, мы можем отследить ее ток в мозге. Мы исходим из предположения, что активирующимся нейронам нужно больше кислорода, чем тем, которые находятся в состоянии покоя, и поэтому в областях мозга, участвующих в решении конкретной когнитивной задачи, в данный момент кровоток будет сильнее всего. Когда мы используем аппарат МРТ таким образом, чтобы изучать функции отдельных областей мозга, эта технология называется функциональной МРТ, или фМРТ.
Изображения, полученные с помощью фМРТ, позволяют увидеть живой функционирующий человеческий мозг в процессе мышления. Если вы будете представлять, как тренируете подачу в теннисе, мы сможем отследить, как кровь движется вверх к моторной коре, а благодаря высокому пространственному разрешению фМРТ мы увидим, что активна именно часть моторной коры, отвечающая за движения руки. Затем, если вы станете решать математическую задачу, кровь начнет движение к лобным долям, и в частности к областям, которые ассоциируются с решением арифметических задач, так что на фМРТ мы увидим это движение и в конечном итоге обнаружим приток крови в лобных долях.
Сможем ли мы благодаря этой науке Франкенштейна, которую я только что описал, — науке визуализации работы мозга — когда-нибудь прочитать чужие мысли? Рад сообщить: вероятно, не сможем, и уж точно не сможем в обозримом будущем4. Причина в том, что у мыслей слишком сложная структура и они задействуют слишком много областей мозга. Наблюдая за фМРТ, я способен сказать, что вы слушаете музыку, а не смотрите немое кино, но я пока не в силах определить, что звучит у вас в голове — хип-хоп или григорианский хорал, не говоря уже о том, какую конкретную песню вы слушаете или какую конкретную мысль обдумываете.
Благодаря высокому пространственному разрешению фМРТ можно с точностью до пары миллиметров определить, где именно в мозге происходит что-либо. Проблема, однако, заключается в том, что временное разрешение у фМРТ не особенно хорошее — из-за того, что для перераспределения крови требуется достаточно много времени и оно происходит с так называемым гемодинамическим отставанием. Однако другие ученые уже исследовали это когда музыкального синтаксиса, или музыкальной структуры. Мы же хотели узнать, где он обрабатывается и, в частности, входят ли в это где области, известные как речевые центры. И мы увидели именно то, что ожидали. Прослушивание музыки и внимание к ее синтаксическим особенностям — к ее структуре — активируют определенную область лобной коры слева, называемую орбитальной и относящуюся к полю Бродмана 47. Область, которую мы обнаружили в своем исследовании, частично совпадала с уже изученными центрами обработки языка, но захватывала и некоторые уникальные зоны. Помимо активации в левом полушарии, мы также обнаружили активацию в аналогичной области правого полушария. Это говорит о том, что внимание к структуре в музыке требует участия обеих половин мозга, тогда как внимание к структуре в языке задействует только левую половину.
Но удивительнее всего то, что области левого полушария, которые, как мы обнаружили, участвуют в определении музыкальной структуры, оказались теми же, что активируются у глухих людей во время общения на языке жестов. Это говорит о том, что область мозга, которую мы идентифицировали, не просто обрабатывает последовательность аккордов в музыке или предложение в речи и делает вывод о том, есть ли в них какой-то смысл. Оказалось, что она еще и реагирует на визуальную информацию, например на последовательность слов, воспроизведенных с помощью американского жестового языка. Мы нашли доказательства существования такой области мозга, которая обрабатывает структуру в целом, при том что эта структура передается во времени. Несмотря на то что данные туда поступают из различных популяций нейронов, а данные оттуда передаются через различные сети, она постоянно участвует в решении любых задач, связанных с организацией информации во времени.
Нейрональная основа восприятия музыки стала понятнее. Все звуки начинаются с барабанной перепонки. Они сразу разделяются по высоте. Потом, вероятно, речь и музыка расходятся — каждая обрабатывается по своей схеме. Речевые схемы раскладывают звуковой сигнал на отдельные фонемы — согласные и гласные звуки, из которых состоит наша фонетическая система. Музыкальные схемы раскладывают звуковой сигнал по разным характеристикам и отдельно анализируют высоту звука, тембр, контур и ритм. Выходы от нейронов, выполняющих эти задачи, поступают в области лобной доли, которые собирают всю информацию воедино и определяют, есть ли во временной последовательности какая-либо структура или порядок. Лобные доли обращаются к нашему гиппокампу и областям височной доли и запрашивают информацию из банков памяти, которая может помочь понять полученный сигнал. Слышали ли мы эту конкретную последовательность раньше? Если да, то когда? И что она значит? Является ли она частью большей последовательности, которая разворачивается перед нами прямо сейчас?
Итак, мы разобрались в нейробиологии музыкальных структур и ожиданий. Теперь готовы приступить к изучению механизмов мозга, лежащих в основе эмоций и памяти.
1 Персонажи серии комиксов Peanuts, созданной Чарльзом Шульцем. — Прим. ред.
2 Имеется в виду ситуация, когда музыканту дают прочитать ноты только правым глазом. Правым зрительным полем называют область, которую видит правый глаз, когда левый не видит ничего (например, закрыт). У человека основной объем зрительной информации от правого глаза обрабатывается левым полушарием, хотя и не весь — есть довольно значительный зрительный перекрест, благодаря которому часть информации от правого глаза попадает в левое полушарие (это нужно для точной обработки информации от двух глаз сразу). — Прим. науч. ред.
3 ЭЭГ регистрирует суммарную активность нейронов, но основной вклад в эту сумму вносят не потенциалы действия нейронов (разряды), а возбуждающие и тормозные постсинаптические потенциалы — намного более слабые, но и более многочисленные электрические процессы в синапсах нейронов, которые, складываясь, приводят (или не приводят) к потенциалу действия. — Прим. науч. ред.
4 Чтение мыслей по МРТ — это уже реальность. Правда, существующая технология работает не со звуками, а с мысленными зрительными образами. — Прим. науч. ред.