Программа распознавания образов систематизировала альбомы «Битлз»

Первый (Please Please Me) и последний (Abbey Road) альбомы группы «Битлз», записанные в Англии

Компьютерная программа распределила песни из альбомов «Битлз» по времени их создания. На фото: первый («Please Please Me») и последний («Abbey Road») альбомы группы «Битлз», записанные в Англии. C сайта en.wikipedia.org

Современные успехи технологий распознавания образов позволяют анализировать произведения искусств, художественные и музыкальные. Так, двое американских специалистов-компьютерщиков применили разработанные методы к анализу музыки «Битлз». Их программный комплекс — перевод аудиограмм в визуальные спектрограммы и последующее их сравнение по тысячам параметров — дал исключительно содержательный результат. Все альбомы «Битлз» распределились по времени их создания. Авторы отмечают, что программными средствами можно проследить стилистическую динамику музыки «Битлз» надежнее, чем это получается у экспертов.

Многие люди задаются вопросом: что такое искусство — рекламный пиар или что-то в этом есть глубинно-правдивое? В обыденной жизни часто приходится прислушиваться к экспертному мнению, толкующему так или иначе произведения искусства или анализирующему творчество авторов. Но всегда остается толика сомнения, что это всего лишь мнение одного человека, а на самом деле альтернативных оценок может быть столько, сколько людей на свете. И дело тут в том, что у нас нет объективных признаков, которые бы отличали настоящее от китча или подделки. Действительно, нельзя же считать бегущие по спине мурашки критерием чего-то стоящего.

Однако специалисты в области распознавания образов серьезно продвинулись в поиске таких признаков. Лиор Шамир (Lior Shamir) и Джо Джордж (Joe George) из Технологического университета братьев Лоуренс представили результаты компьютерной классификации песен «Битлз». Компьютер блестяще справился с задачей, расставив альбомы «Битлз» в хронологическом порядке и выделив сборные альбомы с песнями разных периодов творчества. Это, конечно, не суть человеческого творчества, но уже нечто позволяющее приступить к объективным рассуждениям о творчестве. Компьютерные программы, не имеющие субъективных предпочтений, выделили суть стилистического развития «Битлз», и именно эта динамика отразилась в компьютерном решении.

Ясно, что эта работа появилась не на пустом месте. Шамир со своими коллегами начинал исследования с анализа сигналов китов (Lior Shamir, 2014. Classification of large acoustic datasets using machine learning and crowdsourcing: Application to whale calls). Ученые занимались различением звуковых сигналов разных видов китов, а также популяций одного вида, обитающих в разных частях ареала. Это помогло отработать технику классификации аудиосигналов. Сначала аудиоинформация трансформируется в визуальную в виде спектрограмм (поскольку визуальную запись анализировать проще, чем звуковую). В спектрограмме компьютер может вычленить около 2880 признаков, по которым и ведется сравнение. Примерно той же методикой ученые воспользовались при анализе песен «Битлз».

Из 13 альбомов группы выбрали по 11 песен, переведя их в спектрограммы.

Пример спектрограммы голоса песни «Lonely hearts» (имеются спектрограммы отдельных инструментов)

Пример спектрограммы голоса песни «Lonely hearts» (имеются спектрограммы отдельных инструментов). Рисунок из препринта статьи Joe George, Lior Shamir, 2013. Computer-based approaches to music research

Для каждого альбома была выделена квинтэссенция стиля — комплекс общих характеристик. Затем по степени сходства выделенных параметров сами альбомы были расклассифицированы с использованием обычных методов построения филогенетических деревьев. И на итоговом дереве они расположились строго закономерным образом — в хронологическом порядке.

Схема развития музыкального стиля «Битлз», выполненная программой распознавания образов

Схема развития музыкального стиля «Битлз», выполненная программой распознавания образов. Изображение из статьи: Joe George, Lior Shamir. Computer analysis of similarities between albums in popular music

Даже нарушения хронологического порядка на этом дереве имеют смысл. Так, альбом «Let it be», выпущенный в 1970 году, помещается перед альбомом 1969 года «Abbey Road», так как «Let it be» был в действительности записан раньше. То же и с альбомом «Help!», который был собран раньше, чем «Rubber Soul».

Так что компьютерный алгоритм анализа песен «Битлз» прекрасно «разобрался» в творческой динамике музыкального стиля группы. Не каждый знаток сможет потягаться в этом с компьютером. По всей видимости, те экспертные оценки, на которые принято ориентироваться, эксплуатируют огромный комплекс параметров того или иного произведения. Эксперт редко отдает себе в этом отчет, конкретизируя в уме тот или иной критерий, но его мозг тонко реагирует на весь комплекс критериев. Компьютерная программа, по-видимому, делает отчасти то же самое, но только не отвлекаясь на субъективные моменты.

Разработанный и опробованный метод — это прекрасный инструмент для изучения сущности экспертных оценок искусства, для выявления отдельных школ и тенденций в современном и классическом искусстве. Нужно будет еще проделать дополнительную работу, чтобы доказать, что программа анализирует действительно элементы творчества, а не отклонения в работе звукозаписывающих устройств. Но так или иначе, Шамир с коллегами уже опробовал свою технологию и на произведениях художественного искусства, также получив интригующие результаты. Даже противоречивый художественный стиль Джексона Поллока, в основе которого —псевдобеспорядочные брызги и разводы краски, поддается анализу при помощи разработанного комплекса программ.

Источники:
1) Joe George, Lior Shamir. Computer analysis of similarities between albums in popular music // Pattern Recognition Letters. 1 August 2014. V. 45. P. 78–84.
2) Lior Shamir. What makes a Pollock Pollock: A machine vision аpproach.
3) Lior Shamir. Computer analysis of art // Journal on Computing and Cultural Heritage (JOCCH). 2012. V. 5, Issue 2. Article No. 7.

Елена Наймарк


13
Показать комментарии (13)
Свернуть комментарии (13)

  • nan  | 07.08.2014 | 09:56 Ответить
    >>Многие люди задаются вопросом: что такое искусство — рекламный пиар или что-то в этом есть глубинно-правдивое?

    Искусство - воплощение и развитие этических символов общения в данной культуре (и в отдельных субкультурах) и поэтому нет чего-то однозначно "глубинно-правдивого" или "попсы", - все зависит 1) от общепонимаемого в данной (суб)культуре 2) от уровня понимания этих символов конкретным человеком (так он и будет судить). Подробнее обоснования: http://www.scorcher.ru/neuro/neuro_sys/beautiful/beautiful.php

    >>И дело тут в том, что у нас нет объективных признаков, которые бы отличали настоящее от китча или подделки. ...специалисты в области распознавания образов серьезно продвинулись в поиске таких признаков.

    Таких объективных признаков принципиально не существует... В данной работе, конечно же, вовсе не были выявлены "объективные признаки, которые бы отличали настоящее от китча или подделки" и специалисты вовсе не "продвинулись в поиске таких признаков". Они реализовали жесткий (или ограничено адаптирующийся) алгоритм распознавания некоторых признаков аудиограмм, по котором оказалось возможным их классифицировать в определенных свойствах, зависящих от признаков в аудиограммах. Вот и все. Это - жесткий алгоритм по уровню моделей адаптивности примерно насекомое, чуть сложнее бабочки или виноградной улитки. Подробнее обоснования: http://www.scorcher.ru/adaptologiya/modeli_sistem_individualnoy_adaptivnosti.php
    Ответить
    • sVv#14 > nan | 11.08.2014 | 14:29 Ответить
      Объективные критерии как раз есть. Искусство развивается циклами Вельфлина, только эти циклы очень длительны: не менее 200 лет. За это время формируется канон - цикл ведущих и минорных тем и цикл ведущих и минорных средств их воплощения, происходит их полный перебор, в ходе которого создаются эталонные образцы. До формирования канона нет деления на "высокое искусство" и "подделку". Чтобы была подделка, надо, чтобы было что подделывать и было известно как подделывать, т.е. чтобы были канон и образцы. Аналогично, бессмыслены сравнения в пределах двух различных циклов Вельфлина (кто лучше, Бах или рок-н-ролл). Так что при всем уважении и к авторам статьи, и к референту, полученный результат ничего не доказывает кроме 1) возможности машинного распознавания образов; 2)необходимости широкого кругозора при работе на стыке наук. Хорошая физика не заменит даже плохую лирику. Кстати, не в первый раз: аналогичная ситуация уже реферировалась на сайте, когда якобы было показано, что палеолитические художники рисовали движения лучше, чем художники Возрождения. На деле авторы "открытия" просто не знали, что существуют школы верховой езды. Чтобы говорить о положительном результате, нужно сделать работу Золушки (просо налево, пшено направо). Берите итальянскую оперу и для начала отделите Верди от Доницетти.
      Ответить
    • sVv#14 > nan | 11.08.2014 | 14:52 Ответить
      "специалисты в области распознавания образов серьезно продвинулись в поиске таких признаков". Не продвинулись они, так как вечно путают красивое с сексуальным и симметричным. А коли продвинулись, тогда скажите, почему парусниками восхищаются по меньшей мере все европейцы, 400 лет пишут "марины" и музыкальные этюды, о пароходах в лучшем случае поют с эстрады, а современные круизные "мыльницы" типа "Конкордии" в искусстве вообще никак не отражены? Между тем, именно внешний вид "мыльниц" проектируют дизайнеры, с дипломом художника. "Титаник" проектировал дипломированный инженер, а куттеры и шхуны с голландских марин вообще строились без чертежей по понятиям.Какой именно "этический символ" заложен в боте XVIIв, почему он продолжает волновать в XXI веке не только голландцев, но и представителей иных "cубкультур" и кто именно настраивает этих представителей в таком глобальном масштабе.
      Ответить
  • JEXcome  | 07.08.2014 | 12:44 Ответить
    >> "Действительно, нельзя же считать бегущие мурашки по спине критерием чего-то стоящего."
    Это вы серьезно так думаете? :)
    Ответить
    • niki > JEXcome | 07.08.2014 | 13:34 Ответить
      Похоже что серьёзно :(
      Ответить
      • JEXcome > niki | 07.08.2014 | 22:27 Ответить
        Лучше б они сделали программу по следующей задаче:
        даешь им список трэков от которых мурашки бегут, - и она тебе подбирает другие трэки, от которых могут бежать мурашки :)
        Ответить
  • Favorite  | 07.08.2014 | 21:51 Ответить
    <>
    А где нарушение хронологического порядка для «Help!» и «Rubber Soul»?
    Альбом «Help!» записывался 15–19 февраля, 13 апреля, 10 мая и 14–17 июня и выпущен 6 августа 1965 г.;
    Альбом «Rubber Soul» записывался 17 июня и с 12 октября по 11 ноября и выпущен 3 декабря 1965 г.
    Вероятно, речь идет о композиции «Wait», которая записывалась 17 июня, и которая звучит характерно для середины 1965 г. Но, как пишет М.Льюисон (The Complete Beatles Recording Sessions...), достижением она не стала и её отложили до момента, когда Битлз понадобились песни для альбома «Rubber Soul».
    Ответить
  • feb7  | 08.08.2014 | 10:24 Ответить
    Это новость появилась на Ленте примерно неделю назад. Тогда журналисты объявили о грандиозном прорыве в распознавании музыкальных образов. Похоже, наша красавица и умница Елена Наймарк пала жертвой этой эйфории.
    1. Алгоритм отрабатывался на творчестве одной-единственной, пусть и гениальной команды? А где результаты по остальным группам?
    2. Делать выводы о прорыве на основании одного единственного успеха? Знаете....это как то даже антинаучно, особенно когда почитаешь, как набирают статистику ребята из LHC.
    3. Слава Шиве, что хоть "хваталок" и "держалок" в статье не было! *показывает Елене язык*
    Ответить
    • VladNSK > feb7 | 08.08.2014 | 18:02 Ответить
      Полностью согласен с feb7.

      Эти ребята напомнили мне "фоменковцев" с их "новой" историей. У них тоже есть алгоритм, для которого по известной только авторам алгоритма методике готовятся входные данные, и по этим (неизвестно как препарированным) данным алгоритм выдает в точности тот результат, который авторы и хотели изначально получить.

      Пусть бы они выложили свой алгоритм в виде какого-то готового windows приложения, которым бы мог любой желающий воспользоваться. Пусть бы они выложили методику как нужно готовить музыкальный материал для анализа. И потом взяли бы десять групп, занумеровали их так, чтобы было неизвестно где какая группа, и попросили добровольцев провести анализ, используя их софт и руководствуясь их методикой. Вот тогда бы и можно было бы понять возможности их алгоритма.
      Ответить
      • EnigMan > VladNSK | 10.08.2014 | 21:31 Ответить
        Господа, ну что Вы в самом деле ведете себя как маленькие дети. Ясно же, получен положительный результат в маленькой выборке. Нужно отчитаться, чтобы получить новые гранты на продолжение исследования.
        Ответить
        • naimark > EnigMan | 05.09.2014 | 12:10 Ответить
          У этой группы грантов вполне хватает, посмотрите на их сайте. Не стоит судить просто из общих соображений.
          Ответить
          • EnigMan > naimark | 07.09.2014 | 22:15 Ответить
            Можно подумать, я кого-то оскорбил своим постом. Я всего лишь хотел сказать, что реалии сегодняшнего дня таковы, что исследовательским группам приходится отчитываться на каждом этапе своей работы, в отличии, например, от Дарвина, всю жизнь писавшего "Происхождение видов" сразу выдвинув законченную теорию.
            Ответить
    • naimark > feb7 | 05.09.2014 | 12:09 Ответить
      За красавицу и умницу отдельное спасибо! Относительно остального дела обстоят так. Ленту не читала, хотя, может, стоило. Новость появилась в качестве дайджеста в Science, оттуда я про нее и узнала. Прежде чем писать попсовую новость, прочитала остальные статьи этой группы авторов. Статей опубликовано порядочно. Свою методику авторы опробовали на многих других объектах, среди которых имеются и голоса китов, и музыкальные произведения, не говоря уже о картинах и галактиках (алгоритм анализа изображений более или менее общий). Музыкальных групп несколько, среди них Abba и Queen. Результаты по этим группам такие же превосходные, как и с Биттлз. Я написала про Биттлз только потому, что в свободном доступе была к ним иллюстрация спектрограмм и "филогенез", а по другим группам таких свободных картинок не было. Если Вам интересно, найдите эту статью и посмотрите результаты по другим группам. В новости имеется ссылка на анализ музыкальных произведений разных жанров, очень поучительная статья. Так что я не вижу ничего антинаучного в этой работе. Не стоит думать, что вашу "красавицу и умницу" можно легко поймать на попсе; все же, чтобы написать новость, я читаю не только одну статью по теме, а существенно больше. И стараюсь моих любимых читателей не обманывать.
      Хваталки и держалки очень помогают изложению, они гораздо лучше, чем "мануальный манипулятор", что в переводе, если задуматься на секундочку, означает "рукастая рука".
      Ответить
Написать комментарий
Элементы

© 2005–2025 «Элементы»