«Чтобы музыка стала хитом, должны совпасть три фактора»: музыковед Анна Виленская — о том, как научить нейросеть чувствовать гармонию
В XXI веке музыковедение воспринимается как что-то глубоко архаичное, рудимент советского образования. Насколько это представление ошибочно, понимаешь после знакомства с Анной Виленской. Композитор, лектор и YouTube-блогер, Анна готова рассказывать о нейросетевом будущем музыки с не меньшим воодушевлением, чем о её пифагорейском прошлом. Мы спросили у главного музыковеда в российской медийной среде, куда движется современная музыкальная культура, как правильно обучать искусственный интеллект азам композиторства и возможно ли вырастить на базе ИИ цифрового Чайковского.
- где искать венец и бич европейской музыкальной культуры
- для чего нейросетям нужны тьюторы
- зачем «кормить» искусственный интеллект «пособиями по гармонии»
- как сочиняет хиты Константин Меладзе
- чем отличается харизма от артистизма
Моя профессия консервативна по определению, но музыковеды всегда вносили вклад в эволюцию музыки. До XX века теория и критика в искусстве в целом имели колоссальное значение: критическая заметка в газете могла прославить автора произведения или, наоборот, стать его творческой эпитафией.
В XX веке искусство сильно коммерциализировалось, музыка превратилась в гигантскую индустрию, в которой аналитик и критик заняли места маркетологов. В итоге все статьи о музыке перестали быть непосредственно о музыке. С другой стороны, самих музыковедов перестало быть слышно: новая эстрадная история пришлась им не по душе, в приоритете осталась академическое направление. Но я считаю необходимым изучать эстрадную музыку так же серьёзно, как и Шуберта с Шостаковичем. Я лектор и музыковед вне зависимости от жанра, эпохи, исполнителя. Моя задача — прослушать произведение, проанализировать все его ошибки и нюансы, сравнить задумку композитора с результатом и рассказать об этом аудитории человеческим языком.
Однозначно к академической, так как там уже придуманы и названы все основные понятия. Лингвистический корпус, важный для лектора, давно структурирован и общепризнан. В эстрадной музыке трактовки жанров и стилей различны, многогранны. Приходится работать изобретателем — интересно, но сложно.
Все такие наслоения, как синтезаторная обработка композиции и мастеринг, — это, скорее, про то, как музыка играется, ведь тембр — самый легко варьируемый из всех параметров, связанных со звуковым обликом. Проверяется это так: делаем акустический кавер на песню и сравниваем с коммерческой версией. Что замечаем? Изменилось звучание, а смысл не поменялся. Я уделяю основное внимание в своих лекциях именно смыслу.
Затем должно зародиться что-то кардинально новое, что покончит с эпохой метамодерна и откроет двери новому художественному миру. Я анализировала, как искусственный интеллект обучают писать музыку. Ко мне обращались русскоязычные ребята — исследователи из Британии. Они составили документ почти на 900 страниц о показателях музыки, чтобы помочь нейросети освоиться в системе её влияния на человеческий организм. Когда я ознакомилась с этим документом, то поняла, насколько ошибочно в нём расставлены акценты. А ведь в такой работе должны быть учтены не только общие теоретические аспекты, но и культурологические, цивилизационные.
Необходимо учитывать, например, что для европейца большое значение имеет ладовое устройство композиции: переход с первой ступени на вторую, с устойчивой ноты на неустойчивую. Эта особенность продиктована физикой и сформировалась ещё до XIII века.
А ведь сейчас искусственный интеллект обучают писать именно европейскую музыку. Но пока, на мой взгляд, этот процесс далёк от совершенства.
Программисты имеют право не знать музыкальную теорию, но, сделав неверные выводы, они невольно закладывают их и в компьютер. Искусственный интеллект, с которым мне выпал шанс поработать, неплохо разобрался с тем, что мелодия и гармония должны работать в паре и что для генерирования гармоничной композиции необходим алгоритм. Но нейросеть так и не поняла, как строится музыкальная форма, органичная для человеческого уха. Максимум, на что оказалась способна та умная программа, которую тестировала я, — написать семпл из повторяющихся четырёх тактов музыки и проигрывать его до бесконечности.
У минималистов лучше с балансом физиологичности изменений. Послушайте, например, композиции Людовико Эйнауди. Вы обнаружите многочисленные повторения, но вы также почувствуете, что композитор прекрасно понимает, на какой секунде достигается оптимальный баланс между количеством циклов и физиологическим состоянием: напряжением или иного рода эмоцией. Искусственный интеллект «мыслит» рационально. Поэтому, если заходит речь о сложной форме музыки — песне, рондо, вальсе и так далее, — он не справляется.
Создать сложное произведение с кульминацией и полноценным развитием — пока это задача не для ИИ.
Он не способен передать нам чувства волнения, предвкушения или опасение перед чем-то. Это и есть тот показатель, по которому люди на уровне физиологии улавливают отличия сгенерированной фортепианной музыки в стиле Шопена от самого Шопена.
Совсем нет. Просто по меркам прогресса он ещё юн, ему необходимо время для дальнейшего роста и развития. А пока можно поставить задачу инженерам: через Chat GPT или через какие-то другие вербальные системы «скормить» искусственному интеллекту условное «пособие по гармонии», разработать для него чёткий алгоритм действий и средства выполнения. Тогда, предполагаю, искусственный интеллект быстрее разберётся и сможет даже создать форму. Я уверена, что когда-нибудь мы к этому придём. Но пока сделать это непросто. Разработчикам придётся потратить много времени, прописывая всевозможные варианты аккордов для разных переживаний.
При этом им чётко нужно будет понимать, для какой аудитории они обучают нейросеть: для европейской, азиатской или, скажем, латиноамериканской. Потому что в Азии другая гармония в целом. Как и у латиноамериканцев. У азиатов, например, нет аккордов, вместо них — так называемые длящиеся педы. Аккорды — одновременно и венец и бич европейской музыкальной культуры, потому что они умаляют важность мелодии, делают её абсолютно вторичной, в отличие от африканской культуры, в которой мелодия первична, а аккордов нет.
Мы с вами проживаем эпоху метамодерна, внутри которого множество противоречивых тенденций и процессов. Мир становится разнообразнее и сложнее. Музыка сама по себе как вид искусства с каждым новым десятилетием неизменно усложняется.
Если кто-то думает, что рэп нулевых проще, чем рок 60-х, то это совсем не так. Человеческий мозг так устроен, что всё время хочет больше информации, в том числе и в звуковом формате.
До XX века усложнение музыки происходило в сфере гармонии: ещё более сложная краска, ещё более грязное, непривычное наслоение. В середине XX века сложность стала переходить из сферы гармонии, которая полностью себя исчерпала — никаких новых аккордов мы никогда больше не найдём, — в тембровую сложность. Рок-музыканты стали делать дисторшен-гитары и тому подобное.
Если мы посмотрим на дисторшен-эффект с точки зрения физиологии человека, то поймём, что в голове такой звук порождает очень сложный рисунок нейронного возбуждения.
В современной рэп-музыке мы встречаем микс синтезированных и аналоговых звуков, шумы, семплы, и всё это иногда на одном крохотном участке трека. Попробуйте в таком бытовом контексте поставить своим детям великих The Beatles или гениальную группу Queen. Фиаско гарантировано. Мозг современных детей уже настроен на то, чтобы поглощать как можно более сложное звучание.
Это тоже язык, безусловно, но он намного сложнее вербального. Приведу пример. Вы заливаете, допустим, в некую нейросеть слово «письмо». Оно может означать одновременно и процесс написания, и особенности авторского почерка, и письмо в значении послания кому-то. Три варианта, но контекст помогает выбрать корректный. Если же вы заливаете в нейросеть сочетание нот «до, ми, соль», то их можно проиграть двадцатью разными вариантами, и посыл всегда будет особый и никогда — конкретный.
Музыка затрагивает физиологию, поэтому мы должны объяснить нейросети, какие именно эмоции у нас вызывает это вот «до, ми». А у нас даже нет слов, которыми мы могли бы это объяснить, понимаете? Мы не разговариваем на этом языке, а только обмениваемся звуками. А с ней надо именно поговорить.
Пыталась, и в восторге от результата. Но мой восторг — не от качества искусственной музыки, а от самого факта её существования. Реакция как на рисунок ребёнка, который криво изобразил ёлку, но мило прочертил вокруг каждой ветки иголочки: хвалишь его за внимательность, не обращая внимания на диспропорции.
Как и в случае с ребёнком, разработчикам тут нужно попробовать быть гибкими. Как родителям, им, может быть, стоит самим порефлексировать на тему, как помочь нейросети в данной ситуации. Может быть, вместе с учебником по гармонии ей не помешает ознакомиться со знаниями по анатомии человека, основами психоакустики, психологии. А может быть, уже сейчас в одном из российских вузов обучается перспективный инженер-биолог, который понимает, как перевести на нейросетевой язык каждый из миллиарда импульсов, которые он получает при прослушивании Niletto или «Гражданской обороны».
Математика — это и есть музыка, в том плане, что математика объясняет, почему нам что-то нравится в музыке, а что-то нет. И на большой форме (этот исполнитель интересен, этот раздражает), и на малой форме (эта секунда музыки вызывает восторг, а эта навевает скуку). Правила эти едины. Пифагор говорил и очень дельные вещи: про обертоны и построение аккорда и про гармонию космических тел. Космические тела теперь из области истории философии, а вот «земная» теория музыки в изложении Пифагора до сих пор актуальна.
Здесь формула следующая. Чтобы ваша музыка стала хитом, должны совпасть три фактора. Первый — ваша музыкальная тема должна пройти экспертную подготовку. Есть профессионалы, которые без всяких эмоций, в своей голове, умом дорабатывают или разрабатывают для артистов музыкальный материал.
Вторая часть — у вас должна быть харизма исполнителя. То, насколько вам физически подходит этот материал. Харизма отличается от артистизма: первое всегда огромный плюс, второе иногда бывает совсем неуместно.
Третья составляющая, самая непонятная и рискованная, — это историческое попадание: исполнить своё великолепное произведение в нужный момент перед готовой к этому аудиторией. Когда происходит совпадение этих трёх показателей, рождается новый хит.
Где в музыке математика? О секрете идеальной гармонии звуков
Тут нет никакой конспирологии. Если из российских композиторов, то в первую очередь на ум приходит Константин Меладзе. Откуда я знаю, что он работает со своими произведениями именно так, а не иначе? Об этом свидетельствует анализ его музыки постфактум. Мы смотрим десяток песен, которые стали хитами, понимаем, в какой последовательности там мелодия сочетается с аккордом, какие там есть музыкальные события, как часто они происходят, и выделяем чёткие тенденции, систему и закономерности. Это и есть просчитывание.
И то и другое удастся, если в ближайшее время с нейросетями начать правильно работать. Для такой работы нужны особые специалисты. Помимо разработчиков самой сети необходим тьютор или наставник — человек, который смог бы указывать искусственному интеллекту на его ошибки и подтверждать правильность выбора. Непременное условие профпригодности такого человека — холодность к своим желаниям. Только теория, рациональный подход и никаких личных пристрастий. Если у нейросети будут тьюторы, которые сами понимают, как устроена музыка того или иного композитора, то в перспективе можно ожидать создания такого генератора музыки, почерк которого мы не отличим от почерка реального Петра Ильича.
Как минимум конец эпохи метамодерна. Но это уже тема для отдельного разговора.