17 мая 2012 года

Угадай мелодию

Компьютерным распознаванием печатного текста уже никого не удивишь, над качественным распознаванием слитной речи тоже бьются светлые умы. Теперь настал черед распознавания музыки.

Автор: Андрей Волов | Раздел:  | Дата: 03 ноября 2000 года

Ну очень интересно, чтобы компьютер выдал нотную партитуру, "прослушав" просто насвистывание в микрофон. Еще хотелось бы развлечения ради конвертнуть живой музон из WAV-файла в MIDI-файл, пусть даже не в реальном времени и не сохранив при этом вокальных партий (понятно, что для вокала в MIDI никаких WAVETABLE не наберешься). Найдется масса желающих наиграть что-нибудь на гитаре, а затем распознать ноты своего творения и, подправив все в миди-редакторе, наложить другие инструменты. Согласитесь, приятно было бы к электронно-почтовому поздравлению подцепить собственноручно сделанный MIDI-файл (всего-то в пределах сотни килобайт) с любимой мелодией виновника торжества! На пересылку музыки в форматах MP3 или VQF не каждый разорится: файлы оных весят несколько мегабайт. О полном распознавании трэков непосредственно с "сидюков" и конвертации в MIDI пока остается только мечтать, но мечтать, как известно, не вредно.

Владельцы звуковых карт без таблично-волнового синтеза законно возразят: "мидийный" звук удовольствия мало доставляет. Обладатели карт покруче и сэмплов к ним помузыкальнее имеют противоположное мнение. Одно дело слушать звук того же электрооргана живьем в MIDI, совсем другое - многократно перезаписанный да перемикшированный с тиражируемого CD, причем, в большинстве российских случаев, известного "замеса". Это две бо-о-ольшие разницы, смею вас заверить. И не надо иметь утонченный музыкальный слух, чтобы прочувствовать эту разницу.

Справедливости ради надо признать, что автор MIDI-композиции фактически аранжирует музыкальное произведение по-своему, на свой манер и вкус. Казалось бы, ввел ноты в навороченный CakeWalk - и автоматом получишь результат. Ан нет, такой результат мало кто будет слушать, не говоря о том, чтобы еще и деньги за прослушивание платить. Здесь на секунду отвлечемся, поскольку для конвертирования-сканирования нотной партитуры с листов бумаги в формат MIDI (в своем роде тоже распознавание) служат специальные программы, например, MIDISCAN. Среди всего изобилия MIDI-музыки произведений, ласкающих слух, кот наплакал. Любителям Deep Purple повезло. То ли творения этой легенды хард-рока создавались в MIDI компьютерными последователями с самой беззаветной любовью, то ли Deep Purple сочиняли музыку как будто специально для MIDI, но великолепный результат налицо. Склоняюсь к мысли, что феномен "мидийности" Deep Puple все-таки существует. Есть удачные переложения и других "рок-посевов" (Metallica, Scorpions). А вот поклонники творчества Pink Floyd вряд ли станут слушать их переложение на MIDI, по крайней мере, мне удачных аранжировок найти не удалось. Неплохо звучит практически весь джаз, пожалуй, исключая авангардные вещи. Классика упорно не желает влезать в MIDI-формат, что несколько странно, уж орган Баха качественно переложить, казалось бы, сам Бог велел. Слушая иногда приплывающее из Интернета MIDI-файлы с классикой, так и хочется сказать: "В этом мотиве есть какая-то фальшь". В чем причина разной степени адаптации к MIDI той или иной музыки - остается только гадать. Но вернемся к распознаванию.

На днях попался под руку Music Composer версии 1.45, который якобы шумозащищенный и должен переводить в MIDI полифоническую музыку. Насколько это передовой представитель программного обеспечения распознавания музыки - сейчас попытаемся выяснить. Для начала Music Composer использовался в качестве MIDI проигрывателя, и первое впечатление было обнадеживающим.

Рисунок 1

Возможность регулировать уровень громкости каждого инструмента по отдельности, конечно, радует. Но когда я решил сделать один из инструментов потише и с помощью мышки подвинул регулятор до нужного положения, звук вдруг исчез и появился снова только через несколько секунд. Неприятно, но это мелочи жизни. Что еще из приятного? Если есть необходимость послушать звучание одного инструмента, например, бас-гитары, то программа сделает это легко. Достаточно поставить галочку в столбце SOLO напротив выбранного инструмента. Нужно услышать бас-гитару одновременно с ударными, еще с чем-либо? Нет проблем, помечаем галочками нужные инструменты в столбце On.

Дальше - хуже. Читая коротенький "хелп" (есть чудаки, которые сначала его читают, потом на кнопки давят), узнаем, что полифония не означает распознавания одновременно нескольких инструментов. AKOFF предупреждает: распознан может быть только один инструмент (или голос). Причем распознаются основные музыкальные тона с С3 до В8 в пределах шести октав. Вот такая полифония.

С регулятором входной чувствительности надо подружиться. Сначала я наугад выставил чувствительность, соответствующую некому уровню 16 дБ, любезно отображаемому программой.

Рисунок 2

AKOFF с усердием пытался что-нибудь распознать, и с микрофона, и WAV, но не выдавал ни результата, ни сообщения, просто не оживала кнопка PLAY. Тогда я передвинул регулятор чувствительности до упора вниз, что соответствовало -60 дБ, а уровень записи в микшере к звуковой карте вывел на 75%. Сграбленный ранее с компакт-диска пятиминутный стерео WAV-файл, преимущественно с джазовым фортепиано, обработался программой подозрительно быстро. К примеру, конвертация из WAV в VQF на том же компьютере занимала гораздо больше времени. Затаив дыхание, нажимаю на PLAY и… выпадаю в осадок. Поскольку время от времени в исходном материале появлялись ударные и контрабас, то AKOFF не поленился их приобщить за компанию к фортепиано, естественно в интерпретации звучания последнего, и что из этого получилось - представить несложно. Помучившись с итерациями чувствительности (-32 дБ и 48 дБ), я решил больше не пытать счастья с полифонией.

Share
/  iBusiness