Олексій Устинов
Музичні комп'ютерні технології. Чи може Росія сказати тут своє слово?
... я не знаю нічого іншого настільки ефемерного і абстрактного, але разом з тим настільки чинного ...
Леонід Ріх про музику
В музиці, що зазвичай забувається, чимало математики. Ми використовуємо західноєвропейську нотну систему, основу якої складають дві цілком суворі шкали частоти і часу. Частоти звукоряду представляють собою геометричну прогресію з коефіцієнтом 1,059 ... (корінь 12-го ступеня з 2), а тимчасова організація - це звуки та паузи, що знаходяться в кратних відносинах (найчастіше деноминатор виступає ступінь числа 2). Структура музичного твору нерідко виявляється дуже простий, представляючи собою чергування деяких "блоків-модулів" певної довжини. Мелодійна партія, як правило, ділиться на мотиви, фрази, пропозиції і періоди, а акомпанує має явно виражений періодичний характер. І все це об'єднано гармонією - своєрідними матрицями нормативних поєднань звуків з деякою сітки частот.
На практиці музикант значно рідше математика замислюється про формальну основі музичного твору, яка зафіксована в нотах. Те, що дійсно в музиці є строгим, складалося століттями, обумовлений акустичними явищами і психологією сприйняття звуку. Але все це для традиційного музиканта - якась даність, фундамент, який в повсякденній практиці не вимагає ні ревізії, ні пильної уваги. І це виправдано, оскільки предмет діяльності музиканта, якби він був виконавцем, композитором, педагогом або теоретиком, куди менш формалізований і включає власні непрості завдання.
Як описати музику формально?
Нотний текст і звучить твір - речі дуже різні. По суті партитура - це лише план дій виконавця. З акустичної точки зору звучить твір являє собою надзвичайно складний об'єкт, унікальність якого пов'язана з конкретним музикантом і конкретним виконанням. Дійсно, якщо взятися за аналіз версії найпростішої мелодії, спробувати розібратися в хвилях і спектрах акустичної записи, можна схопитися за голову від великої кількості нюансів. Як співвідносяться обсяги даних нотного тексту і звучить твори? Простий приклад: невеликий менует Ф. Е. Баха складається з 107 нотних знаків. Крім цього в нотному тексті міститься 38 спеціальних вказівок. Чи не складно підрахувати, що якщо на кодування нот використовувати по 3 байта (старт, стоп і номер ноти) і по байту на спеціальні вказівки, то все твір цілком можна закодувати в файлі розміром в 0,5 Кб. Але в реальності твір звучить 2,4 хвилини і займає обсяг в 13 - 16 Мб !!! Навіть якщо використовувати стиснення, то і 1,5 Мб в 3000 разів більше обсягу закодованої партитури. Хтось скаже, що в цих звукових даних багато зайвого, другорядного, і в чомусь буде прав, але ... спробуйте щось подібне сказати музикантові! Виконавцю здається, що як не записуй - завжди щось втрачається. Які вже тут розмови про стиснення і проріджуванні! Але що ж насправді міститься в звукову творі, а що в цих мегабайтах? Напевно, саме в нюансах живого виразного виконання полягає сама музика, а нотна партитура - це насправді лише план виконання.
Дуже давно, ще з часів Піфагора, а може бути, і раніше, математики звернули увагу на формальну сторону організації музики - тимчасову і частотну шкали. Однак механізми, які відтворюють музику за програмою, з'явилися до механізмів-калькуляторів, тому я ризикнув би назвати музикантів найпершими програмістами. Втім, і в письмовому спадщині стародавніх культур, мабуть, нотні записи як опис тимчасового процесу, найближче до текстів програм. І в тій і в іншій формі є блоки, умови, цикли і мітки, тільки далеко не всі програмісти і музиканти знають про ці паралелі. Але якщо пам'ятати про них, вже не можна дивуватися тому, що, створюючи найперші ЕОМ, інженери змушували їх відтворювати мелодії. Правда, музиканти не могли відносити машинну музику до цієї, можливо, тому, що в ній не було нічого, крім "мертвих" звуків або плану. Та й сам машинний звук, що був на перших кроках простим меандрові, був вкрай далекий від звучання акустичних інструментів. Мабуть, тому наступним етапом розвитку музичних комп'ютерних технологій стали дослідження і розробки методів синтезу звуку.
Інженери звернулися до аналізу спектрів акустичних інструментів і до алгоритмів синтезу електронних тембрів. Спочатку розрахунок звукових коливань виконувався центральним процесором, але, як правило, не в реальному часі. Тому на перших ЕОМ створення музичного твору було дуже виснажливим процесом. Треба було закодувати ноти і призначити тембри, потім запустити програму для розрахунку звукової хвилі і ... почекати кілька годин, щоб послухати результат. Якщо музикант, а точніше, програміст-оператор, вносив якусь зміну в партитуру-програму, йому знову до прослуховування доводилося кілька годин чекати. Зрозуміло, що така музична практика не могла бути масовою ... Але дослідникам феномена музики хотілося піти далі, ніж просте застосування машини в якості електронної музичної шкатулки. Так виникло інше - цілком природне - напрямок в музичному використанні ЕОМ: породження, генерація самого нотного тексту. Якщо в музиці дійсно є закони і людина - композитор ці закони дотримується, то, напевно, і машину, яка вміє думати, можна спробувати змусити складати музику? ..
У музичних комп'ютерних технологіях все це вже давно стало історією. Що ж в цій історії пов'язано з Росією? Виявляється, дуже багато, якщо згадати про роботи Л. Термена, Е. Мурзіна, А. Володіна, створили унікальні засоби синтезу звуку - не "після", а "до" західних колег, Р. Заріпова, який присвятив свої дослідження аналізу і генерації нотних текстів, А. Тангян, який працював над проблемами розпізнавання і автонотіровкі. Причому це лише імена тих дослідників, роботи яких визнані за межами Росії. Але було багато й інших, локальних розробок. Чи не єдина, але одна з помітних - перша вітчизняна звукова карта і MIDI-інтерфейс для ПЕОМ "Агат-7" (аналог Aplle II) зі своїм музичним ПО. Все це було ще в середині 80-х, коли IBM-XT були ще далеко не у всіх технічних вузах, а пересічний користувач поняття не мав про торгові марки Sound Blaster (Creative Labs, http: //www.creat. Com) і Voyetra (Voyetra Technologies, http: // www.voyetra.com).
Як і в інших областях (наприклад, в графіку і анімації), в музичних комп'ютерних технологіях розроблялися два принципово різних підходи. Перший пов'язаний з управлінням параметричної моделлю звуку, партії, твори, другий - з оперированием аналогом реального об'єкта. Обидва підходи мають як переваги, так і недоліки і постійно розвиваються. У той час як одні інженери домагалися максимальної правдоподібності в синтезі акустичних тембрів, інші розробляли методи оперування реальним звуком. Якщо перші вирішували завдання оптимізації параметрів синтезу і виконавської управління, то другі працювали над компресією і декомпресією даних, т. Е. Над проблемами звукових хвиль. Але для інженера завжди привабливіше параметричні моделі об'єктів, вони значно краще підходять для оперування і трансформації. Все питання в тому, наскільки точно моделі описують реальний об'єкт, якщо метою є досягнення правдоподібності. З досліджень в області психології сприйняття відомо, що особливу роль в процесі розпізнавання образів грають пороги достовірності та механізми відновлення образів. Непрофесіонал зараз вже не зможе відрізнити синтезований тембр рояля від справжнього саме тому, що не володіє високим порогом достовірності. І цілком можливо, що майбутнє музичних комп'ютерних технологій - за параметричним моделюванням. Що ж являє собою музична комп'ютерна практика кінця 90-х?
Розглянемо коротко, наскільки дозволяє обсяг статті, кілька музичних сфер - в кожній з них є свої особливості.
Як створюється електронна музика
Якщо говорити про масове способі створення музики, то це секвенсорної, або MIDI-технологія. Ядром невеликої студії зазвичай є комп'ютер з основною програмою, секвенсором. У Росії найбільш популярні програмні секвенсори двох фірм: Steinberg Software und Hardware (сімейство секвенсоров Cubase, http: // www.steinberg.net) і Twelve Tone Systems (сімейство секвенсоров Cakewalk, http: // www. Cakewalk.com). Cubase був створений раніше, ніж Cakewalk, і наші музиканти дізналися його першим. Ця програма працювала на дуже рідкісної машині Atari, але багато професіоналів до сих пір віддають перевагу продуктам Steinberg - музиканти по суті своїй консервативні. Однак дійсно масовим у нас став продукт Cakewalk. Компанії Twelve Tone Systems вдалося створити один з найбільш зручних секвенсоров для IBM-сумісних ПК, і поява її продукту збіглося з масовою комп'ютеризацією Росії. З різних причин не настільки поширені у нас секвенсори інших провідних виробників - Opcod Systems (http: // www. Opcode.com), Emagic (http://www.emagic.de), Voyetra Technologies Inc. (http: // www .voyetra. com), Mark of the Unicorn (http: //www.motu. com). В одних випадках це пояснюється орієнтацією на платформу Mac, в інших - цінами і способом поширення, але головне все-таки полягає у звичці музикантів.
Секвенсори служать для програмування, т. Е. Для кодування музичних п'єс. Саме з їх допомогою створюються аранжування: "прописуються" окремі партії, призначаються тембри інструментів, шикуються рівні і баланси каналів (треків), вводяться тонкі нюанси, музичні штрихи (акценти гучності, тимчасове усунення, відхилення від настройки, модуляція та ін.). Ефективне використання секвенсора вимагає від композитора-аранжувальника спеціальних інженерних знань, що сильно відрізняє його роботу від праці академічного музиканта.
Інший вид програмного музичного забезпечення орієнтований на аудіотехнології записи музики. Значне зростання продуктивності та обсягів зберігання даних у звичайних комп'ютерів дозволив довести до рядового користувача запис звуку на жорсткий диск в реальному часі. Нові технології дозволяють музиканту істотно економити на обладнанні. Сам комп'ютер тепер є цифровим багатоканальним магнітофоном, заповітною мрією багатьох музикантів. Тут, так само як і в MIDI-технології, є кілька непоганих пропозицій, але найпоширенішою в Росії стала програма SAW (Innovative Quality Software, http: // www. Igsoft.com). Закономірно, що розробники не зупинилися на рішенні виключно проблеми запису і відтворення. Програми стали доповнюватися опціями редагування звуку - отрисовкой кривих гучності, регулюванням балансу, функціями копіювання, видалення, вставки, фільтрації та ін. В ПО для роботи зі звуком стали переноситися ті прийоми, які вже давно відпрацьовані в студійному обладнанні - мікшерах, лімітер, еквалайзерах, ревербераторах. Відомо, що зазвичай "комбайни" зручні для користування, але в окремих функціях не так потужні, як спеціалізовані продукти. Тому, працюючи зі звуком, професіонали, так і любителі, користуються деяким "джентльменським набором" програм. Так, якщо багатоканальна запис здійснюється в ПО SAW, то обробку сигналів виконують в спеціалізованих звукових редакторах, наприклад, в
Cool Edit (Syntrillium Software, http: // www. Syntrillium.com), Sound Forge (Sonic Foundry, http://www.sfoundry.com) або WaveLab (Steinberg). Деякі функції новітніх редакторів звуку, такі, як зсув настройки без зміни часу звучання (темпу) або гармонізація (синтез акорду з однієї ноти), здаються фантастичними. А адже студійні апаратні аналоги таких програмних функцій стоять сотні і навіть тисячі доларів. Проблема одна: багато складних операції в звукових редакторах не виконуються в реальному часі. Але це, очевидно, тимчасовий питання, якщо врахувати, як швидко ростуть обчислювальні потужності персональних машин.
Зараз MIDI- і аудіотехнологія йдуть рука об руку. Провідні виробники пропонують програмні продукти, в яких обидві технології інтегровані. У процесі створення музики частина партій "прописується" в MIDI і відтворюється звуковими модулями, а частина являє собою акустичну запис. Як бачимо, два основних підходи зовсім не конфліктують, а доповнюють один одного.
навчання
На західному ринку пропонується безліч навчальних музичних програм. Але тут немає однаковості ні в підходах, ні у функціях, ні в цінах. Безліч нескладних програм створюється одним автором або групою, часто і не представляє програмну фірму, у якої є свій вихід на ринок. У цих випадках робота ведеться в рамках навчальної або дослідницької діяльності. Однак існують і дуже великі мережеві пакети, орієнтовані переважно на Mac-платформу і дуже дорогі - $ 1000 і більше. У Росії закордонні навчальні програми майже не застосовуються - через недоступність, через слабку оснащеності навчальних закладів комп'ютерною технікою, через відмінності в методиках навчання. Винятками є, мабуть, Pianist for Windows, Jazz Guitarist for Windows і Band-in-a-Box (фірма PG Music, http: //www.pgmusic. Com), але вони являють собою вузькоспеціалізовані продукти, які навчальними можна вважати лише умовно . Дійсно, перше, що необхідно для навчання, це програми з елементарної теорії музики - ритміці, інтервалах, строю, ладу, гармонії. Значно більше в Росії поширене музичне ПО фірми "Микита" (http: // www.nikita.vest.msk.ru/), але ці програми дуже прості, щоб стати навчальним посібником в музичній школі, а про середній та вищій ступені освіти говорити взагалі не доводиться. Розробка програм для початкового навчання ведуться на кафедрі музичної освіти і просвіти Державної Новосибірської консерваторії (http: //ngk.nsk. Ru), але їх ще немає в продажу. У цій ситуації для вирішення навчальних завдань педагоги намагаються використовувати ті ж MIDI-секвенсори, складаючи музичні приклади і нотно-видавничі системи для роздруківки партитур.
музична наука
Музикознавство є ще більш вузьку спеціалізовану область. Досліджують класичну спадщину музикознавці в більшості своїй дуже далекі від сучасних технологій, хоча багато з того, що було недоступне ще 10 років тому, тепер легко можна робити за допомогою комп'ютера, наприклад проводити статистичний і гармонійний аналіз, моделювати стародавні твори і невикористовувані нині строї і т . д. Але в рядах користувачів є музикознавці-фольклористи, які давно тягнуться до акустичної, матеріальній основі музики. Тепер вони, з радістю відставивши вбік магнітофони та осцилографи, взялися за аналіз фольклорних пам'яток за допомогою звукових редакторів, за реставрацію дорогоцінних експедиційних магнітофонних записів і переклад архівів в "цифру" на компакт-дисках.
композиція
В області композиції завжди були і залишаються донині дві основні задачі: по-перше, генерація музичної ідеї і, по-друге, конструювання твори. Ніхто не звільняв композитора від цих двох завдань, але комп'ютерні технології поставили перед ним третю! Традиційний спосіб створення музики передбачає виконання партитури живими людьми. І, чесно кажучи, саму музику нерідко робить саме виконавець. Адже від композитора він отримує тільки план - партитуру. Але в комп'ютерній MIDI-технології виконавець відсутня! Раніше у автора п'єси не боліла голова з приводу вилучення окремого звуку і виконання всього твору, адже музиканти і диригент знають, як зіграти, як подати твір. А працюючи з секвенсором, композитор повинен сам "прописати", інакше кажучи, "виконати" кожну ноту. Фокус полягає в тому, що хоча композитор представляє, як саме має звучати твір, він далеко не завжди знає, як музиканти домагаються необхідного звучання. У випадку з секвенсором композитору потрібно не в загальних рисах, а абсолютно конкретно знати прийоми звуковидобування, основи психоакустики і звукорежисури. Але найголовніше, треба вміти ці знання перевести в практичну площину - в MIDI-команди управління звукосінтезірующім обладнанням.
Виявило, что композиторам з традіційнім музичною освітою непросто освоїті нову технологію. Альо Відсутність "Виконавця" підштовхнуло їх до поиска Нових ЗАСОБІВ вираженості. Звінувачуючі свого часу Електрон музику, як, втім, и рок, и даже джаз у відсутності новизни (!), Музичні критики в більшості життя без НЕ помітілі виходом на сцену нового персонажа - тембром. В електронних композиціях тембр нерідко ставав формотворчим фактором. Але з позиції традиційного музикознавства, для якого основою музики є мелодія, такий перегляд основ межує з єрессю. Правда, теорія музики завжди відставала від практики. Чи варто чекати об'єктивних оцінок явищ минулого, сьогодення, а тим більше прогнозів на майбутнє, від науки, яка до цих пір не має для аналізу музичних об'єктів кращого інструментарію, ніж враження критика, що оформляються у вигляді літературного нарису ...
У традиційній електронній музиці, на відміну від популярної, композитор, як правило, і не прагне досягти подібності акустичного оркестру. На зміну громкостним, темповим і штриховим нюансам, настільки характерним для академічної музики, прийшли незвичайні електронні тембри, їх ще більш незвичайні поєднання, сувора ритмічна організація і статичність. Комп'ютерна технологія привела до появи нової музичної естетики і нових ціннісних орієнтирів. І зараз, через 20 - 30 років, ми вже цілком можемо електронну музику Штогхаузена, Крафтверк, Тенжеріна Дріма, Вангеліса, Вареза і багатьох інших називати класичною.
Втім, в комп'ютерних музичних технологіях розвивалися і отримали визнання і інші підходи. Деякі з них, йдучи корінням в ранні досліди машинної генерації нотних текстів, в чимось віддалено нагадують процес імпровізації. Існують програмні продукти, побудовані на базі різних алгоритмів породження музичної партитури. Генерація тексту часто виконується на основі вихідних даних - гармонії і обраної стильової моделі. За цим принципом будуються такі відомі масові продукти, як Jammer for Windows (Soundtrek, http: // www.soundtrek.com), Yamaha Visual Arranger for Windows (Yamaha, http://yamaha.com), Voyetra Digital Orchestrator Plus. Подібні алгоритми вкладені у багато моделей недорогих синтезаторів з автоакомпанементом фірм Yamaha, Roland, Casio і ін. Але вони композиторів про такі програми дуже неоднозначні. Одні вважають, що автогенерація сковує творчу фантазію, інші бачать позитивні сторони в тому, що кожен такий продукт включає колосальну базу музичних даних. Дійсно, якщо вам необхідно підшукати ритмічний риф, характерний бас або малюнок акомпанементу, ви легко знайдете щось підходяще серед двох-трьох сотень заготовок. Зрештою, це непоганий спосіб розвивати власні художні орієнтири, вивчаючи налагоджені професіоналами музичні моделі.
В інших програмах генерації тексту, наприклад Sseyo Koan Pro (Sseyo Lyd, http: // www. Computersandmusic.com), Aleatoric Composer for Windows (Carl M. Christensen, christen @ picasso. Ocis.temple.edu, http: // www .hitsquad.com), знаходять застосування більш гнучкі стохастичні алгоритми породження музичних текстів. Існує також досить елітарне напрямок в електронній композиції, яка отримала назву інтерактивної музики. Ця область зараз, мабуть, є більш експериментальної, ніж всі інші. Інтерактивні технології передбачають створення деяких музичних заготовок і завдання певних умов генерації тексту в залежності від зовнішніх впливів. До таких дій відносяться MIDI-повідомлення від різних контролерів або акустичні сигнали. У найпростішому випадку це MIDI-клавіатура фортепіанного типу, але зараз цілком можна застосувати і більш рідкісні контролери - гітарні, духові, ударні та зовсім унікальні, такі, як поверхня підлоги з датчиками або датчики руху, укріплені на "виконавця" (так і хочеться сказати " танцюриста "). У цій області знайшли застосування технології розпізнавання, використовувані для відстеження комп'ютером гри виконавця-музиканта і її оркестрового супроводу, як, наприклад, в програмі Coda Vivace Personal Accompanist (Coda Music Technology, http: // www.codamusic. Com). В одних випадках при цьому гра музиканта повністю прогнозована (твір вибирається заздалегідь), в інших виконано майже недетерминировано. Останній випадок в якійсь мірі можна розглядати як моделювання імпровізаційного процесу, що виникає між музикантами. Правда, програма відгукується далеко не на всі дії живого виконавця і, цілком ймовірно, геть позбавлена музичного гумору. Однак її можна "навчити", точніше, налаштувати на деякі реакції, які в процесі людино-машинного виступу будуть сприйматися як цілком осмислені.
Виконання і відтворення музики -Речі різні
Представлений мною огляд музичних комп'ютерних технологій, звичайно, далекий від повноти. Але метою моєї є пошук відповіді на питання, винесене в заголовок статті. Я не скажу нічого нового, стверджуючи, що новаторство характерно для російської дослідницької та інженерної думки. Але область програмування - абсолютно особлива сфера для новацій. Вона примітна тим, що не вимагає перелопачувати нічого матеріального. Є і суто російські реалії. У нас сильні математики, акустики, наші програмісти не забули асемблер і не бояться "заліза", так як багато хто вийшов з радіоаматорів, а наші середні користувачі мають дуже сучасний парк машин. Правда, зв'язок у нас часто нікудишня. У музичних комп'ютерних технологіях і предмет діяльності, т. Е. Продукт (звук), і споживач (слухач, музикант) дуже специфічні. Це область, де багато інтуїтивного і дуже мало формальних критеріїв. Тому для розробки музичних продуктів програміст повинен бути музикантом, акустиком і радистом одночасно або потрібна група, що об'єднує таких фахівців і, що дуже важливо, що говорять на одній мові. Вимоги не прості, але мені здається, що вітчизняні розробники можуть і повинні сказати своє вагоме слово в музичних комп'ютерних технологіях.
Тут бачиться кілька напрямків. Перше - створення навчального програмного забезпечення. Людей, байдужих до музики, вкрай мало. Мабуть, кожен другий хоча б намагався грати на одному з інструментів, а прагнення навчити своїх дітей музиці не слабшає, незважаючи на економічні негаразди. Але чи багато хто батьки, завівши домашній комп'ютер, встановивши текстовий редактор, бухгалтерську програму і десяток "іграшок", здогадуються, що на столі майже готова музична студія? Що дитина набагато легше освоїть ази музичної теорії, якщо зіграна ним мелодія буде відображатися в нотному вигляді, а набрана на екрані - виконуватися обраним за бажанням тембром; що освоювати ритм набагато цікавіше в ігровій формі? В системі музичної освіти працює чимало талановитих педагогів, є хороші оригінальні методики, що переносяться в програми. Зрештою, навчальні програми - це великий ринок, і не тільки російський. Скільки дорослих, не маючи можливості вивчати музику в дитинстві, намагаються заповнити цю прогалину! Так де ж музична мультимедіа-енциклопедія для всіх? Адже вона потрібна не тільки любителям, але і студентам, педагогам.
На ринку програмних продуктів для ПО обробки звуку існує величезна ніша. Тепер, коли темпи зростання продуктивності процесорів обганяють найоптимістичніші прогнози, навіть ревним прихильникам "железячних" варіантів стає ясно, що пройде два-три роки і багато "залізяки" без особливих проблем будуть замінені програмами. Та ще з усіма приємними штучками програмних рішень - гнучкістю конфігурації, наращиваемость функцій, налаштуванням інтерфейсів, апгрейдами і іншим. І користувачеві набагато легше буде віддати не 500, а 50 доларів, не бігти в салон за коробкою, а завантажити програму з Web-сторінки або CD-ROM, причому ознайомившись з нею ще до оплати. Російські фахівці тепер від принципових схем можуть перейти до розробки програм, де стане в нагоді все те цінне, що було накопичено в проектуванні аналого-цифрових пристроїв. Доказом того, що напрямок обрано вірно, служать продукти російської фірми SoftLab - NSK (http: // www. Softlab-nsk.com), що спеціалізується на розробці засобів мультимедіа. Її звуковий мультитрековий рекордер з функціями відеомонтажу DDClip користується попитом не тільки в Росії, але і на Заході, де в цій галузі досить жорстка конкуренція.
Втім, російським розробникам вдається заявляти про себе і на самому передньому краї музичних комп'ютерних технологій, пропонувати те, чого ще не було. Так, на початку 1996 р на міжнародному музичному ярмарку у Франкфурті-на-Майні Новосибірська фірма NTONYX (http://www.ru.com/ ntonyx /) представила новий тип музичного ПО, покликаний заповнити те, чого досі так не вистачало MIDI-технології створення музики. Новий продукт, створений в результаті досліджень з проблеми моделювання виконання названий Style Enhancer (підсилювач, "покращувач" стилю, манери). Не можна сказати, що дослідники на Заході взагалі не помічали цієї проблеми. Вивченням феномену виразного живого виконання займалися Г. Відмер (G. Widmer), М. Клайнс (M. Clynes), М. Охіа (M. Ohya), Д. Коуп (D. Cope), про важливість даного напрямку говорили К. Роадс (C. Roads), Д. Оппенгейм (D. Oppengaim, http://www.research.ibm. com / music /), та й не тільки вони. Але перший варіант користувальницької програми був зроблений не на Заході, а в Росії! І причина цього криється, швидше за все, в підході до вирішення проблеми.
Спробуємо розібратися в ситуації. Припустимо, що хтось із співробітників дослідної лабораторії або фірми - розробника музичних програм усвідомлює необхідність в програмі, яка не просто відтворює партитуру, а моделює живе виконання, прибираючи з машинного відтворення механістичність. Ініціативу підтримує керівництво. Добре. Що далі? Потрібен фахівець, здатний запропонувати спосіб моделювання або розповісти, як грає музикант. Здавалося б, це повинен бути музикант-теоретик. Але професор консерваторії, прекрасно знає музику, не знає, як грає музикант. Він не може описати цього за допомогою точних параметрів - герц, мілісекунд, децибел. Виконавець краще теоретика знає про технології звуковидобування, але і його знання не можна представити у вигляді акустичних параметрів. Якщо ж шукати відповідь у акустика, результат все одно виявиться незадовільним. Акустик може багато виміряти і завалити вас графіками, але не скаже, чому вони саме такі. А що може зробити програміст без постановки завдання? Здається, все, коло замкнулося. Якщо використовувати традиційний підхід, бачиться єдиний вихід із ситуації: досліджувати живу гру, шукати закономірності, т. Е. Певний критерій "виразного" виконання, і потім спроектувати систему, яка буде аналізувати текст і трансформувати електронну партитуру згідно з цим критерієм. Однак видів музики дуже багато, вони дуже різні, так само як і критерії. Малоймовірно, щоб якийсь дослідний колектив з музикознавців і акустиков зміг в розумні терміни розробити якийсь критерій хоча б для одного інструмента і одного музичного стилю. Бути може, тому традиційний підхід і не дав поки практичного результату у вирішенні проблеми моделювання виконання. Але чи є шанс піти від пошуку суворого критерію? Як винести акустичні параметри "за дужки", як звільнити музиканта-дослідника від аналізу діаграм і дозволити йому працювати в звичному звуковому середовищі і нотних символах?
Виявилося, що така можливість є. Потрібна система, в якій користувач може параметрически задавати режими аналізу тексту і параметри трансформації, т. Е. Виконавську модель. Музичний досвід виконавця, композитора чи педагога - це і є найкращий критерій. Для точних наук описові характеристики музики не становлять великої цінності, але оцінки "добре - погано" і "виразно - невиразно" стоять дуже багато чого в системі, де музикант виконує роль "вимірювального блоку", експерта. Музиканту зовсім і не обов'язково знати, на скільки децибел змінюється гучність нот в музичній фразі або скільки мілісекунд становить пауза на взяття дихання у флейтиста. Але він чудово чує, що реалістично, а що ні. Йому просто-напросто треба дати засіб впливу на характер виконання - "ручки, повзунки", і тоді він без допомоги акустика виставить їх в потрібне положення. У цьому випадку дійсно "за кадром" можна залишити величезне число графіків, таблиць і умов, що відповідають конкретній виконавської моделі.
Звичайно, я кілька спрощую загальну картину. Без дослідження реального виконання, акустичних вимірювань і статистичного аналізу проблему моделювання вирішити не можна. Однак оцінюючи складність завдання, ступінь розробки в теорії музики акустичного і психологічного аспектів проблеми, враховуючи, що наука на даному етапі не має жодним відсотком необхідних експериментальних даних, важко знайти інший шлях. Лише відмова від пошуку суворого критерію виразності і включення музиканта в якості експерта в людино-машинну систему моделювання виконання може дати якісь практичні результати. І свідчення цьому - серія програмних продуктів фірми NTONYX.
Style Enhancer покращує стиль
Сімейство перших в світі призначених для користувача програм моделювання виконання зараз включає Style Enhancer 1.0 (SE), що працює зі стандартними MIDI-файлами, і Style Enhancer Micro 1.1 (SEM), що представляє собою модуль для Cakewalk, одного з найпопулярніших MIDI-секвенсор. Програми, написані на Borland Pascal 7.0 with Objects, - це диспетчер і набір DLL-модулів. Обробка даних будується на послідовному аналізі, розпізнаванні музичних об'єктів - нот, нотних комбінацій - і їх трансформації, т. Е. Внесення виконавських нюансів з метою досягнення виразності. Набір DLL-модулів утворює бібліотеку спеціальних правил та інструментів (Rules & Tools, R & T). Певна організація цих модулів носить назву стилю. Стиль, що включає налаштовані R & T, являє собою алгоритм перетворення даних або виконавську модель. Практично SE розраховує параметри виконання за кілька секунд, тоді як професійного аранжировщику, що програмує музичну п'єсу, на цю роботу потрібні години і навіть дні.
На основі досвіду створення та експлуатації SE 1.0 розробляється друга версія Style Enhancer Pro 2.0 на Сі ++, що представляє собою 32-розрядний додаток для Windows 95 і NT. Перша вистава нової програми заплановано на березень 1998 року, коли буде проходити музичний ярмарок у Франкфурті-на-Майні. На відміну від SE v1.0, SE Pro буде включати новий блок гармонійного і структурного аналізу, власний потужний MIDI-секвенсор, який будується на оригінальний підхід до внутрішнього уявлення даних, що забезпечує коректне відтворення MIDI-секвенцій і унікальних-ні функції їх перетворення. У плани NTONYX входить також створення інтелектуального MIDI-програвача, що дозволяє користувачеві-немузиканту прибрати в MIDI-файлах механістичності початок. Я думаю, для роботи з такою програмою буде досить натискання однієї кнопки "виразно". Але, як відомо, чим менше кнопок зовні, тим більше інтелекту повинно бути всередині. Будемо працювати, сподіваюся, що цей продукт - справа не дуже далекого майбутнього.
На закінчення хочу сказати кілька слів про "Всесвітній павутині". Її розвиток відбивається все сильніше на багатьох сторонах нашого життя, але те, що вона дає для інформаційної сфери та програмних розробок, не можна порівняти ні з чим. Тепер майже все одно, в якому місці конкретно працює програміст - в Іванові, Празі чи Берні. Головне, щоб вам було що сказати колезі і запропонувати користувачеві. Підключившись до мережі, ви отримуєте цінну інформацію швидше, ніж передплатник будь-якого друкованого видання. Якщо у вас є питання, дуже ймовірно, що в Мережі є відповідь. Якщо відповіді немає, можливо, у вас є шанс відповісти на нього самостійно і раніше, ніж дадуть інші. Internet в Росії - вже реальність, ця обставина при всіх соціальних і економічних проблемах значно збільшує шанси виходу вітчизняних розробок в світ.
Олексій Устинов, - директор NTONYX, доцент кафедри комп'ютеризації Державної Новосибірської консерваторії. До нього можна звернутися за адресами: [email protected] і http://www.nsk.ru/~alexmidi.
Версія для друку
Чи може Росія сказати тут своє слово?Як описати музику формально?
Як співвідносяться обсяги даних нотного тексту і звучить твори?
Але що ж насправді міститься в звукову творі, а що в цих мегабайтах?
Якщо в музиці дійсно є закони і людина - композитор ці закони дотримується, то, напевно, і машину, яка вміє думати, можна спробувати змусити складати музику?
Що ж в цій історії пов'язано з Росією?
Що ж являє собою музична комп'ютерна практика кінця 90-х?
Але чи багато хто батьки, завівши домашній комп'ютер, встановивши текстовий редактор, бухгалтерську програму і десяток "іграшок", здогадуються, що на столі майже готова музична студія?
Так де ж музична мультимедіа-енциклопедія для всіх?