iPhone 4S: частина друга Історія компанії HTC. Частина перша Фототест актуальних смартфонів 2011 ПЛАТфон: Платити легше за все
Огляди Статті Опис ЧаПи
AddThis Social Bookmark Button
Версія для друку Блогерам

Музичні сервіси в Інтернеті: впізнання музики

Музичні рекомендаційні сервіси гарні, коли треба знайти щось нове. Але наш споживач не завжди «не знає, чого хоче». Часто він знає, але не може згадати або пам'ятає тільки на слух.

Кожен з нас бував в такій ситуації, коли в голові крутиться якась мелодія, але назва ніяк не згадується. Або почув пісню по радіо або просто на вулиці, а хто співає і як називається - не знаєш. У таких випадках дуже до речі б припав сервіс з упізнання музики.

Світ музичних інтернет-сервісів вирішення завдання правильно впізнати пісню дуже важливо. По-перше, скільки продажів не відбувається через те, що люди не можуть знайти вподобану пісню, вони не знають або забули, як вона називається. По-друге, навіть якщо людина не купить упізнаних композицію, а скачає десь безкоштовно, він, тим не менш, скористається сервісом з упізнання, що можна монетарізовать, наприклад, через рекламу.

Існує декілька технік у упізнання пісні, застосування кожної з них залежить від того, що, власне, знає людина про шуканої композиції.

У кожного треку є два головних ідентифікатора - назва і виконавець.

Це як ім'я і прізвище. В принципі, є ще назву альбому, але альбоми поступово виходять з моди, та й у будь виконавця є дві пісні з однаковою назвою? Так що комбінації «виконавець + назва» цілком достатньо.

Інша справа, що з комбінацією цієї далеко не завжди все ясно. Навіть цілком офіційні джерела часом плутаються в правильному написанні назв музичних груп або їхніх пісень. Чого вже говорити про звичайних людей.

Найпростіший випадок - людина пам'ятає назву пісні, але не пам'ятає виконавця. Або навпаки. У цьому випадку музичний сервіс повинен мати доступ до баз даних про виконання і їх творчості. Користувач подивиться запропоновані варіанти, послухає їх фрагменти в потоковому форматі і вибере потрібне.

Перший крок опитувальника пошукової системи одного з рекорд-лейблів:
Чи пам'ятаєте Ви: 1) Частина імені виконавця, 2) Частина назви альбому, 3) Частина назви композиції, 4) Музичний стиль композиції

Взагалі, можливість предпрослушіванія дуже важлива при впізнанні, тому подібні сервіси обов'язково повинні бути оснащені програвачем потокового аудіо, принаймні, фрагментів композицій, достатніх для впізнання.

Інша схожа завдання - перевірка правильності написання. Як часто ми невірно запам'ятовуємо ім'я виконавця, назва пісні, особливо якщо це нерідну мову! Але ж далеко не всі сервіси беруть це до уваги, засмучуючи черговим «По вашому запиту нічого не знайдено».

Ряд музичних сайтів, проте, організований з розумінням цих складнощів і має систему перевірки написання, що зводять подібні помилки мінімуму. Природно, для цього їм теж необхідно мати широку базу найменувань виконавців і композицій.

Перевірка музичної грамотності на сайті myplaylist.biz

Для створення подібної бази точкою опори поки навіть в Інтернеті залишаються музичні CD. Адже переважна кількість аудіозаписів і раніше виходить в першу чергу в цьому форматі. Офіційний реліз аудіо-CD - захід відповідальне, воно повинно відповідати певним стандартам. Всі випущені диски каталогізуються, заносяться до класифікаторів. Це створює первинну інформацію про запис.

В Інтернеті вже досить довго існують онлайн-бази подібних даних. Це, так би мовити, первинна інформаційна основа усієї «музикосфери». У таких базах міститься довідкова інформація про безліч виконавців, альбомів, композицій. Їх називають CDDB, CD Data Base - бази даних CD. Більшість музичних сервісів використовує ці первинні дані.

Власник найбільшої CDDB (власне, сама абревіатура є зареєстрованою торговою маркою цієї компанії) - американська Gracenote.

Інформацією Gracenote користуються безліч програм (Winamp, Windows Media Player, iTunes) і сервісів.

Зовсім недавно Gracenote була придбана компанією Sony. На тлі фіаско музичного інтернет-проекту останньої - сервісу Connect - це виглядає цікавим контрхід.

Таким чином, якщо є договір з хорошою CDDB, то для перевірки написання від музичних сервісів вимагається лише створення гарної автокорректірующей системи при введенні запиту.

Якщо порівнювати пісню з людиною, то інформацію, що міститься в базах CDDB, можна порівняти з паспортними даними. Назва композиції, альбом, компіляція або сингл, до складу якого вона входить, ім'я виконавця або назва групи - це її ПІБ. Але потрібен номер паспорта. Його роль грає унікальний ідентифікатор CD, з тією відмінністю, що він відноситься не до одного треку, а до їх групі.

Звідки береться цей ідентифікатор? Так як творці стандарту аудіо-CD в свій час ніяк не могли планувати існування треків з CD поза самого CD, то вони не передбачили на диску ніякої ідентифікаційної інформації. Таким чином, компакт-диск за замовчуванням - людина без паспорта. Його самого треба пізнати.

Якщо продовжити аналогію з людиною, то зробити це можна за його прикметами. Для CD це буде поєднання числа треків та їх тривалості. Разом вони дають досить унікальну картину. Так і працюють CDDB - в їх базах зберігаються унікальні ідентифікатори CD, розраховані на підставі даних про кількість, послідовності і тривалості треків - «фоторобот» диска. Програма-клієнт на ПК користувача створює такий «фоторобот» для диска, що підлягає ідентифікації, з'єднується через Інтернет з базою і шукає в ній збігається за прикметами диск. Подібним чином можуть орієнтуватися як фізичні CD-диски, так і їх стислі в MP3 і інші формати копії, головне, щоб збереглася унікальна структура.

В ідеалі у музики повинні бути «встановлюють особу документи» або «особливі прикмети». Для композицій на носії - CD - це унікальні параметри диска, що дозволяють відновити всі дані по базах CDDB. Для оцифрованої музики це метадані, теги.

В реальності ж все не так просто. Що робити, якщо трек позбавлений будь-яких візьме? Таких ситуацій може бути чимало: запис з радіо, безвісний файл, викачаний з Інтернету, запис з диктофона, оцифрована аналогова запис.

У випадку з людиною на допомогу приходять відбитки пальців. Це працює і для пісень.

Акустичні відбитки пальців - це витримка з цифрового звукового файлу, мінімальний обсяг інформації, за якою його можна достовірно встановити. Зазвичай це невеликий масив даних, до 10 КБ. Принципово, що відбитки, містять чисто музичні характеристики - ритм, забарвлення звучання, інформацію про мелодію - і не залежать від конкретного файлу, з якого отримані.

Далі все робиться дуже схоже на технології CDDB: програма-клієнт через Інтернет звіряє «згодовувати» їй композицію з базою даних таких відбитків. Якщо виявляється збіг, значить, файл розпізнано.

В даний час в Інтернеті доступно кілька таких баз даних відбитків.

Gracenote MusicID

Головна CDDB - Gracenote - також володіє власною технологією акустичних відбитків пальців, званої MusicID. Найчастіше з неї зустрічаються в популярному програмному плеєрі Winamp, який може звернутися до бази відбитків Gracenote за запитом користувача. Інший клієнт компанії - виробник мобільних телефонів Sony Ericsson, що не дивно. У базі Gracenote містяться акустичні відбитки понад 7 мільйонів композицій.

AudioID Fraunhofer

Винахідники MP3 також розробили і свою технологію акустичних відбитків пальців. У 2004 році вони створили окрему компанію для розкрутки цієї технології, в 2007 році для цього підприємства було обрано назву Mufin (скорочено MUsic FINd). Поки ця технологія все ще менш помітна на ринку, ніж продукти головних конкурентів, Gracenote і Shazam.

Last.fm Fingerprinter

Компанія з такими амбіціями на ринку музичних послуг, як Last.fm, не може залежати від сторонніх провайдерів даних, у тому числі акустичних відбитків пальців. Тому Last.fm розробляє свою технологію, використовуючи значне ком'юніті як джерело даних і робочу силу. Поки технологія знаходиться в бета-версії, але компанія заявляє, що її база вже містить понад 10 мільйонів відбитків.

Shazam

Ця англійська компанія надає сервіс впізнання музики для стільникових телефонів. Вона володіє власною технологією акустичних відбитків пальців, в її базі даних інформація по більш ніж 4 мільйонам композицій. Ще з 2002 року Shazam пропонує жителям Великобританії оригінальну послугу - зателефонувавши за вказаним номером і піднісши слухавку до джерела звуку, ви отримуєте негайно SMS з іменем виконавця та назвою композиції, якщо, звичайно, її вдалося розпізнати. Компанія намагається розширити свою діяльність, створивши пошукову систему музики. Крім того, вона використовує дані, отримані при впізнанні безлічі пісень для створення своєрідного чарту - яку музику користувачі хотіли розпізнати найчастіше. В даний час сервіс Shazam доступний в 45 країнах у 50 операторів для більш ніж 500 мільйонів використовуваних у світі мобільних телефонів.

MusicDNS

Порівняно недавно, в січні 2007 року, американська компанія MusicIP представила свою систему впізнання музики, названу MusicDNS. Базується вона в тому числі і на технології акустичних відбитків пальців. За заявами компанії, в даний час в її базі містяться відбитки не менше 26 мільйонів композицій.

Крім рекомендаційних сервісів, акустичні відбитки пальців використовуються і в інших сферах. Наприклад, для захисту інтелектуальної власності. За відбитками сервіс може, приміром, визначити, чи належить композиція до числа ліцензованих. Це застосовується на сервісах з можливістю завантаження аудіофайлів користувачем.

Часом, причому нерідко, «тіло» пісні знаходиться в настільки сумний стан, що ніяке зняття відбитків пальців неможливо. Композиція залишилася лише в пам'яті людини у вигляді обривків мелодії, слів. Але це не означає, що її зовсім неможливо впізнати.

Сервіси, здатні впізнавати пісні з уривків мотиву, вже існують, хоч і в дуже сирому стані. Мелодія може вводитися користувачем через якийсь музичний інтерфейс, наприклад, наекранную клавіатуру піаніно. Звичайно, це зажадає якоїсь музичної підготовки від користувача. Або це може бути аналіз аудіоданих, приміром, наспівати в мікрофон, яким сьогодні обладнані дуже багато ПК. Чудес від таких систем поки чекати не слід, але ці системи розпізнання музики, аналогічно системам розпізнання мови, прогресують.

Винахідник MP3 Fraunhofer також працює над системою розпізнавання музики за усним вводу

Сервіс midomi.com пропонує впізнання музики за усним вводу

Інша, мабуть, більш надійна система пошуку, - за словами пісні. Тема слів пісні, Lyrics, сама по собі дуже обширна. У контексті даного матеріалу досить згадати, що в Інтернеті існують бази даних слів пісень, оснащені пошуком по окремих фраз. Це гарна підмога в пізнанні композиції, особливо при якісному алгоритмі пошуку і, знову, системі автокорекції помилок.

Приклад пошуку за словами пісні

З людиною, коли всі методи пізнання виявляються безсилі, вдаються до аналізу ДНК. І тут нам відразу згадується Pandora з її Music Genome Project. Чи можливо використовувати накопичену там інформацію або загальний підхід цієї компанії при впізнанні? Зовсім не виключено. Як аналіз ДНК робиться з використанням генного матеріалу родичів, так і музичну композицію можна спробувати пізнати по її «родичів» в музичному відношенні. Адже часто, намагаючись згадати ту чи іншу пісню, ми відчуваємо, що вона схожа на щось, що ми вже чули раніше.

В ідеалі хотілося б мати можливість при «генетичної експертизи» задавати складні запити: «Вокал, як у такій-то пісні, гітарний риф, як в такий-то, програш нагадує те-то, є ще такі-то і такі-то елементи - що це може бути? »

У результаті ми можемо алгоритмизировать процес упізнання музики і розбити його на ступені складності.

  • Перший ступінь - відоме ім'я пісні і / або автор, але неточно. Тут цілком може допомогти система автокорекції помилок, пошук по базах CDDB за назвою - щоб знайти виконавця або навпаки.
  • 2-а - немає інформації про пісню, але є аудіоматеріал. Це запис з радіо, диктофона, оцифровка аналога. Тут на допомогу прийде впізнання за акустичними відбитками пальців.
  • 3-й ступінь - є лише уривчастий образ музики в пам'яті людини - мотив, слова. Тут підійдуть різні програми впізнання музики, пошук за словами пісень.
  • Нарешті, 4-а, вища складність - образ пісні в пам'яті настільки смутен, що згадується лише, на що вона приблизно схожа. Тут можна спробувати провести «генетичну експертизу».

Таким чином, до теперішнього часу в Інтернеті накопичилося вже достатньо даних і механізмів, які можна використовувати для створення потужної системи впізнання музики. Такої системи, яка б допомагала в ситуаціях типу «пісня крутиться в голові, але ніяк не згадати яка». Справа за малим: створити подібну єдину систему, надати їй зручний інтерфейс. Будучи реалізованою, вона стала б потужним елементом 360-градусної музичної стратегії в Інтернеті.

Олексій Дорожін ( adoro@list.ru )
Опубліковано - 1 липня 2008

Є, що додати?! Пишіть ... eldar@ua-mobile.com

Новини:
Hit

19:20, 25 листопада: Конкурс Windows Phone 7.5 Mango - виграй HTC 7 Mozart!

Hit

12:00, 25 листопада: Вікторина Lexand

Hit

11:00, 25 листопада: Безкоштовні дзвінки за кордон з мобільного телефону

Hit

19:10, 24 листопада: Замовлення таксі в стилі hi-tech

13:38, 21 листопада: Нові електронні книги Ritmix з TFT екранами

Hit

01:13, 19 листопада: Подкаст від ua-mobile.com, випуск № 199 від 19 листопада 2011

Hit

15:10, 18 листопада: Конкурс Acer Iconia Smart триває!

12:40, 17 листопада: Google Music вийшов зі стадії beta і доступний в Android Market

18:49, 16 листопада: Philips представив нові mp4-відеоплеєри Philips GoGear SA60

22:41, 15 листопада: iAudio 10: новий музичний плеєр Cowon

Підписка

Реєстрація | Забули пароль?

Ваш E-mail


Пароль




© ua-mobile.com, 2002-2010. All rights reserved.