Синтез мовлення

Си́нтез мо́влення (СМ) — перетворення друкарського тексту у мовний сигнал (в широкому сенсі — відновлення форми мовного сигналу за його параметрами.

Комп'ютерна система, що здійснює синтез мови, називається синтезатором мови, (СМ) та може бути побудованою на базі програмного чи апаратного рішення.

Система що спроможна виконувати конвертування нормального друкованого тексту у аудіо у реальному часі називається текст-у-мовлення (ТУМ) ( англ. text-to-speech, TTS).

Історія

Синтез мови має довгу історію, що обросла легендами. Ще в Х столітті Герберту Аврілакському приписували володіння мистецтвом виготовлення терафіма — мертвої голови, що говорить. Зроблена з бронзи, ця голова словами «так і ні» відповідала на питання будь-кого, хто до неї звертався. В середині століття монах-домініканець Альберт фон Больштедт й англійський філософ- природодослідник Роджер Бекон також намагалися створювати перші зразки голів, що «говорять».

В кінці XVIII століття данський учений Крістіан Кратценштейн, член Російської Академії Наук, створив модель мовного тракту людини, здатну вимовляти п'ять довгих голосних звуків (а, е, і, о, у). Модель була системою акустичних резонаторів різної форми, що видавали голосні звуки за допомогою вібруючих язичків. У 1778 австрійський учений Вольфганг фон Кампелен доповнив модель Кратценштейна моделями язика й губ та представив акустичну-механічну машину, що говорить, здатну відтворювати певні звуки і їх комбінації. Шиплячі і свистячі видувалися за допомогою спеціального міха з ручним управлінням. У 1837 учений Чарльз Уїтстоун представив покращений варіант машини, здатний відтворювати голосні і більшість приголосних звуків. А в 1846 році Джозеф Фабер продемонстрував свій euphonia, орган, що говорить. В ньому було реалізовано спробу синтезування не тільки мови, але і співу.

В кінці XIX століття відомий учений Олександр Белл створив власну механічну модель, що «говорить», дуже схожу за конструкцією з машиною Уїтстоуна. З початком XX століття почалася ера електричних машин, і учені дістали можливість використовувати генератори звукових хвиль і на їх базі будувати алгоритмічні моделі.

У 1930-х роках працівник Bell Labs Гомер Дадлі, працюючи над проблемою збільшення передавальної здатності у телефонії, розробив вокодер (скорочено від англ. voice — голос, англ. coder — кодувальник) — керований за допомогою клавіатури електронний аналізатор і синтезатор мови. Ідея Дадлі полягала в аналізуванні голосового сигналу, розбору його на частини і пересинтезація у менш вимогливу до пропускної спроможності лінію. Вдосконалений варіант вокодера Дадлі, VODER, був представлений на Нью-Йорській всесвітній виставці 1939 року

Перші синтезатори мови звучали досить неприродньо, і часто було важко розібрати вироблювані ними фрази. Проте якість синтезованої мови постійно поліпшувалася, і мову, що генерується сучасними системами синтезу, деколи не відрізнити від реальної людської мови. Але незважаючи на успіхи електронних синтезаторів мови, дослідження в області створення механічних синтезаторів мови ведуться досі, наприклад, для використання в роботах-гуманоїдах.

Перші системи синтезу мови на базі обчислювальної техніки почали з'являтися в кінці 1950-х років, а перший синтезатор «текст-мова» був створений в 1968.

інші мови
Afrikaans: Spraaksintese
العربية: تصنيع صوتي
български: Речеви синтез
čeština: Syntéza řeči
Esperanto: Parolsintezo
føroyskt: Talusyntesa
français: Synthèse vocale
Bahasa Indonesia: Sintesis bunyi
italiano: Sintesi vocale
日本語: 音声合成
қазақша: Сөз синтезі
한국어: 음성 합성
latviešu: Runas sintēze
Bahasa Melayu: Sintesis pertuturan
Nederlands: Spraaksynthese
norsk nynorsk: Talesyntese
Papiamentu: Síntesis di bos
polski: Synteza mowy
português: Síntese de fala
русский: Синтез речи
srpskohrvatski / српскохрватски: Sinteza govora
Simple English: Text to Speech
српски / srpski: Sinteza govora
svenska: Talsyntes
中文: 语音合成