• BanWar.org

    Наша коммерческая сеть BanWar.org

    Наша коммерческая сеть BanWar.org. Казино "Пари Матч" предоставляет игрокам возможность наслаждаться разнообразными играми и быстрыми выплатами.
    Читать полностью

Модулі перетворення тексту в мову

L & H TruVoice & TTS3000 Voice Engines

L & H TruVoice & TTS3000 Voice Engines

Безкоштовні голосові движки від відомої своїми напрацюваннями в цій галузі компанії Lernout & Haspie виявилися на перевірку досить непоганими, навіть незважаючи на їх старовину і відсутність свіжих оновлень. До послуг користувача більш десяти "дикторів" найпоширеніших мов світу, в тому числі і російськомовний. На коротких пропозиціях все досить пристойно, а ось довгі фрази програмі явно не під силу. Тут "мова" хоч і терпима, але найбільше нагадує деренчливий старе радіо - шум, невиразний "плаваючий" звук, заковтування закінчень. Але ви й не очікували від "халяви" чогось незвичайного, чи не так? Ще гірша ситуація з російським - створюється враження, що говорить, скоріше, фін або прибалт, але аж ніяк не носій цієї мови: побіжна, невиразна мова, справжній хаос в області наголосів і абсолютно дикі скачки в інтонації. У підсумку працювати з кирилицею не представляється можливим, хіба що тільки для того, щоб підняти настрій - запевняю, такого клоуна ні в одному цирку не знайдеш!

Microsoft Speech Engine

Мабуть, одним з нечисленних достоїнств цього движка є те, що він вже попередньо встановлено в Windows XP, і її власникам не доведеться витягати дистрибутив Microsoft Speech Development Kit (а це цілих 68 MB), до складу якого він, власне, і входить. На відміну від всіх своїх інших побратимів дітище Microsoft не використовує словники і фонеми, а синтезує мова на ходу за допомогою математичної моделі, що не могло не позначитися на її якості. Перш за все це характерний акцент, не найкращі інтонації і огидний догану абревіатур і дат. Так, "2004 рік" MS Speech Engine скаже як "two zero zero four", а не "two thousands four", а в такому невинному словосполученні, як Windows 98 SE, і взагалі "з'їсть" останній склад. Звичайно, в порівнянні з попередніми версіями програми наявності значний прогрес, але не настільки великий, щоб користувач міг сказати "вау!". Зрозуміло, що абревіатур і різноманітним скорочень даний движок навчити можна і навіть потрібно, але чи варто це витрачених зусиль? Вважаю, що немає, навіть незважаючи на абсолютну безкоштовність програми.

Digit PC 1.0

Ідейний послідовник знаменитого комерційного модуля Digalo від французької фірми Elan Informatique. В активі Digit всіма основними мовами і діалекти (англійська, французька, бразильський португальська, американська англійська, німецька, польська, італійська), а також російська, представлений чоловічим голосом, більш відомим у вузьких колах як "Микола". Мова англійських дикторів можна оцінити на "чотири" - "відмінно" заважає поставити "ковтання" останніх складів і нечасті помилки у наголоси. "Микола" теж непоганий, хоч і страждає деякою гугнявий і "зомбування" голоси. При бажанні звикнути до нього дуже легко, хоча, звичайно, хотілося б ще більшого. Як і движки від Cepstral, Digit не вимагає для своєї роботи третє програм - він уже інтегрований з оболонкою для читання буфера обміну, і все, що потрібно для ознайомлення з літературою, так це натиснути магічну комбінацію Ctrl + C і запустити сам Digit. Дуже зручно і, крім усього іншого, займає мінімум цінного робочого простору на екрані. На жаль, програма не безкоштовна, і після 15-денного випробувального терміну перестане працювати.

ScanSoft RealSpeak

Чудовий text-to-speech engine від творців знаменитого Dragon NaturallySpeaking, просто не вміють халтурно працювати, - що і відбилося на загальному рівні продукту. Електронні персонажі розмовляють майже природно, і якби не слабкий ефект надриву мови, іноді "спливаючий" на довгих фразах, то їх цілком можна було б сплутати з живими людьми. Ось що значить солідний словник і запас фонем! Мов теж підтримується більш ніж достатньо - цілих 21 (!), Включаючи навіть такі екзотичні, як китайський, норвезький та корейський. Русский представлений жіночим голосом "Катерина", причому працює він нітрохи не гірше за своїх закордонних колег і забезпечує дійсно відмінну якість мовлення. Бентежить лише відсутність пробної (trial) версії - на жаль, RealSpeak, поширюється тільки на комерційній основі, але на сайті ScanSoft доступні інтерактивні демо, завдяки яким можна "наживо" послухати кожну із них. А наостанок хочеться відзначити, що програма взята на озброєння багатьма провідними IT-компаніями світу, такими як Ericsson, Elix і AMTELCO.

Elan SaySo 4.6 Evaluator

Нові технології не стоять на місці, і те, що зараз є для персонального використання, часто просто не може зрівнятися з комерційними продуктами для "великого бізнесу". Ось і фірма Elan Speech, недавно об'єдналася з не менш відомої Babel Technologies, не зупинилася на досягнутому і розробила принципово новий продукт - Elan SaySo, який встановив більш високу планку якості в області TTS. Претензій до акценту і інтонації немає взагалі - все настільки чисто і гладко, що не кожній людині вдасться таке відтворити. Сторонній шум відсутній як такий, наголоси розташовуються там, де їм призначено природою, а дикція просто вражає уяву. І мабуть, найприємнішим фактом для вітчизняного користувача є те, що безкоштовні пробні версії програми можна абсолютно легально завантажити з офіційного сайту і користуватися ними в своє задоволення. Звичайно, вони дуже жорстко обмежені по функціональності - підтримується тільки * .txt, не можна підключити їх голосовий модуль до іншої утиліти, наприклад "Говорилка", а також прочитати буфер обміну. Але текст в своєму рідному вікні читається на "п'ять з плюсом", а ліміт на його обсяг (25 тис. Символів) легко виправляється поділом великий книги на кілька частин. Шкода, правда, що поки відсутній демо-версія російськомовного модуля, хоча його підтримка і заявлена ​​розробником.

Шкода, правда, що поки відсутній демо-версія російськомовного модуля, хоча його підтримка і заявлена ​​розробником

Cepstral SwiftTalker 3.0

На відміну від інших подібних продуктів SwiftTalker - це не тільки "голий" TTS engine, але ще і оболонка, що дозволяє задіяти всі його можливості без застосування третє утиліт. Поки в активі Cepstral LLC лише американський і традиційний англійський, а також німецьку та іспанську. Правда, це з лишком компенсується просто величезною кількістю дикторів - лише для одного US English їх налічується вісім, не відстають і інші мови. Та й якість їх виконання на висоті - мова близька до ідеалу, немає ніяких прикрих завивань або перешкод, хоча іноді деякі скачки інтонації на кінцях слів все-таки прориваються. Не дивно, що дистрибутив кожного голосу займає цілих 30 MB - як-не-як, а словники і фонемний конструкції дещо та важать! Що ж стосується оболонки SwiftTalker, то її можливості цілком відповідають стандартам цього класу утиліт: читання * .txt, * .rtf та * .doc, зручний інтерфейс, а також запис синтезується в WAV-файл. В результаті Cepstral SwiftTalker буде відмінним вибором для користувача, що працює в основному з англомовною літературою - мало хто з конкурентів запропонує подібні можливості за такою низькою ціною.

висновок

Незважаючи на те що найвищу якість синтезу мови все-таки забезпечують комерційні (а тому і малодоступні для вітчизняного користувача) голосові модулі, навіть серед shareware і freeware можна знайти дуже непогані аналоги. Головне - вже зараз процес навчання зовсім не вимагає обов'язкового чування перед комп'ютером. Достатньо всього лише сісти в крісло, розслабитися і прислухатися до мови нашого залізного помічника ...

Але ви й не очікували від "халяви" чогось незвичайного, чи не так?
Зрозуміло, що абревіатур і різноманітним скорочень даний движок навчити можна і навіть потрібно, але чи варто це витрачених зусиль?