STRIGANOV SERGEY: Software development.

Разработка программного обеспечения на: C++, T-SQL, VBS, JavaScript, PHP

Bash скрипт читает новости по RSS: RHVoice или Festival

Этот bash скрипт (см. Attachments) читает голосом по-русски RSS новости Яндекс - главные.
Тестирован на UBUNTU 12.04 (x64), при этом в системе были установлены RHVoice v0.3 и Festival.

Он был создан в дополнение к теме [HOWTO] Учим компьютер говорить по-русски / Festival скрипты
Буду очень рад конструктивной критике, советам по оптимизации кода.

Пример чтения новостей

(обновляется каждые 30 минут)  RHVoice.mp3  ( ~0.5 MB ) и обработанный скриптом [текст rss]


Для сохранения в файл и конвертации в mp3 - использовал lame:

		echo  "текст в mp3" | RHVoice | lame -V 5 - /home/someuser/audio/RHVoice.mp3


Я сейчас пишу программу более сложной подготовки текста к произношению.

Нашел замечательный словарь замены для числительных и физических величин.
Там есть много интересных примеров трудных сучаев.  И еще один словарь здесь .
Но мой метод не подразумевает широкое использование регулярных выражений.
У меня совсем другой принцип обработки текста:
использую комбинацию нескольких специализированных словарей, плюс некоторые
"жестко прошитые в коде" правила русского языка, плюс статистические и
вероятностные алгоритмы с применением теоремы Байеса и самообучением
системы на основе "эталонных" текстов. Получается довольно большого обьема
база данных,  со всеми необходимыми индексами. Но это не проблема.
Мне и не нужно, чтобы все работало даже на калькуляторе.

 

Ссылки по теме:


Скачать скрипт можно здесь:

Attachments:
FileDescriptionFile sizeLast modified
Download this file (ya_news_rss_read.sh)ya_news_rss_read.sh 3 kB2012-12-03 12:48

Add comment