Татарский синтезатор речи торос. Синтезатор татарской речи

В рамках проекта предполагается выполнение следующих видов работ: - разработка элементной базы синтезатора татарской речи на дифонах (для мужского голоса); предположительный объем базы не менее 3000 элементов, для каждого дифона имеется три-четыре варианта оцифровок в зависимости от позиции в слове (в начале слова, в середине слова, в конце слова, в конце предложения), - разработка алгоритмов фонематической и фонетической транскрипции для преобразования орфографических текстов в устную форму языка; необходимость этого шага диктуется отсутствием полного соответствия между графикой и звуковой системой языка. Реализация алгоритмов в программном коде. Статистическая апробация работы фонетического и фонемного транскрибираторов на достаточно большом языковом материале, - разработка моделей просодического оформления предложений, - разработка процедур управления акустическими параметрами речевого сигнала (частотой основного тона, длительностью и интенсивностью сигнала). В результате выполнения проекта должна быть создана версия синтезатора татарской речи, преобразующего произвольный орфографический текст в устную форму языка.

Аннотация к отчету по результатам реализации проекта:

В основе разрабатываемого синтезатора татарской речи лежит идея совмещения методов конкатенации и синтеза по правилам. Звуковой сигнал на выходе синтезатора строится как конкатенация оцифровок дифонов из акустической базы по определенным правилам. Акустическая для синтезатора татарской речи на настоящий момент насчитываеет 992 дифона. Проведено исследование вариативности дифонов. Результаты этих исследований показали слабую контестную зависимость дифонов, но выявили существенную зависимость дифона от их позиции в слове. С учетом данного обстоятельства большинство дифонов были озвучены и включены в базу в трех, а иногда в четырех вариантах (в начале слова, в середине слова, в конце слова, в качестве отдельного слова, состоящего из двух фонем). С учетом позиции дифона в слове объем акустической базы составляет порядка 3000 элементов. Разработан комплекс программ, позволяющий отслеживать версии записанных оцифровок, ведения реестра дифонов, поддерживающий функции резервного копирования. Часть (10%) дифонной базы размечена по периодам основного тона. Создан и отлажен алгоритм фонематической транскрипции для слов татарского языка. В рамках алгоритма фонематической транскрипции решена задача автоматической идентификации заимствований для татарского языка. Дано конструктивное описание фонетического строя языка, разработаны правила, позволяющие синтезатору "произносить" заимствования по татарски. Транскрибиратор использует около 1000 различных линвистических правил анализа текста и преобразования слов фонематическую запись. Описано и частично реализовано подмножество языка спецификаций для реализации лингвистических правил. Целью создания такого языка является разработка инструментария, позволяющее лингвисту создавать и тестировать лингвистические правила преобразования (транскр ипция, разбиение на слоги) исходного текста.

Аннотации к заявке и отчету приведены в авторской редакции. по состоянию на 23.04.2019.

(Казань, 26 мая, «Татар-информ »). Сегодня в Республиканской библиотеке для слепых и слабовидящих состоялась презентация татарского синтезатора речи . С его помощью незрячие люди смогут работать с любой электронной информацией на татарском языке. Подобные продукты на других языках существуют уже много лет, но теперь и татары с ограниченными возможностями зрения смогут отправлять письма, переписываться в социальных сетях и читать новости на родном языке.

«Несколько лет назад команда разработчиков - филологи из нашего университета, программисты - начала работать над проектом синтезатора татарской речи. И сегодня я очень рад, что нам удалось сделать такой нужный татарам продукт», - заметил инициатор создания синтезатора - директор библиотеки для слепых и слабовидящих Наиль Сафаргалеев во время презентации.

«Мы будем активно распространять синтезатор речи среди незрячих, сейчас прорабатываем варианты распространения. Возможности синтезатора уже опробовали посетители нашей библиотеки. В скором времени, думаю, сделаем его доступным для бесплатного скачивания с нашего сайта », - рассказал он.

По словам эксперта проекта Эдуарда Ибрагимова, синтезатор представляет собой модуль, подключаемый к программе, помогающей незрячим работать с компьютером. Он озвучивает совершенные действия, читает названия кнопок и ссылок, на которые нажимает пользователь, воспроизводит всю информацию на сайтах - статьи, комментарии, тексты писем и сообщений.

«Наконец-то татарский присоединится к семье других языковых модулей, работающих на платформе RHVoice, - Эдуард Ибрагимов продемонстрировал, как с помощью установленного на ноутбук модуля он читает статьи на сайте "Азатлык Радиосы ". - Пока работает только на Windows, в будущем обязательно появится на мобильных устройствах под управлением Android. Будет и на Apple, хотя, конечно, с этими устройствами сложнее всего».

Синтезатор «разговаривает» голосом народного артиста Татарстана Талгата Хаматшина. По словам посетителей библиотеки, у них и раньше была возможность озвучивать татарские тексты с помощью русскоязычных синтезаторов. «Но они, конечно, не могут передать правильно татарскую речь: многие звуки, которых нет в русском языке, просто не озвучиваются! » - пояснил тестировщик синтезатора Рифкат Гардиев.


Подписывайтесь на нас в Telegram

Последние новости Татарстана по теме:
В Казани презентовали татарский синтезатор речи для незрячих

В Казани разработали татарский синтезатор речи для незрячих - Казань

Говорящий синтезатор, на татарском языке. Единственная в мире разработка, которая позволит слепым и слабовидящим услышать родную речь, и писать на родном языке.
00:12 27.05.2017 ГТРК Татарстан

В Казани презентовали татарский синтезатор речи для незрячих - Казань

С помощью этой программы незрячие и слабовидящие люди смогут отправлять письма, переписываться в социальных сетях и читать новости на татарском языке.
17:22 26.05.2017 ИА Татар-информ