Уважаемые пользователи подготовлена новая версия синтезатора речи Sakrament “Людмила”, в которой, помимо прочего, был учтён ряд пожеланий, поступивших от пользователей.
В частности, в новой версии 2022.05.19 реализованы следующие основные
исправления и доработки:
1. Проблема неправильных ударений.
Ударение в белорусском языке по своему структурному типу является так
называемым “свободным” или “разноместным” (то есть может падать на
любой слог слова), а также “подвижным” (то есть при словоизменении и
словообразовании может переноситься с одной морфемы на другую).
Также в языке существуют так называемые “омографы”, то есть слова с
одинаковым написанием, но разным произношением, отличить которые можно
только по контексту.
Всё это осложняет автоматизацию задачи расстановки ударений в тексте.
На уровне синтезатора речи это решается встроенным словарём ударений.
Однако ни один из словарей не содержит абсолютно всех слов языка,
особенно сложных производных слов, жаргонизмов и прочего.
Оценка контекста и вовсе на сегодняшний день является крайне
ресурсоёмкой задачей, которая не может быть выполнена в режиме
реального времени на обычных потребительских устройствах, а значит не
подходит для использования в синтезаторах речи, ориентированных на
незрячих.
В связи со всем этим синтезатор речи, запускаемый на обычном
компьютере, неизбежно будет допускать ошибки в речи, связанные с
неправильной постановкой ударений.
Тем не менее, проблема имеет два варианта решения, оба из которых были
реализованы в новой версии Sakrament “Людмила”, а именно:
Во-первых, ряд слов, которые характеризовались неправильными
ударениями, были внесены в словарь, и теперь синтезатор речи
произносит их правильно.
Во-вторых, в новой версии синтезатора появилась поддержка
пользовательского словаря, с помощью которого любой желающий может
самостоятельно корректировать произношение синтезатора. Подробнее
можно прочитать в его справке в разделах 4 и 4.2.
2. Паузирование и интонирование в речи.
В живой речи паузы используются для отделения частей фраз и как
элемент интонирования.
Синтезаторы речи могут подражать этому лишь в ограниченном объёме.
Кроме того, достаточно сложный анализ текста, требующийся для
достижения высокого качества паузирования и интонирования в речи,
опять же возможен лишь с привлечением крайне ресурсоёмких технологий
на основе машинного обучения, которые приведут к невозможности
использования такого синтезатора в реальном времени на обычных
потребительских устройствах.
Таким образом, схематичность интонирования синтезатора является
неизбежным компромиссом между качеством и ресурсоёмкостью.
Тем не менее, в новой версии синтезатора Sakrament “Людмила” были
реализованы ограниченные доработки, направленные на устранение
некоторых особенностей, которые по отзывам отдельных пользователей
приносили наибольшие неудобства. В частности, была устранена длинная
пауза в речи, возникавшая на нескольких пустых строках подряд.
Что касается прочих проблем, в частности, связанных с недостаточно
высоким качеством звука синтезатора и посторонних шумов, то работы в
этом направлении продолжаются. Поскольку существенная часть их
обусловлена дефектами в исходной записи дикторской базы синтезатора,
то ведутся работы по организации записи новых дикторских баз. В
результате планируется получить новые голоса для синтезатора,
характеризующиеся более высоким качеством звучания. К сожалению,
данный процесс требует довольно существенных организационных усилий, а
также временных и прочих затрат, поэтому пока не завершён.
Кроме того, параллельно исследуется возможность сборки синтезатора для
операционных систем Android, чтобы обеспечить возможность читать
тексты на белорусском языке и на современных мобильных устройствах.
Загрузить обновлённую белорусскую сборку синтезатора речи Sakrament
“Людмила” версии 2022.05.19 можно по ссылке –
https://tseykovets.ru/download/windows/sakrament_ludmila_belarusian_setup.exe