Предлагается идея использовать технологию Wave Table, для полноценного синтеза человеческого голоса.
Основные предпосылки:
1. Технология Wave Table - предполагает запись с микрофона живого звука настоящего инструмента и последующим воспроизведением его с возможностью изменения тона. Эти записи объединяются в так называемые “банки инструментов” и выпускаются в виде отдельных модулей для заливки их в память звуковой карточки или подключения к програмному эмулятору Wave Table. Количество инструментов в одном банке может составлять от 64 и выше.
2. Человеческая речь содержит около полусотни основных фонем (возможно больше, но порядок правильный).
Можно сопоставить каждую фонему одному музыкальному инструменту. И, дав прочитать специально подготовленый текст хорошему диктору или известному артисту, возможно получить банк с его голосом.
Развитие идеи:
Звучащие электронные книги малого объёма, читаемые с выражением.
Помощь для людей с проблемами зрения.
Подготовка банков голосов на комерческой основе.
Автор: Платон Влад
E-mail: vlandus@mail.md
Декабрь 18th, 2006 at 11:08
В естесственном языке существует еще множество факторов влияющих на речь и чтобы синтезировать именно речь, а не монотонный голос, нужно учесть во-первых интонацию (на нее в свою очередь влияют: смысл предложения, настроение говорящего, возможно его личное отношение к произносимому) а также другие особенности речи разных людей.