Синтез голоса

Ноябрь 19th, 2006

Предлагается идея использовать технологию Wave Table, для полноценного синтеза человеческого голоса.

Основные предпосылки:

1. Технология Wave Table - предполагает запись с микрофона живого звука настоящего инструмента и последующим воспроизведением его с возможностью изменения тона. Эти записи объединяются в так называемые “банки инструментов” и выпускаются в виде отдельных модулей для заливки их в память звуковой карточки или подключения к програмному эмулятору Wave Table. Количество инструментов в одном банке может составлять от 64 и выше.

2. Человеческая речь содержит около полусотни основных фонем (возможно больше, но порядок правильный).

Можно сопоставить каждую фонему одному музыкальному инструменту. И, дав прочитать специально подготовленый текст хорошему диктору или известному артисту, возможно получить банк с его голосом.

Развитие идеи:
Звучащие электронные книги малого объёма, читаемые с выражением.
Помощь для людей с проблемами зрения.
Подготовка банков голосов на комерческой основе.

Автор: Платон Влад
E-mail: vlandus@mail.md

Категория: Интересные | Автор: guest |

One Response

  1. Dmitra Says:

    В естесственном языке существует еще множество факторов влияющих на речь и чтобы синтезировать именно речь, а не монотонный голос, нужно учесть во-первых интонацию (на нее в свою очередь влияют: смысл предложения, настроение говорящего, возможно его личное отношение к произносимому) а также другие особенности речи разных людей.

Оставить комментарий