Пример: Глобальная сеть INTERNET
Я ищу:
На главную  |  Добавить в избранное  

Главная/

Программирование, базы данных. /

Синтез речи \озвучание речи компьютером\

←предыдущая следующая→
1 2 3 4 5 6 7 8 

для последующей их выдачи адресатам. Для этого в абонентских системах предоставляются зоны памяти, именуемые почтовыми ящиками. Работает почта следующим образом. Пользователь набирает на телефонном аппарате либо другом типе абонентской системы номер службы телефонии. После речевого ответа службы пользователь набирает номер своего почтового ящика и пароль. Затем, он диктует телефонограмму. Это сообщение хранит и передает речевая почта, а выслушивает получатель. Кроме этого, последняя обеспечивает:

•рассылку сообщений группам пользователей;

•рекламу и справочное оповещение;

•сбор объявлений, мнений;

•проведение телеконференций;

•хранение речевых сообщений-телефонограмм.

Создание речевой почты стало возможным при появлении аудиовидеосистем, снабженных микрофонами и динамиками. В отличие от обычной почты, речевая позволяет передавать речевые сообщения отсутствующим у рабочих мест партнерам и создавать Базы Данных (БД), в которых хранятся рассматриваемые сообщения. Благодаря этому, речевые сообщения становятся такими же документами, что и бумажные. Подлинность этих сообщений определяется путем анализа речи, имеющей, как и отпечатки пальцев, уникальные характеристики.

Передача речевых сообщений, в отличие от обычных, очень проста, ибо нет необходимости в использовании клавиатуры или светового пера. Вместе с этим, она требует аналого-дискретного преобразования перед и дискретно-аналогового преобразования после передачи сообщения. Кроме этого, из-за большого объема речевых сообщений необходимо осуществление сжатия данных. При этом удается 30-секундную речь упаковать в 100 Кбайт памяти.

Организация речевой почты в скоростных сетях с маршрутизацией данных не представляет трудностей. Они возникают в сетях с селекцией данных из-за необходимости синхронизации потоков блоков данных. Однако эти трудности устраняются рядом способов. Например, использованием асинхронного способа передачи.

Речь

- speech - вид коммуникативной деятельности Человека.

Эта деятельность связана с использованием при диалоге либо монологе естественного языка. При взаимодействии пользователя с абонентской системой речевой монолог либо речевой диалог обеспечивает передачу необходимых сведений в виде звука. Речь характеризуется фонемами и аллофонами. Генерация и восприятие речи осуществляется с помощью аналогового сигнала, передаваемого колебаниями звукового аппарата Человека. Для того, чтобы сохранить естественную натуральность речи необходимо использование сигнала полосой не менее 6-7 кГц.

Качество речи, записываемой и воспроизводимой устройствами, зависит от многих факторов. Но наиболее существенным из них является используемая полоса частот. Расширение этой полосы в сторону низких частот улучшает натуральность речи, а в сторону высоких частот - разборчивость отдельных звуков.

Что же касается скорости передачи речи после ее кодирования, то стандартами международного союза электросвязи для телефонии приняты следующие режимы:

Режим 0. Передача узкополосной речи (до 3,4 кГц) со скоростью 64 кбит/с.

Режим 1. Передача нормальной речи со скоростью 64 кбит/с.

Режим 2. Передача речи (56 кбит/с) + передача данных (6,4 кбит/с) + синхронизация и управление (1,6 кбит/с).

Режим 3. Передача речи (48 кбит/с) + передача данных (14,4 кбит/с) + синхронизация и управление (1,6 кбит/с).

Стандарты определяют кодирование речи методом адаптивной дифференциальной импульсно-кодовой модуляции, описывают задачи управления и передачи звуковой информации.

Важным компонентом абонентской системы, воспринимающим речь, является речевой кодек - устройство, предназначенное для преобразования аналоговых сигналов, представляющих речь, в код. Рекомендации ITU определяют параметры и процедуры кодирования речевых сигналов с полосой от 50 до 7.000 Гц со скоростью 64 кбит/с для режимов трех типов:

•тип 0 - для дискретной телефонии.

•тип 1 - для широкополосной передачи.

•тип 2 - для многофункциональной передачи.

Речь широко используется в:

•обучающих системах и системах развлечения;

•комментариях к прикладным программам;

•речевой почте для передачи экстренных сообщений;

•диспетчерских системах для информирования персонала о нештатных событиях;

•звуковых командах и подсказках пользователям о допускаемых ими ошибках.

Системы речевого общения - СРО.

------------------------------------------------------------------------

Под системой речевого общения будем понимать программно-аппаратный комплекс, позволяющий человеку общаться с компьютером на естественном языке.

------------------------------------------------------------------------

Современные исследования в области СРО начаты примерно в начале 60-х годов. Первые промышленные СРО появились в конце 70-х годов. К настоящему времени созданы разнообразные СРО для разных сфер применения. Это связано с осознанием потенциальными потребителями преимуществ СРО:

- удобство, простота и естественность процедуры общения, требующей минимума специальной подготовки;

- возможность использования для связи с ЭВМ обычных телефонных аппаратов и существующей телефонной сети;

- устранение ручных манипуляций с одновременным увеличением скорости ввода информации (в 3-5 раз по сравнению с клавиатурным вводом) и разгрузка зрения при получения информации.

 

Цифровой сигнальный процессор (Digital Signal Processor - DSP) -             

специализированный быстродействующий процессор, выполняющий сложную обработку звукового сигнала в режиме реального времени. Звуковые эффекты типа Reverb, Chorus, а также такие виды обработки звука, как компрессия, распознавание и синтез речи, моделирование акустики помещений и т.п., реализуются обычно с помощью DSP. Сигнальный процессор может быть встроенным или внешним.         

Улучшенный сигнальный процессор (Advanced Signal Processor - ASP) и сигнальный процессор Creative (Creative Signal processor - CSP) - названия одного и того же цифрового сигнального процессора фирмы Creative Labs, используемого в некоторых платах типа Sound Blaster. Он обеспечивает реализацию дополнительных методов сжатия звука, увеличивает скорость сжатия, повышает надежность    распознавания речи. На звучание встроенных FM- и WT-синтезаторов ASP влияния  не оказывает.

Системы распознавания и синтеза речи, текста и изображений

-----------------------------------------------------------------------

1.Состав

Технология включает совокупность математических методов, инструментальных и программных средств поддержки, специализированных технологий для решения прикладных интеллектуальных задач, в том числе принятия решений, диагностики, идентификации и прогнозирования, или содержащих задачи указанных типов, в том числе:

•математических методов распознавания образов, прогнозирования, анализа и понимания информации, представленной в виде изображений и сигналов;

•методов автоматизации синтеза и тестирования указанных информационных технологий;

•методов решения индивидуальных (нестандартных или особо важных), специализированных (для классов задач и предметных областей) задач в данной области и инструментальных средств широкого назначения, баз данных и баз знаний для поддержки разрабатываемых методов.

2.Назначение, основные функциональные показатели

Данная группа информационных технологий предназначена для автоматизации, регуляризации и оптимизации выбора

←предыдущая следующая→
1 2 3 4 5 6 7 8 


Copyright © 2005—2007 «RefStore.Ru»