Пример: Глобальная сеть INTERNET
Я ищу:
На главную  |  Добавить в избранное  

Главная/

Программирование, базы данных. /

Синтез речи \озвучание речи компьютером\

←предыдущая следующая→  
1 2 3 4 5 6 7 8 

выбора и применения алгоритмического и программного обеспечения при решении прикладных задач распознавания образов, прогнозирования, анализа и понимания информации, представленной в виде изображений и сигналов, а также разработки, исследования и реализации соответствующих автоматизированных вычислительных систем. Отличительной и принципиальной особенностью решаемых с помощью этих методов задач является невозможность использования классических математических (аналитических) моделей для формализации и представления исходных данных, которые могут задаваться числовыми массивами, изображениями, сигналами, вербальными описаниями или комбинацией указанных способов. Информация в этих задачах "плохая" по определению: ее характерными особенностями являются неполнота, противоречивость, слабая структурированность, неформализованность, нечеткость. В основе их решения лежат модели не чисто расчетные, а основанные на процедурах анализа и оценивания информации о задаче: главным образом, прецедентов, косвенных характеристик, доступных для измерения, логических и физических ограничений, контекстных и неявных знаний.

3.Область применения

Математическая постановка задач распознавания образов, прогнозирования, анализа и понимания изображений и сигналов не зависит от предметной области и специфического вида объекта анализа. Именно поэтому критическая технология, реализующая методы и средства решения указанных задач, применяется в технической диагностике, неразрушающем контроле, дистанционном зондировании; экологическом мониторинге; прогнозировании хода и результатов лечения, диагностике в медицине; в геологии; для прогнозирования в химии и автоматизации научных исследований (обнаружение событий, поиск, восстановление и вывод зависимостей и эмпирических закономерностей).

4.Основания для выбора

Необходимость разработки данной технологии определяется тем, что методы распознавания образов, анализа изображений и прогнозирования лежат в основе информатизации подавляющего большинства отраслей промышленности, автоматизации научных исследований и социальной сферы; значительная часть перспективных высоких и наукоемких технологий использует или предусматривает использование этих методов. Анализ потребностей внутри страны показал, что системы такого типа в период 1996-2000 гг. могут тиражироваться в количестве до 100 тысяч в год. Экспортные возможности на 1996 год на мировом рынке прикладных интеллектуальных программных средств в системах такого класса оцениваются ( при квалифицированном маркетинге ) в 25-30 тысяч штук.

5.Состояние и тенденция развития

Распознавание образов, анализ изображений и речи являются ведущим направлением прикладной информатики. В России получены фундаментальные результаты, позволяющие надеяться на относительно быстрое достижение крупных прикладных успехов при условии соответствующей координации и финансирования работ. В настоящее время разработкой предлагаемых методов занято около 10 тысяч российских ученых и специалистов. За рубежом в этой области работают около 200 тысяч человек.

Имеющийся сейчас в стране научный задел и опыт решения особо важных прикладных задач позволяет осуществить выход на международный рынок наукоемкой продукции и НИОКР. Разрыв между потенциальными возможностями теории и методами, реально используемыми при решении прикладных задач и создании систем распознавания образов и анализа изображений, чрезвычайно велик. В значительной мере такое положение объясняется недостаточным финансированием и плохим материально-техническим обеспечением. В ближайшие несколько лет это может привести к существенному отставанию информатизации общества в России от мирового уровня.

Oki разрабатывает самую миниатюрную в мире БИС для синтеза речи

Компания Oki Electric Industry объявила о разработке новой БИС для синтеза речи, которая по размерам вдвое меньше современных чипов. Опытные поставки БИС MSM9831 начнутся в марте.

По мнению специалистов Oki, ИС MSM9831, скорее всего, найдет свое применение в приложениях с системами с управлением речевыми командами, в навигационных системах транспортных средств и в системах имитации звуковых эффектов.

Этот чип, благодаря использованию алгоритма нелинейной 8- разрядной импульсно-кодовой модуляции, может генерировать звук, эквивалентный звуку, получаемому с помощью 10- разрядного алгоритма прямой импульсно-кодовой модуляции. Он позволяет получать звук на частоте от 4 до 16 кГц, воспроизводить до 31 канала. На частоте 4,0 кГц чип MSM9831 обеспечивает 11 секунд звучания.

Размер чипа - 6,8х5,0 мм, он имеет 8 выводов. Уменьшение его размера стало возможным благодаря использованию последовательного интерфейса, благодаря чему число внешних контактов было сокращено вдвое. Такой миниатюрный размер позволяет встраивать чип MSM9831 во многие современные портативные устройства, такие как цифровые камеры, персональные электронные секретари (PDA) и портативные CD- плейеры.

Дальнейшие планы развития.

Задача синтеза речи, как видно из предыдущих материалов, является частью, одной из подзадач компьютерной телефонии. Поэтому ее так и следует рассматривать. В этом направлении уже создано достаточно много, но, к сожалению, универсальные программы синтеза русской речи пока не получили широкого распросранения. Это связано с тем, что во - первых разработка таких программ требует больших затрат времени квалифицированных специалистов, таким образом деньги вложенные в разработку могут начать приносить прибыль только через несколько лет, и коммерческие фирмы не хотят этим заниматься. Работа в этом направлении ведется в основном в институтах (МГУ).  Во - вторых, использование голосовых технологий на базе сигнальных процессоров фирмы Dialogic требует достаточно крупных капиталовложений (от 800$ ). Это является серьезным барьером для многих фирм - зачастую проще взять на работу девочку для обзвонки абонентов, чем покупать Software и Hardware.

Другое применение программ синтеза речи - чтение текстов незрячим людям. На Западе такие системы имеет практически каждый незрячий. В России это пока недостижимо из - за их финансового положения.

 Выход здесь один - снижать цены. Но и при сегодняшнем положении вещей есть области применения, где компьютерная телефония незаменима. Например, одна из них - предвыборная агитация. В компьютер закладывается список номеров или условие, по которому телефон будет сгенерирован, а так же наговаривается текст предвыборной программы конкурента. Систему настраивают так, чтобы она начала обзвонку и выдачу сообщений, допустим с 1.00 до 6.00. Естественно, за этого кандидата уже никто голосовать не станет. Такая система уже была опробована и показала хорошие результаты на недавних выборах в С.- Петербурге.

Другое направление развития - увеличение количества каналов на одной плате  в России упирается в то, что многие станции вообще не поддерживают функции, предусмотренные системой (АОН) и не имеют ресурсов для подключения этих плат. Тут вообще ничего нельзя сделать. Оставляет желать лучшего и качество связи.

В отношении Hardware систем компьютерной телефонии сейчас ведутся разработки по снижению энергопотребления, миниатюризации и увеличению быстродействия.

←предыдущая следующая→  
1 2 3 4 5 6 7 8 


Copyright © 2005—2007 «RefStore.Ru»