Контакты
Подписка
МЕНЮ
Контакты
Подписка

Организация по стандартизации Web готовит новые стандарты по распознаванию голоса

Организация по стандартизации Web готовит новые стандарты по распознаванию голоса

Организация по стандартизации Web готовит новые стандарты по распознаванию голоса


09.12.2005

Во вторник W3C сообщила, что в следующее поколение VoiceXML войдут спецификации для удостоверения личности по голосу. W3C готовит проект спецификации VoiceXML 3.0, куда войдет технология, позволяющая распознавать голос говорящего при совершении сделок по телефону или для использования голоса в компьютерах.

До сих пор технология VoiceXML применялась главным образом для подачи голосовых команд, а не для ввода текста. Ряд предприятий опирается на нее для автоматизации процессов и сокращения штатов. Однако под влиянием случаев нарушения безопасности при таких операциях пользователей и предприятия все больше беспокоит их защита. «Удостоверение личности по голосу — не только лучшая биометрическая защита при сделках и контактах по телефону; эта технология может гладко сочетаться с распознаванием и синтезом речи в системах VoiceXML», — говорится в заявлении вновь избранного председателя организации VoiceXML Forum Кена Реора (Ken Rehor).

W3C завершила подготовку предварительного проекта требований по VoiceXML 3.0 и планирует выпустить рабочий проект спецификаций к концу первого квартала будущего года, сообщил Джеймс Ларсон, сопредседатель рабочей группы W3C Voice Browser.

Кроме требований по идентификации говорящего, W3C решает в VoiceXML 3.0 проблему расширения функциональности языка Speech Synthesis Markup Language (SSML) с добавлением некоторых новых языков, включая китайский, японский и корейский.

SSML позволяет разработчикам управлять разными аспектами речи, от высоты тона до громкости и произношения. «Китайские теги будут указывать нужный тон, чтобы правильно передавать значение слов, и задавать ограничения, чтобы пользователи знали, где слово начинается и где оно заканчивается», — пояснил Ларсон. Например, в китайском языке слово mai в зависимости от тона голоса может означать либо «кошка», либо «красивый». Теги в SSML уже помогают правильно выговаривать слова при синтезе речи. Например, в США слово aluminium произносится не так, как в Канаде и в Англии.

Несмотря на то, что SSML уже стандартизован, в марте соответствующая рабочая группа W3C планирует провести свое первое официальное совещание для выработки требований по расширению языка, сообщил Ларсон.