本文详细介绍在C#中使用微软AGENT之TTS
微软AGENT简介
微软Agent API能够提供卡通角色的显示,另外,它还可以支持语音识别,因此应用软件可以对语音命令作出反应,而卡通角色可以通过合成的语音、录制好的音频信号或文字对命令作出反应。
使用微软AGENT的要求
要使用该技术,我们必须有下面的组件:
·微软Agent核心组件
·微软Agent中的卡通角色━━Genie、Merlin、Robby和Peedy
·微软Speech API 4.0a运行时间库
·微软语音识别引擎
·Lernout和Hauspie文字-语音引擎
上面的所有这些组件都可以从http://microsoft.com/products/msagent/downloads.htm下载。
语音技术简介
文字-语音转换指的是计算机将文字信息转换为合成语音进行输出,语音识别是指计算机能够识别出说话者所说的话,接受说话者的命令和输入的数据。
语音识别和文字-语音转换都需要用到相关的引擎,几乎所有的语音识别引擎都是将输入的语音数据转换为与特定引擎相关的音素,然后这些音素被转换为应用程序能够使用的文字。
文本-语音转换的二种方式:
1、合成文本-语音转换
2、连续文本-语音转换
合成文本-语音转换方式:
在合成的发音方式中,引擎处理每个单词,并产生该单词的发音音素,然后这些音素被转入一个复杂的算法中,模仿人类的发声方式,生成语音。
连续文本-语音转换方式:
在连续文本-语音转换方式中,引擎对文本信息进行处理,从一个预先录制好的语音库中找出句子、单词和短语,在这种方式中,生成的语音是连续的。
语音应用程序的编程接口
微软语音应用程序编程接口在Win32(Windows 95、Windows NT)下使用了OLE组件对象模式(COM)架构,微软的Agent架构在合成语音输出中使用了微软语音应用程序编程接口(SAPI),还使用SAPI支持语音输入(语音识别SR或文本-语音转换TTS)。微软的Agent定义了让应用程序访问其服务的接口,使得应用程序能够控制角色动画、支持用户输入事件,指定输出方式。
责编:豆豆技术应用