Linux操作系统下的语音识别软件使用说明

豆豆网   技术应用频道   2007年08月13日  【字号: 收藏本文

内容摘要:许多人并没有意识到Linux桌面系统也完全可以用声音来控制,并且软件开发人员们已经取得了一定的成果。下面我们就对Linux系统下的语音识别软件进行分析概括,以便帮助大家了解其优势和缺陷。

  当用户第一次运行某一应用程序时,Xvoice会自动启动命令模式。如果用户想同时打开听写模式,只需要说“听写模式”便可以了;如果想关闭听写模式,也只需要说“停止听写模式”就万事大吉了。

  当然,最好的方法是将Xvoice窗口置于系统的窗口管理器中,这样你就可以随时了解它的工作情况了。如果你想在开机时便自动运行Xvoice,只要将xvoice m 放入窗口管理器的启动程序中就行了。

  声控应用程序

  下面来看一看如何为应用程序定义语法。首先,将要定义语法的软件定义为一个可读的名字,然后为程序的窗口命名一个语句,这样Xvoice便可以识别哪个语法命令是要激活的。在第一行,可以看到一个特殊的固定应用程序名,而它并不是窗口标题。这一特殊的应用程序名必须上下文统一。

  应用程序的标签中包含有听写属性。如果条件为真,则首次运行语句时,Xvoice自动进入听写模式。语句的第二行包含有一些在< define name='numbers'>区中已经定义过的值。用户可以在定义区中自行定义标记,并应用于整个配置文件中。

  语句的第3行举例说明定义区内可以包含的内容,而这里的命令标记只能在本命令范围内使用。这一行的主要作用是通过语音命令各自的箭头键将彼此互联系起来。当执行命令时,系统会将语音命令与相应的键盘命令对应起来。语音命令的识别转换过程从第4行语句开始。第4行到第8行都是与键盘操作相关的语句,与鼠标相关的语句在第9行到第15行,第16行到第22行是与其它应用程序相关的命令语句,第23行是结束行。

  通过对个人配置文件的编辑,用户几乎可以自动完成过去需要键盘和鼠标才能完成的所有操作过程。许多普通应用软件的语法组,事先已经包含在缺省的配置文件中了,成为用户良好的范例。

  语音识别的发展

  Xvoice无法控制一些特殊的应用软件和一些主流游戏软件。对于一些诸如GIMP和Netscape软件来说,虽然Xvoice可以对其进行控制,但是由于此类软件需要大量的鼠标操作,用户会对用语音控制鼠标感到十分厌烦。

  虽然语音识别软件对于大多数命令和一般的文本都可以正确地识别,但是在某些情况下,即使是一个微小的错误也是不允许。语音软件的使用者必须使自已的声音保持稳定。

  另外,虽然XVoice 和ViaVoice可以完成大量的工作,但是用户却无法通过声音控制整个Linux桌面环境。

  IBM公司已经发布了新的ViaVoice,但是只支持Mac 和Windows,未来是否能支持Linux目前尚不确定。Xvoice的开发人员们正在努力寻找一种能支持开放系统的替代产品,而不希望再为Xvoice增加新的功能了。

责编:豆豆技术应用

正在加载评论...