开发了高效,小型的口语解析系统。

童话《灰姑娘》中,王子为了找到心爱的灰姑娘,手拿水晶鞋寻遍了王国的各个角落。如果能对着手机说一句:“水晶鞋的主人在哪里?”就可瞬间检索到灰姑娘位置的话,现实生活将比童话更加美好!
我们常常能在科幻作品中看到人机对话的有趣场景,“语音识别”是实现人机对话的关键技术,当然,让电脑识别人类的口语并不容易。NEC很早就着手此项研究,创造出了拥有 “高效·小型”、“精确”、“自然对话表现”、“适应针对不特定人”、“大词汇” 5大特点的口语解析系统。
1.“高效·小型”:由于NEC开发了可从庞大的语音样本数据库中高效提取更精确数据的软件,因此可在PC、PDA等小型电脑上使用口语解析系统。
2.“精确”:在有噪音和其他人声干扰的环境下,仍可保持识别精度。
3.“自然对话表现”:可识别自然口语。
4.“适应不特定的人”: 除可识别特定人的声音,还可识别多种人声和语调。
5.“大词汇”:搭载可识别庞大词汇量的大规模数据库。
尤其,为了实现“高效·小型”,NEC开发的口语解析系统能按顺序识别口语。(参照 图释1“口语解析的流程”)。首先,从语音的波形读取其特征。因为人发出的语音为连续的,所以将每1/100秒读取一次的波形特征和各个语音样本来对比计算其相似性,以特定其语音。将可能概率较高的语音进行详细计算、而尽快结束对可能性概率较低的语音样本的对比计算,这样可提高计算效率。这种效率化使PDA、手机等CPU速度较低的终端也可进行高精度口语解析。
在此技术基础上,开发了单词词典和词语排列的规则化的统计语言样本,及可检索到最适合单词列的技术,实现了高精度的口语解析系统。
可通过手机 ,PDA语音输入检索文件的语言检索系统
通过手机 ,PDA等终端的语音检索系统就是NEC开发的口语解析系统在文本检索领域的应用。通过该系统对手机等进行语音输入后,可随时随地检索需要的信息。
语音检索系统及语音输入手机、PDA等终端,进行相应的检索并将结果显示在手机、PDA屏幕上。用手机上网查信息时,与传统的按键输入的繁杂操作相比,语音输入显然更简便、快捷,包括不太会用电脑的老年人,都可轻松使用。
例如,用语音对手机输入“这附近的美食餐厅” 后, 信息被传输到语音服务器。口语解析系统识别内容后,即从文件数据库检索适合的文件,再通过网络服务器、分组数据网,将检索结果显示到手机屏幕上。
语音检索系统有3个特征:①可识别通过手机语音输入的检索内容,②可对日常口语进行识别检索,③为语音服务器和网络服务器互相联合的语音网络联合系统。(参照图释2“语音/网络联合型检索系统”)
在屏幕上显示排在前 10位的列表,使用者可进行选择然后点击,就可得到想要的信息。繁杂的使用手册、旅行时对景点、美食等的介绍也在检索的适用范围内。
还有,现在作为企业的形象而被日益重视的服务热线中心,也可导入语音检索系统,实现电话应对的效率化,总之,在多种商务环境中均可进行应用。
口语解析系统不止是实现了语音检索,通过手机、PDA等便携终端而实现的同步翻译技术,也倍受关注。将来,使用英语的人和使用日语的人可自由沟通,语音输入自己的语言就可自动翻译为对方的语言,进行及时对话,让您在多种语言环境中都能享受顺畅沟通的乐趣。此外,查询国际互联网页时,通过手机检索到的中、英、日文文章被翻成中文后读取也将成为可能。
NEC提供的创新技术,让商务更高效、生活更丰富!
|