智能语音技术又名语音识别技术,它的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等,语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合,可以构建出更加复杂的应用,例如语音到语音的翻译 。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等 。
(图一:语音交互是人机交互最自然的方式)
国内智能语音技术的发展历程
我国语音识别研究工作起步于五十年代,但近年来发展很快,研究水平也从实验室逐步走向实用;从1987年开始执行国家863计划后,国家863智能计算机专家组为语音识别技术研究专门立项,每两年滚动一次 。我国语音识别技术的研究水平已经基本上与国外同步,在汉语语音识别技术上还有自己的特点与优势,并达到国际先进水平 。中科院自动化所、声学所、清华大学、北京大学、哈尔滨工业大学、上海交通大学、中国科技大学、北京邮电大学、华中科技大学等科研机构都有实验室进行过语音识别方面的研究,其中具有代表性的研究单位为清华大学电子工程系与中科院自动化研究所模式识别国家重点实验室 。
清华大学电子工程系语音技术与专用芯片设计课题组,研发的非特定人汉语数码串连续语音识别系统的识别精度,达到94.8%(不定长数字串)和96.8%(定长数字串) 。在有5%的拒识率情况下,系统识别率可以达到96.9%(不定长数字串)和98.7%(定长数字串),这是目前国际最好的识别结果之一,其性能已经接近实用水平 。研发的5000词邮包校核非特定人连续语音识别系统的识别率达到98.73%,前三选识别率达99.96%;并且可以识别普通话与四川话两种语言,达到实用要求 。
中科院自动化所及其所属模式科技(Pattek)公司2002年发布了他们共同推出的面向不同计算平台和应用的“天语”中文语音系列产品——PattekASR,结束了中文语音识别产品自1998年以来一直由国外公司垄断的历史 。
语音识别技术分类
语音识别系统可以根据对输入语音的限制加以分类,从说话者与识别系统的相关性考虑可以将识别系统分为三类:一是特定人语音识别系统:仅考虑对于专人的话音进行识别;二是非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;三是多人的识别系统:通常能识别一组人的语音,或者成为特定组语音识别系统,该系统仅要求对要识别的那组人的语音进行训练 。
探究国内语音技术未来的发展趋势
语音识别是一门交叉学科,语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术结合使人们能够甩掉键盘,通过语音命令进行操作,语音技术的应用已经成为一个具有竞争性的新兴高技术产业 。
推荐阅读
- GUCCI 酒神系列全面解读 gucci酒神包国内专柜价
- 国内外茶叶标准分析
- 孕妇护肤品不是越贵越好! 孕妇专用化妆品
- 数码知识:努比亚x有没有小牛语音有语音助手吗
- 国内自驾游经典线路 国内自驾游路线推荐
- 王者语音包设置怎么弄 王者语音包设置方法介绍
- 国内春节旅游最佳去处 适合春节游玩的地点介绍
- 国内口碑好的情感挽回机构 爱情挽回机构靠谱吗
- 国内唯一黄色变异茶种黄金芽
- 医药电商平台排名,国内最大的医药电商平台有哪些