DIY编程器网

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 1270|回复: 0
打印 上一主题 下一主题

[待整理] Nuance语音识别技术

[复制链接]
跳转到指定楼层
楼主
发表于 2015-4-27 08:07:33 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式
1.语音识别概述
       
        语音识别技术,Automatic Speech Recognition,简称ASR,是一种让机器听懂人类语言的技术。语言是人类进行信息交流的最主要、最长用、最直接的方式。语音识别技术是实现人机对话的一项重大突破,在国外近年来发展十分迅速,其应用也逐步得到推广。近几年逐渐普及的IVR(自动电话应答)处理了不少简单而又重复的咨询工作,节省了不少人力,但这种按键式的语音自动应答却让客户花费很多时间按指引来完成简单的查询,令用户倍感不便。
       
        语音识别无疑可以解决该方面的问题。语音识别系统的开发成功,充分发挥了计算机技术和网络技术的优势,采用先进的人机对话方式,摆脱电话按键的束缚,人们只要象平常一样对着电话简单的说出所需服务项目,即可轻松获取自动系统提供的所需信息。
       
       
        语音识别系统结构

       
        2.语音识别应用
       
        Nuance公司是自然语音接口软件的佼佼者。使用自然语音接口软件,人们可以通过电话方便安全地获取信息、服务并进行交易。每天,千千万万的人通过拨打运行Nuance公司语音识别、语言理解和声纹鉴别软件的电话,进行出游预订、股票交易、与其它通讯媒体、企业和互联网系统进行交往等活动。NUANCE的应用:美国航空、Bell Atlantic、Charles Schwab、家庭购物网络、Lloyds TSB、Sears、UPS.
       
        3.NUANCE语音识别特点
       
        (1)海量词汇、独立于讲话者的健壮识别功能
       
        Nuance系统能可靠地对多种语言进行大词汇量的识别,并可提供识别结果的置信度。该系统对商业上使用的大量词汇提供最准确的语音识别技术。利用Nuance系统开发的应用程序,在市场上具有最高的准确率。生产中的应用程序经测试,准确性超过96%.
       
        (2)基于主机的客户/服务机结构
       
        Nuance系统基于开放式客户/服务机结构,特别为大型应用程序所需的健壮性和可伸缩性而设计。呼叫者的讲话由客户端收集,而识别和鉴别处理的负载被平均分配到网络上的多个分开的服务器上。
       
        (3)N-Best处理
       
        对于有些应用程序,可能需要识别引擎产生可能的识别结果集,而不是一个最好的结果。Nuance系统的N-best识别处理方法便有这个功能,它提供了可能的识别结果列表,并按可能性从高到低排列。
       
        (4)语法概率
       
        Nuance系统允许对呼叫者所讲的特定词语或短语的在语法中的概率进行指定。当被讲的词语或短语的概率可根据实际使用进行估计时,非常有用。对语法增加概率可提高识别的准确率和速度。
       
        (5)降低噪音
       
        当进来的呼叫包含稳定的背景噪音时,Nuance系统通过一种机制,使识别服务器更准确地进行识别。识别服务器将进来的话语进行增强,以有效地将语气、嗡嗡声、哼叫声、嘘嘘声等噪声过滤。如果相当数量的电话均含有稳定的背景噪声,比如在汽车上免提打电话时,这个机制效果较理想。
        4.基于识别的应用
        语音短信本身业务、公司电话簿、个人电话簿、智能点歌、股票查询和交易、智能信息点播、列车时刻查询
       
        (1)基于语音识别的公司电话簿
       
        公司电话薄应用描述
       
        系统能支持多个接入号码,虚拟多个公司的总机。并依靠语音识别技术,智能转接到相应的用户。
       
        流程
       
        用户拨打接入码,系统根据接入码找到相应的公司数据库,同时提醒用户说出相应的用户,系统依据相应的用户查询数据库,并得到该用户的号码,并通知交换机将该号码接通。
       
       
        公司电话簿特点

       
        ●系统支持电话接入方式
       
        用户可通过电话修改个人密码,个人上班电话和非上班电话
       
        ●系统支持WEB接入方式
       
        ●系统管理员可修改所有信息
       
        ●各公司管理员可增加,删除,修改本公司的电话信息
       
        (2)基于语音识别的点歌功能
       
        功能描述
       
        用户接入系统,提示用户说出歌名,并依靠语音识别技术,查找到该歌名,并播放给用户。
         
        应用流程
       
        用户拨打接入码,提示用户说出歌名或歌手名,并依靠语音识别技术,查找到该歌名或歌手名,若为歌名查询数据库,得到该歌存储的路径,并播放给用户,若为歌手名,则读出该歌手的专辑,并提醒用户选择,用户选择后,读出该专辑的歌名,并提醒用户选择,用户选择后,给用户播放该歌曲。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏 分享分享 支持支持 反对反对
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|文字版|手机版|DIY编程器网 ( 桂ICP备14005565号-1 )

GMT+8, 2024-12-27 16:19 , 耗时 0.096168 秒, 21 个查询请求 , Gzip 开启.

各位嘉宾言论仅代表个人观点,非属DIY编程器网立场。

桂公网安备 45031202000115号

DIY编程器群(超员):41210778 DIY编程器

DIY编程器群1(满员):3044634 DIY编程器1

diy编程器群2:551025008 diy编程器群2

QQ:28000622;Email:libyoufer@sina.com

本站由桂林市临桂区技兴电子商务经营部独家赞助。旨在技术交流,请自觉遵守国家法律法规,一旦发现将做封号删号处理。

快速回复 返回顶部 返回列表