百度开放四大全新语音技术将提升用户人
机交互体验
11月22 日百度宣布在其语音开放平台上线三周年之际 向公众开放四项全新语音技术的接口 以使用户在使用语音与机器进行交流时享受到更奇妙的交互体验。
百度公司首席科学家吴恩达简单介绍了这四项深具革命性的语音技术 即情感合成、远场方案、唤醒二期技术和长语音方案并宣布即日起百度将这几项技术免费开放给用户和开发者共享。
“这些技术有很大的潜力去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会将为人机交互带来巨大的改变。 ”吴恩达表示。
这些技术旨在解决用户在使用语音交互的场合时普遍感到困扰的一些关键问题。例如百度情感合成技术主要聚焦在为合成语音“加入情感” 目前可达到接近真人发声效果百度今年早些时候曾利用此技术复原已逝明星张国荣的声音。
类似地开发者还可以利用新的接口使语音识别距离增加到3-5米将设备的语音唤醒率提升到95%以上同时更省电误报更少或提升长时间语音识别的准确率问题。这
将为语音技术带来远比现在更多的想象空间而不只是遥控电视或解锁手机。
例如前两者的代表是百度的“小度机器人人机语音交互点餐”已在上海肯德基旗舰店投入应用可远距离随时应答点餐。后者则已经在诸多内容记录、智能客服、视频转写等应用场景表现出巨大的想象空间。
在这场名为“极智开放·共语未来”的庆典上来自斯坦福大学的人工智能专家James Landay也分享了一项与百度合作的最新研究成果该研究发现智能手机在语音输入时输入速度比键盘输入快3倍。他表示 “近两年受益于大数据和深度学习技术的不断发展语音识别技术突飞猛进速度及准确性都有了长足进步。 ”
吴桂林打开视频应用“爱奇艺”的手机客户端说“VIP续费”系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出借助百度语音开放平台每天有百万以上的爱奇艺用户使用语音搜索其中80%以上转化为有效点击。
读者甘肃数码科技有限公司总经理金大时认为语音开放平台的价值并不止于商业。 “读者数字农家书屋”已在甘肃庆阳市试点成功完成了65个新农村“数字农家书屋”。他表示 “很多不识字的老年人和留守儿童语音合成让他们也享受到了阅读的乐趣。 ”
目前百度语音开放平台的合作伙伴已涵盖多个领域
和场景包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、 SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。
“语音是人类交流最自然的方式通过开放语音技术百度希望可以引领语音功能产品的繁荣发展。 ”吴恩达表示。
据悉百度语音开放平台自2013年10月上线以来每日在线语音识别要求从2013年的500万上升到今天的1亿4千万在线语音合成每日请求达2亿开发者数量超过
14万。
在技术指标方面百度语音识别准确率目前已高达97%居于全球领先。今年2月百度深度语音识别系统DeepSpeech 2入选MIT 2016十大突破技术。包括语音技术在内的
百度大脑入选2016第三届乌镇世界互联网大会15大领先科技成果成为国内唯一入选的综合型人工智能技术。
RAKsmart发布了9月份优惠促销活动,从9月1日~9月30日期间,爆款美国服务器每日限量抢购最低$30.62-$46/月起,洛杉矶/圣何塞/香港/日本站群大量补货特价销售,美国1-10Gbps大带宽不限流量服务器低价热卖等。RAKsmart是一家华人运营的国外主机商,提供的产品包括独立服务器租用和VPS等,可选数据中心包括美国加州圣何塞、洛杉矶、中国香港、韩国、日本、荷兰等国家和地区数据中心(...
halocloud怎么样?halocloud是一个于2019下半年建立的商家,主要提供日本软银VPS,广州移动VDS,株洲联通VDS,广州移动独立服务器,Halo邮局服务,Azure香港1000M带宽月抛机器等。日本软银vps,100M/200M/500M带宽,可看奈飞,香港azure1000M带宽,可以解锁奈飞等流媒体,有需要看奈飞的朋友可以入手!点击进入:halocloud官方网站地址日本vp...
DiyVM是一家成立于2009年的国人主机商,提供的产品包括VPS主机、独立服务器租用等,产品数据中心包括中国香港、日本大阪和美国洛杉矶等,其中VPS主机基于XEN架构,支持异地备份与自定义镜像,VPS和独立服务器均可提供内网IP功能。商家VPS主机均2GB内存起步,三个地区机房可选,使用优惠码后每月69元起;独立服务器开设在香港沙田电信机房,CN2线路,自动化开通上架,最低499元/月起。下面以...