百度开放四大全新语音技术将提升用户人
机交互体验
11月22 日百度宣布在其语音开放平台上线三周年之际 向公众开放四项全新语音技术的接口 以使用户在使用语音与机器进行交流时享受到更奇妙的交互体验。
百度公司首席科学家吴恩达简单介绍了这四项深具革命性的语音技术 即情感合成、远场方案、唤醒二期技术和长语音方案并宣布即日起百度将这几项技术免费开放给用户和开发者共享。
“这些技术有很大的潜力去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会将为人机交互带来巨大的改变。 ”吴恩达表示。
这些技术旨在解决用户在使用语音交互的场合时普遍感到困扰的一些关键问题。例如百度情感合成技术主要聚焦在为合成语音“加入情感” 目前可达到接近真人发声效果百度今年早些时候曾利用此技术复原已逝明星张国荣的声音。
类似地开发者还可以利用新的接口使语音识别距离增加到3-5米将设备的语音唤醒率提升到95%以上同时更省电误报更少或提升长时间语音识别的准确率问题。这
将为语音技术带来远比现在更多的想象空间而不只是遥控电视或解锁手机。
例如前两者的代表是百度的“小度机器人人机语音交互点餐”已在上海肯德基旗舰店投入应用可远距离随时应答点餐。后者则已经在诸多内容记录、智能客服、视频转写等应用场景表现出巨大的想象空间。
在这场名为“极智开放·共语未来”的庆典上来自斯坦福大学的人工智能专家James Landay也分享了一项与百度合作的最新研究成果该研究发现智能手机在语音输入时输入速度比键盘输入快3倍。他表示 “近两年受益于大数据和深度学习技术的不断发展语音识别技术突飞猛进速度及准确性都有了长足进步。 ”
吴桂林打开视频应用“爱奇艺”的手机客户端说“VIP续费”系统准确跳转到了相应的充值页。这位爱奇艺技术总监指出借助百度语音开放平台每天有百万以上的爱奇艺用户使用语音搜索其中80%以上转化为有效点击。
读者甘肃数码科技有限公司总经理金大时认为语音开放平台的价值并不止于商业。 “读者数字农家书屋”已在甘肃庆阳市试点成功完成了65个新农村“数字农家书屋”。他表示 “很多不识字的老年人和留守儿童语音合成让他们也享受到了阅读的乐趣。 ”
目前百度语音开放平台的合作伙伴已涵盖多个领域
和场景包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、 SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程、手机QQ阅读等。
“语音是人类交流最自然的方式通过开放语音技术百度希望可以引领语音功能产品的繁荣发展。 ”吴恩达表示。
据悉百度语音开放平台自2013年10月上线以来每日在线语音识别要求从2013年的500万上升到今天的1亿4千万在线语音合成每日请求达2亿开发者数量超过
14万。
在技术指标方面百度语音识别准确率目前已高达97%居于全球领先。今年2月百度深度语音识别系统DeepSpeech 2入选MIT 2016十大突破技术。包括语音技术在内的
百度大脑入选2016第三届乌镇世界互联网大会15大领先科技成果成为国内唯一入选的综合型人工智能技术。
RAKSmart 商家最近动作还是比较大的,比如他们也在增加云服务器产品,目前已经包含美国圣何塞和洛杉矶机房,以及这个月有新增的中国香港机房,根据大趋势云服务器算是比较技术流的趋势。传统的VPS主机架构方案在技术层面上稍微落后一些,当然也是可以用的。不清楚是商家出于对于传统VPS主机清理库存,还是多渠道的产品化营销,看到RAKSmart VPS主机提供美国、香港和日本机房的半价促销,当然也包括其他...
EdgeNat 商家在之前也有分享过几次活动,主要提供香港和韩国的VPS主机,分别在沙田和首尔LG机房,服务器均为自营硬件,电信CN2线路,移动联通BGP直连,其中VPS主机基于KVM架构,宿主机采用四路E5处理器、raid10+BBU固态硬盘!最高可以提供500Gbps DDoS防御。这次开年活动中有提供七折优惠的韩国独立服务器,原生IP地址CN2线路。第一、优惠券活动EdgeNat优惠码(限月...
中秋节快到了,spinservers针对中国用户准备了几款圣何塞机房特别独立服务器,大家知道这家服务器都是高配,这次推出的机器除了配置高以外,默认1Gbps不限制流量,解除了常规机器10TB/月的流量限制,价格每月179美元起,机器自动化上架,一般30分钟内,有基本自助管理功能,带IPMI,支持安装Windows或者Linux操作系统。配置一 $179/月CPU:Dual Intel Xeon E...