info@icroute.
com第页1LD3320语音识别芯片(单芯片/非特定人/动态编辑识别列表语音识别解决方案)用声音去沟通VUI(VoiceUserInterface)ICRoute用声音去沟通VUI(VoiceUserInterface)Web:www.
icroute.
comTel:021-68546025Mail:info@icroute.
cominfo@icroute.
com第页2一一一一、、、、.
.
.
.
语音识别芯片介绍语音识别芯片介绍语音识别芯片介绍语音识别芯片介绍LD3320是一颗基于非特定人语音识别(SI-ASR:Speaker-IndependentAutomaticSpeechRecognition)技术的语音识别/声控芯片.
提供了真正的单芯片语音识别解决方案.
LD3320芯片上集成了高精度的A/D和D/A接口,不再需要外接辅助的Flash和RAM,即可以实现语音识别/声控/人机对话功能.
并且,识别的关键词语列表是可以动态编辑的.
基于LD3320,可以在任何的电子产品中,甚至包括最简单的51作为主控芯片的系统中,轻松实现语音识别/声控/人机对话功能.
为所有的电子产品增加VUI(VoiceUserInterface)语音用户操作界面.
主要特色功能:非特定人语音识别技术非特定人语音识别技术非特定人语音识别技术非特定人语音识别技术::::不需要用户进行录音训练可动态编辑的识别关键词语列表可动态编辑的识别关键词语列表可动态编辑的识别关键词语列表可动态编辑的识别关键词语列表::::只需要把识别的关键词语以字符串的形式传送进芯片,即可以在下次识别中立即生效.
比如,用户在51等MCU的编程中,简单地通过设置芯片的寄存器,把诸如"你好"这样的识别关键词的内容动态地传入芯片中,芯片就可以识别这样设定的关键词语了.
真正单芯片解决方案真正单芯片解决方案真正单芯片解决方案真正单芯片解决方案::::不需要任何外接的辅助Flash和RAM,真正降低系统成本.
内置高精度内置高精度内置高精度内置高精度A/DA/DA/DA/D和和和和D/AD/AD/AD/A通道通道通道通道::::不需要外接AD芯片,只需要把麦克风接在芯片的AD引脚上;可以播放声音文件,并提供550mW的内置放大器.
高准确度和实用的语音识别效果高准确度和实用的语音识别效果高准确度和实用的语音识别效果高准确度和实用的语音识别效果支持用户自由编辑支持用户自由编辑支持用户自由编辑支持用户自由编辑50505050条关键词语条关键词语条关键词语条关键词语在同一时刻,最多在50条关键词语中进行识别,终端用户可以根据场景需要,随时编辑和更新这50条关键词语的内容.
LD3320芯片外观info@icroute.
com第页3二二二二、、、、语音识别介绍语音识别介绍语音识别介绍语音识别介绍语音识别ASR技术,是基于关键词语列表识别的技术.
只需要设定好要识别的关键词语列表,并把这些关键词语以字符的形式传送到LD3320内部,就可以对用户说出的关键词语进行识别.
不需要用户作任何地录音训练.
语音识别ASR现实意义:ASR技术最重要的现实意义就在于提供了一种脱离按键,键盘,鼠标的基于语音的用户界面VUI:VoiceUserInterface.
使得用户对于产品的操作更快速,更自然.
非特定人语音识别技术ASR,是对几十G的语音数据经语言学家语音模型分析,科学家建立数学模型,并经过反复训练提取基元语音的细节特征,以及提取各基元间的特征差异.
可以得到在统计概率最优化意义上的各个基元语音特征.
最后才由资深工程师将算法以及语音模型转化为硬件芯片以应用在嵌入式系统中.
基于领先的语音识别核心引擎,经过在各大主流手机产品中三年来超过一千万份的量产检验,LD3320提供了可以真正实用的语音识别/声控功能.
ASR技术是基于关键词语列表识别的技术.
每次识别的过程,就是把用户说出的语音内容,通过频谱转换为语音特征,和这个关键词语列表中的条目进行一一匹配,最优匹配的一条作为识别结果.
比如在手机的应用中,这个关键词语列表的内容就是电话本中的人名/手机的菜单命令/T卡中的歌曲名字.
不论这个列表的条目内容是什么,只需要用户设置相关的寄存器,就可以把相应的待识别条目内容以字符形式传递给识别引擎.
LD3320可以识别列表中的关键词,用户说的语音可以是这个列表中任意的关键词语,而且不需要用户在识别前进行任何训练.
识别引擎不关心关键词语列表中的关键词语的内容,可以是命令,人名,歌曲名字,操作指令等等任何的汉字字符串.
每条关键词语最大可以支持的字数,从算法角度是限制在30字以内.
但是从实际情况来看,用户一口气说超过8个字以上的条目时,几乎肯定会出现说错字/说漏字/说多字/打嗝/停顿等情况,这些情况都会严重影响识别并造成识别错误.
因而一般来说,如果要获得理想的识别效果,建议每条关键词语的字数不要过长,避免影响效果.
ASR技术上的局限性在于:ASR不是听写系统ASR不能把人的声音转换为确定的拼音串ASR不能任意地识别人的说话内容info@icroute.
com第页4ASR不能识别关键词语列表中的某个关键词语的一部分内容,除非这一部分内容自身也是一个关键词语ASR不可以识别与关键词语列表中列出的关键词语不相符的情况比如,前后加了"嗯","阿"之类的语气词比如,只说出了关键词语中的一部分而不是整个关键词语比如,没有列在关键词语列表中的词语三三三三、、、、应用场景应用场景应用场景应用场景由于LD3320可以动态编辑的识别关键词语列表,因此其可以应用的范围大大超过了那些不可以改变识别列表的芯片.
同时,LD3320是一颗真正的单芯片解决方案,不需要辅助的外围Flash/RAM/AD,只需要有一颗51级别的单片机芯片就可以控制LD3320,从而降低了系统的成本.
其应用场景主要包括:1.
智能玩具/对话玩具2.
导航仪3.
MP3/MP44.
数码像框5.
机顶盒/彩电遥控器6.
电磁炉/微波炉/洗衣机/智能家电操作7.
PMP/游戏机8.
自动售货机9.
地铁自动售票机10.
导游机11.
楼宇电视的广告点播(请参考"LD3320语音识别芯片应用场景")四四四四、、、、主要技术参数主要技术参数主要技术参数主要技术参数1.
内置单声道mono16-bitA/D模数转换2.
内置双声道stereo16-bitD/A数模转换3.
内置20mW双声道耳机放大器输出4.
内置550mW单声道扬声器放大器输出5.
支持并行接口或者SPI接口6.
内置锁相电路PLL,输入主控时钟频率为2MHz-34MHz7.
工作电压:(VDD:forinternalcore)3.
3V8.
48pin的QFN7*7标准封装9.
省电模式耗电:1uAinfo@icroute.
com第页5LD3320评估板的照片:(其中,控制MCU目前选用的是STC的51单片机)五五五五、、、、联系我们联系我们联系我们联系我们Tel:021-68546025Mail:info@icroute.
com
关于HostDare服务商在之前的文章中有介绍过几次,算是比较老牌的服务商,但是商家背景财力不是特别雄厚,算是比较小众的个人服务商。目前主流提供CKVM和QKVM套餐。前者是电信CN2 GIA,不过库存储备也不是很足,这不九月份发布新的补货库存活动,有提供九折优惠CN2 GIA,以及六五折优惠QKVM普通线路方案。这次活动截止到9月30日,不清楚商家这次库存补货多少。比如 QKVM基础的五个方案都...
在2014年发现原来使用VPS的客户需求慢慢的在改版,VPS已经不能满足客户的需求。我们开始代理机房的独立服务器,主推和HS机房的独立服务器。经过一年多的发展,我们发现代理的服务器配置参差不齐,机房的售后服务也无法完全跟上,导致了很多问题发生,对使用体验带来了很多的不便,很多客户离开了我们。经过我们慎重的考虑和客户的建议。我们在2015开始了重大的改变, 2015年,我们开始计划托管自己...
Megalayer 商家算是比较新晋的国内主机商,主要方向是美国、香港、菲律宾等机房的独立服务器为主,以及站群服务器和显卡服务器。同时也有新增价格并不是特别优惠的VPS云服务器。上午的时候有网友问问有没有CN2线路的美国独立服务器的,这里我推荐他选择Megalayer看看,目前也是有活动截止到月底的。Megalayer 商家创办2年左右时间,如果我们初次使用建议月付体验。目前在进行且可能截止到6月...
info是什么意思为你推荐
压缩软件哪个好解压软件哪个好手动挡和自动挡哪个好自动挡和手动挡哪个好?ps软件哪个好什么PS软件好手机音乐播放器哪个好手机音乐播放器哪个好车险哪个好人保和平安车险哪个好车险哪个好汽车保险买哪个公司的好红茶和绿茶哪个好红茶和绿茶哪个更好?看书软件哪个好手机阅读软件哪个好用?清理手机垃圾软件哪个好清理手机垃圾的软件哪个好51空间登录手机怎么登陆51空间啊
Dedicated googleapps sugarsync 贵州电信宽带测速 php免费空间 绍兴高防 卡巴斯基永久免费版 100m免费空间 jsp空间 域名和空间 能外链的相册 789 监控服务器 数据库空间 万网空间 97rb 阿里云邮箱个人版 免费获得q币 百度新闻源申请 web服务器有哪些 更多