Linux语音控制--BDSpeech

昨天晚上心血来潮...
应该是前天晚上了...
想做个语音控制,太渴望拥有钢铁侠里面那个贾维斯了...
于是白天,查了很多资料....
PC平台并没有免费的开放API,也不像Android,Windows.Mac/IOS,有内置的语音识别接口...
大概搜索到了基于隐含马尔可夫模型的Sphinx,HTK两个开源项目,还有国内什么迅飞语音,不过收费,直接PASS了...
最后确定后期会在Sphinx上投入时间,只不过文档全英文,好蛋疼...
也只能暂时PASS,后来搜索到了GOOGLE非公开API,用于chromium/chrome语音识别项目...
API到是挺简单的,POST语音文件,得到识别后的文本...

所以后来做的这个BDSpeech也只能根据返回的文本做逻辑处理,并不具有根据多次训练达到准确识别这一条件..
虽然后来加了个HashMap,模糊文本检索,能准确识别几个命令,但也特么的蛋疼....
比如,我要打开chrome,我说open chrome,准确率在10%左右,我说google chrome,准确率在80%左右,说open goole chrome在75%左右...
虽然用个HashMap和模糊文本检索能解决这个问题,还有那些完全不是我想要的意思,完全不能识别的,那真是心碎啊...
想想要是提供处理后的特征码,特征模板什么的,那这个问题大概也好解决了...
BDSpeech,现在也就一个人玩玩,能打开我常用的软件游戏什么的...
想想以后还是认真研究哈语音识别,希望在 Sphinx上能取得一点点进步去完善BDSpeech..
一个心血来潮的作品, 感觉弱暴了,认真投身算法,毕业前做个像样的... 写了一天的程序,发现,我也只能写程序了,不然就只能发呆.. 好安静...

BreezeDust

继续阅读我的更多文章