首页 文章

Google语音识别如何运作? [关闭]

提问于
浏览
0

我知道音频指纹识别能够识别音频文件并且很棒,但我真正想知道的是Google如何制作语音识别API,他们是如何获取音频和返回文字的 .

我写了一个宝石来指纹wav音频文件并进行比较,但是如果我使用指纹将我的声音与充满指纹的数据库进行比较,那么它可能会花费很长时间 . 谷歌如何做到这一点?

Purpose:

我真的很喜欢语音识别,我想要一个地方开始编码,但我不知道从哪里开始 . DragonVoice是语音识别软件的另一个例子,所有这些软件都非常快 .

我想知道从获取音频记录到将其转换为文本的服务器流程 .

1 回答

  • 3

    使用来源,卢克:-)

    最佳的开源语音识别软件(imho):CMUSphinx http://cmusphinx.sourceforge.net/

    学习曲线有点陡峭,但它应该值得...

    FWIW,Stackoverflow上标签语音识别的描述说:语音识别是指识别谈话的人,并经常误用“语音识别” - 识别所说的内容 .

    如上所述,这是一个非常常见的错误:-)

    玩得开心 !

相关问题