我正在构建一个Web应用程序,并计划使用speechRecognition和navigator.getUserMedia进行音频输入 .
我注意到我的桌面浏览器(Mac上的Chrome,版本31.0.1650.63)要求两次获得使用麦克风的权限 . 虽然这对用户来说可能有点烦人,但语音识别和音频输入似乎都有效 .
但是,如果我在Android上打开相同的页面(Nexus 7,Android v4.4.2; Chrome v31.0.1650.59),它会要求两次使用我的麦克风,但我只能使用其中一个(以哪个开始)第一) . 有时,即使我允许访问麦克风,我也会收到语音识别错误 error: "not-allowed"
错误 .
我做了一个jsFiddle,这里:http://jsfiddle.net/5xBpW/
我的问题是:有没有办法在输入流上执行语音识别?或者,有没有其他方法可以在Chrome for Android上使用这两种功能?
1 回答
你考虑过其他工具吗? Nuance有一个令人兴奋的新工具/产品(由Ray K创建,现在是Google Engineering的负责人),它使用专有学习算法(例如机器智能)将语音数据转换为动作 .
此工具了解上下文并可将其应用于特定操作,因此用户不必使用完全短语:
https://developer.nuance.com/public/index.php?task=mix
旅游:https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html
缺点是您依赖于第三方,但由于您正在寻找的API也是实验性的,因此可能会引起关注 .