语音识别和getUserMedia-Java 学习之路

我正在构建一个Web应用程序，并计划使用speechRecognition和navigator.getUserMedia进行音频输入 .

我注意到我的桌面浏览器（Mac上的Chrome，版本31.0.1650.63）要求两次获得使用麦克风的权限 . 虽然这对用户来说可能有点烦人，但语音识别和音频输入似乎都有效 .

但是，如果我在Android上打开相同的页面（Nexus 7，Android v4.4.2; Chrome v31.0.1650.59），它会要求两次使用我的麦克风，但我只能使用其中一个（以哪个开始）第一） . 有时，即使我允许访问麦克风，我也会收到语音识别错误 error: "not-allowed" 错误 .

我做了一个jsFiddle，这里：http://jsfiddle.net/5xBpW/

我的问题是：有没有办法在输入流上执行语音识别？或者，有没有其他方法可以在Chrome for Android上使用这两种功能？

1 回答

1

你考虑过其他工具吗？ Nuance有一个令人兴奋的新工具/产品（由Ray K创建，现在是Google Engineering的负责人），它使用专有学习算法（例如机器智能）将语音数据转换为动作 .

此工具了解上下文并可将其应用于特定操作，因此用户不必使用完全短语：

https://developer.nuance.com/public/index.php?task=mix

旅游：https://developer.nuance.com/views/templates/mix/howDoesMixWork/phone/index.html

缺点是您依赖于第三方，但由于您正在寻找的API也是实验性的，因此可能会引起关注 .

回复于 2024-05-02T22:40:50+08:00

语音识别和getUserMedia

1 回答

相关问题