首页 文章

在iOS中同时管理文本到语音和语音识别

提问于
浏览
2

我希望我的 iOS 应用程序使用文本到语音向用户读取从服务器接收的一些信息,我还希望允许用户通过语音命令停止此类语音 . 我已经尝试了类似于_2515784的iOS语音识别框架,我发现它正在监听和检测应用程序本身的信息,并且它在识别用户的语音命令时会产生干扰 .

是否有人在 iOS 处理了这个场景,并为此找到了解决方案?提前致谢

1 回答

  • 1

    实施并非易事 . 不幸的是iOS和其他人记录了通过扬声器播放的声音 . 您唯一的选择是使用耳机 . 在那种情况下,语音识别可以继续收听输入 . 在Openears中,除非插入耳机,否则在TTS期间禁用识别 .

    如果您仍想实现此功能,称为“插入”,则必须执行以下操作:

    • 存储通过麦克风播放的音频

    • 实施噪声消除算法,有效地从记录中删除音频 . 您可以使用互相关在记录和谱减法中找到适当的偏移量以删除音频 .

    • 识别剩余信号中的语音 .

    如果不对开球源进行重大修改,就不可能做到这一点 .

    相关问题是Android Speech Recognition while music is playing

相关问题