在iOS中同时管理文本到语音和语音识别

提问于 2024-05-03T13:10:06+08:00

浏览次

2

我希望我的 iOS 应用程序使用文本到语音向用户读取从服务器接收的一些信息，我还希望允许用户通过语音命令停止此类语音 . 我已经尝试了类似于_2515784的iOS语音识别框架，我发现它正在监听和检测应用程序本身的信息，并且它在识别用户的语音命令时会产生干扰 .

是否有人在 iOS 处理了这个场景，并为此找到了解决方案？提前致谢

1 回答

1
实施并非易事 . 不幸的是iOS和其他人记录了通过扬声器播放的声音 . 您唯一的选择是使用耳机 . 在那种情况下，语音识别可以继续收听输入 . 在Openears中，除非插入耳机，否则在TTS期间禁用识别 .

如果您仍想实现此功能，称为“插入”，则必须执行以下操作：
- 存储通过麦克风播放的音频
- 实施噪声消除算法，有效地从记录中删除音频 . 您可以使用互相关在记录和谱减法中找到适当的偏移量以删除音频 .
- 识别剩余信号中的语音 .
如果不对开球源进行重大修改，就不可能做到这一点 .

相关问题是Android Speech Recognition while music is playing
回复于 2024-05-03T13:10:06+08:00

相关问题