我想知道我是否可以使用JavaScript自动将错误定时的字幕文件与相应的音频或视频轨道对齐 .

我知道语音识别API,这可能会有所帮助,但我不知道有什么办法将音频流输入其中,而不是麦克风输入 . 关于MDN的文档让我觉得这可能是可能的,但是谁知道呢?

提供从音频输入(通常通过设备的默认语音识别服务)识别语音上下文的能力,并进行适当的响应

要明确:我正在寻找一个仅限JavaScript的解决方案 . 我不想在设备本身上重新路由输入和输出流 .