Google Cloud Speech API要求您将sync recognition mode用于运行时间不到一分钟的音频文件,如果音频文件超过一分钟则使用async recognition mode .
如何基于音频文件大小来分析用于获取脚本的接口?或者如何找到音频durig转录的总时间或如何处理这种情况?
Google Cloud Speech API要求您将sync recognition mode用于运行时间不到一分钟的音频文件,如果音频文件超过一分钟则使用async recognition mode .
如何基于音频文件大小来分析用于获取脚本的接口?或者如何找到音频durig转录的总时间或如何处理这种情况?
1 回答
音频文件大小与确定音频持续时间无关,因为音频文件由多个音频样本组成(此样本总数取决于每秒采集的音频样本数,以赫兹为单位),每个具有给定大小的样本(编码样本需要多少位) .
您可能会发现sox实用程序及其
soxi
程序可用于确定音频文件的持续时间 .soxi
将解析音频文件的 Headers 以提供该信息 . 以下是WAV文件的示例:这有帮助!