-
0 votesanswersviews
Google Speech to Text API不适用于超过一分钟的音频文件
我正在尝试使用Google Speech to Text API转换具有以下属性的音频文件 1)原始文件2)采样率:16000 3)比特率:16 4)音频类型:单声道 我使用以下Python代码来获取文本文件 service_request = service.speech().asyncrecognize( body={ 'config': { ... -
1 votesanswersviews
反应本机录音和谷歌语音API
我'm using Expo' s Audio library记录用户语音,并将其发送到Google Speech API进行翻译 . 唯一匹配Google speech's accepted encoding的格式是 AMR_WB . 但是,我无法找到任何React Native音频库来播放 AMR_WB 文件( 3gp 扩展名) . 允许翻译和回放用户的录音是核心要求 . 关于我能做什么的任... -
0 votesanswersviews
使用Xamarin将麦克风音频流式传输到Google语音到文本
我正在尝试编写一个应用程序,将音频从手机麦克风流式传输到谷歌语音到文本API并在设备上实时显示 . 我从这里和那里得到点点滴滴,但没有任何东西允许我复制谷歌在其“https://cloud.google.com/speech-to-text/”网站上提供的演示 . 有没有人有从Xamarin流式传输音频的经验,并将其发送到API并在仍然流式传输音频的同时接收响应? -
1 votesanswersviews
谷歌演讲中的一些问题
谷歌演讲有点问题 . 我在FLAC中有一个音频文件但是当通过谷歌语音发送该音频时,响应会错过一些像是,不,好的话 . 有人发生了同样的事情 . 我使用的是PHP 7.1和Beta API版本: 这是我的代码: $ encoding = RecognitionConfig \ AudioEncoding :: FLAC; $ languageCode ='en-US'; $config = new ... -
2 votesanswersviews
从cordova-plugin-audioinput到Google Speech API的音频流
对于使用Meteor框架的跨平台应用程序项目,我想录制麦克风输入并提取语音,这要归功于Google Speech API 在Google文档之后,我更具体地尝试构建音频流来为Google语音客户端提供信息 . 在客户端,录制按钮触发以下 startCapture 函数(基于cordova audioinput plugin): export var startCapture = function ... -
1 votesanswersviews
Google Cloud语音API中的转录文件大小
Google Cloud Speech API要求您将sync recognition mode用于运行时间不到一分钟的音频文件,如果音频文件超过一分钟则使用async recognition mode . 如何基于音频文件大小来分析用于获取脚本的接口?或者如何找到音频durig转录的总时间或如何处理这种情况? -
0 votesanswersviews
加拿大的Google Speech API合规性
我正在与之合作的客户希望使用Google Speech API来转录音频,但存在合规问题 . 我知道您可以直接上传文件或在Google Cloud 端存储中拥有API访问文件 . 对于这些方法中的任何一种,是否有人熟悉它们如何与加拿大的数据合规性法律相互作用? 例如,如果将音频文件上传到蒙特利尔数据中心的 Cloud 存储桶,并且我们对其进行API调用,该文件是否会离开该数据中心? 提前感谢任何见... -
1 votesanswersviews
如何在Google Speech API中转录大文件?
我如何转录大文件以避免使用Google Speech API异步转录为大型音频文件发生错误 Operation not complete and retry limit reached. ? 可能的解决方案 If the operation has not completed, you can poll the endpoint by repeatedly making the GET reque... -
2 votesanswersviews
浏览器中的离线语音识别
我正在开发一种产品,需要从用户那里获取输入并根据它进行某些操作 . 我们通过打字通过聊天框实现了它,它正在服务于我们的目的 . 对于将来的版本,我们希望在聊天窗口中添加语音识别功能 . 我们考虑过使用 window.speechRecognition()|| window.webkitSpeechRecognition() 但我们发现浏览器中功能可用的是Google的Cloud Speech ... -
0 votesanswersviews
运行时出现Google Speech API React-Native错误
尝试将Google语音转换为文本API到React-Native . 这是我到目前为止的代码 . 我得到的错误是:“捆绑失败:错误: 无法从/Users/Desktop/finalTest/final3/App.js解析模块fs:Haste模块映射中不存在模块fs“ . 我尝试运行建议的命令,但它仍然无法正常工作: 清晰的守望者 Watch :守望者 Watch - 所有 . 删除node... -
0 votesanswersviews
使用Google Speech API rpc服务帐户的Google Oauth2无效
我正在开发一个Android应用程序,目前使用谷歌语音通过谷歌 Cloud 流式传输文本Speech API,但是我无法让身份验证工作 . 我想使用OAuth2和来自Google服务帐户的authkey.json在Google Cloud API上进行身份验证 . 我使用包 google.cloud.speech.v1beta1 中的 SpeechGrpc.SpeechStub 类来调用RPC方法... -
1 votesanswersviews
Google语音API超时时间
我正在尝试使用Speech API客户端API将音频文件转换为文本 . 到目前为止,我已经成功转换了一个短的音频剪辑,但现在有一个更长的文件(10分钟),我得到这个错误: Retry total timeout exceeded before anyresponse was received 我已经在docs中读到,对于异步呼叫,每个呼叫的最大分钟数为60,并且我已将文件上传到Google Cl... -
6 votesanswersviews
Google语音中的用户数据隐私到文本api / Google Cloud 语音解决方案
当我使用Google语音文本api或谷歌 Cloud 语音解决方案时,保持了什么级别的数据隐私 . 我想知道这一点,因为我正在开发一个将音频文件转换为文本的应用程序,这些文件可能包含用户敏感数据 . -
3 votesanswersviews
如何正确地将音频文件发送到Google Speech API?
我正试图通过以下演示在Android中实现Google Speech API:https://github.com/GoogleCloudPlatform/android-docs-samples 通过使用位于R.raw中的给定“audio.raw”文件,我能够在我的应用程序中成功重现该示例,一切都运行良好 . 但是,当我尝试使用自己的音频文件时,它返回“API成功”而没有任何转录文本 . 我不确... -
3 votesanswersviews
使用C#的Google语音识别REST API出现错误请求错误
我想在C#中使用Google Speech Recognition API Rest . 我想使用API Rest而不是客户端库的原因是因为我想使用Unity3D,它目前不支持客户端库 . 我使用HttpClient连接和Newtonsoft Json序列化json(我现在正在使用Windows窗体,当它在Winforms中工作时将移动到Unity) . 我总是收到来自Google的错误请求回复,... -
0 votesanswersviews
为什么我在谷歌语音API中丢失了太多文本?
我已经花了一天的时间来了解使用谷歌语音API的最佳实践 . 这是我的最后一次尝试 . 在这里,我们将使用在线资源,以确保我们有相同的音频 . 另一个要求是你需要 ffmpeg 将mp3转换为谷歌API所需的格式 . audio information: 歌手:阿黛尔 歌:追逐路面 可能的languange:en-GB(阿黛尔起源)或en-US 采样率:44100Hz Chann... -
0 votesanswersviews
PHP Google语音API问题 - 超时,SSL错误
我正在使用Google Speech API,但它确实不稳定且实际上无法使用 . 我正在尝试API的同步/异步服务,但结果是一样的 . 以下是我的代码示例,即使用异步服务来转录音频: putenv('GOOGLE_APPLICATION_CREDENTIALS=E:\PHP\google.json'); # Your Google Cloud Platform project ID ... -
12 votesanswersviews
Google Speech API和Web Speech API之间存在差异
我正在进行网络语音识别 . 我发现Google为开发人员提供了一个称为“Google speech API V2”的API . 但我注意到每天都有限制使用它 . 之后我发现有一个原生的WEB Speech API也可以实现语音识别 . 它只是在谷歌Chrome和歌剧: http://caniuse.com/#feat=speech-recognition 那么1.什么是不同的Google Spee... -
0 votesanswersviews
如何在使用Google Cloud Speech API时实施服务器以接收访问令牌
此代码是在Android上调用“credential.json”文件并获取“访问令牌”的代码 . 这个应用程序的服务器是python并通过http进行通信 . (用于处理app数据的服务器而不是用于访问令牌的服务器) https://github.com/GoogleCloudPlatform/android-docs-samples/tree/master/speech/Speech 上面链接... -
1 votesanswersviews
为什么Google语音识别API仅返回前2-3秒转换后的音频文本
我在Google Cloud Console中创建了一个项目,并在此项目中启用了Google Speech API,并创建了凭据 . 还使用了Google推荐的transcribe.py, https://cloud.google.com/speech/docs/samples https://github.com/GoogleCloudPlatform/python-docs-samples/t... -
2 votesanswersviews
Google Speech API Python异常:指定FLAC编码以匹配文件头?
我正在运行此处发布的Google Speech API Python的示例代码:https://googlecloudplatform.github.io/google-cloud-python/stable/speech-usage.html 我要去异步识别方法(只允许使用LINEAR16编码): 导入Google Cloud客户端库 from google.cloud import speec... -
0 votesanswersviews
通过服务帐户创建的实例无法使用Google Cloud Speech API - 身份验证错误
我按照Google针对Speech API的快速入门文档启用了帐户的结算和API . 此帐户已授权服务帐户代表其创建Compute实例 . 在子帐户上创建实例后,托管二进制文件以使用Speech API,我无法在C#语音示例中成功使用Google提供的示例C#代码: try { var speech = SpeechClient.Create(); ... -
0 votesanswersviews
多个用户如何同时使用Google Cloud 语音
我正在构建一个使用Google Cloud Speech的应用 . 我的应用中有一个Google服务帐户密钥,我用它来调用API . 它在一个用户使用时效果很好,但在多个用户同时使用它时不起作用 . 例如,只有一个用户可用或全部不可用 . 服务帐户密钥的权限是项目所有者 . 我认为这是服务帐户的关键问题......如何解决? private class AccessTokenTask extend... -
1 votesanswersviews
Google语音API内部服务器错误-83104
我刚刚接触Google speech API并试图让official Node.js demo工作 . 但是,当我使用.flac文件(来自我的手机并进行转换)来测试演示时,我从Google语音API服务器收到此错误: Got audio file! Analyzing speech... { Error: Aborted: internal server error -83104 at R... -
3 votesanswersviews
为什么Google Cloud Speech API不会转录整个音频文件?
我正在尝试使用Google Cloud Speech API(异步)转录一个简短的采访音频文件,但它只转录录制的前半分钟 . 我有几次尝试录音的时间超过一分钟,结果是一样的 . 我的问题是,如何实现给定文件的完整音频转录? 你可以在这里找到我的一个用例: 上传音频文件: POST https://speech.googleapis.com/v1beta1/speech:asyncrecognize... -
0 votesanswersviews
Google Speech API速度更快,采样率更高
我正在使用Google Cloud Speech API Python库从视频文件中提取文本 . 在先前的步骤中,视频文件被转换为flac audiofile . sample_rate = 48000 client = speech.Client() cmd = "ffmpeg -i {} -vn -ac 1 -ar {} {}".format(mpg_file, samp... -
0 votesanswersviews
超出了Google语音配额
当我致电Google Speech API时,我经常收到以下错误消息 . 这个错误发生在昨天 . 错误:{[错误:超出配额 . ]代码:8,元数据:元数据{_internal_repr:{}},注意:'Exception occurred in retry method that was not classified as transient'} 我的访问次数非常少 . 它没有达到限制(每100秒... -
2 votesanswersviews
当我的音频包含长时间的静音时,如何让Google Speech API不会失败?
我正在使用Google Speech API转录音频,使用long-running-recognize endpoint通过Python Cloud Speech API Client Library . 我的音频文件通常是15-90分钟 . 在大多数情况下,API调用工作正常,返回我的音频转录 . 但是,如果我的音频包含长时间的静音(大约超过一分钟),则转录失败 . Python客户端库调用返... -
2 votesanswersviews
Google Cloud语音转文本API - 无限期等待
我正在尝试使用Google Cloud Speech-to-Text API . 我根据API文档理解将mp3音频文件格式转换为.raw,并上传到存储桶 . 这是我的代码: def transcribe_gcs(gcs_uri): """Asynchronously transcribes the audio file specified by the gcs... -
1 votesanswersviews
Google Cloud Speech:单词开始时间
我'm looking at using Google Cloud Speech to convert long-form narrated audio files and I need to know the start time of each phrase in the audio file. Is there a way to do this with Google Cloud Speec...