-
0 votesanswersviews
语音识别(语音到文本 - STT cordova插件)
我在 Ionic2 框架中寻找 speech recognition 与cordova plugin . 如果可以实现,你可以轻轻提供一个代码示例(.html和.ts)吗? 我找到了这个,但是对于Ionic1:http://devgirl.org/2016/01/08/speaking-with-cordova/,我无法调整Ionic2的代码 . 我非常感谢你能提供的任何帮助,对不起我的小英语... -
6 votesanswersviews
以.3gp或wav格式录制的音频文件的语音识别[重复]
可能重复:Android上的语音识别与录制的声音剪辑? 我正在开发一个Android应用程序,它将音频录制到文件,然后使用语音识别从录制的语音中获取文本 . 是否有语音识别库可用于此类任务?我该如何开始? -
4 votesanswersviews
使用TensorFlow进行端到端语音识别的RNN
我没有成功使用TensorFlow训练RNN for Speech to text问题 . 我已决定使用纯FFT(即频谱图)作为训练数据来再现Alex Graves, and Navdeep Jaitley, 2014中描述的方法的结果,并且编码3层双向RNN,每个具有300个LSTM单元 . 我想描述从预处理音频信号到解码日志所遵循的步骤 . 预处理: 来自matplotlib.mlab的已... -
0 votesanswersviews
Python中的Inproc语音识别引擎
我目前正在使用PySpeech识别语音 . 我试图在没有Windows语音识别的默认命令的情况下启动语音识别 . 从谷歌搜索,我发现在speech.py中更改此行: _recognizer = win32com.client.Dispatch("SAPI.SpSharedRecognizer") 至: _recognizer = win32com.client.Dispatch... -
2 votesanswersviews
Microsoft语音识别引擎在语法之间切换
所以我有这个语音识别代码,我一直在使用微软的语音识别引擎 . 不幸的是,在理解语音方面并不是那么棒,所以我一直在想办法解决这个问题 . 其中之一是在特定语法和一般字典语法之间切换 . 我似乎无法弄清楚如何在不承认给定语音的情况下在语法之间切换 . 如果有人可以帮我弄清楚如何构造这个,那么只要我的命令列表语法无法识别所拾取的语音,就可以将我的commandList语法切换到DictationGram... -
0 votesanswersviews
如何让语音识别插件适用于离子v 1?
我正在使用Ionic 1.3.5,AngularJS 1.5.3和Cordova Cli 8开发应用程序 . 我的应用程序必须适用于Android和iOS . 我想在我的应用程序中添加语音识别功能,但对于Ionic v1来说似乎没有太多选择 . 我试着用这个:https://github.com/pbakondy/cordova-plugin-speechrecognition 但它只能与Ioni... -
3 votesanswersviews
W3C语音到文本:在您说话时输出值
我一直在我的应用程序中使用W3C Speech Synthesizer用于网络 . 我说话了 . 目前,规范中的 result 事件等待在不说话的一秒左右后追加整个数组 . 我已经查看了标准,但我发现它只是等待从结果事件构造最终结果列表: 5.1.3 SpeechRecognition Events 结果事件:语音识别器返回结果时触发 5.1.8 SpeechRecognitionEvent re... -
0 votesanswersviews
语音识别引擎和复选框的困难时期
我很难将此代码与复选框结合使用 . 我希望代码在启用复选框时运行(true)并在禁用复选框时停止(false)但由于某种原因我不能并且我想要一些帮助 . 如果有人有解决方案或某些不同的建议,我将不胜感激 . 代码是: private void Form1_Load(object sender, EventArgs e) Choices cities = new Choices(new string... -
3 votesanswersviews
为什么Google Cloud Speech API不会转录整个音频文件?
我正在尝试使用Google Cloud Speech API(异步)转录一个简短的采访音频文件,但它只转录录制的前半分钟 . 我有几次尝试录音的时间超过一分钟,结果是一样的 . 我的问题是,如何实现给定文件的完整音频转录? 你可以在这里找到我的一个用例: 上传音频文件: POST https://speech.googleapis.com/v1beta1/speech:asyncrecognize... -
2 votesanswersviews
语音到phonegap / android中的文本
我正在开发一个android / phonegap应用程序 . 我有一张表格由客户填写 . 我的客户希望我设计一个可以接收语音输入并将其转换为文本的表单 . 现在,我有以下一系列问题/澄清, 每台运行2.1以上的Android手机都具有语音搜索功能,因此无需在应用程序中添加该功能? 如果我在我的应用程序中实现该功能,我应该在哪里实现 - 在android或phonegap中? . 我想在... -
27 votesanswersviews
良好的语音识别API
我正在开展一个大学项目,我正在使用语音识别 . 目前我正在Windows 7上开发它,我正在使用与.net一起提供的system.speech API包,我正在C#上进行 . 我面临的问题是听写识别不够准确 . 然后每当我启动应用程序时,桌面语音识别都会自动启动 . 这对我来说是一个很大的麻烦 . 正如我所说的话已经不够清楚,并且冲突的识别被解释为正在执行诸如应用程序切换最小化之类的命令和动作 .... -
1 votesanswersviews
用于语音识别系统的免费API
我正在寻找一个免费的语音识别API,可以在我的应用程序中使用,它可以提供最好的结果 . 在谷歌搜索我发现很少包括Windows语音识别宏 . 但我的应用程序的任务是比Windows语音识别系统更好 . 所以,你作为一个程序员,意识到一个非常好的语音识别系统 . 我在SO上发现了类似的问题但他们处理的是不同的情况 . -
0 votesanswersviews
没有语法文件的语音识别
我正在尝试使用.Net的语音识别功能将单词转换为文本 . 虽然,我见过的每个地方都在使用语法文件 . 有没有办法可以在没有一个人的情况下检测语音? -
2 votesanswersviews
Annyang语音识别文件
你能用Annyang.js从文件中识别语音吗?具体而言,该文件将包含简单的预定义命令,如简单的单词,字母或数字 . 基本上,我想要做的是从音频文件而不是麦克风获取Annyang的输入 . 如果这不是正确的方法,有人可以建议如何做到这一点? -
0 votesanswersviews
如何使用语音识别结果来过滤/搜索元素
我正在尝试制作一个读出的网站,其中包含我们只能读出的长文本,而不需要任何滚动 . 但我对纯JS并不是很好,而且我有点失落 . 我尝试了语音识别,并在第二次制作过滤器/搜索列表 . 在另一方面,我正在把 <p> 中的每个单词分别在 <spans> 中分开,因为我想我必须做出类似“当你听到 <span>1</span> 时,你等着听 <span&g... -
1 votesanswersviews
文本到语音和语音到文本识别 - >自我识别正在发生
我想开发一个应该支持语音到文本和文本到语音的应用程序, i)语音到文本 - 程序 - 我使用语音框架进行语音到文本,每当我打开一个应用程序,如果我开始说话,应用程序应该识别语音,并应将语音转换为文本 . 这是工作 ii)文本到语音 - 过程-i已使用AVFoundation和MediaPlayer库如果用户按下播放按钮,它应该将文本,即屏幕上出现的任何内容转换为语音 . 立即工作 . 这是在处理文... -
0 votesanswersviews
在Java中使用Voce语音识别
我一直在努力让语音识别能够在Java应用程序上运行,我已经尝试过Sphinx但是它太复杂了我所需要的,所以我找到了Voce . 我正在努力让识别演示工作 . 问题是我无法初始化SpeechInterface,这是我一直在使用的代码: voce.SpeechInterface.init("C:/Users/G/Documents/NetBeansProjects/VoceTest/lib&... -
0 votesanswersviews
Windows Phone 8.1应用程序中的语音识别器在线
我在Windows Phone 8.1应用程序中的语音识别问题很严重 .我的代码(我在Google中发现了类似的内容): private SpeechRecognizer speechRecognizer; public async Task InitializeSpeechRecognizerAsync() { speechRecognizer = new SpeechRecogniz... -
1 votesanswersviews
访问匿名类之外的变量
我目前正在使用IBM Watson java SDK中包含的IBM的Speech to Text服务 . 我试图将transcript String设置为等于结果'transcript . 但是,当我运行此代码时,不会打印该值 . 我不确定为什么会这样,或者如何解决问题 . 任何帮助,将不胜感激 . 我尝试在main方法之外使用带有静态变量的外部setter,但是我没有成功 . final Str... -
1 votesanswersviews
Swift - 在语音上下文数组中添加短语时崩溃
根据最佳做法,google documentation中建议了以下信息 . “Cloud Speech API包含非常大的词汇表 . 但是,如果专有名称或特定领域的单词不在词汇表中,您可以将它们添加到提供给请求的speechContext的短语中 . “ 所以,我在google sample application中的speechContextsArray中添加了短语,如下所示: let reco... -
0 votesanswersviews
在我的应用中更改语音识别的默认语言
我用英语制作应用程序 . 我的应用使用语音识别 . 但是,如果我使用其他系统语言,例如法语或俄语在设备上安装此应用程序 . 我的语音识别不起作用 . 它仅适用于系统默认的语言 . 对于我的应用,如何默认为语音识别制作英语? 我发现了这种方法,但它不起作用 Locale myLocale; myLocale = new Locale("English (US)", &qu... -
-2 votesanswersviews
没有语法的VOCE语音识别
我是 Java 和 speech recognition 的初学者,我使用 VOCE (http://voce.sourceforge.net/)将语音转换为文本 . 我使用了提供的示例,它只通过识别 .gram 文件中指定的单词来工作 . 但是,我需要应用程序识别比语法文件中指定的单词更多的单词 . 我发现了类似的问题(Speech Recognition API without Grammar... -
2 votesanswersviews
如何使用curl访问IBM语音到文本api?
我无法使用curl访问IBM Bluemix上的语音到文本API!我尝试使用curl的无会话请求的文档中的示例,但它不起作用;我收到了无效的用户ID /密码消息 . 这是我得到的错误: “{”code“:401,”error“:”Not Authorized“,”description“:”2016-10-08T15:22:37-04:00,访问https://158.85时出现错误ERCDPL... -
1 votesanswersviews
在WATSON语音到文本api中传递URL而不是系统路径
我使用存储在我系统上的输入flac文件向Watson语音到文本API发出了卷曲请求 . 我使用了音频/ flac文件的路径,它存储在我的系统中 . 我想将它存储在 Cloud 上,并使用音频文件的URL作为我的输入 . 请让我知道如何做到这一点 . 下面是我使用存储在我系统上的flac文件传递输入的curl请求: curl -X POST -u username:password --header... -
3 votesanswersviews
cURL没有指定url
我正在按照本教程在IBM Bluemix中设置语音到文本服务:https://www.ibm.com/watson/developercloud/doc/speech-to-text/tutorial.shtml 我已经安装并测试了先决条件,但是当我尝试输入时,我得到了一个错误: curl -X POST -u <username>:<password> --header ... -
0 votesanswersviews
Google Speech API速度更快,采样率更高
我正在使用Google Cloud Speech API Python库从视频文件中提取文本 . 在先前的步骤中,视频文件被转换为flac audiofile . sample_rate = 48000 client = speech.Client() cmd = "ffmpeg -i {} -vn -ac 1 -ar {} {}".format(mpg_file, samp... -
1 votesanswersviews
Google Cloud Speech:单词开始时间
我'm looking at using Google Cloud Speech to convert long-form narrated audio files and I need to know the start time of each phrase in the audio file. Is there a way to do this with Google Cloud Speec... -
0 votesanswersviews
使用NAudio录制音频时,将字节数据发送到Google Cloud Speech
我正在创建一个简单的WinForms语音到文本应用程序 . 此应用程序使用NAudio API侦听麦克风,并将音频发送到Google Cloud Speech API . 当Google Cloud Speech API使用文本进行响应时,我会将该文本附加到TextBox . 请参阅以下代码: async private void WaveIn_DataAvailable(object sende... -
0 votesanswersviews
如何使用Google的Cloud Speech-to-Text REST API转录视频
我希望在视频中有两个人的成绩单,但我从 Cloud 语音到文本API得到一个空洞的回复 Approach: 我有一个56分钟的视频文件,其中包含两个人之间的对话 . 我希望获得该对话的成绩单,并且我想使用Google的Cloud Speech-to-Text API来实现这一目标 . 为了节省我的Google Cloud 端存储空间,首先使用 mmpeg 将视频转换为音频 . 首先,我尝试使用下面... -
10 votesanswersviews
Android上的文字语音[关闭]
我希望创建一个具有语音到文本的应用程序 . 我使用RecognizerIntent了解这种能力:http://android-developers.blogspot.com/search/label/Speech%20Input 但是 - 我不希望弹出一个新的Intent,我想在我当前的应用程序中对某些点进行分析,我不希望它弹出一些声明它正在尝试录制你的声音 . 有没有人知道如何最好地做到这一点 ...