首页 文章
  • 2 votes
     answers
     views

    Theano中的类型列表

    考虑以下机器翻译问题 . 设 s 为源句, t 为目标句 . 这两个句子在概念上表示为索引列表,其中索引对应于相关词典中单词的位置 . 例: s = [34, 68, 91, 20] t = [29, 0, 43] 请注意, s 和 t 不一定具有相同的长度 . 现在让 S 和 T 成为这样的实例的集合 . 换句话说,它们是平行的语料库 . 例: S = [[34, 68, 91, 20], [...
  • 0 votes
     answers
     views

    如何使用tf.case在渐变/激活上节省内存

    我正在使用多个编码器/解码器(每种语言各一个)进行多语言机器翻译设置,在火车时刻,我将批量从单个源提供给单个目标,我在编码器和解码器之间切换a tf.case ,取决于批次给出的 lang_src 和 lang_tgt .我的问题是,当我使用5种语言时,我达到了GPU的12GB内存限制 .我不确定tensorflow是如何工作的,但我认为它为每个分支的激活或渐变分配GPU内存,但这在我的情况下...
  • 1 votes
     answers
     views

    Seq2Seq聊天机器人模型

    我正在构建一个带有序列的chat-bot来编码编码器解码器模型,如NMT . 根据给出的数据,我可以理解,在训练时,它们将解码器输出与编码器单元状态一起馈送到解码器输入 . 我无法弄清楚当我实际部署实时聊天机器人时,我应该如何输入解码器,因为那时我必须预测输出 . 请有人帮我解决这个问题吗?
  • 0 votes
     answers
     views

    使用LSTM进行机器翻译时无法生成正确的英语到SQL翻译

    我正在使用循环神经网络来训练模型,将样本英语句子(例如“获取所有员工数据”)翻译成sql,例如“SELECT * FROM EMPLOYEE” . 现在我的程序需要100个训练时间,但是所有输入都是相同的 . 所需的库是tensorflow和keras . 有人可以看看我的程序来帮助我生成正确的翻译吗? 这是我在python中的代码:https://github.com/Kashdog/engsq...

热门问题