给定一个模型方程,一个特定的损失函数和梯度(我已经推导出),我如何使用像Theano / TensorFlow(或者Keras,因为它更通用)来训练模型而不使用神经网络?

我只是想使用SGD来最小化正则化的逻辑损失 . 这是一个很好的例子:http://www.deeplearning.net/tutorial/logreg.html

例如,http://arxiv.org/pdf/1510.04935v2.pdf的等式(1)和(2)是我正在尝试使用的东西 .