我最近对机器学习感兴趣,并决定实施神经网络 . 我没有报纸,还有其他一些信息,然后预测学生会得到什么等级,就像PaperRater一样 . 但是,我打算让它比_607412更加个性化 .

该程序有四个输入,一个是学生的论文,第二个是学生的id(即主键),第三个是教师的id,最后是课程id . 我在一个网站上实现这一点,只有经过注册,经过验证的用户才能提交他们的论文进行评分 . 本文的内容将根据教师与学生之间的关系以及与课程难度的关系进行权衡 . 网络适应教师对某些课程的评分习惯,教师与学生之间的关系(例如,如果教师不喜欢学生,您可能希望看到学生的成绩下降),以及课程水平(例如,老师不应该像一位大四学生那样严厉地对新生的论文进行评分 .

但是,这种方法存在一些相当大的问题 . 有一个固有的限制,学生,教师和课程的数量证明太多,一切都爆炸了!那是因为没有可以说明学生,老师和课程的每个组合的神奇数字 .

因此,我得出结论,每个教师,学生和课程必须具有与之相关的个体(尽管是任意的)权重,而不是神经网络本身 . 教师的体重将描述她的评分难度,学生的体重将描述她作为作家的能力 . 课程的重量将描述课程的难度 . 当然,随着越来越多的数据被聚合,权重应该适应变得更准确的表示 .

我意识到教师和学生,教师和课程,学生和课程之间存在关系;因此,我计划制作三个相应的隐藏层,它们对输入的权重求和并应用激活函数 . 但是,我如何存储与每位教师,学生和课程相关的权重?

我已经考虑将它存储在各自的表中,但我不知道它的扩展程度如何(或者就此而言,如果能够工作) . 我还考虑将它存储在一个文件中并像这样调用它,但我确信这比将它存储在数据库中更糟糕 .

所以我的主要问题是:它(客观上)在空间和计算复杂性方面是否有效,并且可扩展,用于存储和管理神经网络之外的SQL数据库中某些输入的每个可能元素的单独权重,如果这些输入的可能选择有限(不一定很小),并且仍能获得合理的输出?

无论如何,我想解释一下如何来 . 我相信它会很好,但我不能自己证明这一点,所以我在寻求帮助 . 提前致谢!

(P.S . :如果您发现我的方法有任何问题不在本问题的范围内,或者有一般性建议,请将其作为答案的附录,或者请给我留言) .