Background
我正在尝试编码Fisher的精确测试(参见:wiki),特别是2 x 2列联表(矩阵) . 但是在给定观察到的非负整数矩阵的情况下,我被卡住 on one particular step: 来生成替代矩阵,其中替代矩阵的行和列和必须等于原始矩阵 . This page (Wolphram)有所有步骤的描述,但下面我将详细说明我坚持的位 .
Question
为了对2 x 2列联表实施Fisher精确检验,给出了一个2 x 2矩阵,其元素是非负整数,代表观测值,即观测矩阵 .
其中一个步骤要求我生成2 x 2矩阵的所有组合,即替代矩阵,其非负整数元素受以下条件限制:
-
所有替代矩阵的尺寸为2×2,即等于观察到的矩阵 .
-
替代矩阵的每一行的总和必须等于观察到的矩阵的每一行的对应和,即,在每个备选矩阵中观察到的矩阵中的行2的总和=行2的总和 .
-
替代矩阵的每列的总和必须等于观察到的矩阵的每列的对应总和 .
对我来说,生成替代矩阵的最明显的方法是在2 x 2矩阵中强制所有可能的数字组合,其值小于或等于观察到的矩阵的行/列的总和 . 然后迭代这些组合,过滤掉不满足上述条件的组合 .
Edited: What is the fastest algorithm to generate all combinations of elements in a 2x2 matrix (alternative matrices), with row and column sums equal to those of the observed matrix?
原文:我们如何用以下任何一种语言实现它:R,Python,C / C,Matlab?
Example
对于2×2测试的示例应用,让X成为期刊,比如数学杂志或科学,并且让Y是关于这些期刊的给定期刊中出现的数学和生物学主题的文章的数量 . 如果“数学杂志”有五篇关于数学的文章和一篇关于生物学的文章,而“科学”没有关于数学和关于生物学的四篇文章,则相关矩阵将是:
然后所有可能的替代矩阵将是:
Related posts
2 回答
这实际上很容易 . 您只需要选择与条件匹配的所有可能组合 .
这是python中的一个解决方案:
我有一个使用sympy的答案 . 这个想法是一样的:解决从矩阵元素之和得到的线性方程组,即行数和列数 . 这是硬编码的M. s基本上是你的矩阵 . linsolve为您提供了无限的解决方案,其余的将它们限制为正整数 .