首页 文章

如何计算时间段之间的相关性

提问于
浏览
0

如果我有2个时间间隔列表:

清单1:

  1. 2010-06-06至2010-12-12
  2. 2010-05-04至2010-11-02
  3. 2010-02-04至2010-10-08
  4. 2010-04-01至2010-08-02
  5. 2010-01-03至2010-02-02

和List2:

  1. 2010-06-08至2010-12-14
  2. 2010-04-04至2010-10-10
  3. 2010-02-02至2010-12-16

计算两个列表之间某种相关性或相似性因子的最佳方法是什么?

谢谢!

2 回答

  • 1

    你可以试试Cross-Correlation .

    但是,您应该知道您有矢量数据(开始,长度),并且算法假设它们之间存在功能依赖关系 . 这取决于您的数据的语义,这在问题中并不清楚 .

    HTH!

    A more useful link for your current problem here.

  • 2

    这是数据的范围还是仅仅是一个样本来了解您拥有的结构?

    关于如何看待这个问题的一些想法...我很抱歉,如果你看到这个集合当前状态是多余的 .

    比较这样的区间有两个基本思路:绝对或相对 . 相对比较将忽略间隔数据的绝对时间,并查找在两个组中但不一定同时发生的重复结构或签名 . 绝对版本会认为同时发生的事件是相关的,如果每周发生一些事情,如果它们相隔一年就没关系......你可以通过了解数据的来源来做出这种区分 .

    如果它是您可用于关联的决策的总数据,那么将归结为关于什么构成“相关性”的一些假设 . 例如,如果你有一个特定的模型来处理正在发生的事情 - 例如一个开始的时间,停止的时间(失败)模型你可以评估观察另一个序列的可能性 . 但是,如果没有更多示例数据,您似乎不太可能得出任何确切的结论 .

    两组中的第一个区间几乎相同,因此它们对我能想到的两组的相关性测量有很大贡献 . 如果这个集合有一个随机模型,我会期望很多模型会显示这两个观察结果而且“不太可能”就是因为这样 .

    评估“相似性”的一种方法是询问时间轴的哪个部分被覆盖(可能推广到多个覆盖范围)并在此基础上比较两个组 .

    另一种可能性是为这些事件的整个区间中的任何特定日期分配一个为每个序列添加一个的函数 . 这样,您就可以获得连续的功能,并对同一日期的多个事件进行基本描述 . 计算两组之间的相关性可能会为您提供结构相似性的建议,但同样需要更多数据组才能得出任何结论 .

    好的,这有点漫无边际 . 祝你的项目好运!

相关问题