首页 文章

R:用于Gephi的结构标签数据

提问于
浏览
0

我准备了一个包含大约20k行唯一标识符的数据集,如果标记连接到该标识符,则包含布尔信息的约60列:

ID   Gender   Tag1   Tag2   Tag3   Tag4   Tag5   Tag6   Tag 7   ...
A    m        0      1      1      0      0      0      0       ...
B    m        1      0      1      0      0      1      0       ...
C    f        1      1      0      0      0      1      1       ...

我想在Gephi中探索数据,但不知道要使用哪种导出结构/格式 . 为了能够探索标签之间的关系,数据应该如何?到达这个结构我需要做什么?我是否需要进一步总结它,我可以将性别数据作为要分析的属性保存在那里吗?

1 回答

  • 1

    假设您的数据代表网络,这里有一种方法可以将其导出为边缘列表csv:

    df <- read.table(header =T, sep =";", text = "ID;Gender;Tag1;Tag2;Tag3;Tag4;Tag5;Tag6;Tag7
    A;m;0;1;1;0;0;0;0
    B;m;1;0;1;0;0;1;0
    C;f;1;1;0;0;0;1;1")
    
    library(dplyr)
    library(tidyr)
    library(magrittr)
    df %>%
      gather(Target, isTrue, -ID, -Gender) %>%
      filter(isTrue == 1) %>%
      select(-isTrue) %>%
      set_names(c("Source", "Gender", "Target")) %>%
      write.csv(file = file.path(tempdir(), "my.csv"), row.names = FALSE)
    

    你可以在Gephi中将它作为边缘列表导入,让gephi自动创建节点列表:

    enter image description here

相关问题