首页 文章

在不同级别的应用中应用功能

提问于
浏览
1

我有以下几点:

library(tidyverse)

set.seed(1234)

df <- tibble(
  x1 = letters[1:2],
  y1 = list(
    tibble(
      x2 = letters[3:4],
      y2 = list(
        tibble(
          x3 = seq(1, 100, 1),
          y3 = rnorm(100)
        )
        )
      )
    )
)

我需要访问包含 x3y3 的tibble中的tibble,并为每个数据帧应用自定义函数 . 为简单起见,假设我需要将 base::mean() 应用于 y3 .

我的真实数据比这要大得多,所以我正在寻找一种干净有效的方法 . 有任何想法吗?

2 回答

  • 1

    你可以不用自己的方式吗?

    df %>% unnest() %>% unnest() %>% 
       group_by(x2) %>% 
       summarise(mean(y3))
    
    # A tibble: 2 x 2
      x2    `mean(y3)`
      <chr>      <dbl>
    1 c         -0.157
    2 d         -0.157
    

    不确定您希望最终的数据帧看起来如何,但这是另一个建议

    df %>% unnest() %>% 
       mutate(y3.average = map(y2, ~mean(.$y3)) ) %>% 
       unnest(y3.average)
    
    # A tibble: 4 x 4
      x1    x2    y2                 y3.average
      <chr> <chr> <list>                  <dbl>
    1 a     c     <tibble [100 × 2]>     -0.157
    2 a     d     <tibble [100 × 2]>     -0.157
    3 b     c     <tibble [100 × 2]>     -0.157
    4 b     d     <tibble [100 × 2]>     -0.157
    
  • 0

    您需要找到要应用函数的级别(我通过括号索引进行),然后应用该函数 . 我希望这可以转移到你需要做的事情上 .

    > df[["y1"]][[1]][[2]] %>% lapply(., function(x){mean(x$y3)})
    
    [[1]]
    [1] 0.04124318
    
    [[2]]
    [1] 0.04124318
    

相关问题