首页 文章
  • 1 votes
     answers
     views

    如何从SPSS可移植文件中正确导入缺失值?

    如其他问题所述,将SPSS数据集导入R的最佳方法是首先将SPSS文件导出为“便携式SPSS”格式,然后使用memisc,如下所示: library(memisc) mydata <- as.data.set(spss.portable.file("myspss.por")) 但我的问题是NA被编码为文本(即使我在SPSS中指定了NA值) 我的解决方案是为每个变量执行此...
  • 4 votes
     answers
     views

    使用ifelse()通过引用不同长度的另一个数据帧来替换一个数据帧中的NA

    我已经回顾了以下两篇文章并认为他们可能会回答我的问题,尽管我很难看到如何: 1)Conditional replacement of values in a data.frame 2)Creating a function to replace NAs from one data.frame with values from another 话虽如此,我试图通过引用另一个不同(较短)长度的数据帧并...
  • 0 votes
     answers
     views

    具有滞后函数的Dplyr变异忽略NA值

    我想在数据框上创建一个新列(Ifl_10min_mm.h),其值是前一行和实际行的总和 . 我正在使用dplyr包,具有mutate和lag功能 . 当尝试将实际行值与先前的NA行值相加时,结果输出为NA . 如何避免NA输出? library(dplyr) df = read.csv(file= "prueba3.csv ",header=TRUE,sep= ",&...
  • 0 votes
     answers
     views

    R累计和计算NA问题

    我一直试图解决累积和问题几天并且已经非常接近,但我仍然遇到一些问题 . 我正在尝试为data.frame中的多个列向后计算累计和(从nrow到第一行) . 当data.frame结尾没有NA / NaN值时,代码可以正常工作 . 但是如果存在NA值,则代码返回实际值,而我希望它返回NA . 另外,我需要在我测量的最后一年存在结束值(df2中的RBH行) . df2的样本测量:2009年 - 1....
  • 2 votes
     answers
     views

    ggplot排序顺序处理NA值

    我的目标是创建服务请求的散点图 .X轴将是请求的日期 .X值将显示从最旧到最新,从左到右的日期 .Y轴将显示分配给请求的优先级 .我希望将Y值从最高优先级(即1)排序到最低 .尚未优先排序的请求在该列中具有NA . 这是一个示例数据集(注意 - 原始数据文件id选项卡 - 在下面显示“NA”的位置没有值分隔,为清楚起见): ID Priority DateCreated 549 NA ...
  • 76 votes
     answers
     views

    在数据框的选定列中包含NA(缺失)值的行的子集

    我们有一个CSV文件的数据框 . 数据框 DF 包含包含观察值的列和包含测量日期的列( VaR2 ) . 如果未记录日期,则CSV文件包含值 NA ,用于缺少数据 . Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们希望使用subset命令来定义新的数据框 new_DF ,使其仅包含列中具有 NA' 值的行( VaR2 ) . 在给出的...
  • -1 votes
     answers
     views

    来自角色的POSIXct返回NA

    我有一段时间在excel中,当转换为R时,作为一个角色出现并且看起来像这样 0.59658. 我试图转换为POSIXct但它返回为带有NA的POSIXct . teste <- as.POSIXct(test, format = "%H:%M") 我也尝试了 teste <- as.POSIXct(test, format = "%H:%M:%S&quo...
  • 0 votes
     answers
     views

    为什么在R中舍入时间时会删除一些日期时间值?

    我将一系列csv文件导入R.这些文件包含日期/时间列,id和两列温度值 . 这将给出数据的示例: id<-c(1,2,3,4) date.time<-as.character(c("12/03/17 00:21:28", "12/03/17 02:21:28", "12/03/17 04:21:28", "12/03...
  • 0 votes
     answers
     views

    svm预测R中的函数错误

    我正试图在泰坦尼克号数据集上运行svm,但我遇到了预测函数的问题 . svm.iceberg <- svm(Survived ~ Pclass+Sex+SibSp+Parch+Ticket+Fare+Cabin+Embarked+Surname+Age_Range, data = train.iceberg) svm.prediction <- predict(svm.iceberg...
  • 2 votes
     answers
     views

    传递和计算皮尔森相关性

    我真的很喜欢编码,我需要在数据集中运行一些统计数据,例如pearson相关性,但是我在操作数据时遇到了一些麻烦 . 从我的理解,我需要转置我的数据,以计算皮尔森相关性,但这里我有一些问题 . 对于初学者,列名称将变为新行,而不是成为新的列名称 . 然后我收到一条消息,表明我的值不是数字 . 我也有一些NA,我正在尝试计算与此代码的相关性 cor(cr, use = "complete.o...
  • 2 votes
     answers
     views

    填充数据框中的缺失值

    嘿,我需要填写数据框的缺失值 . 逻辑很简单,如果 M[i, j + 1] 中有值,则使用 M[i, j + 1] ,否则使用 M[i, j - 1] . 但是棘手的是我需要在每行的最后一个非na值之后填充从行开始到列的缺失值,而不仅是非空单元格附近的单元格 . 这是数据 a1 <- c('a',9,8,rep(NA,5)) a2 <- c('b',NA,NA,NA,NA,3,NA,...
  • 0 votes
     answers
     views

    如何在列表中用Na完成缺失值?

    我有一个数据框,其中包含以下列:树ID,月,值 . 几个月来,没有记录数据,因此数据框中不存在这些月份 . 我已经完成了缺少月份的列表,但现在我不知道如何在增加的月份的值列中插入NA . 例: Tree.Id :1,2,3,4,5,6,7,8,9,10 Month :Jan,Feb,Mar,May,Jun,Jul,Sept,Oct,Nov,Dec Values :1,0,1, 1,0,2,1,...
  • 0 votes
     answers
     views

    sparklyr数据帧:用NA替换NULL单元 - 如何将gsub和regex用于spark DF?

    如何将 gsub 和 regex 用于spark数据帧?此运行示例适用于经典DF . ## function to replace empty cell by NA empty_as_na <- function(x){ if("factor" %in% class(x)) x <- as.character(x) ifelse(as.character(x...
  • 0 votes
     answers
     views

    'mice' R包没有输入数据

    我运行回归来替换数据集中的缺失数据,并希望将其与Stef va Buuren使用'mice'包的结果进行比较 我在这里通过交叉验证的Link to Post引用此链接 我也在阅读这是类似的语法和用法 . 我的代码是: imp <- mice(without_response, method = "norm.predict", m = 1) #Impute data im...
  • 0 votes
     answers
     views

    在R中逐行和逐列合并数据帧

    如何合并两个数据帧,一个是列,另一个是行?例如,我有两个这样的数据框: A: add1 add2 add3 add4 1 k NA NA NA 2 l k NA NA 3 j NA NA NA 4 j l NA NA B: age size name 1 5 6 ...
  • 1 votes
     answers
     views

    带有AND和N / A计算的IF语句

    我希望你能提供帮助 . 我有几个公式因细胞中出现N / A而破裂 . 我想知道这些N / A是否可以容纳在我的公式中以仍然返回数值结果 . 在下面的图片中,您可以看到在C21单元格中有“N / A”,而在S21中则是错误#VALUE!这个错误的原因当然是因为'N / A' 可以修改S21中的公式以计算该“N / A”并返回一个数字,即使它存在 . 我的公式如下 =SUM(AND(C21>=1...
  • 2 votes
     answers
     views

    从单个csv文件中提取多个数据文件

    我正在阅读大量的.csv文件 . 它们中的每一个都有四组数据,由三个空白列分隔 . 读入整个文件并将其分配给数据框后,空白列的内容将被解释为NA . 有超过一百个这样的文件,我无法保证每组数据的列数不变 . 从初始数据帧开始,我需要创建四个独立的数据帧 . 在这种情况下,我无法弄清楚如何使用标签 . 描述四个数据集中的每一个的标签标记其第一列,但所有其他列名称都获得自动名称(V2,V3,V4等) ...
  • 0 votes
     answers
     views

    索引数据框中的NA值[重复]

    这个问题在这里已有答案: An NA in subsetting a data.frame does something unexpected 1回答 在按某种条件对数据帧进行子集化时,如果数据帧包含NA,则可能会因条件而获得NA值 . 然后它会在data.frame的子集化中产生问题: # data generation set.seed(123) df <- data.frame(a...
  • -1 votes
     answers
     views

    使用sapply将na.rm添加到自定义R函数

    我正在努力将na.rm命令添加到数据框下面的自定义函数(仅一个百分比),其中每列是一个时间点,其中填充了行中标识的证券的价格 . 这个df包含相当多的NA . 这是功能: pctabovepx=function(x) { count_above_px=x>pxcutoff 100*(sum(count_above_px)/nrow(count_above_px)) } 然后,我想在...
  • 563 votes
     answers
     views

    如何在R数据帧中用零替换NA值?

    我有一个数据框,有些列有 NA 值 . 如何用零替换这些 NA 值?
  • 1 votes
     answers
     views

    MANOVA包含来自不同数据集的变量

    这个问题已在stats.stackexchange上提出,但没有人回答 . 由于我不确定哪个论坛是合适的,我在这里再次发布一些数据 . 我已经对树皮的各种特征进行了实验,现在想要比较五种被检树种在评估参数方面的差异 . 因此,有人建议我应该使用MANOVA来分析我的数据,这对我来说似乎是合理的 . 我的分析是在 R 进行的 . 然而,与我发现的如何做MANOVA(即here,here,here)的...

热门问题