首页 文章
  • -1 votes
     answers
     views

    使用值标签在R中导入spss文件的最佳方法是什么?

    我有一个spss文件,其中包含变量和值标签 . 我看到了具有 read.spss 功能的外包: data <- read.spss("2017.sav", to.data.frame = TRUE, use.value.labels = TRUE) 如果我使用 use.value.labels = TRUE ,所有字符串更改为因子变量,我不想要它,因为它们不是因子全部 ...
  • -4 votes
     answers
     views

    什么是最小化因变量的st偏差的适当方法(例如聚类?)

    我坚持最小化因变量的st偏差是以天为单位的时差 . 意思是好的,但偏差很可怕 . 通过自变量尝试聚类并注意到非常不同的聚类 . 现在,想知道:1)我如何将这种知识从聚类应用到自变量?事实是它没有包含在初始聚类分析中,因为我知道它依赖于其他分析 . 2)鉴于我知道时差的变量是依赖的,我是否应该使用簇数变量进行聚类,这是我初始聚类分析的结果?这会有帮助吗? 3)除了聚类之外是否有任何其他技术可以帮助...
  • 3 votes
     answers
     views

    SPSS - 如何识别一行120个变量中的第一个和最后一个可用测量值

    我已经检查了之前关于它的帖子(SPSS最后一次可用的测量变量),但我仍然怀疑如何更有效地执行此任务 . 我有一个包含9800万行和120个变量的数据集(每月一个,从2005年1月到2014年12月) . 对于数据集中的每个观察,我需要识别变量行中的第一个和最后一个有效(非缺失)测量值 . 数据集如下所示: v1 v2 ... v1201 2 ... 5. 2 ... 53 1 ...... 我已...
  • 3 votes
     answers
     views

    如何诊断R导入中的重复级别

    我使用R来分析来自IPUMS的大型数据文件,这些文件在人口普查记录上发布了复杂的微观数据 . IPUMS将其摘录提供为SPSS,SAS或STATA文件 . 为了将数据导入R,我最幸运的是下载SPSS版本并使用"foreign"库中的 read.spss 函数: library(foreign); ipums <- read.spss("usa_00106.sa...
  • 2 votes
     answers
     views

    将SPSS文件读入R throw错误 - 读取系统文件头错误

    最近,我在使用 foreign 包中的 read.spss 读取SPSS文件时有时会出错: read.spss(“sample.sav”)中的错误:读取系统文件头的错误此外:警告消息:在read.spss(“sample.sav”)中:sample.sav:错误的格式说明符字节(0) 我制作了一个只有一个变量的小 sample.sav 文件和3个会导致错误的情况 . Download the...
  • 2 votes
     answers
     views

    将Cyrillic的spss文件读入R中

    我试图将几个SPSS文件读入R,包括 Cyrillic text . 所有文件都在 Cyrillic text 中 . 当我将大部分内容读入R时,控制台会显示"re-encoding from CP1251" . 但是,当我读到一些文件时,也就是在 Cyrillic text 中,它说的是"re-encoding from CP1252",我认为这是一个拉...
  • 0 votes
     answers
     views

    无法在SPSS中为字符串分配缺失值

    我正在使用SPSS语法编辑器来组合字符串变量 . 我知道每个记录的一个或零个变量中都会有数据,但两个变量中都不会有数据 . 这是我的代码,问题出在第一行: IF (MISSING(ywFamilyPlayers)=1) AND (MISSING(vywFamilyPlayersBoolean)=1) THEN newString=missing. IF (MISSING(ywFamilyPlaye...
  • 9 votes
     answers
     views

    导入.sav时出现警告/错误

    我有两个版本的SPSS在工作 . 在Windows XP上运行的SPSS 11和在Linux上运行的SPSS 20 . SPSS的两个副本都可以正常工作 . 使用任一版本的SPSS创建的文件在其他版本的SPSS上打开而不会发生意外 . I.E. - 我可以在Linux上使用SPSS 20创建一个.sav文件,并在Windows上的SPSS 11上打开它而不会发生任何事故 . 但是,如果我使用S...
  • 5 votes
     answers
     views

    将SPSS数据文件导入R

    在我的公司,我们正在考虑在选择R时逐步淘汰SPSS . 在过渡期间,我们仍将使用SPSS数据文件格式(.sav) . 我在将此SPSS数据文件导入R时遇到问题 . 当我将SPSS文件导入R时,我想保留变量的值和值标签 . foreign 包中的 read.spss() 函数允许我选择保留变量的值或值标签,但不能同时保留两者 . AFAIK,R确实允许因子变量具有值(级别)和值标签(级别标签) ...
  • 0 votes
     answers
     views

    将SAS数据导出到SPSS,日期和日期时间

    我在SAS内部有数据 . 我想将数据文件存储为SPSS格式(* .sav) 我使用以下程序: PROC export Data=SASdataToStoreInSPSS FILE="Path\Filename_%sysfunc(today(),date9.).sav" dbms=sav replace; RUN; 这非常有效 . 除非我在SPSS中打开文件,否则日期将被严格格...
  • 1 votes
     answers
     views

    自动化IBM SPSS Data Collection调查导出?

    对于这里模糊的问题,我很抱歉,但我希望SPSS专家能够帮助我 . 我们有一些调查是通过SPSS完成的,我们从中提取内部报告的数据 . 目前这个过程非常繁琐,需要进入SPSS Data Collection Interviewer Server Administration页面并手动导出两个不同项目的数据(一次需要几个小时!) . 然后我们获取该数据,按摩它,并将其上传到驱动内部报告的另一个数据库 ...
  • 3 votes
     answers
     views

    SPSS:如何从数据库创建.sav文件

    我们目前正在构建一个数据库(MongoDB),我们提供.csv和.xlsx格式的数据导出 . 我们收到了提供数据的.sav下载请求,因为数据操作(变量和值标签,缺失)需要花费很多时间 . 原则上,当您将Excel文件导入SPSS并编写脚本时,生成它并不是很困难 . 但是,如果我们可以直接生成.sav文件并另外提供此格式,我们的数据库看起来会更好 . 有谁知道一个允许这个的工具? 提前致谢!
  • 2 votes
     answers
     views

    导入R时的SPSS日期格式

    我之前没有使用过SPSS( .sav )文件,并且正在尝试使用提供给我的一些数据文件,将它们导入到R.我没有收到任何文件的解释,因为沟通很困难我想弄清楚尽我所能 . 这是我的第一个问题 . 这是导入后R数据框中 Date 字段的样子: > dataset2$Date[1:4] [1] 13608172800 13608259200 13608345600 13608345600 我不知道数...
  • 1 votes
     answers
     views

    在SPSS中将非标准日期格式转换为日期

    我觉得自己就像一个白痴,因为我无法自己解决这个问题,但几个小时徒劳无功,我意识到我真的需要一些帮助: 我将从Excel导入的出生日期数据以这些格式导入SPSS: 2004 *assume year of birth 12-Sep-14 它们作为字符串变量导入SPSS . 当我尝试将变量类型更改为Date时,它们就会消失,这意味着我一直在尝试对其进行编码 . 在线查看答案我相信答案看起来与此类似:...
  • 0 votes
     answers
     views

    查询SPSS文件

    R版本:2.12.2 / OS:Windows XP 我需要查询和操作的数据存储在SPSS .sav文件中(大小约112MB),我对SPSS语法有基本的了解 . 我更熟悉R(并且通常更喜欢它用于数据操作和分析),因此我将SPSS文件保存为制表符分隔文件(大小约为85MB),并尝试使用RODBC软件包中的功能进行查询 . 使用Windows控制面板上“管理工具”组中的“数据源(ODBC)”应用程序,...
  • 1 votes
     answers
     views

    如何从SPSS可移植文件中正确导入缺失值?

    如其他问题所述,将SPSS数据集导入R的最佳方法是首先将SPSS文件导出为“便携式SPSS”格式,然后使用memisc,如下所示: library(memisc) mydata <- as.data.set(spss.portable.file("myspss.por")) 但我的问题是NA被编码为文本(即使我在SPSS中指定了NA值) 我的解决方案是为每个变量执行此...
  • 4 votes
     answers
     views

    如何将PL / SQL包中的数据导入SPSS?

    我有这个巨大的Oracle包,它在执行传统的ETL过程后生成.CSV文件 . 目前,我正在使用一堆临时表来加载来自各种源的数据,并使用listagg函数转换数据,并最终将其转储为clob . 我正在查看具有不同数据类型的 300-400 列 . 我们在做什么? 导出到.CSV文件然后导入到SPSS ...在SPSS中导入数据和设置格式需要大量的工作 我在找什么? 将所有数据保存为数据库中的...
  • 17 votes
     answers
     views

    忽略R字符串中的转义字符(反斜杠)

    在SPSS中运行R插件时,我收到一个Windows路径字符串作为输入,例如 'C:\Users\mhermans\somefile.csv' 我想在后续的R代码中使用该路径,但是斜杠需要用正斜杠替换,否则R将其解释为转义(例如“\ UU,不使用十六进制数字”错误) . 然而,我无法找到一个可以用斜线替换反斜杠或双重逃避它们的函数 . 所有这些函数都假设这些字符被转义 . 那么,是否有类似的东西:...
  • 0 votes
     answers
     views

    r包读取SPSS z压缩文件

    我最近发现了.zsav扩展,这是天赐的,因为我的网络中的SPSS .sav文件大小在4-10GB之间,但是当它们保存为.zsav时,它们减少到大约300-500MB . 话虽如此,我发现很难找到一种在R中读取这些格式的方法 . 有没有人知道R的任何软件包允许使用这种格式,或任何可以读取它/变通方法的R代码?
  • 2 votes
     answers
     views

    处理数据时保留SPSS值标签

    我正在分析PISA 2015的学生成绩数据 . 数据以SPSS格式提供here 我可以使用haven软件包中的read_sav函数将数据加载到R中 . 我需要能够编辑R中的数据,然后以SPSS格式保存/导出数据,原始值标签完整地包含在SPSS下载中 . 我使用的代码是: library(haven) student<-read_sav("CY6_MS_CMB_STU_QQQ.sav...
  • 0 votes
     answers
     views

    从R到SPSS获取多行utf-8数据(2900列)

    是否有一种故障保护方法来获取包含多行utf8文本的单元格的数据,其中包含从R到SPSS的多列?优选具有保守类型 . 如果您说CSV,您可能没有尝试使用包含多行文本和utf8字符的临时单元格传输2700列 . 这似乎不可能 . 如果偶尔有一些包含多行的单元格,SPSS将失败(将在几种情况下看到它, DELCASE 不解决这个问题并要求您知道列数) . OpenOffice可以正确处理字符...
  • 1 votes
     answers
     views

    包memisc中的spss.system.file在导入字符串变量时添加额外的空列

    之前我曾在 memisc 包中使用了 spss.system.file 函数,并且's always worked without error. However, recently I'已经尝试导入几个包含String变量的SPSS文件 . 似乎每当我使用 spss.system.file 导入这些变量时,它会产生6个额外的空白列 . 例如,如果以下字符向量是名为Age的SPSS中的String变...
  • 2 votes
     answers
     views

    SPSS百分位数问题

    我正在使用SPSS 18 .我使用FREQUENCIES来计算变量的第95百分位数 . FREQUENCIES SdrelPromSldDeu_Acr_5_0 /FORMAT=NOTABLE /PERCENTILES 1,5,95,99. 结果在表格中给出 统计SdrelPromSldDeu_Acr_5_0N有效8881缺少0百分位数1 -1,0010606440145 -1,000541...
  • 1 votes
     answers
     views

    SPSS用加权平均值计算百分位数

    我的背景是数据库和SQL编码 . 我在SPSS中使用了CTABLES功能,主要用于计算sql中缓慢的百分位数 . 但现在我有一个数据集,我需要计算加权平均值的百分位数,这不是那么简单,我无法弄清楚它是否可能在SPSS中 . 我有类似以下的数据 Country Region District Units Cost per Unit USA Central Divi...
  • 0 votes
     answers
     views

    使用线性回归去除自变量对因变量(区间/比率)的估计影响

    Question: Can we use unstandardized coefficients derived from linear regression to remove the effect of an independent variable on the dependent variable? 我有一个大型数据集,并怀疑(不需要的)自变量(IV)会影响研究中的数百个依赖值(DV) ....
  • 2 votes
     answers
     views

    计算包含缺失值的相关系数

    我想要计算R中的某种形式的相关系数(或实际上任何常见的统计数据包),其中相关值受缺失值的影响 . 我不确定这是否可行,我正在寻找一种方法 . 我不想归咎于数据,但实际上希望根据某些系统方式中包含的不完整案例的数量来减少相关性 . 数据是由不同个体生成的一系列时间点,并且相关系数用于计算可靠性 . 在许多情况下,一个人的数据将包括比其他人多几个时间点...... 同样,不确定是否有任何标准程序来处理...
  • 0 votes
     answers
     views

    确定重要矛兵的rho相关性的方向

    我在stackexchange上询问了以下问题https://stats.stackexchange.com/questions/272657/determining-the-direction-of-a-significant-spearmans-rho-correlation - 当我使用spss时,有人指向我这个网站的方向,所以如果有人有任何建议会非常感激 . 我用两个序数变量进行了Spe...
  • 52 votes
     answers
     views

    将SPSS文件读入R中

    我正在尝试学习R并想要引入一个SPSS文件,我可以在SPSS中打开它 . 我尝试使用 read.spss 来自 foreign 和 spss.get 来自 Hmisc . 两条错误消息都是相同的 . 这是我的代码: ## install.packages("Hmisc") library(foreign) ## change the working directory ge...
  • -1 votes
     answers
     views

    从spss导入r和spss到sas时数据不匹配

    我一直在尝试将spss(.sav)文件导入r和sas并匹配数据 . 日期变量数量巨大,所以我在R中转换它 . 我会得到日期和时间变量的差异 . s中缺少显示r中开始日期的记录之一 . 所有时间戳均为12.00.00 in r而00.00.00 in sas . 任何人都可以帮我解决我弄错的地方吗? 这是我在R中使用的代码: library("memisc") data<...
  • 0 votes
     answers
     views

    通过memisc从SPSS便携式文件转换导入的日期

    我一直在教自己使用R大约6个月,并发现当我在网上找不到解决方案时,这或者是一个不起眼的问题,或者很明显没有人会问过它 . 我认为这是后者 . 基本上我通过R的memisc包导入了一个SPSS文件,使用: misc.MP.data <- as.data.frame( as.data.set( spss.portable.file("SPSS data.por"))) 一切...

热门问题