首页 文章
  • 5 votes
     answers
     views

    dplyr - 聚合不正确?

    我有dplyr的som问题,group_by函数没有按预期工作 . 使用汇总,我希望得到输入到group_by语句中的id和year的每个唯一组合的var1的均值 . 此代码应创建一个带有id年观察的df,其中我想为每个id和year组合聚合var 1的均值 . 但是,这不能按预期工作,输出会忽略id,而只会在年份聚合 . df <- data.frame(id=c(1,1,2,2,2,3,...
  • 1 votes
     answers
     views

    Dplyr差异在group_by中变异和总结

    我对一些基线理解很困难 . 下面的数据框包含一个列,以后应该提供聚合方法 . 还有一个加权变量 n.group . structure(list(hosptg = structure(c(3L, 3L, 1L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L,...
  • 0 votes
     answers
     views

    使用唯一ID计算具有相同日期的行

    之前会问一个类似的问题,但它在我的数据集中不起作用 . 我有一个名为“daten”的数据集,客户在同一天购买了多个商品 . 我想计算客户在同一天购买的物品 . 每个客户都有一个唯一的ID,因此我想创建一个新变量并总结与ID号相对应的相同日期 . 目的是总结在同一天购买的物品,如果用户在不同的日子购买物品,我不想包括当天 . 所以数据看起来应该像新变量“items of items”: Order ...
  • 130 votes
     answers
     views

    汇总/汇总每组的多个变量(例如总和,平均值)

    从数据框架中,是否有一种简单的方法可以同时聚合( sum , mean , max et c)多个变量? 以下是一些示例数据: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) mont...
  • 1 votes
     answers
     views

    聚合和计数与条件匹配的行,按唯一值和转换表进行分组

    必须有一个简单而优雅的方法在R中使用data.table包执行此操作,但我无法搞清楚 . 矢量化操作是优选的 . library(data.table) d1 <- as.Date("01-13-2013", '%m-%d-%Y') d2 <- as.Date("12-31-2013", '%m-%d-%Y') data ...
  • 0 votes
     answers
     views

    R中ave函数的问题:错误“无法分配大小为419 kb的向量” .

    对于长格式的数据,我试图生成一个1:事件长度的序列来计算ID中每个事件的长度(时间),如下所示: ID Event Time 1 1 1 1 1 2 1 1 3 1 2 1 1 2 2 1 2 3 使用ave看起来很简单: time <- ave(event, ID, FUN = seq...
  • 0 votes
     answers
     views

    MongoDB 3.6聚合返回firstBatch

    在MongoDB 3.4中(根据文档仍然在3.6中), collection.aggregate([...]) 方法返回一个游标 . 然后我们可以做 collection.aggregate([...]).toArray() 或 .forEach() . 获取或迭代结果数组 . 从3.6开始(现在需要 cursor 选项,这在doc中没有指定),以下命令: collection.aggregat...
  • 0 votes
     answers
     views

    根据另一个表上的计数值更新表

    我正在使用MS Access VBA根据另一个表上的计数值更新数据库文件中的表,该表引用回我想要更新的表 . Table 1: request - Columns: requestID, requestStatus Table 2: requestItem - Columns: requestItemID, requestID, requestItemStatus 1个请求可以有n个请...
  • 2 votes
     answers
     views

    访问说明符之间的关系和使用c 0x中POD类型的初始化列表

    参加以下两门课程: class Test1{ public: Test1()=default; Test1(char in1,char in2):char1(in1),char2(in2){} char char1; char char2; }; class Test2{ public: Test2()=default; Test2(char in1,char in2)...
  • 2 votes
     answers
     views

    修剪的直角积的 LINQ 实现

    我希望有人能够帮助我,至少对我来说,这是一个非常棘手的算法。 问题 我有一个列表(1 <= size <= 2)需要组合的列表(1 <= size <= 5,但大小未知,直到 run-time)。这是我正在查看的示例:- ListOfLists = { {1}, {2,3}, {2,3}, {4}, {2,3} } 所以,我需要做两个步骤: (1)。我需要以这样的方式组合...
  • 0 votes
     answers
     views

    表达mongoose:获取聚合返回空数组

    亲爱, 我在使用mongoose回复mongoDB聚合时遇到了麻烦 . MongoDB中的查询正在发送数据,但来自mongoose的调用始终返回空数组 UPDATE I found the fix, I have to add a 3rd parameter when setting the model const RawData = mongoose.model('rawdata', raw...
  • 839 votes
     answers
     views

    按多列分组

    如何在LINQ中执行GroupBy多列 SQL中与此类似的东西: SELECT * FROM <TableName> GROUP BY <Column1>,<Column2> 如何将其转换为LINQ: QuantityBreakdown ( MaterialID int, ProductID int, Quantity float ) ...
  • 0 votes
     answers
     views

    按因子列聚合混合数据

    在过去的一周里,我一直在尝试聚合我的数据集,该数据集由不同月份的不同重量测量值组成,伴随着R中的大量背景变量 . 我已经阅读了很多关于这个主题的不同问题(即R aggregate data by defining grouping,How to aggregate count of unique values of categorical variables in R),但它们似乎只能用于一种类型...
  • 0 votes
     answers
     views

    在条件上聚合data.table但添加列

    我在R中有一个data.table,如下所示: > head(t) ITEM COUNTRY YEAR MONTH QUANTITY 1: 1 1 2014 1 2 2: 1 2 2014 1 133 3: 2 3 2014 1 2 4: 3 4 201...
  • 3 votes
     answers
     views

    将分组的聚合nunique列添加到pandas数据帧

    我想在我的pandas数据帧中添加一个聚合的,分组的,nunique列,但不会聚合整个数据帧 . 我试图在一行中执行此操作,并避免创建新的聚合对象并合并它等 . 我的df有track,type和id . 我希望每个轨道/类型组合的唯一ID数量作为表格中的新列(但不会在生成的df中折叠轨道/类型组合) . 行数相同,列数增加1 . 这样的事情不起作用: df['n_unique_id'] = df....
  • 0 votes
     answers
     views

    具有聚合函数的SQL查询在一对多关系的左连接上

    我有一对多的关系,每个用户都有很多任务,按难度评分 . 我想查询一个列表,显示每个用户一次以及他们最困难的任务 . users表:user_id,username 任务表:user_id,task_id,taskname,难度 我试过像这样的查询 SELECT u.user_id, u.username, t.task_id, t.taskname, MAX(t.difficulty) FROM ...
  • 228 votes
     answers
     views

    C#Linq Group By多列[重复]

    这个问题在这里已有答案: Group By Multiple Columns 12个答案 public class ConsolidatedChild { public string School { get; set; } public string Friend { get; set; } public string FavoriteColor { get; set...
  • 1 votes
     answers
     views

    使用聚合EPA的派生事件属性中的FIWARE CEP(质子)错误

    我从Orion收到一个ContextUpdate事件,并设置了一个规则来计算接收事件的数字,可能在特定时间窗口内使用相同的“entityId” . 在聚合EPA的派生事件中,我希望“DeviceID”属性假定接收事件的“entityId”的值相同 . 但是,无论是“Deferred”还是“Immediate”评估策略,在消费者输出(文本文件)的DeviceID属性中,我都得到: “DeviceI...
  • 0 votes
     answers
     views

    MongoDB / Mongoose聚合查询

    我正在努力将聚合查询放在一起查找来自一个集合的数据并拉入另一个集合中 . 这是我的设置...... Collection One :training_documents 数据结构示例: { "_id": ObjectId("5a0350ad7df0977d94cffab6"), "doc_description": "D...
  • 119 votes
     answers
     views

    汇总/汇总每组的多个变量(例如总和,平均值)

    从数据框架中,是否有一种简单的方法可以同时聚合( sum , mean , max et c)多个变量? 以下是一些示例数据: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) mont...
  • 5 votes
     answers
     views

    在R中的“周”箱中聚合平均值“%H%M”

    我一直在努力解决这个问题 . 我是使用ts数据和所有相关R包的新手 . 我有一个带有几个变量的df,包括GMT "%H%M"中的'time of day'和采样日期"%Y/%m/%e" . 我想将我的日期数据分箱/汇总到"weeks"(即%W /%g),并在该周期间进行抽样时计算平均值'time of the day' . 我能够通过首先...
  • 0 votes
     answers
     views

    PostgreSQL聚合函数用于整数数据

    显然, string_agg 不起作用,因为我有整数数据要聚合 . 什么是Integrer数据的等效函数: SELECT the_geom, string_agg(profile_id || ', ' || upper_dept, || ', ' ||lower_dept, || ', ' ||phaq_val_1, '; ' ORDER BY upper_dept) AS pH_...
  • 1 votes
     answers
     views

    在MongoDB中聚合双嵌套数组的文档

    我正在尝试计算具有不同条件的文档 . 在这里,我有这样简化的文本表(文件): { "teamId": "1", "stage": "0", "answeredBy": [userId_1, userId_2], "skippedBy": [userId_3], ...
  • 0 votes
     answers
     views

    使用聚合函数在AS中使用AS命名列

    所以这是我最初的查询: DECLARE @total AS FLOAT; SET @total =(SELECT COUNT(*) FROM Crimes) SELECT Areas.Area, Areas.AreaName, COUNT(*) AS Total, Round(CONVERT(float,(COUNT(*) / @total) * 100),3)...
  • 19 votes
     answers
     views

    SQL独特和计数

    我有一个查询,我想获得不同的日期,与这些日期相关的电话号码,以及每个日期的电话号码计数 . 例如,我有一个包含日期和电话号码的数据库,我想要结果 9/2005 5554446666 3 9/2005 4445556666 1 10/2005 1112223333 1 11/2005 2223334444 2 我可以通过此查询获取日期和计...
  • 0 votes
     answers
     views

    如何将每日时间序列转换为平均每周?

    我希望(算术上)平均每日数据,从而将我的每日时间序列转换为每周一次 . 在这个帖子之后:How does one compute the mean of weekly data by column using R?,我正在使用 xts 库 . # Averages daily time series into weekly time series # where my source is a zo...
  • 126 votes
     answers
     views

    用dplyr汇总多列? [重复]

    这个问题在这里已有答案: Aggregate / summarize multiple variables per group (e.g. sum, mean) 5个答案 Can dplyr summarise over several variables without listing each one? [duplicate] 2个答案 我在使用dplyr语法时遇到了一些麻烦 . ...
  • 0 votes
     answers
     views

    mongodb聚合,groupby列在对象中

    我正在寻找在嵌套对象中的给定值执行组 . 例如,我的文档结构如下:(抱歉有限的数据) "_id" : "92623ba7-4ca5-46c7-8d76-c4bc8387ea00", "Status" : 2.0, "UploadDate" : ISODate("2018-10-30T12:01...
  • 1 votes
     answers
     views

    R - 按小时聚合,最大值为秒

    我有数据,我想在时间步骤上聚合,另外想要计算该组中另一个值的最大值 . 为了聚合,我运行以下代码: s_stats <- lapply(s_df_array, function(x) { aggregate(x, by=list(unique.values=x$start), length) }) s_df_array是一个数据帧表,代码可以很好地计算x $ start中每个值的条目出现次...
  • 2 votes
     answers
     views

    rbindlist data.frames的列表列并选择唯一值

    我有一个data.table'DT',其中一列('col2')是一个数据帧列表: require(data.table) DT <- data.table(col1 = c('A','A','B'), col2 = list(data.frame(colA = c(1,3,54, 23), ...

热门问题