首页 文章
  • 2 votes
     answers
     views

    使用python按周汇总数据

    我有一个这样的数据,并且我不会在一周内将它聚合为两个日期:我确实有这个元组列表,它从我的交易表中显示每天的销售额 Metadate = [(Day, 'totalSales By dollars')] data=[('2013-06-21', 14), ('2013-06-20', 19), ('2013-06-23', 11), ('2013-06-22', 13), ('201...
  • 1 votes
     answers
     views

    Elasticsearch奇怪的术语聚合

    聚合中有奇怪的术语,如果另一个映射包含不同类型的相同属性名称: MAPPING { "mappings" : { "access" : { "properties" : { "cache" : { "type" : "string" } ...
  • 2 votes
     answers
     views

    用于数据分析的NoSQL或RDBMS

    我问自己是否应该尝试使用NoSQL数据库或SQL数据库 . 我已经阅读了很多,但是想听听一些有NoSQL经验的人 .我的情况如下:我们有一个不那么复杂的关系数据库模式 . 我们对推荐系统进行了重新研究,因此监控用户与特定门户网站的交互 . 我们后来想要分析收集的数据,以向用户显示他在门户网站上所做的工作,并根据他在门户网站上所做的工作生成建议 . 因为我们不需要进行大量的实验 . 但它会包含很多 ...
  • 1 votes
     answers
     views

    通过关于R中的缺失数据进行条件聚合

    我试图将每小时数据汇总到R中的每日数据 . 问题是缺少值 . 我想在聚合之前考虑缺失值数量的阈值 . If the number of missing values is more than two in the given day , DO NOT compute the daily average and fill that day with NA . 我的虚拟数据是2005年第一天...
  • 0 votes
     answers
     views

    弹性搜索 - 不一致的术语方面结果

    我在以前的帖子中找不到答案,所以我希望我的帖子是相关的 . 我在使用ElasticSearch术语方面遇到了麻烦 . 当我查询每个术语方面的文档计数时,我得到,对于某些字段值,我会说8但是当我查询具有该字段的特定值的文档计数时,我得到,比方说19 . 为了更加深思熟虑,我正在使用Kibana,这里是查询和响应(我被告知要重命名字段值fyi): all term facets count query...
  • 1 votes
     answers
     views

    调查统计信息的Mongo shell查询(使用2D数组展开$)

    我的文档结构(仅为该想法提供了2个): /* 1 */ { "_id" : ObjectId("59edc58af33e9b5988b875fa"), "Agent" : { "Name" : "NomanAgent", "Location&...
  • 3 votes
     answers
     views

    如何使用data.table按日期(月,年,日)和子组聚合结果

    使用R版本3.1.3我试图计算事件日志数据中的事件 . 我有一个timstamped事件的数据集 . 我已经清理了数据,并将其加载到data.table中以便于操作 . Colnames是OrderDate,EventDate,OrderID,EventTypeID,LocationID和EncounterID, 这些事件聚合为:EncounterID具有多个orderID,每个orderID具有...
  • 6 votes
     answers
     views

    ArangoDB分面搜索性能

    我们正在评估AlatoDB在facet计算空间中的性能 . 通过特殊的API或查询语言,还有许多其他产品可以做同样的事情: MarkLogic Facets ElasticSearch聚合 Solr Faceting等 我们知道,Arango中没有特殊的API可以明确地计算出来 . 但实际上,它不是必需的,多亏了全面的AQL,它可以通过简单的查询轻松实现,如: FOR a in A...
  • 0 votes
     answers
     views

    聚合返回键中的术语,但不返回根据排序条件排序的完整字段

    从ES 5.4获得不同的 Headers 我有问题 . 它只返回单个不同的单词而不是整个 Headers . 我已经创建了原始多字段,如question中所示 . 我已经从那里调整了解决方案到current mapping changes但是由于我收到错误它不能正常工作: “默认情况下,Fielddata在文本字段上被禁用 . 在[title.raw]上设置fielddata = true,以便...
  • 0 votes
     answers
     views

    总计平均聚合总数(DAX)

    我在PowerPivot中创建了一个具有以下公式的度量:计算的百分比:= [PercentageA] [PercentageB] * AVERAGE([Multiplier]) 结果如下: 我想从这个度量中得到的是Desired values列 . 重点是将总计作为度量值的总和,而不是将总计百分比B乘以乘数的总平均值 .
  • 110 votes
     answers
     views

    显示所有Elasticsearch聚合结果/桶而不仅仅是10

    我试图在聚合上列出所有桶,但它似乎只显示前10个 . 我的搜索: curl -XPOST "http://localhost:9200/imoveis/_search?pretty=1" -d' { "size": 0, "aggregations": { "bairro_count": { ...
  • 3 votes
     answers
     views

    SQL - 基于DateTime查询多个聚合 - MySQL

    这是一个复杂的问题 . 但我有一个表有一个DATETIME字段,还有一些其他int和float字段需要求和和平均 . 我们希望根据时间戳对此表进行求和和平均,并最终旨在开发3个查询,这些查询在某种意义上将相互构建 . 所以能干看起来像这样 TIMESTAMP |subj_diff| SCR2 | SCR3 2011-09-20 09:01:37 | 1 | 0.02 | ...
  • 1 votes
     answers
     views

    消息聚合的Camel条件

    我正在寻找一种基于消息聚合有条件地处理消息的方法 . 我已经研究了很多方法,但似乎Apache Camel不支持它 . 我将解释这个场景,然后解释我尝试过的解决方案 . 场景:我正在尝试有条件地清理目录 . 我每隔x天从目录轮询并获取所有文件(file:// ...) . 我将其路由到聚合,聚合将文件聚合为单个大小(directorySize) . 然后我检查这个大小是否超过了某个阈值 . 这就是...
  • 7 votes
     answers
     views

    Elasticsearch:从聚合中的存储区访问值

    我想创建单词 Cloud 来可视化Elasticsearch查询的结果 . 在词 Cloud 中,应显示与查询匹配的文档中出现的所有术语 . 因此,我需要计算某些任意文档集中出现的所有术语的术语频率 . 问题在于我需要文档中所有术语的实际频率,而不仅仅是术语出现的文档数量(这可以使用术语聚合或方面轻松解决) . 给出以下测试指数 curl -XPOST localhost:9200/test -d...
  • 0 votes
     answers
     views

    ElasticSearch动态存储桶聚合

    目前我有以下映射: array( 'index' => 'my_index', 'body' => array( 'mappings' => array( 'products' => array( '_source' => array...
  • 132 votes
     answers
     views

    继承与聚合[关闭]

    关于如何在面向对象的系统中最好地扩展,增强和重用代码,有两种思路: 继承:通过创建子类来扩展类的功能 . 覆盖子类中的超类成员以提供新功能 . 当超类想要一个特定的接口但是对它的实现不可知时,使方法抽象/虚拟以强制子类“填空” . 聚合:通过获取其他类并将它们组合到一个新类中来创建新功能 . 为这个新类附加一个公共接口,以便与其他代码互操作 . 每个的好处,成本和后果是什么?还有其他选...
  • 2 votes
     answers
     views

    elasticsearch中嵌套字段的平均和直方图聚合

    我在elasticsearch中有一个嵌套文档,如下所示: { { "doctxt": "doca", "nested": [ { "pos": 1, "txt": "terma" }, { ...
  • 1 votes
     answers
     views

    Elasticsearch术语或基数聚合 - 按不同值的数量排序

    朋友们, 我正在做一些分析,以找出数百万个文档中的唯一对 . 模拟示例如下所示: doc field1 field2 AAA:BBB AAA:CCC PPP:QQQ PPP:QQQ XXX:YYY XXX:YYY MMM:NNN 90%的文档包含一个唯一的对,如上面的文档3,4,5,6和7所示,我对我的聚合结果不感兴趣 . 我有兴趣汇总文档1和2 . 条款聚合查询:...
  • 0 votes
     answers
     views

    通过Elasticsearch术语聚合计算重复值

    我正在尝试在索引中的文档的多个字段上运行Elasticsearch术语聚合 . 每个文档都包含多个带标签的字段,可以使用自定义标签分析器提取 . 目标是找到系统中最常见的主题标签 . 如Elasticsearch documentation中所述,无法在文档的多个字段上运行术语聚合 . 因此我试图使用 copy_to 字段 . 现在的问题是,如果文档在多个字段中包含相同的#标签,则应该多次计算该术...

热门问题