首页 文章
  • 7 votes
     answers
     views

    ggplot2:为每个方面添加具有总体中位数的hline

    我想绘制一个水平小平面线与该方面的总体中位数 . 我尝试了这种方法,但没有使用以下代码创建虚拟汇总表: require(ggplot2) dt = data.frame(gr = rep(1:2, each = 500), id = rep(1:5, 2, each = 100), y = c(rnorm(500, mean = 0, sd = ...
  • 2 votes
     answers
     views

    2D中值滤波器,忽略nan值

    作为我项目的一部分,我需要使用在rxr窗口上执行中值过滤的代码,并忽略nan值 . 我目前使用MATLAB的nlfilter函数 . 问题是它非常慢:300x300示例需要将近5秒,而MATLAB的medfilt2需要0.2秒 . 有没有人有更高效和优雅的解决方案? 注意:在我的情况下,在边界上的行为并不重要 . 在这个例子中,nlfilter自动用零填充数组,但其他解决方案,如边界重复也是可以的...
  • 45 votes
     answers
     views

    找到数组总和的中位数

    给出了两个长度为n的排序数组,问题是在O(n)时间内找到它们的和数组的中值,它包含数组A的每个元素和数组B的每个元素之间的所有可能的成对和 . 例如:令A [2,4,6]和B [1,3,5]为两个给定的数组 . sum数组是 [2+1,2+3,2+5,4+1,4+3,4+5,6+1,6+3,6+5] . 在O(n)中找到该数组的中位数 . 在O(n ^ 2)中解决问题非常简单,但是对于这个问题...
  • 0 votes
     answers
     views

    很多 Value 中位数

    我正在寻找C中最好的方法,如果可能的话,计算很多现场值的中位数 . 这是情况,我正在阅读PGM图像(灰色图像)并读取所有灰色值[0到255之间]并获得中值 . 我考虑过存储所有这些数字并对数组进行排序,但内存管理在这个项目中非常重要,所以我正在寻找一种实时方法来获得中位数 . 有任何想法吗 ?谢谢 在另一个主题中,没有明确的答案可以真正帮助我 .
  • 38 votes
     answers
     views

    如何计算或近似列表的中位数而不存储列表

    我正在尝试计算一组值的中位数,但我不想存储所有值,因为这可能会破坏内存需求 . 有没有一种计算或近似中位数的方法而不存储和排序所有单个值? 理想情况下,我想编写我的代码,如下所示 var medianCalculator = new MedianCalculator(); foreach (var value in SourceData) { medianCalculator.Add(valu...
  • 5 votes
     answers
     views

    在1.5秒内找到超过2000万个3到4个不同整数的中位数

    我试图排序并找到一个只包含3到4个不同整数的整数字符串的中位数 . 我正在处理的数字量大约为2千万到2千5百万,我应该对向量进行排序,每次将新整数添加到向量中时找到中位数,并将中位数添加到单独的“总计”变量中每次生成中位数时,它会汇总所有中位数 . 1 Median: 1 Total: 1 1 , 2 Med...
  • 174 votes
     answers
     views

    用MySQL计算中值的简单方法

    's the simplest (and hopefully not too slow) way to calculate the median with MySQL? I'使用了 AVG(x) 来查找平均值,但我将所有行返回给PHP,进行排序,然后选择中间行,但肯定必须有一些简单的方法在单个MySQL查询中执行 . 示例数据: id | val -------- 1 4 2 7 ...
  • 37 votes
     answers
     views

    如何使用Spark查找中值和分位数

    如何使用分布式方法,IPython和Spark找到 RDD 整数的中位数? RDD 大约有700,000个元素,因此太大而无法收集并找到中位数 . 这个问题与这个问题类似 . 但是,问题的答案是使用Scala,我不知道 . How can I calculate exact median with Apache Spark? 使用Scala答案的思考,我试图在Python中编写类似的答案 . 我...
  • 22 votes
     answers
     views

    C有效计算正在运行的中位数[重复]

    这个问题在这里已有答案: Find running median from a stream of integers [duplicate] 8个答案 那些读过我之前问题的人都知道我在理解和实现快速排序和快速选择方面的工作,以及其他一些基本算法 . Quickselect用于计算未排序列表中的第k个最小元素,此概念也可用于查找未排序列表中的中位数 . 这一次,我需要帮助设计一种有效的技术来计算...
  • 0 votes
     answers
     views

    DAX的中位数和切片机

    我有一个问题,我希望一些更有经验的DAX程序员可以帮助我 . 我一直在尝试在Excel 2013 / PowerPivot / PowerView中开发仪表板,我想要显示的图形之一是按小时计算的中位数性能线图 . 然后,我想基于单独的列使用我的性能指标过滤数据集,并将其链接到切片器 . 应该相对于过滤的数据集计算中位数 . 对于中位数计算,我试图调整Marco Russo提出的公式(http://...
  • 106 votes
     answers
     views

    C中的滚动中值算法

    我目前正在研究一种在C中实现滚动中值滤波器(类似于滚动均值滤波器)的算法 . 从我对文献的研究中,似乎有两种合理有效的方法 . 第一种是对值的初始窗口进行排序,然后执行二进制搜索以插入新值并在每次迭代时删除现有值 . 第二个(来自Hardle和Steiger,1995,JRSS-C,算法296)构建了一个双端堆结构,一端是maxheap,另一端是minheap,中间是中间值 . 这产生线性时间算法...
  • 1 votes
     answers
     views

    使用d中的dplyr的summarize()获取中位数

    我有一个按日期和时间间隔列出的整数计数观察数据框 . 我想使用dplyr软件包按日期查找这些观察结果的中位数 . 我已经正确格式化了日期列,并使用了group_by,如下所示: data.bydate <- group_by(data.raw, date) 当我使用summarize()来查找每个日期组的中位数时,我得到的只是一堆零 . 数据中有NA,所以我用na.rm = TRUE剥离它...

热门问题