首页 文章

数据分析方法[关闭]

提问于
浏览
2

我正在寻找一个报告工具 . 数据驻留在~6GB的postgresql数据库中 . 该应用程序是一个在线商店/目录应用程序,具有项目和订单 . 利益相关者正在请求一项功能,允许他们搜索项目并计算过去两年中所有这些订单的计数 .

某些行包含数量和度量单位,这将需要每行的数量和UoM的乘积 .

未来还可能需要其他报告功能 .

我没有深入研究编程的数据分析方面 . 我喜欢Clojure,所以我很高兴找到一个使用Clojure的解决方案,但前提是Clojure为我的需求提供了有竞争力的工具 .

以下是我正在考虑的一些选项:

  • 只是SQL

  • Clojure

  • core.reducers

  • 一个clojure hadoop库

  • Hadoop

任何人都可以为我解决这些问题吗?你会推荐哪些文章?

1 回答

  • 1

    Hadoop可能对这个项目有点过分 . 似乎很可能只是简单地使用Clojure-jdbc或Korma从数据库中读取数据并在Clojure中过滤/减少它可能会很好 . 在工作中,我们通常使用该大小的序列,但这取决于预期的响应时间 . 如果需要即时响应,您可能需要进行一些预处理和缓存 .

相关问题