我休息后回到编程 .

Data structures have grown in size tremendously. 我记得,过去的约束是内存大小,处理器速度和代码大小 . 凭借非常大的数据集和丰富的机器资源,这些约束变得极小 .

Correct me if I am wrong, but the goals now are knowing how to:

  • 有效地遍历数据集(数据结构/策略)

  • 尽可能少的通过(算法效率)

  • 具有最少的重复计算(数学/统计专业知识)

If I am right ,我看到预处理,准备数据,创建查找表,尽可能预先计算或索引等等......基本上在可能的情况下提供支持......创造了巨大的 Value .


基本上,你会跑进来,快速浏览一下数据 . 除了你的智慧,你不会随身携带任何东西,除了你的答案之外别无他法 . 杰克敏捷,杰克很快 .


I have also seen some algorithms 通过数据集迭代多次,但由于它可能保留在缓存中,因此操作很快 . 作为交换,他们可以同时执行输入和输出(图像处理),或同时进行io和计算(例如,在cpu中完成io和缓冲,在gpu中完成处理) . 所以并行操作 might 值得做重复的任务 .

I can hunt all over down rabbit holes 并找到了小宝贝和金块,但是很久以来我已经退出了一段时间 . 必须有很多地方收集和共享这些策略和算法 .

I usually work in python, but I am extremely flexible and I am the one asking for help, after all. Help teach this old dog some new tricks.