首页 文章

Rust能够优化本地堆分配吗?

提问于
浏览
3

在编写相对实时的代码时,通常避免主执行循环中的堆分配 . 因此,根据我的经验,您可以在初始化步骤中分配程序所需的所有内存,然后根据需要传递内存 . C中的玩具示例可能如下所示:

#include <stdlib.h>

#define LEN 100

void not_realtime() {
    int *v = malloc(LEN*sizeof(int));
    for (int i=0; i<LEN; i++) {
        v[i] = 1;
    }
    free(v);
}

void realtime(int *v, int len) {
    for (int i=0; i<len; i++) {
        v[i] = 1;
    }
}

int main(int argc, char **argv) {

    not_realtime();

    int *v = malloc(LEN*sizeof(int));
    realtime(v, LEN);
    free(v);
}

而且我相信Rust中的等价物:

fn possibly_realtime() {
    let mut v = vec![0; 100];
    for i in 0..v.len() {
        v[i] = 1;
    }
}

fn realtime(v: &mut Vec<i32>) {
    for i in 0..v.len() {
        v[i] = 1;
    }
}

fn main() {

    possibly_realtime();

    let mut v: Vec<i32> = vec![0; 100];
    realtime(&mut v);
}

我想知道的是:Rust是否能够优化 possibly_realtime ,这样 v 的本地堆分配只发生一次,并在后续调用 possibly_realtime 时重用?我有一些神奇的东西使它成为可能 .

1 回答

  • 5

    截至目前,它是 not 优化 . 要调查此问题,将 #[inline(never)] 添加到您的函数,然后查看LLVM IR on the playpen非常有用 . 这是一段摘录:

    ; Function Attrs: noinline uwtable
    define internal fastcc void @_ZN17possibly_realtime20h1a3a159dd4b50685eaaE() unnamed_addr #0 {
    entry-block:
      %0 = tail call i8* @je_mallocx(i64 400, i32 0), !noalias !0
      %1 = icmp eq i8* %0, null
      br i1 %1, label %then-block-255-.i.i, label %normal-return2.i
    

    也就是说,每次调用 possibly_realtime 时,都会通过 je_mallocx 分配内存 .

    社论

    重用缓冲区是泄露安全信息的好方法,我鼓励你 avoid it as much as possible . 我相信你已经熟悉这些问题,但我想确保未来的搜索者做出记录 .

    我也怀疑这个"optimization"会被添加到Rust中,尤其是没有程序员明确选择加入 . 需要在某处可以存储指向已分配内存的指针,但实际上并不存在 . 这意味着它需要是一个全局或线程局部变量! Rust可以在没有线程的环境中运行,但是全局变量仍然会阻止对此方法的递归调用 . 总而言之,我认为将缓冲区传递给方法会更明确地说明会发生什么 .

    我还假设您的示例使用具有固定大小的 Vec 用于演示目的,但如果您在编译时确实知道大小,则固定大小的数组可能是更好的选择 .

相关问题