首页 文章

替换大于某个值的Python NumPy Array的所有元素

提问于
浏览
136

我有一个2D NumPy数组,并希望将其中的所有值替换为大于或等于阈值T的255.0 . 据我所知,最基本的方式是:

shape = arr.shape
result = np.zeros(shape)
for x in range(0, shape[0]):
    for y in range(0, shape[1]):
        if arr[x, y] >= T:
            result[x, y] = 255
  • 最简洁和pythonic的方法是什么?

  • 有没有更快(可能不那么简洁和/或更少pythonic)的方式来做到这一点?

这将是用于人体头部的MRI扫描的窗口/水平调整子程序的一部分 . 2D numpy数组是图像像素数据 .

6 回答

  • 39

    我认为最快和最简洁的方法是使用Numpy的内置索引 . 如果您有 ndarray 名为 arr ,则可以使用值 x 替换所有元素 >255 ,如下所示:

    arr[arr > 255] = x
    

    我在我的机器上用500 x 500随机矩阵运行它,用5替换所有值> 0.5,平均花费7.59ms .

    In [1]: import numpy as np
    In [2]: A = np.random.rand(500, 500)
    In [3]: timeit A[A > 0.5] = 5
    100 loops, best of 3: 7.59 ms per loop
    
  • 7

    因为你实际上想要一个不同的数组 arr ,其中 arr < 255255 否则,这可以简单地完成:

    result = np.minimum(arr, 255)
    

    更一般地说,对于较低和/或上限:

    result = np.clip(arr, 0, 255)
    

    如果您只想访问超过255的值,或更复杂的值,@ mtitan8的答案更为通用,但 np.clipnp.minimum (或 np.maximum )更适合您的情况:

    In [292]: timeit np.minimum(a, 255)
    100000 loops, best of 3: 19.6 µs per loop
    
    In [293]: %%timeit
       .....: c = np.copy(a)
       .....: c[a>255] = 255
       .....: 
    10000 loops, best of 3: 86.6 µs per loop
    

    如果你想在原地进行(即修改 arr 而不是创建 result ),你可以使用 np.minimumout 参数:

    np.minimum(arr, 255, out=arr)
    

    要么

    np.clip(arr, 0, 255, arr)
    

    out= 名称是可选的,因为参数的顺序与函数的定义相同 . )

    对于就地修改,布尔索引加速很多(不必单独制作然后修改副本),但仍然没有 minimum 那么快:

    In [328]: %%timeit
       .....: a = np.random.randint(0, 300, (100,100))
       .....: np.minimum(a, 255, a)
       .....: 
    100000 loops, best of 3: 303 µs per loop
    
    In [329]: %%timeit
       .....: a = np.random.randint(0, 300, (100,100))
       .....: a[a>255] = 255
       .....: 
    100000 loops, best of 3: 356 µs per loop
    

    为了进行比较,如果你想用最小值和最大值限制你的值,没有 clip ,你必须做两次,比如像

    np.minimum(a, 255, a)
    np.maximum(a, 0, a)
    

    要么,

    a[a>255] = 255
    a[a<0] = 0
    
  • 5

    我认为你可以通过使用 where 函数实现最快:

    例如,在numpy数组中查找大于0.2的项并将其替换为0:

    import numpy as np
    
    nums = np.random.rand(4,3)
    
    print np.where(nums > 0.2, 0, nums)
    
  • 1

    您可以考虑使用 numpy.putmask

    np.putmask(arr, arr>=T, 255.0)
    

    这是与Numpy的内置索引的性能比较:

    In [1]: import numpy as np
    In [2]: A = np.random.rand(500, 500)
    
    In [3]: timeit np.putmask(A, A>0.5, 5)
    1000 loops, best of 3: 1.34 ms per loop
    
    In [4]: timeit A[A > 0.5] = 5
    1000 loops, best of 3: 1.82 ms per loop
    
  • 239

    另一种方法是使用 np.place 进行就地替换并使用多维数组:

    import numpy as np
    
    arr = np.arange(6).reshape(2, 3)
    np.place(arr, arr == 0, -10)
    
  • 8

    您还可以使用 &| (和/或)来获得更大的灵活性:

    5到10之间的值: A[(A>5)&(A<10)]

    值大于10或小于5: A[(A<5)|(A>10)]

相关问题