我有一个大型数据集,其中包含16位无符号整数的3d数组。我想将每个整数转换为位,然后仅保留其8:12位为“ 0000”的值。到目前为止,我在三个阶段中使用了非常慢的循环方法:
import numpy as np
# Generate random data
a = np.ones([4,1200,1200], dtype="int16")
# Generate an array which serves later as mask
b = np.zeros(a.shape, dtype=int)
for i in range(4):
for j in range(1200):
for k in range(1200):
b[i,j,k] = int('{:016b}'.format(a[i,j,k])[8:12])
a = np.ma.masked_where(b!=0, a)
如果您能提出一个干净快捷的替代方法,我将不胜感激
您的问题和示例有些令人困惑,但是通常,如果您希望专注于某些位,则可以使用正确的掩码应用二进制和运算符&
。因此,如果要在16位无符号整数中选择“ 8:12位”,则该掩码0b0000000011110000
为240
。
例如,有了arr = np.random.randint(0, 2 ** 16 - 1, (6, 6))
,
array([[28111, 29985, 2056, 24534, 2837, 49004],
[ 7584, 8798, 38715, 40600, 26665, 51545],
[34279, 8134, 16112, 59336, 15373, 46839],
[ 131, 12500, 11779, 44852, 57627, 50253],
[63222, 60588, 9191, 3033, 18643, 8975],
[17299, 62925, 31776, 10933, 59953, 28443]])
然后np.ma.masked_where(arr & 240, arr)
产生
masked_array(
data=[[--, --, 2056, --, --, --],
[--, --, --, --, --, --],
[--, --, --, --, 15373, --],
[--, --, 11779, --, --, --],
[--, --, --, --, --, 8975],
[--, --, --, --, --, --]],
mask=[[ True, True, False, True, True, True],
[ True, True, True, True, True, True],
[ True, True, True, True, False, True],
[ True, True, False, True, True, True],
[ True, True, True, True, True, False],
[ True, True, True, True, True, True]],
fill_value=999999)
这与使用for
循环得到的结果一致。
非常感谢Edward。您为我提供了确切的解决方案。抱歉,我的问题和示例有些混乱。
可能我无法完全遵循它。如果我必须保留所有3:5位为“ 00”的值并屏蔽其他所有内容,该怎么办。(例如,我想屏蔽xxx11xxxxxxxxxxx或xxx10xxxxxxxxxxx或xxx01xxxxxxxxxxx)