插件窝 干货文章 numpy删除单行、删除单列、删除多列实现方式

numpy删除单行、删除单列、删除多列实现方式

gt arr 数组 array 440    来源:    2024-10-17

numpy删除单行、删除单列、删除多列

import numpy as np

删除元素

通过index删除单行、删除单列、删除多行

def delFun():
    """
    删除
    :return:
    """
    source = np.array([[1, 2, 3], [1, 2, 3], [1, 2, 3]])

    # 删除第三行
    del_arr_1 = source.copy()
    del_row = np.delete(del_arr_1, 2, axis=0)

    # 删除第二列
    del_arr_2 = source.copy()
    del_col = np.delete(del_arr_2, 1, axis=1)

    # 删除第二、三行
    del_arr_3 = source.copy()
    del_mult_row = np.delete(del_arr_3, (null, 2), axis=0)

    print(del_row)
    print(del_col)
    print(del_mult_row)

原始数据

   [
        [1 2 3]
        [1 2 3]
        [1 2 3]
    ]

del_row 删除第三行 返回结果

   [
        [1 2 3]
        [1 2 3]
    ]

del_col 删除第二列 返回结果

   [
        [1 3]
         [1 3]
         [1 3]
    ]

del_mult_row 删除第二、三行 返回结果

   [
        [1 2 3]
    ]

Numpy增加和删除元素

1. delete

numpy.delete(arr, obj, axis=None):

  • arr:类数组。操作对象
  • obj:切片、整数或者整数数组。指示要沿指定轴(由参数axis指定)删除的子数组的索引
  • axis:整数型,可选参数。指示删除子数组(由参数obj指定)所沿的轴
  • axis = None:arr会先按行展开,然后按照obj,删除第obj-1(从0开始)位置的数,返回一个展开的arr
>>> arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

# obj参数
>>> np.delete(arr,1,1)
array([[ 1,  3,  4],
       [ 5,  7,  8],
       [ 9, 11, 12]])

>>> np.delete(arr,[1,2],axis=1)
array([[ 1,  4],
       [ 5,  8],
       [ 9, 12]])

# axis参数
>>> np.delete(arr,1,0)
array([[ 1,  2,  3,  4],
       [ 9, 10, 11, 12]])
       
>>> np.delete(arr,1)
array([ 1,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

2. insert

numpy.insert(arr, obj, values, axis=None):沿着给定的轴(axis),在给定的索引(obj)之前插入值

  • arr:类数组。操作对象
  • obj:切片、整数或者整数数组。指示插入values的位置索引(可以是单个索引也可以是多个索引),values插入在这些索引之前。
  • values:类数组。插入到arr中的值

如果values的数据类型和arr的数据类型不同,values会被自动转换为arr的数据类型

values的形状应使 arr[…,obj,…] = values 合法

  • axis:整数,可选参数。指示values沿着哪个轴插入

axis = None:arr会先被展平,类似numpy.delete函数

>>> arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

# obj参数
>>> np.insert(arr,1,0,axis=1)
array([[ 1,  0,  2,  3,  4],
       [ 5,  0,  6,  7,  8],
       [ 9,  0, 10, 11, 12]])

>>> np.insert(arr,1,[1,2,3],axis=1) # values的形状应使 arr[...,obj,...] = values 合法
array([[ 1,  1,  2,  3,  4],
       [ 5,  2,  6,  7,  8],
       [ 9,  3, 10, 11, 12]])

>>> np.insert(arr,[1,2],np.array([[1,2],[3,4],[5,6]]),axis=1) # values的形状应使 arr[...,obj,...] = values 合法
array([[ 1,  1,  2,  2,  3,  4],
       [ 5,  3,  6,  4,  7,  8],
       [ 9,  5, 10,  6, 11, 12]])

>>> np.insert(arr,[1],[1,2,3],axis=1)
array([[ 1,  1,  2,  3,  2,  3,  4],
       [ 5,  1,  2,  3,  6,  7,  8],
       [ 9,  1,  2,  3, 10, 11, 12]])

# values参数
>>> np.insert(arr,1,[1.5,2,True],axis=1)
array([[ 1,  1,  2,  3,  4],
       [ 5,  2,  6,  7,  8],
       [ 9,  1, 10, 11, 12]])

# axis参数
>>> np.insert(arr,1,0,axis=0)
array([[ 1,  2,  3,  4],
       [ 0,  0,  0,  0],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

>>> np.insert(arr,1,0)
array([ 1,  0,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

注释:特别注意numpy.insert(obj = some_integer)与numpy.insert(obj = [some_integer])的区别。

3. append

numpy.append(arr, values, axis=None):添加值到数组的末尾

  • arr:类数组。操作对象
  • values:类数组 values的形状必须正确
  • axis:整数,可选参数。指示values沿着哪个轴添加到arr末尾
  • axis = None:arr会先被展平,类似numpy.delete和numpy.insert函数
>>> arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

# values参数
>>> np.append(arr,[13,14,15,16],axis=0)
ValueError: all the input arrays must have same number of dimensions, but the array 
at index 0 has 2 dimension(s) and the array at index 1 has 1 dimension(s)

>>> np.append(arr,np.array([[13,14,15,16]]),axis=0)
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12],
       [13, 14, 15, 16]])

>>> np.append(arr,[5,9,13],axis=1)
ValueError: all the input arrays must have same number of dimensions, but the array 
at index 0 has 2 dimension(s) and the array at index 1 has 1 dimension(s)

>>> np.append(arr,np.array([[5],[9],[13]]),axis=1)
array([[ 1,  2,  3,  4,  5],
       [ 5,  6,  7,  8,  9],
       [ 9, 10, 11, 12, 13]])

# axis参数
>>> np.append(arr,[13,14,15,16])
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16])

注释: 特别注意values参数的形状。

4. resize

numpy.resize(a, new_shape):返回具有指定形状的新数组

  • a:类数组。操作对象
  • new_shape:整数或整数序列。调整大小后的数组的形状

如果新数组比原始数组大,那么新数组会用重复的原始数组来填充,这时会按照C语言的顺序重复遍历数组

>>> arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

>>> np.resize(arr,(null,3))
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

>>> np.resize(arr,(null,4))
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12],
       [ 1,  2,  3,  4]])

>>> np.resize(arr,(null,5))
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12,  1,  2,  3]])

>>> np.resize(arr,(null,3))
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

注释:

numpy.resize没有单独考虑各个轴,因此其不适用于插值/外推。所以,numpy.resize不适用于调整图像或数据的大小,其中每个轴代表一个单独的不同实体。

numpy.resize和ndarray.resize的区别:

  • numpy.resize返回原始数据的副本,而ndarray.resize是对原始数据原地(in-place)修改
  • numpy.resize是用原始数组来填充,而ndarray是用0来填充
>>> arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
       
>>> np.resize(arr,[3,5])
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12,  1,  2,  3]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

>>> arr.resize(null,5,refcheck=False)
>>> arr
array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12,  0,  0,  0]])```

numpy.resize和numpy.reshape的区别

  • numpy.resize中新数组的形状可以和原始数组不兼容,而numpy.reshape中新数组的形状必须和原始数组兼容
  • numpy.resize返回的是原始数组的副本,而numpy.reshape返回的是原始数组的视图 
>>> arr = np.array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
>>> id(arr)
2040077636592
>>> arr.ctypes.data
2039348516176

>>> arr_reshape = np.reshape(arr,(null,3))
>>> arr_reshape
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])
>>> id(arr_reshape)
2040077636832
>>> arr_reshape.ctypes.data
2039348516176

>>> arr_resize = np.resize(arr,(null,3))
>>> arr_resize
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])
>>> id(arr_resize)
2040077636752
>>> arr_resize.ctypes.data
2039348513616

>>> arr[0][0] = 0
>>> arr
array([[ 0,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
>>> arr_reshape
array([[ 0,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])
>>> arr_resize
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])

5. trim_zeros

numpy.trim_zeros(filt, trim=‘fb’):修剪一维数组或序列开头和/或尾部的0

filt:一维数组或序列

trim:字符串,可选参数

  • ‘f’:修剪一维数组或序列开头的0
  • ‘b’:修剪一维数组或序列尾部的0
  • ‘fb’:修剪一维数组或序列开头和尾部的0(默认值)
>>> arr = np.array([0, 0, 0, 1, 2, 3, 0, 2, 1, 0, 0])
>>> arr
array([0, 0, 0, 1, 2, 3, 0, 2, 1, 0, 0])

>>> np.trim_zeros(arr)
array([1, 2, 3, 0, 2, 1])
>>> np.trim_zeros(arr,trim='f')
array([1, 2, 3, 0, 2, 1, 0, 0])
>>> np.trim_zeros(arr,trim='b')
array([0, 0, 0, 1, 2, 3, 0, 2, 1])

>>> list1 = [0, 0, 0, 1, 2, 3, 0, 2, 1, 0, 0]
>>> np.trim_zeros(list1)
[1, 2, 3, 0, 2, 1]
>>> np.trim_zeros(list1,trim='f')
[1, 2, 3, 0, 2, 1, 0, 0]
>>> np.trim_zeros(list1,trim='b')
[0, 0, 0, 1, 2, 3, 0, 2, 1]

6. unique

numpy.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None):查找数组唯一的元素,返回数组排序后的唯一的元素

参数:

  • ar:类数组
  • return_index:布尔值,可选参数
  • True:返回一个一维的数组unique_indices,其中每个元素表示每个排序后的唯一值在原始数组ar中的索引
  • return_inverse:布尔值,可选参数
  • True:返回一个一维的数组unique_inverse,其中每个元素表示原始数组ar中每个元素在返回的数组中的索引,用于重建原始数组
  • return_counts:布尔值,可选参数
  • True:返回一个一维的数组unique_counts,其中每个元素表示每个排序后的唯一值在原始数组中出现的次数
  • axis:整数或None,可选参数
  • None:原始数组ar会被展平

返回:

  • unique:ndarray对象,排序后的唯一值
  • unique_indices:ndarray对象(长度和unique一致),return_index为True时才返回
  • unique_inverse:ndarray对象(长度和展品后的原始数组一致),return_inverse为True时才返回
  • unique_counts:ndarray对象,return_counts为True时才返回
>>> arr = np.array([[1,2,3,4], [5,6,7,8], [5,6,7,8], [9,10,11,12]])
>>> arr
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

>>> arr_unique, arr_index, arr_inverse, arr_counts = np.unique(arr, return_index=True, return_inverse=True, return_counts=True)
>>> arr_unique
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])
>>> arr_index
array([ 0,  1,  2,  3,  4,  5,  6,  7, 12, 13, 14, 15], dtype=int64)
>>> arr_inverse
array([ 0,  1,  2,  3,  4,  5,  6,  7,  4,  5,  6,  7,  8,  9, 10, 11],
      dtype=int64)
>>> arr_counts
array([1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 1, 1], dtype=int64)

# unique = arr.flatten()[index]
>>> arr.flatten()[arr_index]
array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

# arr = unique[inverse].reshape(arr.shape)
>>> arr_unique[arr_inverse].reshape(arr.shape)
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])

>>> arr_unique_0, arr_index_0, arr_inverse_0, arr_counts_0 = np.unique(arr, return_index=True, return_inverse=True, return_counts=True,axis=0)
>>> arr_unique_0
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
>>> arr_index_0
array([0, 1, 3], dtype=int64)
>>> arr_inverse_0
array([0, 1, 1, 2], dtype=int64)
>>> arr_counts_0
array([1, 2, 1], dtype=int64)

>>> arr_unique_1, arr_index_1, arr_inverse_1, arr_counts_1 = np.unique(arr, return_index=True, return_inverse=True, return_counts=True,axis=1)
>>> arr_unique_1
array([[ 1,  2,  3,  4],
       [ 5,  6,  7,  8],
       [ 5,  6,  7,  8],
       [ 9, 10, 11, 12]])
>>> arr_index_1
array([0, 1, 2, 3], dtype=int64)
>>> arr_inverse_1
array([0, 1, 2, 3], dtype=int64)
>>> arr_counts_1
array([1, 1, 1, 1], dtype=int64)

注释: 本篇中所有函数都会先对待操作数组进行拷贝,再进行操作。

总结

以上为个人经验,希望对您有所帮助。