不懂 NumPy 算什么 Python 程序员? CSDN 博文精选
作者 | 天元浪子
责编 | 郭芮
出品 | CSDN 博客
大约七八年前,我曾经用 pyOpenGL 画过地球磁层顶的三维模型,这段代码至今仍然还运行在某科研机构里。在那之前,我一直觉得自己是一个合(you)格(xiu)的 Python 程序员,似乎无所不能。但磁层顶模型的显示效果令我沮丧——尽管这个模型只有十几万个顶点,拖拽、缩放却非常卡顿。
最终,我把顶点数量删减到两万左右,以兼顾模型质量和响应速度,才勉强交付了这个任务。从此我开始怀疑 Python 的性能,甚至一度怀疑 Python 是否还是我的首选工具。
幸运的是,后来我遇到了 NumPy 这个神器。NumPy 是 Python 科学计算的基础软件包,提供多维数组对象,多种派生对象(掩码数组、矩阵等)以及用于快速操作数组的函数及 API,它包括数学、逻辑、数组形状变换、排序、选择、I/O 、离散傅立叶变换、基本线性代数、基本统计运算、随机模拟等等。
了解 NumPy 之后,我才想明白当初磁层顶的三维模型之所以慢,是因为使用了 list(Python 数组)而不是 ndarray(NumPy 数组)存储数据。有了 NumPy,Python 程序员才有可能写出媲美 C 语言运行速度的代码。熟悉 NumPy,才能学会使用 PyOpenGL / PyOpenCV / Pandas / Matplotlib 等数据处理及可视化的模块。
事实上,NumPy 的数据组织结构,尤其是数组(numpy.ndarray),几乎已经成为所有数据处理与可视化模块的标准数据结构了(这一点,类似于在机器学习领域 Python 几乎已经成为首选工具语言)。越来越多的基于 Python 的科学和数学软件包使用 NumPy 数组,虽然这些工具通常都支持 Python 的原生数组作为参数,但它们在处理之前会还是会将输入的数组转换为 NumPy 的数组,而且也通常输出为 NumPy 数组。在 Python 的圈子里,NumPy 的重要性和普遍性日趋增强。换句话说,为了高效地使用当今科学/数学基于 Python 的工具(大部分的科学计算工具),你只知道如何使用 Python 的原生数组类型是不够的,还需要知道如何使用 numpy 数组。
在这个 AI 和 ML 霸屏的时代,如果不懂 NumPy,请别说自己是 Python 程序员。
list VS ndarray
numpy 的核心是 ndarray 对象(numpy 数组),它封装了 python 原生的同数据类型的 n 维数组(python 数组)。numpy 数组和 python 数组之间有几个重要的区别:
numpy 数组一旦创建,其元素数量就不能再改变了。增删 ndarray 元素的操作,意味着创建一个新数组并删除原来的数组。python 数组的元素则可以动态增减。
numpy 数组中的元素都需要具有相同的数据类型,因此在内存中的大小相同。python 数组则无此要求。
numpy 数组的方法涵盖了大量数学运算和复杂操作,许多方法在最外层的 numpy 命名空间中都有对应的映射函数。和 python 数组相比,numpy 数组的方法功能更强大,执行效率更高,代码更简洁。
然而,以上的差异并没有真正体现出 ndarray 的优势之所在,ndarray 的精髓在于 numpy 的两大特征:矢量化(vectorization)和广播(broadcast)。矢量化可以理解为代码中没有显式的循环、索引等,广播可以理解为隐式地对每个元素实施操作。矢量化和广播理解起来有点抽象,我们还是举个栗子来说明一下吧。
例题:a 和 b 是等长的两个整数数组,求 a 和 b 对应元素之积组成的数组。
1、用 python 数组实现:
c = listfor i in range(len(a)):c.append(a[i]*b[i])
2、用 numpy 数组实现:
c = a*b
这个栗子是不是体现了矢量化和广播的强大力量呢?请仔细体会!
总结:
矢量化代码更简洁,更易于阅读;
更少的代码行通常意味着更少的错误;
代码更接近于标准的数学符号;
矢量化代码更 pythonic。
dtype AND shape
子曰:找对象先了解品行,学对象先了解属性。ndarray 对象有很多属性,详见下表。
基于以下三个原因,我认为,dtype 和 shape 是 ndarray 最重要的两个属性,重要到几乎可以忽略其他的属性。
我们趟过的坑,几乎都是 dtype 挖的;
我们的迷茫,几乎都是因为 shape 和我们期望的不一样;
我们的工作,很多都是在改变 shape。
ndarray.astype 可以修改元素类型,ndarray.reshape 可以重新定义数组的结构,这两个方法的重要性和其对应的属性一样。记住这两个属性和对应的两个方法,就算是登堂入室了。想了解 numpy 支持的元素类型,请点击《数学建模三剑客MSN》(https://blog.csdn.net/xufive/article/details/52449255)。
创建数组
(1) 创建简单数组
numpy.array(object, dtype=None, copy=True, order=None, subok=False, ndmin=0)numpy.empty(shape, dtype=float, order='C')numpy.zeros(shape, dtype=float, order='C')numpy.ones(shape, dtype=float, order='C')numpy.eye(N, M=None, k=0, dtype=float, order='C')
应用示例:
>>> import numpy as np>>>> np.array([1, 2, 3])array([1, 2, 3])>>> np.empty((2, 3))array([[2.12199579e-314, 6.36598737e-314, 1.06099790e-313],[1.48539705e-313, 1.90979621e-313, 2.33419537e-313]])>>> np.zeros(2)array([0., 0.])>>> np.ones(2)array([1., 1.])>>> np.eye(3)array([[1., 0., 0.],[0., 1., 0.],[0., 0., 1.]])
(2) 创建随机数组
numpy.random.random(size=None)numpy.random.randint(low, high=None, size=None, dtype='l')
应用示例:
>>> np.random.random(3)array([0.29334156, 0.45858765, 0.99297047])>>> np.random.randint(2, size=10)array([1, 0, 0, 0, 1, 1, 0, 0, 1, 0])>>> np.random.randint(5, size=(2, 4))array([[4, 0, 2, 1],[3, 2, 2, 0]])>>> np.random.randint(3,10,(2,4))array([[4, 8, 9, 6],[7, 7, 7, 9]])
(3) 在数值范围内创建数组
numpy.arange(start, stop, step, dtype=None)numpy.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)numpy.logspace(start, stop, num=50, endpoint=True, base=10.0, dtype=None)
应用示例:
>>> np.arange(5)array([0, 1, 2, 3, 4])>>> np.arange(0,5,2)array([0, 2, 4])>>> np.linspace(0, 5, 5)array([0. , 1.25, 2.5 , 3.75, 5. ])>>> np.linspace(0, 5, 5, endpoint=False)array([0., 1., 2., 3., 4.])>>> np.logspace(1,3,3)array([ 10., 100., 1000.])>>> np.logspace(1, 3, 3, endpoint=False)array([ 10. , 46.41588834, 215.443469 ])
(4) 从已有数组创建数组
numpy.asarray(a, dtype=None, order=None)numpy.empty_like(a, dtype=None, order='K', subok=True)numpy.zeros_like(a, dtype=None, order='K', subok=True)numpy.ones_like(a, dtype=None, order='K', subok=True)[source]
应用示例:
>>> np.asarray([1,2,3])array([1, 2, 3])>>> np.empty_like(np.asarray([1,2,3]))array([0, 0, 0])>>> np.zeros_like(np.asarray([1,2,3]))array([0, 0, 0])>>> np.ones_like(np.asarray([1,2,3]))array([1, 1, 1])
(5) 构造复杂数组
[1] 重复数组 tile
>>> a = np.arange(3)>>> aarray([0, 1, 2])>>> np.tile(a, 2)array([0, 1, 2, 0, 1, 2])>>> np.tile(a, (2,3))array([[0, 1, 2, 0, 1, 2, 0, 1, 2],[0, 1, 2, 0, 1, 2, 0, 1, 2]])
[2] 重复元素 repeat
>>> a = np.arange(3)>>> aarray([0, 1, 2])>>> a.repeat(2)array([0, 0, 1, 1, 2, 2])
[3] 一维数组网格化: meshgrid
>>> lon = np.arange(30, 120, 10)>>> lonarray([ 30, 40, 50, 60, 70, 80, 90, 100, 110])>>> lat = np.arange(10, 50, 10)>>> latarray([10, 20, 30, 40])>>> lons, lats = np.meshgrid(lon, lat)>>> lonsarray([[ 30, 40, 50, 60, 70, 80, 90, 100, 110],[ 30, 40, 50, 60, 70, 80, 90, 100, 110],[ 30, 40, 50, 60, 70, 80, 90, 100, 110],[ 30, 40, 50, 60, 70, 80, 90, 100, 110]])>>> latsarray([[10, 10, 10, 10, 10, 10, 10, 10, 10],[20, 20, 20, 20, 20, 20, 20, 20, 20],[30, 30, 30, 30, 30, 30, 30, 30, 30],[40, 40, 40, 40, 40, 40, 40, 40, 40]])
[4] 指定范围和分割方式的网格化: mgrid
>>> lats, lons= np.mgrid[10:50:10, 30:120:10]>>> latsarray([[10, 10, 10, 10, 10, 10, 10, 10, 10],[20, 20, 20, 20, 20, 20, 20, 20, 20],[30, 30, 30, 30, 30, 30, 30, 30, 30],[40, 40, 40, 40, 40, 40, 40, 40, 40]])>>> lonsarray([[ 30, 40, 50, 60, 70, 80, 90, 100, 110],[ 30, 40, 50, 60, 70, 80, 90, 100, 110],[ 30, 40, 50, 60, 70, 80, 90, 100, 110],[ 30, 40, 50, 60, 70, 80, 90, 100, 110]])>>> lats, lons = np.mgrid[10:50:5j, 30:120:10j]>>> latsarray([[10., 10., 10., 10., 10., 10., 10., 10., 10., 10.],[20., 20., 20., 20., 20., 20., 20., 20., 20., 20.],[30., 30., 30., 30., 30., 30., 30., 30., 30., 30.],[40., 40., 40., 40., 40., 40., 40., 40., 40., 40.],[50., 50., 50., 50., 50., 50., 50., 50., 50., 50.]])>>> lonsarray([[ 30., 40., 50., 60., 70., 80., 90., 100., 110., 120.],[ 30., 40., 50., 60., 70., 80., 90., 100., 110., 120.],[ 30., 40., 50., 60., 70., 80., 90., 100., 110., 120.],[ 30., 40., 50., 60., 70., 80., 90., 100., 110., 120.],[ 30., 40., 50., 60., 70., 80., 90., 100., 110., 120.]])
上面的例子中用到了虚数。构造复数的方法如下:
>>> complex(2,5)(2+5j)
数组操作
(1) 切片和索引
对于一维数组的索引和切片,numpy和python的list一样,甚至更灵活。
a = np.arange(9)>>> a[-1] # 最后一个元素8>>> a[2:5] # 返回第2到第5个元素array([2, 3, 4])>>> a[:7:3] # 返回第0到第7个元素,步长为3array([0, 3, 6])>>> a[::-1] # 返回逆序的数组array([8, 7, 6, 5, 4, 3, 2, 1, 0])
假设有一栋2层楼,每层楼内的房间都是3行4列,那我们可以用一个三维数组来保存每个房间的居住人数(当然,也可以是房间面积等其他数值信息)。
>>> a = np.arange(24).reshape(2,3,4) # 2层3行4列>>> aarray([[[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11]],[[12, 13, 14, 15],[16, 17, 18, 19],[20, 21, 22, 23]]])>>> a[1][2][3] # 虽然可以这样23>>> a[1,2,3] # 但这才是规范的用法23>>> a[:,0,0] # 所有楼层的第1排第1列array([ 0, 12])>>> a[0,:,:] # 1楼的所有房间,等价与a[0]或a[0,...]array([[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11]])>>> a[:,:,1:3] # 所有楼层所有排的第2到4列array([[[ 1, 2],[ 5, 6],[ 9, 10]],[[13, 14],[17, 18],[21, 22]]])>>> a[1,:,-1] # 2层每一排的最后一个房间array([15, 19, 23])
提示:对多维数组切片或索引得到的结果,维度不是确定的。
(2) 改变数组的结构
numpy 数组的存储顺序和数组的维度是不相干的,因此改变数组的维度是非常便捷的操作,除 resize 外,这一类操作不会改变所操作的数组本身的存储顺序。
>>> a = np.array([[1,2,3],[4,5,6]])>>> a.shape # 查看数组维度(2, 3)>>> a.reshape(3,2) # 返回3行2列的数组array([[1, 2],[3, 4],[5, 6]])>>> a.ravel # 返回一维数组array([1, 2, 3, 4, 5, 6])>>> a.transpose # 行变列(类似于矩阵转置)array([[1, 4],[2, 5],[3, 6]])>>> a.resize((3,2)) # 类似于reshape,但会改变所操作的数组>>> aarray([[1, 2],[3, 4],[5, 6]])
np.rollaxis 用于改变轴的顺序,返回一个新的数组。用法如下:
numpy.rollaxis(a, axis, start=0)
a:数组;
axis:要改变的轴,其他轴的相对顺序保持不变;
start:要改变的轴滚动至此位置之前,默认值为0。
应用示例:
>>> a = np.ones((3,4,5,6))>>> np.rollaxis(a, 3, 1).shape(3, 6, 4, 5)>>> np.rollaxis(a, 2).shape(5, 3, 4, 6)>>> np.rollaxis(a, 1, 4).shape(3, 5, 6, 4)
(3) 数组合并
[1] append
对于刚刚上手 numpy 的程序员来说,最大的困惑就是不能使用 append 方法向数组内添加元素了,甚至连 append 方法都找不到了。其实,numpy 仍然保留了 append 方法,只不过这个方法不再是 numpy 数组的方法,而是是升级到最外层的 numpy 命名空间了,并且该方法的功能不再是追加元素,而是合并数组了。
>>> np.append([1, 2, 3], [[4, 5, 6], [7, 8, 9]])array([1, 2, 3, 4, 5, 6, 7, 8, 9])>>> np.append([[1, 2, 3]], [[4, 5, 6]], axis=0)array([[1, 2, 3],[4, 5, 6]])>>> np.append(np.array([[1, 2, 3]]), np.array([[4, 5, 6]]), axis=1)array([[1, 2, 3, 4, 5, 6]])
[2] concatenate
concatenate 和 append 的用法非常类似,不过是把两个合并对象写成了一个元组 。
>>> a = np.array([[1, 2], [3, 4]])>>> b = np.array([[5, 6]])>>> np.concatenate((a, b), axis=0)array([[1, 2],[3, 4],[5, 6]])>>> np.concatenate((a, b.T), axis=1)array([[1, 2, 5],[3, 4, 6]])>>> np.concatenate((a, b), axis=None)array([1, 2, 3, 4, 5, 6])
[3] stack
除了 append 和 concatenate ,数组合并还有更直接的水平合并(hstack)、垂直合并(vstack)、深度合并(dstack)等方式。假如你比我还懒,那就只用 stack 吧,足够了。
>>> a = np.arange(9).reshape(3,3)>>> b = np.arange(9,18).reshape(3,3)>>> aarray([[0, 1, 2],[3, 4, 5],[6, 7, 8]])>>> barray([[ 9, 10, 11],[12, 13, 14],[15, 16, 17]])>>> np.hstack((a,b)) # 水平合并array([[ 0, 1, 2, 9, 10, 11],[ 3, 4, 5, 12, 13, 14],[ 6, 7, 8, 15, 16, 17]])>>> np.vstack((a,b)) # 垂直合并array([[ 0, 1, 2],[ 3, 4, 5],[ 6, 7, 8],[ 9, 10, 11],[12, 13, 14],[15, 16, 17]])>>> np.dstack((a,b)) # 深度合并array([[[ 0, 9],[ 1, 10],[ 2, 11]],[[ 3, 12],[ 4, 13],[ 5, 14]],[[ 6, 15],[ 7, 16],[ 8, 17]]])
stack 函数原型为 stack(arrays, axis=0),请注意体会下面例子中的 axis 的用法。
>>> a = np.arange(60).reshape(3,4,5)>>> b = np.arange(60).reshape(3,4,5)>>> a.shape, b.shape((3, 4, 5), (3, 4, 5))>>> np.stack((a,b), axis=0).shape(2, 3, 4, 5)>>> np.stack((a,b), axis=1).shape(3, 2, 4, 5)>>> np.stack((a,b), axis=2).shape(3, 4, 2, 5)>>> np.stack((a,b), axis=3).shape(3, 4, 5, 2)
(4) 数组拆分
拆分是合并的逆过程,概念是一样的,但稍微有一点不同:
>>> a = np.arange(4).reshape(2,2)>>> aarray([[0, 1],[2, 3]])>>> x, y = np.hsplit(a, 2) # 水平拆分,返回list>>> xarray([[0],[2]])>>> yarray([[1],[3]])>>> x, y = np.vsplit(a, 2) # 垂直拆分,返回list>>> xarray([[0, 1]])>>> yarray([[2, 3]])>>> a = np.arange(8).reshape(2,2,2)>>> aarray([[[0, 1],[2, 3]],[[4, 5],[6, 7]]])>>> x,y = np.dsplit(a, 2) # 深度拆分,返回list>>> xarray([[[0],[2]],[[4],[6]]])>>> yarray([[[1],[3]],[[5],[7]]])
(5) 数组排序
排序不是 numpy 数组的强项,但 python 数组的排序速度依然只能望其项背。
[1] numpy.sort
numpy.sort 函数返回输入数组的排序副本。
numpy.sort(a, axis=-1, kind='quicksort', order=None)
a:要排序的数组;
axis:沿着它排序数组的轴,如果没有,数组会被展开,沿着最后的轴排序;
kind:排序方法,默认为’quicksort’(快速排序),其他选项还有 ‘mergesort’(归并排序)和 ‘heapsort’(堆排序);
order:如果数组包含字段,则是要排序的字段。
应用示例:
>>> a = np.array([3, 1, 2])>>> np.sort(a)array([1, 2, 3])>>> dt = np.dtype([('name', 'S10'),('age', int)])>>> a = np.array([("raju",21),("anil",25),("ravi", 17), ("amar",27)], dtype = dt)>>> aarray([(b'raju', 21), (b'anil', 25), (b'ravi', 17), (b'amar', 27)],dtype=[('name', 'S10'), ('age', '<i4')])>>> np.sort(a, order='name')array([(b'amar', 27), (b'anil', 25), (b'raju', 21), (b'ravi', 17)],dtype=[('name', 'S10'), ('age', '<i4')])
[2] numpy.argsort
函数返回的是数组值从小到大的索引值。
numpy.argsort(a, axis=-1, kind='quicksort', order=None)
a:要排序的数组;
axis:沿着它排序数组的轴,如果没有,数组会被展开,沿着最后的轴排序;
kind:排序方法,默认为’quicksort’(快速排序),其他选项还有 ‘mergesort’(归并排序)和 ‘heapsort’(堆排序);
order:如果数组包含字段,则是要排序的字段。
应用示例:
>>> a = np.array([3, 1, 2])>>> np.argsort(a)array([1, 2, 0], dtype=int64)
(6) 查找和筛选
[1] 返回数组中最大值和最小值的索引
numpy.argmax(a, axis=None, out=None)numpy.argmin(a, axis=None, out=None)
[2] 返回数组中非零元素的索引
numpy.nonzero(a)
[3] 返回数组中满足给定条件的元素的索引
numpy.where(condition[, x, y])
应用示例:
>>> a = np.arange(10)>>> aarray([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])>>> np.where(a < 5)(array([0, 1, 2, 3, 4], dtype=int64),)>>> a = a.reshape((2, -1))>>> aarray([[0, 1, 2, 3, 4],[5, 6, 7, 8, 9]])>>> np.where(a < 5)(array([0, 0, 0, 0, 0], dtype=int64), array([0, 1, 2, 3, 4], dtype=int64))>>> np.where(a < 5, a, 10*a)array([[ 0, 1, 2, 3, 4],[50, 60, 70, 80, 90]])
[4] 返回数组中被同结构布尔数组选中的各元素
numpy.extract(condition, arr)
应用示例:
>>> a = np.arange(12).reshape((3, 4))>>> aarray([[ 0, 1, 2, 3],[ 4, 5, 6, 7],[ 8, 9, 10, 11]])>>> condition = np.mod(a, 3)==0>>> conditionarray([[ True, False, False, True],[False, False, True, False],[False, True, False, False]])>>> np.extract(condition, a)array([0, 3, 6, 9])
(7) 增减元素
[1] 在给定索引之前沿给定轴在输入数组中插入值,并返回新的数组
numpy.insert(arr, obj, values, axis=None)
应用示例:
>>> a = np.array([[1, 1], [2, 2], [3, 3]])>>> aarray([[1, 1],[2, 2],[3, 3]])>>> np.insert(a, 1, 5)array([1, 5, 1, 2, 2, 3, 3])>>> np.insert(a, 1, 5, axis=0)array([[1, 1],[5, 5],[2, 2],[3, 3]])>>> np.insert(a, 1, [5,7], axis=0)array([[1, 1],[5, 7],[2, 2],[3, 3]])>>> np.insert(a, 1, 5, axis=1)array([[1, 5, 1],[2, 5, 2],[3, 5, 3]])
[2] 在给定索引之前沿给定轴删除指定子数组,并返回新的数组
numpy.delete(arr, obj, axis=None)
应用示例:
>>> a = np.array([[1, 2], [3, 4], [5, 6]])>>> aarray([[1, 2],[3, 4],[5, 6]])>>> np.delete(a, 1)array([1, 3, 4, 5, 6])>>> np.delete(a, 1, axis=0)array([[1, 2],[5, 6]])>>> np.delete(a, 1, axis=1)array([[1],[3],[5]])
[3] 去除重复元素
numpy.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)
arr:输入数组,如果不是一维数组则会展开;
return_index:如果为true,返回新列表元素在旧列表中的位置(下标),并以列表形式储;
return_inverse:如果为true,返回旧列表元素在新列表中的位置(下标),并以列表形式储;
return_counts:如果为true,返回去重数组中的元素在原数组中的出现次数。
应用示例:
>>> a = np.array([[1, 0, 0], [1, 0, 0], [2, 3, 4]])>>> np.unique(a)array([0, 1, 2, 3, 4])>>> np.unique(a, axis=0)array([[1, 0, 0],[2, 3, 4]])>>> u, indices = np.unique(a, return_index=True)>>> uarray([0, 1, 2, 3, 4])>>> indicesarray([1, 0, 6, 7, 8], dtype=int64)>>> u, indices = np.unique(a, return_inverse=True)>>> uarray([0, 1, 2, 3, 4])>>> indicesarray([1, 0, 0, 1, 0, 0, 2, 3, 4], dtype=int64)>>> u, num = np.unique(a, return_counts=True)>>> uarray([0, 1, 2, 3, 4])>>> numarray([4, 2, 1, 1, 1], dtype=int64)
(8) 数组IO
numpy 为 ndarray 对象引入了新的二进制文件格式,用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。.npy 文件存储单个数组,.npz 文件存取多个数组。
[1] 保存单个数组到文件
numpy.save(file, arr, allow_pickle=True, fix_imports=True)
file:要保存的文件,扩展名为 .npy,如果文件路径末尾没有扩展名 .npy,该扩展名会被自动加上;
arr:要保存的数组;
allow_pickle:可选,布尔值,允许使用 python pickles 保存对象数组,python 中的 pickle 用于在保存到磁盘文件或从磁盘文件读取之前,对对象进行序列化和反序列化;
fix_imports:可选,为了方便 pyhton2 读取 python3 保存的数据。
[2] 保存多个数组到文件
numpy.savze 函数用于将多个数组写入文件,默认情况下,数组是以未压缩的原始二进制格式保存在扩展名为 .npz 的文件中。
numpy.savez(file, *args, **kwds)
file:要保存的文件,扩展名为 .npz,如果文件路径末尾没有扩展名 .npz,该扩展名会被自动加上;
args:要保存的数组,可以使用关键字参数为数组起一个名字,非关键字参数传递的数组会自动起名为 arr_0, arr_1…
kwds:要保存的数组使用关键字名称。
[3] 从文件加载数组
numpy.load(file, mmap_mode=None, allow_pickle=True, fix_imports=True, encoding='ASCII')
file:类文件对象(支持 seek() 和 read()方法)或者要读取的文件路径;
arr:打开方式,None | ‘r+’ | ‘r’ | ‘w+’ | ‘c’;
allow_pickle:可选,布尔值,允许使用 python pickles 保存对象数组,python 中的 pickle 用于在保存到磁盘文件或从磁盘文件读取之前,对对象进行序列化和反序列化;
fix_imports:可选,为了方便 pyhton2 读取 python3 保存的数据;
encoding:编码格式,‘latin1’ | ‘ASCII’ | ‘bytes’。
应用示例:
a = np.array([[1,2,3],[4,5,6]])b = np.arange(0, 1.0, 0.1)c = np.sin(b)# c 使用了关键字参数 sin_arraynp.savez("runoob.npz", a, b, sin_array = c)r = np.load("runoob.npz")print(r.files) # 查看各个数组名称print(r["arr_0"]) # 数组 aprint(r["arr_1"]) # 数组 bprint(r["sin_array"]) # 数组 c
[4] 使用文本文件存取数组
numpy 也支持以文本文件存取数据。savetxt 函数是以简单的文本文件格式存储数据,对应的使用 loadtxt 函数来获取数据。
应用示例:
a = np.array([1,2,3,4,5]) np.savetxt('out.txt',a)b = np.loadtxt('out.txt')print(b)
常用函数
(1) 舍入函数
[1] 四舍五入
numpy.around(a, decimals=0, out=None)
应用示例:
>>> np.around([-0.42, -1.68, 0.37, 1.64])array([-0., -2., 0., 2.])>>> np.around([-0.42, -1.68, 0.37, 1.64], decimals=1)array([-0.4, -1.7, 0.4, 1.6])>>> np.around([.5, 1.5, 2.5, 3.5, 4.5]) # rounds to nearest even valuearray([ 0., 2., 2., 4., 4.])
[2] 去尾和进一
numpy.floor(a)numpy.ceil(a)
应用示例:
>>> np.floor([-0.42, -1.68, 0.37, 1.64])array([-1., -2., 0., 1.])>>> np.ceil([-0.42, -1.68, 0.37, 1.64])array([-0., -1., 1., 2.])
(2) 数学函数
(3) 统计函数
牛刀小试
例题:vertices 是若干三维空间随机点的集合,p 是三维空间的一点,找出 vertices 中距离 p 点最近的一个点,并计算它们的距离。
1、用 python 数组实现:
import mathvertices = [[3,4,5], [7,8,9], [4,9,3]]p = [2,7,4]d = listfor v in vertices:d.append(math.sqrt(math.pow(v[0]-p[0], 2)+math.pow(v[1]-p[1], 2)+math.pow(v[2]-p[2], 2)))print(vertices[d.index(min(d))], min(d))
2、用 numpy 数组实现:
import numpy as npvertices = np.array([[3,4,5], [7,8,9], [4,9,3]])p = np.array([2,7,4])d = np.sqrt(np.sum(np.square((vertices-p)), axis=1))print(vertices[d.argmin()], d.min)
用随机方式生成1000个点,比较两种方法的效率。
作者:天元浪子,本文精选自CSDN博客
原文https://blog.csdn.net/xufive/article/details/87396460。
【End】
吐血整理!6大类常用网站汇总,帮你解决度娘也搞不定的问题
每次找资料只会用度娘?有时候度娘也解决不了你的问题?
把下面这些网站放进收藏夹,下次找资料的时候更有针对性,效率更高!
常用工具、搜索引擎、平面设计、图片资源、学习提升、资源共享 ,六大类网站绝对有你需要的!
文末有网站合集链接,可直接翻到文章最后获取~
工具类
1)http://www.135editor.com/
135编辑器,微信公众号排版工具,使用需要注册
2)https://wordart.com/
文字云编辑工具,功能简单,收费网站,基础功能够用
3)https://www.rrxiu.net/
人人秀,免费H5制作工具,想要效果好需要充值会员
4)https://www.jianguoyun.com/
坚果云,云备份工具,适合小团队使用,方便大量文档备份,也适合多台设备之间转换使用
5)https://send.firefox.com/
火狐分享,小于1G的资源可以直接上传,避免百度云下载很慢的情况
6)https://www.jiandaoyun.com/
轻量级低代码应用搭建平台,企业管理必备
7)https://cp.ifval.com/
拷贝兔,方便分享轻量文件,免费
8)http://www.nicetool.net/
在线工具大全,一些需要的工具都可以搜一搜(随机点名、抖音字体生成、证件照换底色、艺术二维码等)
9)https://uzer.me/z/apps
在线PS/Ai/Project等软件编辑工具,主打轻量
10)http://pixelmap.amcharts.com/
生成各种地图素材,免费
11)http://ictclas.nlpir.org/nlpir/
语义分析系统,方便做用户分析的,免费免注册
12)http://ef.zhiweidata.com/#!/index
知微事见,社会热门事件的分析/用户画像/传播路径等,免费免注册
13)http://termonline.cn/index.htm
术语在线,用来查询专业术语的,无需注册&付费
14)https://www.processon.com/diagrams
ProcessOn,在线画流程图/泳道图,需要账号登录
15)https://shimo.im/
协同办公文档,跟腾讯文档功能高度重叠
16)https://modao.cc/workspace/apps
交互原型设计工具,同类产品有axure、Adobe XD CC等
17)https://docs.qq.com/desktop
腾讯文档,协作办公类网站,原生级支持qq
18)https://tool.lu/
程序员的工具箱
19)http://www.jikedaohang.com/
程序员常用网站合集
20)https://flow.microsoft.com/zh-cn/
微软自动化流程,有空可以研究研究
21)https://mp.weixin.qq.com/
微信公众平台
22)http://www.dingdone.com/
傻瓜式制作APP/微信小程序
23)http://www.500d.me/
在线制作简历,五百丁平台
24)http://www.qiuziti.com/
字体搜索平台
25)https://www.toptal.com/designers/subtlepatterns/
PPT背景纹理资源网站
26)http://www.m1vip.cn/s/34cco3#title-text-1
营销落地页制作平台
27)https://freevectormaps.com/
地图图片编辑工具(方便PPT/WORD插入需要处理的图片)
28)http://www.17ziti.com/
字体相关下载软件平台
29)https://www.iconfinder.com/
IconFinder,国外的找icon的网站
30)http://echarts.baidu.com/index.html
地图+数据编辑,适合做专业地域分析
31)http://app.xunjiepdf.com/
文档相关工具,例如文档格式转化之类的
32)https://cli.im/
草料二维码生成器
33)https://www.fanyigou.com/
翻译狗,专门做文档翻译的,积分可以免费领五十积分,兑换码:pHqz4ScBazXXv8ax
34)http://echarts.baidu.com/feature.html
ECharts,数据可视化工具网站,需要一定编程基础
35)https://list.yinxiang.com/moban/
印象笔记模板库
36)https://squoosh.app/
压缩图片,包括对SVG图片的处理
37)https://cowtransfer.com/
奶牛快传,2G/7天,微信登录
38)https://getquicker.net/
安卓-Windows版本“捷径”
39)http://we.wwei.cn/
微信/支付宝/股票等对话模仿网站,仅作娱乐
40)https://www.wrike.com/zh-cn/
wrike甘特图在线绘制工具,需要注册
41)https://www.producthunt.com/
producthunt app产品经理交流平台,让所有人自由沟通
搜索类
1)http://www.sowang.com/link.htm
搜索引擎集合网站,非搜索时候也可以浏览增强印象
2)http://scholar.chongbuluo.com/
虫部落-学术搜索
3)http://search.chongbuluo.com/
虫部落-快搜
4)http://zhihu.sogou.com/?p=73351200&kw=
搜狗-知乎搜索
5)http://weixin.sogou.com/?p=73141200&kw=
搜狗-微信搜索
6)http://www.xilinjie.com/?qqdrflag=06820
全网资源垂直搜索引擎
7)http://www.huisou.me/
麦库搜索,主要来源是百度网盘、新浪微盘
8)http://www.manmanbuy.com/
购买比价网站,可以查看是否买的东西是最低价
另:之前整理过更详细的搜索网站,戳链接获取:
【猫猫爱软件汇总】搜索网站汇总
设计类
1)https://www.chuangkit.com/
创客贴,在线平面设计工具,使用需要注册
2)https://www.canva.com/
在线平面设计工具,需要账号登录
3)http://hao.uisdc.com/
设计师网站导航,很多设计师相关的东西都可以在这个网站找找
图片类
1) https://tinypng.com/
jpg/png图片文件压缩(主要是改位深),功能简单
2)https://www.soogif.com/
GIF在线网站,包括资源+内容制作+编辑压缩,免费
3)https://www.iconfinder.com/
icon查询,且支持在线icon编辑,部分收费
4)http://waifu2x.udp.jp/index.zh-CN.html
利用卷积神经网络对图片进行高清晰度放大
5)http://www.gaitubao.com/
在线更改图片尺寸,免费(图片需要小于8M)
6)https://fabiaoqing.com/
表情包大全...免费+无需注册
7)https://www.easyicon.net/
也是找icon的
8)http://www.iconfont.cn/
也是找icon的,阿里巴巴矢量图标库
9)http://picascii.com/
图片转ascii,写代码必备~
10)https://www.runoob.com/python/python-exceptions.html
python所有的报错类型By菜鸟教程
11)https://www.remove.bg/
自动抠图的web网站,免费
学习类
1)http://cn.linux.vbird.org/linux_basic/0105computers.php
鸟哥的Linux私房菜(有计算机基础章节)
2)https://zh.ifixit.com/Teardown
计算机硬件拆解,了解硬件必备
3)https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
廖雪峰的python教程,简单易学(导航栏还有各种教程)
4)http://www.arvrschool.com/
AR开发学习网站,主流/大厂的AR SDK都有涉及
5)https://developers.google.cn/
谷歌开发者中心(国内版)
6)https://github.com/
开源项目汇集地,学程序首站(建议翻墙使用)
7)https://stackoverflow.com/
技术问答网站,类似技术知乎
8)http://bbs.pcbeta.com/
远景论坛,微软geek社区
9)http://www.runoob.com/
菜鸟教程,范围大但学习较浅的教程
10)http://www.chongbuluo.com/
虫部落,著名搜索类网站,好东西很多
11)https://school.azure.cn/
微软在线人工智能学院
12)http://ued.baidu.com/case
百度用户体验中心,大量偏向AI方向的文章分享
13)https://cdc.tencent.com/
腾讯用户体验部门,大量方案分享,且逻辑清楚,推荐学习
14)http://www.woshipm.com/
著名的,人人都是产品经理网站,东西混杂、质量参差,文章择优收藏
15)https://www.chiphell.com/
目前已经暂停注册的数码硬件论坛,土豪云集,想买热门数码产品之类的东西可以先看下评测
16)https://daxue.qq.com/
腾讯大学,偏向于微信、营销等方面
17)https://yq.aliyun.com/teams/132/type_blog?spm=5176.100239.blogcont250165.2.JIiSuW
阿里云栖社区的翻译小组,有不少技术科普
18)https://www.csdn.net/
CSDN,国内最大的中文IT社区,很多大牛的blog写得很好,可以多上去搜一搜
19)https://www.aidaxue.com/
讯飞大学(讯飞开放平台),偏向AI教育类,很多讲座和教程值得去看
20)https://open.163.com/
网易公开课
资源类
1)https://www.portablesoft.org/category/office/
软件大全,有想要的软件基本都可以找到
2)http://www.zishu010.com/z/bigdataleader.html
紫数-数据资源,大类数据基本都可以找到
3)http://data.chongbuluo.com/
各种指数的搜索页
4)https://amazing-apps.gitbooks.io/windows-apps-that-amaze-us/content/zh-CN/
windows优秀软件推荐汇总
5)https://github.com/Awesome-Windows/Awesome/blob/master/README-cn.md
windows优秀软件推荐汇总1*github版
6)https://github.com/iCHAIT/awesome-macOS/blob/master/README.md
MacOS优秀软件推荐汇总*github版
7)https://github.com/stackia/best-windows-apps
windows优秀软件推荐汇总2*github版
8)https://love.appinn.com/
windows小众软件推荐
9)https://www.skypixel.com/explore
天空之城,多航拍/全景内容资源,需要航拍+学习航拍都可以在这里看看
10)http://7mx.com/?cate=03
7MX图片社区,有很多高清的图片值得观看,因为版权原因,需要配合图片下载插件使用
11)http://mebook.cc/
个人书籍论坛,可以免费下载kindle资源
12)https://bookfere.com/
书伴,kindle资源/教学类网站,五星好评
13)http://www.ituring.com.cn/
图灵图书,多程序/IT类的网站,可以多看看
14)http://www.xiniudata.com/
烯牛数据,创投数据平台
15)http://index.iresearch.com.cn/app
艾瑞数据,主要是一些移动端数据
16)https://www.itjuzi.com/
IT桔子,泛互联网创投项目相关数据查询
17)http://www.meihua.info/
梅花网,一些互联网信息查询,包括广告检测等
18)https://www.appannie.com/cn/
app annie,主要做应用市场数据分析的(免费版亦有一些数据可以使用)
19)https://www.dataeye.com/
DataEye,主要做大数据营销分析的,有一些广告投放数据可以使用
20)http://cn.data.cmcm.com/rank
猎豹大数据,数据样本感觉较小,免费的可以查看周活跃渗透率和周打开次数
21)http://www.iresearch.com.cn/report.shtml
艾瑞咨询的报告专区,一些一般性的产业报告和投资内参可以阅读,需要筛选数据来源
22)https://www.talkingdata.com/products.jsp?languagetype=zh_cn
TalkingData,主打可视化数据,免费的可以使用应用统计和游戏运营分析
23)http://www.questmobile.com.cn/research/report-new
QuestMobile,可以查看到一些行研报告,更新频率较频繁
网站合集:
链接过多,做了一个合集,戳链接获取吧~(是不是很贴心)
【猫猫爱软件汇总】常用网站汇总
整理不易,收藏点赞关注来一波~
相关问答
linux初学者应该怎样学习呢,学习路线是怎样的?谢邀~来分享一些东西,干货有点多,有需要可以先收藏下。Linux学习路径图如下:Linux操作系统在短短的几年之内得到了非常迅猛的发展,这与Linux具有的良好特性...