Python 数据科学手册学习.1
Python 数据科学手册pdf+源代码这本书可以说的上是使用python进行数据分析的必备书籍了,作为学习记录还是不想鸽的。
完成了基本的配置工作
help和?搭配使用,可以简单的看成一个查询帮助系统
一个?,基本的信息
二个??,打印源码
_然后Tab补全命令
* 通配符命令
Ipython里面支持的快捷键,建议在cmd用%单行输入%%多行输入
多个代码复制时使用,先复制代码然后执行这个命令,就自动复制了
可以使用run命令,运行外面的脚本文件
成功def square(x): """求平方""" return x ** 2for N in range(1, 4): print(N, "square is ", square(N))你自己试试
一些简单的pdb调试命令
性能检测部分
% 单行,说了很多次%%多行,然后这个命令不会对垃圾回收的什么做干预所以会慢一些
对于一个函数来说,可以使用下面的函数来对每一行的代码来计时
可以看到对每一行的计时操作
这里就是要重点说的numpy了按照惯例名字叫np缩写,打印了一下版本其实np里面最多的概念就是数组,就像matlab一样时矩阵优先在这里先使用自带的array库,生成一个list
我们用np的时候时这样的输入然后int和float共存的情况下,进行数据升级操作
也可以指定要生成的数据类型
也可以对每一列进行+1的操作,循环3次
生成一个10个数的数组,类型是integer
也可以生成规模指定的数组
或者可以指定生成的浮点型数组
这几个适合一起对比看,就不单独的截图了第一个,按照步进2 ,从0到20第二个在0到1之间,随机生成5个数字第三个是均匀分布第四个是均值0,方差1的正态分布最后一个,[0,10)区间的随机整型数组
最后来个单位阵np.zeros(10, dtype='int16')np.zeros(10, dtype=np.int16)这是两种不同的指定数据类型的方法,我觉得最后的写法更酷更统一一些
标准的数据类型有这么多
对一个数组的操作,大概就是这么多x3=np.random.randint(10,size=(3,4,5))# 三维数组先建立一个3x3的数组
上面这些个方法就可以对一个任意维数的数组做定量的描述了第一个是维度第二个是形状第三个是元素的数量第四个是元素的类型第五个是单个元素的大小第六个是所有元素的总和
写一个一维的数组,来所用索引号来访问值前两个是正向的获取值方法后两个是使用负值进行末尾元素的获取
x2是一个二维的数组使用(行,列)这样的元素获取法,这样的形式叫逗号分割的索引元组
如何获得一个子数组第一个生成一个一维的数组获取前五个元素获取后五个元素获取中间的子数组隔一个元素取一下从1开始,隔一个取一下