大话 Python:python 操作 excel 系列 -- 数据汇总与统计

在完成了前面系列的数据整理、数据清洗、数据提取与筛选之后,我们需要对进行进一步的汇总与统计使数据变成我们的可用信息。
1,数据分类汇总
# 对指定列分组后进行数量统计data_inner.groupby('name').count()# 对指定列分组后,统计 id 字段的数量 data_inner.groupby('name')['id'].count()# 对某两个字段进行分组后,统计 id 字段的数量data_inner.groupby(['name','age'])['id'].count()
2,数据统计
# sample() 函数简单的数据采样,设置 n 的数值为 5data_inner.sample(n=5)# sample() 函数的 replace 参数表示采样后是否放回,值为 False 表示不放回,值为 True 则表示放回data_inner.sample(n=5, replace=False)# 采样描述统计,返回数据的数量、均值、标准差等信息# round() 函数参数值设置为 2 表示保留两位小数data_inner.describe().round(2).T

此处数据统计只是最简单的模式,python 关于数据统计提供了更加细致的操作,比如统计协方差、相关分析、标准差等数据统计方式,有相关统计学知识才学习起来更加方便。

(0)

相关推荐