大话 Python:python 操作 excel 系列 -- 数据汇总与统计
首页 专栏 python 文章详情
0
头图

大话 Python:python 操作 excel 系列 -- 数据汇总与统计

老王说编程 发布于 3 月 2 日

在完成了前面系列的数据整理、数据清洗、数据提取与筛选之后,我们需要对进行进一步的汇总与统计使数据变成我们的可用信息。

1,数据分类汇总

# 对指定列分组后进行数量统计
data_inner.groupby('name').count()
# 对指定列分组后,统计 id 字段的数量 
data_inner.groupby('name')['id'].count()
# 对某两个字段进行分组后,统计 id 字段的数量
data_inner.groupby(['name','age'])['id'].count()

2,数据统计

# sample() 函数简单的数据采样,设置 n 的数值为 5
data_inner.sample(n=5)
# sample() 函数的 replace 参数表示采样后是否放回,值为 False 表示不放回,值为 True 则表示放回
data_inner.sample(n=5, replace=False)
# 采样描述统计,返回数据的数量、均值、标准差等信息
# round() 函数参数值设置为 2 表示保留两位小数
data_inner.describe().round(2).T

此处数据统计只是最简单的模式,python 关于数据统计提供了更加细致的操作,比如统计协方差、相关分析、标准差等数据统计方式,有相关统计学知识才学习起来更加方便。
更多精彩前往老王说编程>>>

python excel 数据统计
阅读 21 发布于 3 月 2 日
收藏
分享
本作品系原创, 采用《署名-非商业性使用-禁止演绎 4.0 国际》许可协议
avatar
老王说编程

搜索微信公众号【老王说编程】,专注后端编程技术分享、交流经验。

0 声望
0 粉丝
关注作者
0 条评论
得票 时间
提交评论
avatar
老王说编程

搜索微信公众号【老王说编程】,专注后端编程技术分享、交流经验。

0 声望
0 粉丝
关注作者
宣传栏
目录

在完成了前面系列的数据整理、数据清洗、数据提取与筛选之后,我们需要对进行进一步的汇总与统计使数据变成我们的可用信息。

1,数据分类汇总

# 对指定列分组后进行数量统计
data_inner.groupby('name').count()
# 对指定列分组后,统计 id 字段的数量 
data_inner.groupby('name')['id'].count()
# 对某两个字段进行分组后,统计 id 字段的数量
data_inner.groupby(['name','age'])['id'].count()

2,数据统计

# sample() 函数简单的数据采样,设置 n 的数值为 5
data_inner.sample(n=5)
# sample() 函数的 replace 参数表示采样后是否放回,值为 False 表示不放回,值为 True 则表示放回
data_inner.sample(n=5, replace=False)
# 采样描述统计,返回数据的数量、均值、标准差等信息
# round() 函数参数值设置为 2 表示保留两位小数
data_inner.describe().round(2).T

此处数据统计只是最简单的模式,python 关于数据统计提供了更加细致的操作,比如统计协方差、相关分析、标准差等数据统计方式,有相关统计学知识才学习起来更加方便。
更多精彩前往老王说编程>>>