Python秒处理多张Excel表的方法
导读:本文共1990.5字符,通常情况下阅读需要7分钟。同时您也可以点击右侧朗读,来听本文内容。按键盘←(左) →(右) 方向键可以翻页。
摘要: 背景小明就职于一家户外运动专营公司,他们公司旗下有好多个品牌,并且涉及到很多细分的行业。小明在这家公司任数据分析师,平时都是通过 Excel 来做数据分析的。今天老板丢给他一个任务:下班前筛选出集团公司旗下最近一年销售额前五名的品牌以及销售额。对于 Excel 大佬来说,这不就是分分钟的事吗?小明并没有放在眼里,直到市场部的同事将原始的数据文件发给他,他才意识到... ...
目录
(为您整理了一些要点),点击可以直达。小明就职于一家户外运动专营公司,他们公司旗下有好多个品牌,并且涉及到很多细分的行业。小明在这家公司任数据分析师,平时都是通过 Excel 来做数据分析的。今天老板丢给他一个任务:下班前筛选出集团公司旗下最近一年销售额前五名的品牌以及销售额。
对于 Excel 大佬来说,这不就是分分钟的事吗?小明并没有放在眼里,直到市场部的同事将原始的数据文件发给他,他才意识到事情并没有那么简单
这并不是想象中的排序取前五就行了。这总共有90个文件,按常规的思路来看,他要么将所有文件的内容复制到一张表中进行分类汇总,要么将每张表格进行分类汇总,然后再最最终结果进行分类汇总。
想想这工作量,再想想截止时间,小明挠了挠头,感觉到要渐渐头秃。
这种体力活,写程序解决是最轻松的啦。小明这时候想到了他的程序员好朋友小段,于是他把这个问题抛给了小段。
小段缕了下他那所剩无几的头发,说:so easy,只需要找潘大师即可。
小明说:你搞不定吗?还要找其他人!
小段苦笑说:不不不,潘大师是 Python 里面一个处理数据的库,叫 Pandas ,俗称 潘大师。
小明说:我不管什么大师不大师,就说需要多久搞定。
小段说:给我几分钟写程序,再跑几秒钟就好了!
小明发过去了膜拜大佬的表情。
小段略微思考了下,整理了一下程序思路:
计算每张表每一行的销售额,用“访客数 转化率 客单价”就行。
将每张表格根据品牌汇总销售额。
将所有表格的结果汇总成一张总表
在总表中根据品牌汇总销售额并排序
第零步,读取 Excel :
第一步,计算每张表格内的销售额:
第二步,将每张表格根据品牌汇总销售额:
第三步,将所有表格的结果汇总成一张总表:
第四步,在总表中根据品牌汇总销售额并排序:
最后,我们来看看完整的程序:
最后的结果是这样的:
可以看到最终的前五已经出来了,整个程序运行起来还是很快的。
Python秒处理多张Excel表的方法的详细内容,希望对您有所帮助,信息来源于网络。