通过Excel自网页爬取数据,并通过Power Query整理之后,得到了热销总榜的实时更新数据(此时我感觉我就是个大神,虽然依然是个渣渣)。
但是在使用过程中,发现当销售量超过1万的时候,单元格内数字格式和1万以下的单元格不同,导致无法进行直接比较。按照过往操作Excel的方法,是直接修改单元格内数字,但是这是一个实时更新的单元格数据,通过手动修改的方式是不可行的。所以,还得借助Power Query这个方便使用的工具。
1、在实时更新的excel表格内打开Power Query窗口:在【数据】中选择【查询与连接】,在弹出的窗口中就可以看到对应的table表格。鼠标右击table(0),点击编辑,我们熟悉的Power Query窗格就弹出来了。
2、可以看到在近两个小时销售量中,排名前几位的仅仅剩下1这样的数字(万已经被替换完毕),后面的数字可以正常显示。
3、将文本格式调整为数字格式:选择对应的列,在编辑器上部选择【转换】,将数据类型选择为【小数】,这列数字就会变成数字格式(斜体显示)
4、将数字格式统一:在编辑器【添加列】中选择【条件列】,弹出的窗口中填入相关信息,然后点击确定。之后表格内自动添加了按照【新列名】命名的新的一列,但是数字格式还是未调整完毕,需要进行接下来的操作
5、在代码窗格内调整if语句中赋值公式,数字就可以变成为统一量纲。
通过以上的这些步骤,是不是感觉又精进了一步?又变的厉害了一点?
通过Python学习的最终目的,就是开展大量数据处理与分析,现在数据处理已经达到了可以直接使用的程度,下一步就是利用excel原有的图标功能开始进行数据可视化分析啦~
一样的,这里面也都是动态表格,想更新表格的内容,继续在table里面刷新即可(我设定了每分钟自动刷新,所以就像股票大盘一样,我可以每分钟都看到形状的细微变化)
感觉好有成就感。
#加油,girl
#一点一滴的努力,未来都会有回报。
#岁月静好,不去羡慕旁人,只做好自己,花朵总会绽放。
#以上学习感悟来自于《网络爬虫进化论:从Excel爬虫到Python爬虫》(中国水利水电出版社2021年出版)