本文来自读者投稿,作者:晓东
这次来分享一个数据采集与Excel数据分析的方法,内容比较简单,就像10分钟可以做好的早餐那样。
目标是以麦当劳天猫旗舰店的数据为例,想知道:
哪一款产品销量最高,
店铺的销售收入,
哪个价位段的产品最受欢迎。
内容主要分为两步:
收集数据(买菜)
分析数据(做菜)
我们先把浏览器中麦当劳天猫的网址复制下来(https://mcdonalds-china.tmall.com/search.htm?spm=a1z10.1-b.w5002-15789402903.1.58562b6d8DU5C8&scene=taobao_shop&search=y&orderType=hotsell_desc&tsearch=y),粘贴到后羿采集器的地址栏中,然后点击“智能采集”。
由于天猫有反爬取机制,我们需要登陆后才能采集数据
登陆后,软件会自动分析页面,产品的数据会在界面下端显示,点击“开始采集”。
接下来可以打开导出后的Excel表格,上面就是我们需要用到的数据,至此收集数据这一步便完成了。这里可以理解为食材已准备好了,接着开始做早餐了。
图中,这里我只保留了标题,price,总销量这三列,其他数据列删去。
我们可以看到销量最高的是一款售价10元的礼券。
计算总收入比较简单,在D2单元格输入公式=b2*c2,然后鼠标移到d2单元格的右下角,出现一个十字架符号后双击,Excel会自动填充余下单元格。
最后选中i2:i5单元格,按下快捷键Ctrl+d,向下自动填充。
由此我们可以得出每个价位段的总销售量,如图显示,1-49元价位段的产品是最受消费者欢迎的。
感谢你看到这里,希望会对刚入门的同学有所帮助。文章写到后面,才发现自己力有不逮。限于篇幅,有些地方讲得比较粗略,例如上面用到的vloolup,sumif等Excel函数公式都没有仔细讲解,感兴趣的同学可以自行搜索学习。如果大家有其他想法,欢迎留言讨论交流。
猜你喜欢:
为什么要学统计学:赤裸裸的统计学
@ 号主:可乐
@ 公众号/知乎专栏/头条/简书:可乐的数据分析之路
@ 加微信(data_cola)备注:进群,拉你进可乐的数据分析交流群,数据分析知识总结,不定期行业经验分享