现在人们哪怕是买个牙刷可能都会在淘宝上面,并且在买东西的时分每个人都会做的一件工作就是看谈论,看看之前买家谈论了解商品质量,外观是不是和图片相同等等。可是假如真的想要一条一条去看的话,那时刻是真的要许多,当然了假如买的小物件那倒无所谓,假如是比较宝贵的物品就必须得好好看了(PS:在小编心里100以上就是宝贵物品,哈哈哈哈)
假如是一般人为了让自己买的东西定心当然是挑选一条一条看,或许直接去实体店买。可是身为技(chui)术(niu)人(zhuang)员(bi)的小编,肯定是用Python批量爬取淘宝商品信息并进行简略的数据剖析啦~~~~
想要爬取谈论榜首件事就是找到实在的URL地址,具体步骤:
F12(开发者选项)
Notework
F5(改写)
feedRateList(文件名)
Headers
仿制Request URL
然后去除不必要的字段,获取自己想要的内容
看看运转后的效果图
假如你想要进行简略数据剖析的话,那能够把爬取下来的谈论保存下来。
然后用Python对其进行数据剖析,关于数据可视化小编比较引荐pyecharts
它能够是这样的
也能够是这样的