如题所述
新浪微博数据抓取方法:
插入热门话题,会有相对应的热门关键词能够体提升阅读数;
发布的内容带有用户可以直观搜索的关键词;
图片最好采用九图模式;
发布头条文章;
申请话题主持人等。
要看你是想要抓取哪些数据了,其实微博里面包含的有用的数据非常多,如果是进行海量的数据抓取的话,建议进行爬虫。
使用Python中的scrapy工具来抓取所需要的数据,如果要提高抓取速度的话,还可以用redis开启多线程抓取。
这里有一个现成的参考项目,只需要想好你想抓取的数据,按照步骤修改相应的代码就能大量抓取微博数据了。网页链接