新浪微博数据采集:八爪鱼采集器图文攻略

生活小百事通 2022年08月19日 阅读 (442)

随着大数据和社交网络的火爆发展,社交网络上产生的数据也越来越有价值,特别是微博微信作为时下最火热的社交平台,如果能对这两个平台上的数据进行深入分析挖掘,那么价值将非常巨大,但是如果要开发一套爬虫程序的话也绝非易事,通过多方比较尝试,笔者最终顺利完成了整个数据采集过程,要采集的数据为指定城市的所有微博用户的相关信息。比如微博名称,微博地址,微博数量,粉丝数量,名片等等,进入正题,看看具体一步一步怎么操作来实现的。

1、打开采集器,新建一个任务之后,如下图选择分组:新浪微博,这里其实随便什么分组都可以,我是把新浪微博专门放了一个分组,以便管理采集微博的多个任务。任务名称,这里按照自己的情况输入即可,我这里采集的是沈阳的微博信息。然后输入备注。

新浪微博数据采集:八爪鱼采集器图文攻略

2、然后就到了设计采集流程的界面,这个界面看起来复杂,其实很简单,我们先看上面一半,包括第一个 go to web page, 和check condition 里面的全部流程步骤。其实他们完成一个什么工作呢?就是打开微博登录页面,然后检查用户是否登录,如果没有登录,则走左边流程,三步:输入用户名,输入密码,点击登录。如果已经登录,则走右边流程:什么事情都不做。为什么需要登录呢,如果不登录,则只能看到一页数据,登录后就能看所有数据,所以我们想要采集所有数据,就要登录。下半部分流程因截图不全,所以请大家看第三步。

新浪微博数据采集:八爪鱼采集器图文攻略

3、接上一步,这里看下半部分流程,下半部分第一步是打开沈阳用户列表,然后是一个loop循环:循环翻页,因为我们要采集所有页面的数据,在这个循环内部,还有一个循环:循环当前页所有用户,这样就能采集到一个页面的多个用户的数据,微博一页有20个用户的数据。这个循环内部有一个提取数据的步骤,这一步就是真正提取数据,不过他提取的是当前循环用户的数据。我们只需要在页面上点击要采集的数据,系统就会自动配置好,所以这一步很容易。

新浪微博数据采集:八爪鱼采集器图文攻略

4、配置好采集规则之后,我们设定执行计划,这里因为我需要每周采集一次,以获取到这一周新注册的微博用户,所以我选择一周一次,注意这个定时是云采集的,意思是,他会在云服务器跑,而且启动时间如图,我们定的是周一晚上0点,当然这个时间你可以自己定。所以我们电脑不用每周一晚上0点打开去采集,我们配好就不管了,以后每个周一0点,云采集服务器都会自动启动我的任务进行采集。

新浪微博数据采集:八爪鱼采集器图文攻略

5、经过以上几个步骤就算配置好了,我们下一步,进行一个测试,从图中可以看到已经顺利采集到了数据,当采集完成之后,即可导出为excel等使用了。

新浪微博数据采集:八爪鱼采集器图文攻略

精彩内容尽在问答鸭,如果您觉得这篇内容不错,别忘了分享给好友哦!

相关文章

  • 如何将CAD数据导入奥维互动地图(手机版).

    如何将CAD数据导入奥维互动地图(手机版)

    1、用cass9.0打开测量数据2、另存为dxf格式的文件3、打开91卫图助手4、点击菜单栏上的加载矢量,选择“打开dxf文件”5、选择浏览找到自己另存好的dxf文件,选择文件数据所在的坐标系,然后选择数据所在的中央子午线经度,如图6、查看导入结果,看和影像是否匹配,如果不匹配,检查数据和影像坐标系是否是同一坐标系7、点击91卫图助手菜单栏“保存矢量”,进行设置,选择图层置为导入的数据图层,保存格式设置为goolglekml文件*.kml,保存文件即保存路径,坐标投影默认wgs84,点击确定即可

    2022-07-08 阅读 (654)
  • PPT柱状图怎么显示数据.

    PPT柱状图怎么显示数据

    1、首先用鼠标点击屏幕中任意一个条形图,然后点击顶部图表工具栏中的“设计”。2、这时会弹出一些选项,选择屏幕左上角“文件”下方的“添加图表元素”。

    2022-06-27 阅读 (415)
  • 如何在分区链接采集正文数据——前嗅ForeSpider.

    如何在分区链接采集正文数据——前嗅ForeSpider

    第一步:新建任务1、点击左上角“加号”新建任务,如图所示。2、在弹窗里填写采集地址,任务名称,如图所示。

    2022-08-27 阅读 (274)
  • excel把不同年份的两组数据在一条折线图上体现.

    excel把不同年份的两组数据在一条折线图上体现

    1、第一步:整理好所需数据2、第二步:插入一个空白折线图表3、第三步:1,把鼠标放在图标上,点击右键,弹出对话框后,选择数据源,2,点击“添加”3,点击“值”4、第四步:在英文输入法状态下,分别选择数据用逗号链接,外面加上括号事例=a,b

    2022-07-06 阅读 (261)
  • 迷你世界怎么采集石油?.

    迷你世界怎么采集石油?

    1、准备材料:我们需要到深海去采集石油块,所以我们要准备船只,南瓜灯,铲,金镐或钻头以及深海呼吸剂。2、制作南瓜灯:深海中光线很暗,我们很难观察到石油块的存在,所以我们可以使用南瓜和煤块制作一些南瓜灯照明。

    2023-03-03 阅读 (154)
  • 明日之后草菇怎么采集.

    明日之后草菇怎么采集

    1、草菇在明日之后游戏中,主要在资源采集地刷新,玩家可以进入到森林或者远星城等资源采集地进行草菇的收集。

    2023-04-10 阅读 (133)
  • 织梦后台数据如何搬家.

    织梦后台数据如何搬家

    织梦cms是很多企业建站的首选,许多个人站长也在使用织梦。在网站的运营当中,或多或少会面临一些数据的迁移,比如网站需要改版,要拿到本地来测试,空间不稳定需要网站搬家等等,在本地测试为例,为大家讲解一下网站织梦是如何搬家的。

    2022-07-04 阅读 (126)
  • 后台实现数据修改操作和数据删除操作delete.

    后台实现数据修改操作和数据删除操作delete

    后台实现数据修改操作1、1.数据修改的实现步骤修改【商品列表】模版中的【修改按钮】地址2、2.get参数的传递和接收3、3.数据接收4、4.隐藏域type类型设置和value值设置。

    2022-07-08 阅读 (124)
  • 江南百景图的摇钱树怎么采集.

    江南百景图的摇钱树怎么采集

    1、首先打开游戏江南百景图。2、进入游戏界面后,找到并点击同乡会馆。3、打开同乡会馆后,点击下面的出发。

    2023-03-22 阅读 (120)
  • 松花粉如何能更快的采集呢?.

    松花粉如何能更快的采集呢?

    1、1、选择合适的采集时间和采集地点。松花粉要到合适的季节才能更成熟,也长的更多,而且有些松树的松花粉特别少,所以自己在采集的时候要找对地方,找好时间。

    2023-03-09 阅读 (116)