一、采集场景
https://www.douyin.com/video/7063388051535416614
https://www.douyin.com/video/7536523802503908646
二、采集字段

三、采集结果预览

四、采集步骤
以下为具体步骤:
步骤一、打开网页
在首页【新建】-【自定义任务】-【手动输入】网址
https://www.douyin.com/video/7063388051535416614
https://www.douyin.com/video/7536523802503908646
然后点击【保存设置】,八爪鱼自动打开网页并生成循环网址步骤。
步骤二、设置预登录
开启浏览模式,用抖音app扫码登录,然后关闭浏览模式设置cookie
说明:
预登录设置详细教程参考:登录验证采集
步骤三、提取数据
提取字段【抖音昵称】、【标题】、【发布时间】、【页面网址】步骤四、建立【循环列表】提取评论数据
4.1、创建循环列表提取一级评论字段
说明:
如何创建循环列表?详细教程学习【03 采集列表数据】
4.2、编辑修改字段
依次编辑修改字段名,如下:
步骤五、设置滚动
因为抖音评论数据是需要滚动的,因此我们需要加上循环滚动设置,另外抖音评论数据是局部区域进行滚动加载的,因此这里需要设置为局部滚动,局部滚动的xpath为://*[@id="douyin-right-container"]/div[2]
最后再把循环提取列表数据步骤拖拽到循环滚动内,即可实现边滚动边采集的效果。
说明:什么是边滚动边采集?怎么设置局部滚动?具体学习教程边滚动翻页边采集
步骤六、规则优化
配置好任务后,为了采集效果更稳定一些,对任步骤务设置等待时间进行优化
说明:规则优化设置参考教程:规则优化
步骤七、启动采集
点击保存然后启动采集
特别说明:
a. 【本地采集】是使用自己的电脑进行采集,【云采集】是使用八爪鱼提供的云服务器采集,点击查看 本地采集与云采集详解。
2、采集完成后,选择合适的导出方式导出数据。支持导出为Excel、CSV、HTML、数据库等。这里导出为Excel。