请输入
菜单

【抖音】搜索关键词采集视频列表

 

采集场景

采集某个音关键词下视频列表数据,示例是网址:https://www.douyin.com/root/search/%E8%A5%BF%E8%97%8F?type=video视频列表

采集字段

关键词 、图片链接 、视频链接 、播放时长、点赞数 、简介 、博主名称、发布时间

 

采集结果

采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:

 

 

教程说明

八爪鱼版本:V8.7.7

如果因网页改版造成网址或步骤无效,无法采集到目标数据,请联系官方客服,我们将及时修正。

 

采集步骤

步骤一、打开网页开启浏览模式手动验证

步骤二、按照批量关键词进行搜索采集

步骤三、配置【循环列表】提取数据

步骤四、编辑字段

步骤五、优化采集

步骤六、启动采集

 

以下为具体步骤:

 

步骤一、打开网页开启浏览模式手动验证

 

1、在首页【输入框】中输入目标网址 https://www.douyin.com/root/search/%E8%A5%BF%E8%97%8F?type=video

点击【开始采集】,八爪鱼自动打开网页,网页打开后需要开启浏览模式手动验证

 

步骤二、按照批量关键词进行搜索采集

1、采集需求:在抖音首页,依次输入 关键词1、关键词2、关键词3、关键词4 (用户可将其更换成自己想要的关键词,单次最多支持输入2W个)并搜索,然后采集每个关键词的搜索结果数据

 

 

 

步骤三、配置【循环列表】提取数据

1、创建【循环列表】,采集页面的列表数据

①、先选中页面上第一个列表的第一个单元格,再点击提示框右下角的【扩大选区】 按钮,选中至一整行。(  的作用是,扩大选中的范围。当前选中的是一个单元格,点一下, 选中的范围就扩大一个层级,即选中了一行)

②、在提示框中,选择【选中全部子元素】。第1个视频中的具体字段就被选中了,这时八爪鱼又自动识别到页面中其他热搜列表具有相同的【子元素】。

③、在提示框中,选择【选中全部相似组】。可以看到页面中所有热搜列表中的子元素也都被选中了,被绿色框框起来。

④、在提示框中,选择【元素中数据内容】。这时候,八爪鱼就将表格中的字段都提取下来了。

 

2、修改滚动的方式

①、为采集更多数据,配置需要设置滚动步骤,当前页面属于全局滚动模式,滚动模式设置为:全局。

②、根据页面情况设置滚动方式:滚动到底部或向下滚动一屏。

③、当前页面属于全局滚动模式,滚动模式设置为:全局,将滚动次数修改为100(可根据实际需要进行调整滚动次数)

④、抖音列表页数据属于向下加载形式,需要配置相应的滚动步骤加载更多数据。因为需要实现边滚动边采集,所以需要把【循环列表提取数据】移动到滚动网页里面,形成循环




特别说明:

a. 打开网页后,如果开始开始【自动识别】,请点击【不再自动识别】或【取消识别】将其关掉。因为本文不适合使用【自动识别】。

b. 【自动识别】适用于自动识别网页上的列表、滚动和翻页,识别成功后直接启动采集即可获取数据。详情点击查看 【自动识别】教程

c. 向下加载边滚动边采集详细教程参考:边滚动边采集数据的方法

 

步骤四、编辑字段

1、在【当前页面数据预览】页面,可删除多余字段,修改字段名,移动字段顺序等。 


步骤五、优化规则

1、配置好任务后,因为抖音有反爬,为了采集效果更稳定一些,根据页面加载情况,对任务步骤设置等待时间进行优化



步骤六 、启动采集

1、单击【保存】,【采集】并选择【普通模式】。启动后八爪鱼开始自动采集数据。但对于这类会出现验证码的网站,建议您在启动采集后立即点击“显示网页”,从而及时发现网站是否出现验证码,需要先【暂停采集】自己手动完成验证码点击,然后再继续采集,这个步骤,如果出现验证,请及时验证通过后才能采集,如果验证无法通过,则无法正常采集数据!

 

 

特别说明:

a. 【本地采集】是使用自己的电脑进行采集,【云采集】是使用八爪鱼提供的云服务器采集,点击查看 本地采集与云采集详解

 

2、采集完成后,选择合适的导出方式导出数据。支持导出为Excel、CSV、HTML、数据库等。这里导出为Excel。

 

 

示例数据:

 


作者:Mona

编辑:Mona



 

最近修改: 2025-08-14