请输入
菜单

【小红书】详情页采集

 
采集场景

采集小红书详情页链接下的数据,示例:

https://www.xiaohongshu.com/search_result/66f52308000000001a0219b2?xsec_token=AB9_cgffdvkFvShjLlEAjoKU4KVzgssUmiywI4ToN8vHs=&xsec_source=

https://www.xiaohongshu.com/search_result/6892ba5e0000000023019d45?xsec_token=ABTVjNHAidGW3C66M3znOQ5oMtf8zD2JDIeIDBtN06AFU=&xsec_source=

https://www.xiaohongshu.com/search_result/67b7f8680000000029025d58?xsec_token=ABveXTsitmxB-tv78tn_3WBr9_cjgFxqcwQAtiIpbGyEs=&xsec_source=

 

 

采集字段

博主名称 、博主页链接、标题、正文、发布时间、主图链接、点赞数、收藏数、评论数

采集结果

采集结果可导出为Excel,CSV,HTML,数据库等多种格式。导出为Excel示例:

 

 

教程说明

本篇教程制作时间:2025/08/08 八爪鱼版本:V8.7.7

如果因网页改版造成网址或步骤无效,无法采集到目标数据,请联系官方客服,我们将及时修正。

 

采集步骤

步骤一、打开网页及设置cookie

步骤二、配置【提取数据】

步骤三、规则优化

步骤四、启动采集

 

以下为具体步骤:

 

步骤一、打开网页及设置cookie

1、在首页左上角点击【新建】—【自定义任务】。网址输入界面默认的是【手动输入】。将复制好的一批同类网址,粘贴进网址输入框中,并点击【保存网址】。八爪鱼中内置的浏览器会自动打开网页。同时,可以看到,流程中已自动创建【循环-打开网页】步骤。

点击【开始采集】,八爪鱼自动打开网页进入配置界面。

 

说明:循环打开网址,参考教程:URL循环:批量采集同类网页

 

网页打开后出现登录验证,需要开启浏览模式手动登录,并设置获取cookie

说明:

预登录设置详细教程参考:登录验证采集 


步骤二、配置【提取数据】

1、【提取数据】提取帖子数据并编辑字段命名

点击页面所需字段位置,提取文本或链接,生成提取步骤

 

说明:提取非循环项的数据,参考教程:采集单个数据

步骤三、规则优化

配置好任务后,因为小红书有反爬,为了采集效果更稳定一些,根据页面加载情况,对任务步骤设置等待时间进行优化




说明:规则优化设置,参考教程:规则优化

步骤四 、启动采集

1、单击【保存】,【采集】并选择【普通模式】。启动后八爪鱼开始自动采集数据。

建议启动采集后立即点击“显示网页”,从而及时发现网站是否出现验证码,需要先【暂停采集】自己手动完成验证码点击,然后再继续采集,如果出现验证,请及时验证通过后才能采集,如果验证无法通过,则无法正常采集数据!

 

 

特别说明:

a. 【本地采集】是使用自己的电脑进行采集,【云采集】是使用八爪鱼提供的云服务器采集,点击查看 本地采集与云采集详解

b.   【登录步骤】采集需要登录账号的网页,采集任务中应设置相应的登录流程,详细步骤请参考以下链接中教程。,点击查看 登录验证采集

2、采集完成后,选择合适的导出方式导出数据。支持导出为Excel、CSV、HTML、数据库等。

 

 

 

示例数据:

 

 

 

说明:若是网站改版导致无法采集,或者遇到其他问题,可扫码加群咨询反馈

 作者:Leon

 编辑:Leon 

上一个
【小红书】搜索关键词采集
下一个
新闻资讯
最近修改: 2025-08-11