菜单

【小红书】一级评论采集

一、采集场景

采集网页端小红书评论页面的一级评论数据，示例网址：

https://www.xiaohongshu.com/explore/68030bf5000000000f031b23?xsec_token=ABPTI7A7WCxkUQwb4LqbauL8fEfbBxTKF40uLFRL0Ya2Q=&xsec_source=pc_search&source=web_search_result_notes
https://www.xiaohongshu.com/explore/64b263f6000000001e011a54?xsec_token=AB8EA_m8o7Ukv4EEjAjGIoEfOJQBlXQMl0-VDJTduD65s=&xsec_source=pc_feed

二、采集字段

博主、话题标题、话题内容、评论人昵称、评论时间、评论内容、点赞数、页面网址

三、采集结果预览

采集结果可导出为Excel、CSV、HTML、数据库等多种格式。导出为Excel示例：

教程说明

本篇教程制作时间：2025/08/04 八爪鱼版本：V8.7.7

如果因网页改版造成网址或步骤无效，无法收集到目标数据，请联系官方客服，我们将及时修正。

四、采集步骤

步骤一、打开网页

步骤二、设置预登录

步骤三、提取数据

步骤四、建立【循环列表】提取评论数据

步骤五、设置滚动

步骤六、规则优化

步骤七、启动采集

步骤一、打开网页

在首页【新建】-【自定义任务】-【手动输入】网址 https://www.xiaohongshu.com/explore/68030bf5000000000f031b23?xsec_token=ABPTI7A7WCxkUQwb4LqbauL8fEfbBxTKF40uLFRL0Ya2Q=&xsec_source=pc_search&source=web_search_result_notes
https://www.xiaohongshu.com/explore/64b263f6000000001e011a54?xsec_token=AB8EA_m8o7Ukv4EEjAjGIoEfOJQBlXQMl0-VDJTduD65s=&xsec_source=pc_feed，然后点击【保存设置】，八爪鱼自动打开网页并生成循环网址步骤。

步骤二、设置预登录

扫码登录小红书，然后设置cookie

说明：

预登录设置详细教程参考：登录验证采集

步骤三、提取数据

提取字段【博主】、【话题标题】、【话题内容】、【页面网址】

步骤四、建立【循环列表】提取评论数据

4.1、创建循环列表提取一级评论字段

说明：

如何创建循环列表？详细教程学习【03 采集列表数据】

4.2、编辑修改字段

依次编辑修改字段名，如下：

4.3、修改字段xpath

我们可以看到评论时间、点赞数、评论数部分是空的，需要修改这几个字段的xpath，

【评论时间】的相对xpath修改为：//div[@class="date"]

【点赞数】的相对xpath修改为：//div[@class="like"]

【评论数】的相对xpath修改为：//div[@class="reply icon-container"]

特别说明：

a. 为什么默认的XPath，无法精准定位到所有的字段？这是因为默认生成的xpath只能定位其中一部分，需要手动修改xpath实现定位全部的字段。

b. 如何写精准定位到所有字段的XPath？这需要一定的XPath知识。点击查看 XPath学习与实例教程。

步骤五、设置滚动

因为评论数据是需要滚动的，因此我们需要加上循环滚动设置，另外我们可以发现评论数据是局部区域进行滚动加载的，因此这里需要设置为局部滚动，局部滚动的xpath为：//div[@class="interaction-container"]/div[2]

说明：什么是边滚动边采集？怎么设置局部滚动？具体学习教程边滚动翻页边采集

步骤六、规则优化

配置好任务后，因为小红书有反爬，为了采集效果更稳定一些，对任步骤务设置等待时间进行优化

说明：规则优化设置参考教程：规则优化

步骤七、启动采集

点击保存然后启动采集

特别说明：

a. 【本地采集】是使用自己的电脑进行采集，【云采集】是使用八爪鱼提供的云服务器采集，点击查看本地采集与云采集详解。

2、采集完成后，选择合适的导出方式导出数据。支持导出为Excel、CSV、HTML、数据库等。这里导出为Excel。

上一个

【豆瓣】电影短评采集

下一个

【小红书】博主页主页笔记采集

最近修改: 2025-08-12

大纲