扣子Coze智能体搭建教程:一键采集1000条小红书爆款笔记
小红书爆款笔记是自媒体人挖掘热点与流量密码的核心阵地。面对海量优质内容,如何快速捕捉趋势、提炼可复用的创意模板?手动刷屏效率低下,而智能化采集工具能彻底改变这一局面。
本文将深度拆解一套实战方案:利用扣子(Coze)AI智能体,批量抓取1000+条小红书爆款笔记,彻底解析其数据采集逻辑与自动化工作流程。
智能体的运行逻辑与手动操作完全一致,核心流程包括:输入关键词搜索目标笔记、逐条提取图片文案及互动数据(点赞/收藏)、最终结构化存储至Excel或飞书表格中。
核心差异在于自动化——你只需设定关键参数,智能体即可全自动执行数据抓取任务。
扣子AI智能体搭建全流程指南
第一步:创建自动化工作流
新建工作流,命名并添加描述,这是整个数据采集任务的起点。
第二步:配置开始节点参数
在开始节点中预设五个核心参数:totalNumber(采集数量)、cookieStr(身份凭证)、keywords(搜索关键词)、noteType(笔记类型)、sort(排序方式)。这些参数将直接传递给后续插件。
参数设定是智能体运行的先决条件,精准配置能确保数据采集的完整性与准确性。
第三步:接入小红书搜索插件
点击“添加节点”,搜索并选择“小红书”插件,然后插入“xhs_search_notes”节点。该插件需要与开始节点中的五个参数一一对应。注意:cookieStr是获取数据的核心密钥,后续将详解获取方法。完成参数关联后,每次执行只需在开始节点填入对应值即可自动化运行。
第四步:构建循环抓取逻辑
添加循环节点,遍历搜索结果列表,逐条抓取笔记数据。
第五步:添加笔记详情提取节点
在循环体内插入获取笔记详情的节点,自动拉取每条笔记的完整信息(含文本、图片、互动数据等)。
第六步:编写数据提取代码
添加代码节点,从原始返回结果中提取目标字段(如标题、点赞数、收藏数等),配置好代码逻辑与输出参数。
第七步:设置请求间隔防封控
插入延时节点,设置1秒等待,降低请求频率以避免触发平台反爬机制。务必检查循环节点的输入输出通路,确保数据流转无误。
第八步:字段名本地化处理
添加代码节点,将英文字段名映射为中文(如“title”→“标题”),使最终导出的Excel表头清晰可读。
第九步:数据导出为Excel
使用JSON2Excel插件,将处理后的数据转换为Excel文件,配置好输入来源与输出格式即可。
第十步:完成结束节点配置
配置结束节点,标记工作流终点,确保流程完整闭环。
虽然步骤看似繁多,但核心逻辑清晰:搜索→循环→提取详情→数据清洗→延迟→导出。这条自动化采集流水线能高效产出小红书爆款笔记的结构化数据。立即填入关键词测试,体验智能体全自动抓取的效率。
