
## 工作流概述
这个n8n工作流实现了通过Bright Data API自动抓取Yelp商家数据,并将结构化信息存储到Google Sheets的完整流程。用户只需提交Yelp商家URL,系统就能自动完成数据抓取、处理和存储。
## 工作原理
### 触发机制
– **表单触发器**:用户通过表单提交Yelp商家URL
– **启动数据抓取**:将URL发送到Bright Data API开始抓取Yelp商家页面
### 数据处理流程
1. **监控抓取状态**:持续检查Bright Data快照处理状态
2. **等待处理完成**:设置30秒等待间隔后重新检查状态
3. **重试逻辑**:如果数据尚未就绪,循环返回等待;如果就绪则继续
4. **获取结构化数据**:从完成的快照中检索商家详细信息
### 数据存储
– **Google Sheets集成**:将抓取到的商家数据(名称、评分、评论数量、URL、图片视频链接等)自动追加到Google Sheets
– **集中存储**:所有数据统一存储在”Yelp scraper data by URL”工作表中
## 技术特点
– **智能重试机制**:确保数据抓取可靠性
– **实时状态监控**:精确掌握数据处理进度
– **结构化数据输出**:提取关键商家信息
– **自动化存储**:无需手动操作即可完成数据归档
## 应用场景
– 市场调研和竞争分析
– 商家数据收集和监控
– 本地服务业务研究
– 数据驱动的商业决策支持

评论(0)