
这是一个自动化工作流,专门用于从Indeed平台抓取公司数据并进行智能摘要。工作流通过Airtable管理公司链接列表,使用Bright Data Web Unlocker可靠地抓取Indeed公司页面内容,然后利用Google Gemini AI模型对抓取的数据进行提取、清理和摘要处理。
**目标用户群体:**
– 招聘人员和HR团队,需要快速获取公司摘要信息
– 市场研究人员和分析师,需要结构化业务洞察
– 创始人、投资者和顾问,寻找潜在竞争对手、合作伙伴或客户
– 无代码爱好者,希望自动化数据提取和丰富流程
**解决的问题:**
手动从Indeed收集结构化公司信息耗时且不一致。页面结构各异,提取清晰可读的摘要需要技术爬取专业知识。
**工作流功能:**
– 按需触发
– 从Airtable提取公司页面URL
– 使用Bright Data Web Unlocker抓取每个Indeed公司简介内容
– 将原始HTML发送给Google Gemini进行提取和摘要
– 通过Webhook通知机制将摘要数据发送到其他平台
**设置要求:**
1. 在Bright Data注册并创建Web Unlocker区域
2. 在n8n中配置Header Auth凭证
3. 配置Google Gemini API账户
4. 配置Airtable个人访问令牌
5. 更新Webhook通知器端点
**自定义选项:**
– 扩展抓取器:修改Bright Data目标以提取职位列表、薪资或员工评价
– 自定义摘要提示:要求Gemini提取不同的属性,如招聘趋势、实践等
– 路由输出到不同目的地:Google Sheets、Airtable或CRM系统

评论(0)