
## AI新闻抓取系统 – 自动化新闻内容采集与归档工作流
这个n8n工作流自动化了从精选RSS源获取突发AI相关头条新闻、抓取其完整内容,并将可读的Markdown版本直接保存到Google Drive的过程。
### 应用场景包括:
– 创建个人新闻简报策划系统
– 自动化博客文章研究工作流
– 为后续摘要或AI使用存档新闻内容
### 工作原理
**定时触发器**
工作流使用多个Schedule Trigger节点每3-4小时运行一次。每个触发器针对不同的新闻源(例如Google News、OpenAI Blog、Hugging Face等)。
**获取和解析Feed**
通过HTTP Request节点获取RSS源。使用Split Out节点将源中的项目拆分为单独的条目。
**抓取文章内容**
每个文章URL都发送到Firecrawl API,附带提示以仅提取Markdown格式的主要内容。抓取过程跳过导航、页眉、页脚和广告。
**转换和保存**
提取的Markdown使用Convert to File节点转换为.md文件。然后文件上传到Google Drive文件夹。
### 注意事项
– 此工作流使用Firecrawl API进行网页抓取。请确保配置带有API密钥的Generic HTTP Header凭据。
– 输出文件以Markdown格式保存
– 您可以添加更多Schedule Trigger + HTTP Request对来将此工作流扩展到其他源。
### 要求
– Firecrawl API账户用于抓取
– Google Drive账户(必须在n8n中配置OAuth2凭据)
– n8n实例(自托管或云端)
### 自定义想法
– 用与您领域相关的源替换或扩展RSS源
– 将抓取的新闻故事加载到提示中,创建新内容如TikToks和Reels
– 使用像GPT或Claude这样的LLM添加摘要步骤
– 将Markdown文件发送到Notion、Slack或博客CMS
### 示例源
| 源名称 | URL |
|——–|—–|
| Google News (AI) | https://rss.app/feeds/v1.1/AkOariu1C7YyUUMv.json |
| OpenAI Blog | https://rss.app/feeds/v1.1/xNVg2hbY14Z7Gpva.json |
| Hugging Face | https://rss.app/feeds/v1.1/sgHcE2ehHQMTWhrL.json |

评论(0)