
## 工作流概述
这个工作流整合了来自五个不同系统的数据——Google Sheets、PostgreSQL、MongoDB、Microsoft SQL Server和Google Analytics——到一个主Google Sheet中。它每周按计划触发运行三次。在合并之前,每个数据集都被标记了唯一的源标识符,确保数据可追溯性。最后,合并的数据集被清理、标准化,并写入输出Google Sheet用于报告和分析。
## 分步说明
### 1. 触发工作流
**Schedule Trigger** – 按设定的周期间隔运行工作流。
### 2. 从源收集数据
**Google Sheets Source** – 从特定表格检索记录。
**PostgreSQL Source** – 从数据库提取客户数据。
**MongoDB Source** – 从定义的集合拉取文档。
**Microsoft SQL Server** – 执行SQL查询并返回结果。
**Google Analytics** – 捕获用户活动和参与度指标。
### 3. 标记每个数据集
**Add Sheets Source ID** – 标记来自Google Sheets的数据。
**Add PostgreSQL Source ID** – 标记来自PostgreSQL的数据。
**Add MongoDB Source ID** – 标记来自MongoDB的数据。
**Add SQL Server Source ID** – 标记来自SQL Server的数据。
**Add Analytics Source ID** – 标记来自Google Analytics的数据。
### 4. 合并和处理
**Merge** – 将所有标记的数据集合并为单一结构。
**Process Merged Data** – 清理、对齐模式和标准化关键字段。
### 5. 存储整合输出
**Final Google Sheet** – 使用处理后的数据追加或更新主表格。
## 为什么使用这个工作流?
– 将多个数据源集中到单一、一致的数据集中
– 通过标记每个源确保数据可追溯性
– 减少数据清理和整合的手动工作
– 为业务分析提供可靠的报告中心
– 启用计划的自动化更新以获得最新的可见性

评论(0)