
这个工作流提供了强大的发票和收据数据自动化提取解决方案,使用Google的Gemini API进行OCR(光学字符识别)。
主要流程(Google Drive触发器):当新文件(PDF或图片)添加到指定的Google Drive文件夹时触发,通过拆分批处理节点逐个处理文件。对于每个文件,它会:下载文件、转换为base64格式、将文件数据和详细提示发送到Gemini API、解析JSON响应,然后将提取的数据(发票日期、类别、发件人、货币等)及原始文件名和文件链接添加到指定的Google表格中。
补充流程1(Gmail触发器):监控Gmail账户中带有特定标签的邮件。当收到匹配的带附件邮件时,它会遍历邮件和附件,使用YYYY-MM-DD_发件人用户名的格式重命名附件,并将重命名的附件保存到指定的Google Drive文件夹,从而触发核心OCR处理。
补充触发器2(Telegram触发器):允许您将物理收据的照片转发到配置的Telegram机器人,使用YYYY-MM-DD_Telegram的格式重命名图片文件,并将其保存到指定的Google Drive文件夹,同样触发核心OCR处理。
设置要求:需要配置Google OAuth2、Telegram和Gemini API密钥,创建专门的Google Drive文件夹和Google表格,并可选择配置Gmail标签和Telegram机器人。
目标用户:忙碌的企业家、初创公司创始人、自由职业者、小企业主、簿记员和会计师,旨在消除手动、重复且容易出错的任务。
解决问题:手动输入发票和收据数据耗时且容易出错,通过自动化发票数据提取,该工作流简化了财务管理流程,显著提高了准确性,减少了操作开销。

评论(0)