
这个n8n工作流演示了如何使用多模态LLM在n8n中解析和提取PDF文档。
在这个特定场景中,我们将候选人的简历/简历传递给AI,该AI会筛选掉不合格的申请。然而,这位狡猾的候选人添加了隐藏提示来绕过我们的机器人!我们该怎么办?不用担心,使用AI视觉是解决这个问题的一种方法…继续阅读!
工作原理
我们的候选人简历/简历是通过Google Drive为此演示下载的PDF。
然后使用名为Stirling PDF的工具将PDF转换为PNG图像。由于隐藏提示具有白色字体颜色,因此在转换后的图像中不可见。
然后将图像转发到Basic LLM节点,使用我们的多模态模型进行处理 – 在这个例子中,我们将使用Google的Gemini 1.5 Pro。
在Basic LLM节点中,我们需要设置一个类型为Binary的用户消息。这使我们能够直接在请求中发送图像文件。
LLM现在对隐藏提示免疫,其响应符合预期。
带有隐藏提示的示例简历/简历可以在这里找到:https://drive.google.com/file/d/1MORAdeev6cMcTJBV2EYALAwll8gCDRav/view?usp=sharing
要求
Google Gemini API密钥。或者,GPT4也适用于此用例。
Stirling PDF或其他可以将PDF转换为图像的服务。请注意,出于数据隐私考虑,此示例使用公共API,建议您自托管并使用Stirling PDF的私有实例。
自定义工作流
将手动触发器替换为另一个触发器,例如webhook,以集成到您现有的服务中。
此示例演示了一个验证用例,即”候选人看起来合格吗?”。您可以尝试额外提取数据点,例如工作经验年限、之前的公司等。

评论(0)