使用Gemini 2.0进行图像边界框检测工作流

Gemini 2.0图像边界框检测 - n8n工作流模板 — Gemini 2.0,图像检测,边界框,对象识别,n8n工作流,AI图像处理,自动化检测

此n8n模板演示了如何在您的工作流中开始使用Gemini 2.0的新边界框检测功能。

关键区别在于这为图像启用了基于提示的对象检测，这对于图像上的上下文搜索非常强大。例如”在此图像中为所有带孩子的成年人放置边界框”或”为停放在停车位边界之外的汽车放置边界框”。

工作原理
通过HTTP节点下载图像，并使用”Edit Image”节点提取文件的宽度和高度。
然后将图像提供给Gemini 2.0 API进行解析，并返回所请求主题的边界框坐标。在此演示中，我们要求AI识别所有兔子。
然后使用原始图像的宽度和高度重新缩放坐标以正确对齐它们。
最后为了测量对象检测的准确性，我们使用”Edit Image”节点将边界框绘制到原始图像上。
使用方法
这真的取决于想象力！也许可以构建基于证据的工作流的基础形式，或者构建更高级的图像搜索形式。
要求
Google Gemini for LLM
自定义工作流
此模板只是Gemini 2.0实验版本的演示。建议在Gemini 2.0退出此阶段后再用于生产环境。

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

使用Gemini 2.0进行图像边界框检测工作流

评论(0)

提示：请文明发言取消回复

近期文章

近期评论

使用Gemini 2.0进行图像边界框检测工作流

评论(0)

提示：请文明发言 取消回复

相关文章

个性化冷邮件系统：基于Google Gemini AI与Telegram审批的智能营销工作流

使用Pipedream MCP服务器构建智能AI助手工作流

自动化网络研讨会注册与Zoom和KlickTipp表单集成

n8n工作流自动备份到GitHub：每6小时定时备份工作流

近期文章

近期评论

提示：请文明发言取消回复