Gemini 2.0图像边界框检测 - n8n工作流模板
Gemini 2.0,图像检测,边界框,对象识别,n8n工作流,AI图像处理,自动化检测

此n8n模板演示了如何在您的工作流中开始使用Gemini 2.0的新边界框检测功能。

关键区别在于这为图像启用了基于提示的对象检测,这对于图像上的上下文搜索非常强大。例如”在此图像中为所有带孩子的成年人放置边界框”或”为停放在停车位边界之外的汽车放置边界框”。

工作原理
通过HTTP节点下载图像,并使用”Edit Image”节点提取文件的宽度和高度。
然后将图像提供给Gemini 2.0 API进行解析,并返回所请求主题的边界框坐标。在此演示中,我们要求AI识别所有兔子。
然后使用原始图像的宽度和高度重新缩放坐标以正确对齐它们。
最后为了测量对象检测的准确性,我们使用”Edit Image”节点将边界框绘制到原始图像上。
使用方法
这真的取决于想象力!也许可以构建基于证据的工作流的基础形式,或者构建更高级的图像搜索形式。
要求
Google Gemini for LLM
自定义工作流
此模板只是Gemini 2.0实验版本的演示。建议在Gemini 2.0退出此阶段后再用于生产环境。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。