OpenClaw等Agent里面自动处理亚马逊上架过程中,生成合规的图片是最重要的一环。我们对目前的三款热门的生图AI进行使用,主要探讨国内的即梦、豆包,以及国外的Nano Banana的使用方式和生成的效果,分析哪个AI大模型最适合亚马逊生成商品图片。
维度 | 即梦 | 豆包 | Nano Banana(Pro) |
模型类型 | 国内模型 | 国内模型 | 国外(Google Gemini系) |
出图效果 | ❌ 偏差大(配件缺失、还原差) | ⚠️ 一般(无差异、不稳定) | ✅ 最优(理解强、场景灵活) |
Prompt理解能力 | ❌ 较弱(需反复调) | ⚠️ 一般(较死板) | ✅ 很强(理解精准、自由度高) |
稳定性 | ❌ 不稳定 | ⚠️ 一般 | ✅ 稳定 |
是否适合上架 | ❌ 需要多次修改 | ❌ 需多次修改 | ✅ 基本可直接用 |
单张成本 | 标称0.2元(实际更高) | ✅ 约0.1元 | ❌ 约0.5元 |
文字生成能力(详情图) | ❌ 乱码明显 | ⚠️一般,需要多次调整 | ✅文字完整 |
批量生成能力 | ❌ 强依赖Prompt | ❌ 难批量 | ✅ 可结合Agent实现 |
使用门槛 | ✅ 低 | ✅ 低 | ❌ 需海外账号 |
自动化潜力 | ❌ 低 | ❌ 低 | ✅ 高(适合工作流) |
即梦和豆包是国内较为优秀的生图AI工具,我们也进行了测评,下面所有的测评都是基于图1为参考图和使用deepseek根据五点描述和标题生成统一的prompt(生成图片的提示词)进行A/B测试。
我们通过openclaw调用即梦API和豆包接口去生成,进行多次prompt的调整后,生成效果如图2和图3 所示,我们能很明显的看得出来,图2跟图1差距非常大,配件不齐全,图3生成的图片生成的图并没有形成差异化,并且不稳定,到达不了上架的标准,需要修改很多次提示词,才能达到要求。


![]()
图 1 主图原图 图 2 即梦生成图
![]()
![]()
图 3 豆包生成图
我们对比了两个模型的价格,豆包相对便宜,一张图在0.1元左右,即梦在文档中明码标价是0.2元一张,不过根据我使用的体验看来,收费的成本远远大于0.2元一张,新注册的账户有200张的免费额度,有兴趣的可以去生成体验。

图 4 即梦价格

图 5豆包价格
我们亚马逊出图还需要尺寸详情图,目前即梦和豆包都没有办法完全解决文字乱码的情况,即无法将商品信息清晰的展示在图里,其次生成的图片太依赖提示词,无法做到批量去生图。
在国外的gemini旗下的Nano Banana,目前是被不少博主强烈推荐,很多市面上的AI生图的软件和网址,都是嵌入Nano Banana,目前最为热门就是Nano Banana Pro。我们此次也是使用Nano Banana Pro进行测试,根据图6,我们能感受到同样的prompt下,Nano Banana Pro生成的商品图片是最好的,对提示词的理解也是相当到位,没有像国内的豆包、即梦这两个大模型一样很死板,它可以更改使用场景、使用状态,灵活生成的图片。
但是根据图7的价格表来说,Nano Banana生成图片所需要的费用过高,默认的1k画质费用转化为人民币都将近0.5元一张图片。

图 6 Nano Banana生成图

图 7 Nano Banana价格
通过对比国内和国外的目前最火的几个生图AI,我个人比较倾向于Nano Banana,使用Nano Banana目前存在几个问题:1、需要获取国外账户,不然无法长期使用Nano Banana;2、Nano Banana的使用费用相较于豆包、即梦来说太高了。
如果要做到批量去生图,去测试能否上架,目前Nano Banana最合适,调用一个AI Agent根据商品详情生成提示词,提示词传给Nano Banana,最后生成,形成一套可以简单又复用的流程,但是Nano Banana所需要的价格又远超于国内的大模型,因此要看个人或者企业的实际进行去选择适合自己的大模型,毕竟生图不是一次就能使用,要考虑专利和侵权等问题,因此必须要考虑生图的成本问题,国内的大模型每个产品都需要打磨提示词才能达到我们想要的结果。