lovart设计智能体实测 – 勉强可用,但远不如之前的宣传稿“卖家秀”
五月中旬,AI设计工具Lovart在社交媒体上掀起了一轮营销热潮。这款号称”全球首个专注于设计领域的AI智能体”声称基于先进的思维链(MCoT)技术构建,能够”像经验丰富的专业人士一样理解设计概要,像创意总监一样思考,并一次性交付多个极具影响力的概念”。各种软文中展示的案例效果令人印象深刻,从复杂的广告分镜设计到精美的海报制作,Lovart似乎无所不能,弹指间就能产出专业级的设计作品。
鉴于此前Manus等AI工具过度营销后实际体验不佳的教训,我选择等待官方放开更多访问权限后再进行实测。经过近两周的等待,我终于获得了邀请码并进行了深度测试。
测试结论:Lovart在简单设计任务上表现尚可,但处理复杂需求时明显力不从心,实际效果与营销宣传存在显著差距。
案例1:测试为某个香水品牌生成30秒的广告视频
采用了这段提示词来进行测试 - “请帮我为这款香水产品生成一个 30 秒广告需要的所有分镜图片,后续我会基于这些图片指导拍摄和生成视频”,然后提供了一款香水的产品图片作为参考。
之前的宣传稿:lovart使用上面这段提示词完美地生成了一段30秒的广告分镜图,甚至还生成了最后的视频。
实际测试结果:Lovart确实生成了一套广告分镜图,构图和画面质量在技术层面可以接受。然而,最核心的问题是完全无法保持我提供的香水产品的视觉风格和品牌特征。生成的分镜图中的产品造型、色调、包装设计都与原产品相去甚远(甚至不同分镜中出现的香水也不同…)。
这使得整套分镜图除了能提供一点模糊的创意启发外,毫无实际应用价值。至于宣传中提到的自动生成最终视频,更是无从谈起。
我提供的香水产品原图(可以看到和上面的香水图完全不同了…):
案例2:尝试生成老铺黄金的info graph
最近因为港股新消费“三朵金花”股价创新高,我提供了一张做得不错的泡泡玛特的信息图表infographic来请lovart作为参考,然后做一张类似风格的老铺黄金的信息图。
参考图(来自金十数据,原图太长仅截取了部分,应该是手工画的)
Lovart生成的老铺黄金版(仅截取部分)
我给lovart的要求是参考上面的泡泡玛特的图片,然后对老铺黄金的公司和财务情况做调研后生成一张类似的。Lovart确实去做了老铺黄金的调研,结果虽然较浅但是应该也够用了,但在信息图表的视觉设计环节明显力不从心。
生成的图表,信息层级混乱,视觉元素拼凑感严重,设计呆板,完全没有体现出参考图表的美感和专业性。它仅仅是将调研到的文本生硬地塞进了一些几何框体里,离真正的“Infographic”相去甚远(而且还出现了严重的“幻觉”)。
当然,必须承认这个需求本身就包含了“股票研究”和“专业设计”两个高难度任务。但这也恰恰证明了,Lovart所谓的“思维链”远未达到能够理解并执行复杂综合需求的水平。
案例3:为一段短视频生成适合抖音风格的封面图
相比前两个,这应该是一个非常基础的需求了:为一段视频生成一张吸引人的封面图。
我提供了一张视频访谈的截图,并给出了具体要求:
“附件是一段视频访谈的截图,请协助我为这个视频设计一个适合抖音上的视频封面。视频的核心内容是:如果AI能像挚友般真正理解你的所思所想?OpenAI副总裁访谈揭秘即将推出的AI硬件设备”
但最终输出的下图的问题很明显,基本不可用:
- 人物形象变动较大,这很明显是4o的特性;
- 中文的显示不够完美,看起来也很4o;
- 成品作为一个视频封面图实在是不够美观…
所以我最后还是用了剪映自带的封面图模版…
基于实测的优缺点分析
在看过以上三个“买家秀”后,我们可以更客观地总结Lovart的真实能力边界。
优点:
- 背靠前沿模型: 核心能力大量依赖GPT-4o的图像生成模型。考虑到直接访问GPT-4o的门槛,Lovart在国内提供了一个相对便捷的“中转站”,让用户能间接触及到前沿的AI生图能力;
- 聚焦成熟领域: 设计,特别是静态图像生成,是当前AI技术应用最成熟的领域之一。因此,只要你的需求足够简单直接,Lovart总能给你一个“保底”的、看起来还不错的视觉结果;
缺点:
- 复现神话失败,过度营销明显: 尝试复现官方宣传稿中的惊艳案例,但结果以失败告终,效果与“卖家秀”相去甚远,过度营销的问题显而易见;
- 继承了GPT-4o的所有“遗传病”: 无法保持主体(人物、产品)的一致性、中文支持极差、图像细节容易出现怪异错误等问题,在Lovart中被原封不动地继承了下来;
- 奇怪的交互逻辑: Lovart主打海外市场,但其交互和输出基本是纯英文的,即使用户输入中文,它也无法智能匹配输出语言,这点体验很差;
结语:与其追逐泡沫,不如回归价值
通过测试可以明显感受到,Lovart大量依赖GPT-4o的图像生成能力,这既是其优势也是其劣势。优势在于能够快速生成视觉效果不错的图像,劣势在于继承了GPT-4o在一致性控制、中文支持等方面的所有问题。
所谓的MCoT(思维链)技术在实际应用中的表现并不突出。真正的设计思维链应该包括需求分析、概念构思、视觉探索、细节优化等多个环节,而目前Lovart更像是一个包装过的图像生成工具。
智能体确实代表了AI应用的重要发展方向,但当前阶段的产品普遍存在能力被过度包装的问题。对于设计从业者和企业决策者来说,理性评估这些工具的真实能力边界,在合适的场景下合理使用,才是正确的态度。
与其追逐最新的营销概念,不如扎实地将现有成熟的AI能力应用好。