Black Forest Labs 推出 FLUX.1 Kontext:高级上下文感知图像生成和编辑
您要一张森林中鹿的照片。那么你想要在冬天使用。然后,戴上帽子。大多数生成工具都会迫使您在每次构建新请求时重新启动。黑森林实验室宣布推出一款不会出现这种情况的工具。
FLUX.1 Kontext 是最近发布的生成流匹配模型套件,引入了用于图像创建和编辑的高级上下文感知功能。与传统的文本到图像系统不同,FLUX.1 Kontext 让用户有机会使用文本和参考图像进行提示,从而实现更精确和迭代的视觉转换。这些模型支持高速、逼真的渲染、强大的提示依从性以及最小延迟的逐步编辑。
多模态功能重新定义图像生成
FLUX.1 Kontext 将文本到图像合成与交互式本地化图像编辑相结合。它支持从概念设计到创意探索的各种用例,提供字符一致性、本地编辑和风格转移等功能。该套件包括两个新型号:
- FLUX.1 Kontext [专业版]:针对迭代图像编辑和修改进行了优化,它接受文本和图像输入,使用户能够跨多个步骤优化图像,同时保持风格和字符的一致性。
- FLUX.1 Kontext [max]:该模型专为高性能和速度而设计,可增强提示跟踪和版式,而不会牺牲输出质量。
这两种模型都可以通过 KreaAI、OpenArt 和 TogetherAI 等合作伙伴以及 FLUX.1 Kontext [dev] 进行访问,FLUX.1 Kontext [dev] 是一种可定制的开放权重变体,目前正在为研究人员和开发人员提供私人测试版。
另请参阅: 努力使文本到图像的生成民主化
基准测试结果和开发者游乐场
性能评估显示 FLUX.1 Kontext [pro] 在文本编辑和字符保存等任务中名列前茅。它还在延迟方面超过了竞争对手,在生成和编辑工作流程中提供更快的结果。
为了简化实验,Black Forest Labs 还发布了 FLUX Playground,这是一个演示环境,允许用户无需技术设置即可测试 FLUX 模型。 Playground 支持评估生产用途 FLUX 的团队进行实时原型设计和决策。
虽然这些模型产生了很好的结果,但仍然存在一些局限性,包括在长时间的多次编辑会话中偶尔会出现提示误解和退化。 Black Forest Labs 计划在未来的更新中解决这些问题。
访问 Playground.bfl.ai 探索 Playground。
物联网技术