The Lab · 2026-04-01 09:29:15 · 36氪
阿里巴巴在图像生成领域推出新动作,发布了其统一模型Wan2.7-Image。该模型的核心信号在于其宣称的“千人千面”能力与全新的“调色盘”功能,旨在实现对生成图像色彩的精准控制。这标志着阿里在AI图像生成与编辑的全链路能力上,正试图通过更精细化的控制来建立差异化优势。
根据发布信息,Wan2.7-Image集成了文生图、图生组图、图像指令编辑和交互式编辑等多种功能。其“调色盘”功能被特别强调,暗示了模型在色彩理解和操控层面的技术进展。在当前AI图像模型竞争白热化的阶段,此类针对特定维度(如色彩、个性化)的深度优化,成为厂商争夺专业用户和细分市场的重要策略。
此次发布将阿里直接置于与国内外主流图像生成模型的竞争场中。模型的全链路能...
The Lab · 2026-04-20 23:32:58 · 36氪
据最新报道,人工智能领域的领军者OpenAI正酝酿在图像生成领域投下一枚重磅炸弹。该公司计划在未来数周内发布一款全新的图像模型,其核心突破在于生成复杂图像和图表的能力将获得显著提升。这一动向预示着AI生成内容(AIGC)的竞争版图可能即将迎来新一轮的技术洗牌。
此次发布并非对现有模型的简单迭代,而是瞄准了更专业、更复杂的视觉内容创作需求。当前,图像生成模型在细节一致性、逻辑构图和复杂数据可视化方面仍面临挑战。OpenAI选择在此节点推出新模型,显然意在巩固其技术领先地位,并可能直接冲击专业设计、数据分析和教育等依赖高质量视觉材料的行业。
新模型的发布将加剧与Midjourney、Stable Diffusion等竞争对手的正面交...
The Lab · 2026-04-22 00:03:11 · 36氪最新 (RSSHub)
OpenAI以一场深夜直播打破了沉寂,首席执行官萨姆·奥特曼亲自带队,发布了被其称为从GPT-3到GPT-5级飞跃的ChatGPT Images 2.0。这款模型不仅重新夺回了AI图像生成的统治地位,更以“会思考”的能力和前所未有的细节精度,宣告了一个新时代的到来。在最新的Arena榜单中,Images 2.0一骑绝尘,登顶全球AI生图榜首,并在全部7个文生图类别中位列第一,实力远超竞争对手。
Images 2.0的核心突破在于其“思考”与“执行”的融合。它不仅是首个具备推理能力的图像模型,能够联网搜索实时信息并进行二次自检,更在像素级精度上实现了质变。直播演示中,模型生成了一座“米山”,其中一粒大米上竟清晰刻有“GPT imag...
The Lab · 2026-04-22 04:03:11 · 华尔街见闻 (RSSHub)
GPT-image-2的公测效果在AI圈引发震动,其核心突破在于将图像生成从“整体涂抹”转向了“序列化构建”。这一技术拐点让模型首次能可靠地生成清晰文字、规整的UI截图和接近设计稿的海报,标志着图像生成模型开始被严肃讨论为真正的生产工具。过去基于扩散模型的主流方法,擅长处理连续的光影纹理,却在生成文字等离散结构时集体失灵,因为其“整体发生”的生成逻辑无法处理字符顺序、拼写规则等约束。
GPT-image-2的技术路径发生了根本性转变。它通过视觉分词器将图像拆解为类似文本token的离散单元序列,从而将图像生成问题转化为序列生成问题。这使得成熟的语言模型方法得以接入,生成过程具备了“从前到后”的顺序性,文字、布局等约束可以被显式控制...