商汤发布并开源日日新SenseNova U1,以单一模型架构统一多模态理解、推理与生成

发布时间:

2026-04-29 10:25:02

来源:财经涂鸦
商汤发布并开源日日新SenseNova U1,以单一模型架构统一多模态理解、推理与生成

“未来,该模型还能为机器人提供具身大脑。”

作者:苏打

编辑:tuya

出品:财经涂鸦(ID:caijingtuya)

公司情报专家《财经涂鸦》获悉,4月28日,商汤正式发布并开源日日新SenseNova U1 系列原生理解生成统一模型。

该模型基于商汤今年三月自主研发的NEO-unify架构,在单一模型架构上统一了多模态理解、推理与生成。

据悉,本次开源发布的是SenseNova U1的轻量版系列SenseNova U1 Lite,包含SenseNova-U1-8B-MoT(基于稠密骨干网络)与SenseNova-U1-A3B-MoT(基于混合专家(MoE)骨干网络)两个不同规格的模型。

与传统多模态模型经常出现的等待、误解和信息损耗相比,SenseNova U1基于统一表征空间构建,可以将不同模态的信息以更紧凑、更高密度的方式组织起来。

该模型下,图像和语言不再是两套系统之间的接力,而是在同一个大脑中自然融合,令信息流转更快捷、理解更直接、生成更高效。

在涵盖图像理解、图像生成与编辑、空间智能和视觉推理的多项基准测试中,SenseNova U1 Lite均达到同量级开源模型SOTA水平,为统一多模态理解与生成树立了新的标杆,甚至仅凭8B-MoT的较小规格,就能达到甚至超越部分大型商业闭源模型,展现出全维度多领域的统治力。

(SenseNova U1 Lite的商业级复杂信息图生能力)

商汤表示,正在沿着当前的技术路径继续Scale,计划在未来推出体量更大的模型,“我们相信,基于高效的原生架构,可以以低得多的计算成本达到国际顶尖模型的水平。”

因此同时,凭借NEO-Unify架构的优势,SenseNova U1亦在业内首次实现连续性的图文创作输出,且只需单次单模型调用,就能输出更高质量的作品,较传统范式实现了效率的大幅提升。

SenseNova U1 所具备的原生图文理解生成能力,能天然将图像和文本底层融合信号完整的保留上下文中,区别于过去只能利用多模型串联勉强实现,它的图像间风格具备明显的高一致性,能在统一表征空间进行高效连贯思考。

例如,绘制一个钢铁侠图案时,它可以从扫描草稿出发,逐步进行连续创作,最终做出一个完成度很高的图像。每一步创作的过程对于前一步的结构和细节都做了精准的保持,一个统一表征的共享上下文在其中发挥了关键作用。

据悉,该模型即将上线办公小浣熊。未来,该模型还能为机器人提供具身大脑,实现在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行的全过程,为推动技术与产业发展提供重要基础与关键引擎。

“我们相信,原生统一的多模态智能是通往 AGI 的必经之路”。商汤表示,未来还将持续推动开源生态建设,并发布更大参数规模的 U1 系列模型,与广大用户和开发者共同定义智能交互的未来。

本文由公众号财经涂鸦(ID:caijingtuya)原创撰写,如需转载请联系涂鸦君。

添加涂鸦君个人微信(ID:tuyaclub)加入【公司情报社群】参与资本市场讨论获取一手情报

免责声明:所有平台仅提供服务对接功能,资讯信息、数据资料来源于第三方,其中发布的文章、视频、数据仅代表内容发布者个人的观点,并不代表泡财经平台的观点,不构成任何投资建议,仅供参考,用户需独立做出投资决策,自行承担因信赖或使用第三方信息而导致的任何损失。投资有风险,入市需谨慎。

古东管家

请先登录后发表评论

0条评论