商汤发布并开源日日新SenseNova U1，以单一模型架构统一多模态理解、推理与生成

“未来，该模型还能为机器人提供具身大脑。”

作者：苏打

编辑：tuya

出品：财经涂鸦（ID：caijingtuya）

公司情报专家《财经涂鸦》获悉，4月28日，商汤正式发布并开源日日新SenseNova U1 系列原生理解生成统一模型。

该模型基于商汤今年三月自主研发的NEO-unify架构，在单一模型架构上统一了多模态理解、推理与生成。

据悉，本次开源发布的是SenseNova U1的轻量版系列SenseNova U1 Lite，包含SenseNova-U1-8B-MoT（基于稠密骨干网络）与SenseNova-U1-A3B-MoT（基于混合专家（MoE）骨干网络）两个不同规格的模型。

与传统多模态模型经常出现的等待、误解和信息损耗相比，SenseNova U1基于统一表征空间构建，可以将不同模态的信息以更紧凑、更高密度的方式组织起来。

该模型下，图像和语言不再是两套系统之间的接力，而是在同一个大脑中自然融合，令信息流转更快捷、理解更直接、生成更高效。

在涵盖图像理解、图像生成与编辑、空间智能和视觉推理的多项基准测试中，SenseNova U1 Lite均达到同量级开源模型SOTA水平，为统一多模态理解与生成树立了新的标杆，甚至仅凭8B-MoT的较小规格，就能达到甚至超越部分大型商业闭源模型，展现出全维度多领域的统治力。

（SenseNova U1 Lite的商业级复杂信息图生能力）

商汤表示，正在沿着当前的技术路径继续Scale，计划在未来推出体量更大的模型，“我们相信，基于高效的原生架构，可以以低得多的计算成本达到国际顶尖模型的水平。”

因此同时，凭借NEO-Unify架构的优势，SenseNova U1亦在业内首次实现连续性的图文创作输出，且只需单次单模型调用，就能输出更高质量的作品，较传统范式实现了效率的大幅提升。

SenseNova U1 所具备的原生图文理解生成能力，能天然将图像和文本底层融合信号完整的保留上下文中，区别于过去只能利用多模型串联勉强实现，它的图像间风格具备明显的高一致性，能在统一表征空间进行高效连贯思考。

例如，绘制一个钢铁侠图案时，它可以从扫描草稿出发，逐步进行连续创作，最终做出一个完成度很高的图像。每一步创作的过程对于前一步的结构和细节都做了精准的保持，一个统一表征的共享上下文在其中发挥了关键作用。

据悉，该模型即将上线办公小浣熊。未来，该模型还能为机器人提供具身大脑，实现在单一模型闭环内完成从复杂环境感知、逻辑推演到精准任务执行的全过程，为推动技术与产业发展提供重要基础与关键引擎。

“我们相信，原生统一的多模态智能是通往 AGI 的必经之路”。商汤表示，未来还将持续推动开源生态建设，并发布更大参数规模的 U1 系列模型，与广大用户和开发者共同定义智能交互的未来。

本文由公众号财经涂鸦（ID：caijingtuya）原创撰写，如需转载请联系涂鸦君。

添加涂鸦君个人微信（ID：tuyaclub）加入【公司情报社群】参与资本市场讨论获取一手情报

免责声明：所有平台仅提供服务对接功能，资讯信息、数据资料来源于第三方，其中发布的文章、视频、数据仅代表内容发布者个人的观点，并不代表泡财经平台的观点，不构成任何投资建议，仅供参考，用户需独立做出投资决策，自行承担因信赖或使用第三方信息而导致的任何损失。投资有风险，入市需谨慎。

请先登录后发表评论

共0条评论