月之暗面获超10亿美金融资，中国“OPEN AI”花落谁家？

近日，AI创业公司「月之暗面」近期已完成新一轮超10亿美金融资，投资方包括阿里、红杉中国、小红书、美团，砺思资本等老股东跟投。本轮融资后，月之暗面估值已达约25亿美金，为国内大模型领域的头部企业之一。

据了解，自ChatGPT掀起全球浪潮以来，这是国内AI大模型公司迄今获得的单轮最大金额融资。

那么，月之暗面究竟有何魔力？

月之暗面创业团队背景深厚，长文本处理能力价值凸显

月之暗面是国内大模型领域的关键玩家。自成立以来，强大的创业团队、长文本和ToC一直是月之暗面的关键词。

创业团队方面，目前月之暗面团队人数已超80人，由清华大学交叉信息学院的杨植麟教授领衔。据介绍，创始人杨植麟虽然是一位90后，但却在学术界有着深厚的积累，其不仅拥有清华大学计算机科学的背景，以及卡内基梅隆大学的博士学位，还曾与多位图灵奖得主合作发表过论文，其学术成就和行业经验，为月之暗面带来了强大的技术背书。

团队成员中还包括来自Google、Meta、Amazon等国际科技巨头的人才，其核心团队曾参与到Google Gemini、Google Bard、盘古NLP、悟道等多个大模型的研发中。其中，值得一提的是，联合创始人周昕宇和吴育昕，在拥有清华大学背景的同时，也拥有在旷视科技和Meta等知名科技公司的工作经验。

可见，月之暗面拥有一支在大模型道路上探索多年的队伍。

专业的团队仅是各路资本看好月之暗面的原因之一。强大的技术背景和研发能力造就的高端产品，是月之暗面能够持续获得看好的重要基础。

据悉，023年10月，月之暗面正式推出首个面向C端的产品“Kimi智能助手”，这是月之暗面做To C超级应用的第一次尝试。杨植麟曾表示，ToC就是一个自然而言的选择，他看到的是一个成为AI时代Super App的机会。

应用方面，Kimi Chat通过创新的网络结构和工程优化，在千亿参数下实现了无损的长程注意力机制，不依赖于滑动窗口、降采样、小模型等对性能损害较大的“捷径”方案。这些改进允许Kimi Chat在不牺牲理解能力和生成质量的前提下，处理长达20万汉字的输入，这在当前的AI模型中是非常罕见的。

据了解，月之暗面第一次亮相，没有写诗，没有写代码，而是用一个支持20万汉字的超长文本输入的AI产品完整吃下了一本《三体》。这在当时已经是市面上可使用的大模型中文本输入长度最长的一个。与月之暗面亮相同期，文本长度方面最引人关注的Claude-100k换算成汉字也只有8万字左右。

当前大模型落地的瓶颈，不仅有参数规模大小（即模型计算能力），还有模型的“内存”大小，即记忆力。每轮对话能处理多少上下文信息，决定着AI应用的体验好坏。

数据显示，其实际使用效果能够支持约20万汉字的上下文，2.5倍于Anthropic公司的Claude-100k（实测约8万字），8倍于OpenAI公司的GPT-4-32k（实测约2.5万字）。

可见，相比当前市面上一些追求“面面俱到”的大模型，月之暗面的大模型Kimi Chat的主攻方向更加触及当前大模型的技术本质，更专注于长文本方面的能力，这也恰好迎合了“处理海量信息”这一市场需求。

相比于或保守或跟风地投身B端市场的众多国产大模型，Kimi Chat却明确定位于C端市场，通过提供个性化和便捷的AI服务，与同类大模型形成了差异化竞争。

而上述优势也让Kimi Chat在金融、法律、科研等需要快速分析和总结长篇文档的领域，展现出了巨大的潜力。

月之暗面躺平稳赢，为时尚早？

不过，暂时脱颖而出的月之暗面还不能完全“躺平”。

从国内的AI竞赛来看，通用大模型领域的第一梯队也已经清晰展现。据当前公开信息，除月之暗面以外，包括智谱AI、MiniMax、百川智能、零一万物在内的创业公司，估值都已达10亿美金后。

而这五家初创公司中，阿里巴巴目前已经投资了MiniMax之外的其余四家；腾讯投资了包括智谱AI、百川智能以及MiniMax在内的三家；美团则参与了智谱AI和月之暗面两笔融资。

有业内人士分析称，当前头部的大模型公司的融资窗口仍在开放，“军备竞赛”还未告一段落。

此外，随着OpenAI发布的首个AI视频模型Sora问世，以及谷歌最新多模态模型Gemini Pro 1.5的重磅发布，有业内人士猜测，大模型创业公司的未来发展重点也在随之改变，多模态模型或将成为新的核心竞争点。

目前，多模态技术的需求正在不断增长。据了解，很多应用场景如果没有多模态技术支持几乎难以实现，尤其是在需要处理多种类型数据的领域，例如医疗、机器人、电商、零售、游戏等。

但是，多模态技术有着高标准的技术要求。有业内人士表示，一个好的多模态大模型评分标准应该具备四大特性。

第一，应该覆盖尽可能多的范围，包括感知和认知能力（感知是认知的基础）；第二，它的数据或者标注应该尽可能避免采用已有的公开数据集，以减少数据泄露的风险；第三，指令设计应该尽可能简洁，并且符合人类的认知习惯；第四，多模态大模型在该简洁指令下的输出应该是直观的、并且便于定量统计。

因此，相比起以文本为主的大语言模型，以图像、视频为主的多模态模型，训练成本更高，未来将会需要更巨量的资金和人才，月之暗面将会面临更多挑战。

据业内人士透露，训练一个通用大模型，可能需要花费5000万元左右，而这只是一次的训练成本，还不包括后续的优化、更新、部署等费用。这样的成本对于大多数创业公司来说是难以承受的，甚至对于一些互联网巨头来说也是不小的负担。

同时，大模型并不是一劳永逸的，随着数据量和需求的增加，需要不断地进行调整和改进，否则就会出现“幻觉”问题（指模型生成不正确、无意义或不真实的文本）或者落后于竞争对手。

好在，月之暗面早已“未雨绸缪”。

据了解，月之暗面当前已经在秘密研发通用多模态模型，预计今年内将推出。月之暗面在多模态相关技术上多有储备，团队成员曾发明了包括基于对比学习的视觉预训练范式MoCo、最高效的视觉网络结构之一ShuffleNet等，也有团队成员主导开发了detectron2，后者是一个被广泛使用的视觉开源项目，曾被集成到Meta全线VR/AR产品中。

免责声明：泡财经所有平台仅提供服务对接功能，资讯信息、数据资料来源于第三方，其中发布的文章、视频、数据仅代表内容发布者个人的观点，并不代表泡财经平台的观点，不构成任何投资建议，仅供参考，用户需独立做出投资决策，自行承担因信赖或使用第三方信息而导致的任何损失。投资有风险，入市需谨慎。

请先登录后发表评论

月之暗面获超10亿美金融资，中国“OPEN AI”花落谁家？

机器人

共0条评论