2025年,国内的AI厂商们,王炸是一波接一波地放出来。这不,轮到百度出招了,发布了文心大模型4.5和文心大模型X1。
温馨提示,这两款新模型已经登陆文心一言官网,所有用户都可以免费体验!
秋香总结了一下百度官方的介绍,这两个模型最大的特点是:更高更快更强。
比如文心大模型4.5是原生多模态大模型,其多模态理解、文本和逻辑推理能力显著提升,在多项测试中表现都比OpenAI的GPT4.5要好,而且API调用价格还只是为GPT4.5的1%;
和前阵子大火的DeepSeek-R1一样是深度思考模型的文心大模型X1,在达到和它相同性能的同时,调用价格只有为R1的一半。
到底真实情况是不是这么厉害呢?接下来给大家分享一下秋香的一些理解和体验成果。(点击上面视频可查看~)
接下来,我要同时问文心大模型X1和DeepSeek-R1同样的问题,看看谁的回答更出色。
第一个问题是关于图片理解的问题。我给他们都发了由意大利艺术家毛里齐奥·卡泰兰创作的艺术作品《喜剧演员》,理解这幅片的难度在于,这是一个概念作品,结构简单,但是不同的人理解不同。
从回答来看,文心大模型X1对作品背景信息、艺术⻛格、象征意义都有比较清晰理解,DeepSeek-R1显然还没办法解析,智能识别文字。
这一局,文心大模型X1胜。
第二个问题,我决定问很多大模型都比较弱势的数理分析问题,在⼀个 100 盏灯的房间⾥,开关初始状态全关,按第 1 轮开关全部打开,按第 2 轮开关所有编号为 2 的倍数的灯,问最后有哪些灯是亮着的?
这一轮两个模型都发挥了推理模型的优势,回答的都十分准确。
进入第三个问题,独立解决复杂分析。这几年金价的涨势比较迅猛,所以我的问题是,分析一下近些年金价上涨的原因,以及预测未来五年金价的变化趋势。
这个问题的难点是,既要分析影响金价的几个因素,还要预测未来这些因素可能的变化。从结果来看,两个模型都给出了一些不错的建议,但是文心大模型X1考虑到多个影响因素,并以表格形式呈现结果,内容展现清晰,实⽤性强。
最后一个测试,我决定考验一下多工具调用。先分别给两个模型发送了一个贝果的照片,然后要求他们给我一个制作贝果的工序,并生成pdf发给我。解决这个问题需要用到图片理解、高级联网和代码解释器等多个工具。
从结果来看,文心大模型X1能够自动识别代码错误进行调整,并且生成pdf,DeepSeek-R1还没办法解决这类问题。
看来这文心大模型X1还真不错。那再看看文心大模型4.5。既然百度说它的理解能力大幅提升,那我就先来测测理解能力。
秋香先让他生成几张就秋香的图片,你别说,跟我的需求很接近了。
那我们加大剂量,直接上梗图。梗图可以说是考验AI理解能力的高标准了,因为太抽象了!不了解相关背景的人很难理解。
文心大模型4.5都知道,第一张图的意思是,第二张图的意思是,你说说厉害不!
不仅是梗图理解,风景图、影视剧截图、碑文字画、蔬菜植物、艺术品等相关解读,文心大模型4.5都手拿把掐,最重要的是不胡说八道,能够准确解读。
不只是解读,秋香还让文心大模型4.5根据一个图片生成脚本、生成一段小红书产品文案,甚至给一个视频配一段BGM,文心大模型4.5都能做到。
这得给大家减少多少工作量!
测试完文心大模型4.5和文心大模型X1,秋香只想感叹,这AI的时代真的来了。百度过去十年押注1300亿元的投入算是赌对了,未来大厂的竞争,应该就是AI的竞争
作为普通人,如果你问秋香,要从哪里开始学习AI知识,秋香的建议是,可以从熟练使用AI工具开始。
免责声明:所有平台仅提供服务对接功能,资讯信息、数据资料来源于第三方,其中发布的文章、视频、数据仅代表内容发布者个人的观点,并不代表泡财经平台的观点,不构成任何投资建议,仅供参考,用户需独立做出投资决策,自行承担因信赖或使用第三方信息而导致的任何损失。投资有风险,入市需谨慎。
请先登录后发表评论