大模型发展受阻,智能体将崛起? 大模型遇“算力墙”,2025智能体元年?

本文主要聚焦于AI大模型领域,对过去一年的技术演进、趋势以及开源开发者生态数据进行多方面的总结梳理,同时探讨了大模型面临的诸如算力受限等困境,以及在这种情况下智能体成为下一代“明星产品”的可能性等内容。

一份报告聚焦AI大模型领域,全方位地对过去一年该领域的技术演进动态、趋势走向以及开源开发者生态数据等进行了综合性的总结与梳理。

在报告的第二章《TOP 101 - 2024大模型观点》里,浙江大学计算机博士、美国南加州大学访问学者傅聪提出了一个重要观点。在“算力墙”的限制下,大模型的模型效果边际收益不断递减,而且其训练与运营成本高昂。在这样一个关键的时间节点上,傅聪认为最好的AI产品将会是智能体,甚至大胆预测2025年将会成为智能体元年。

近期,大模型教父Sam Altman在Reddit上的评论透露了GPT - 5难产的担忧。他直言有限的算力约束让OpenAI在迭代优先级上面临艰难抉择,这就好像在通往AGI道路上一路领先的OpenAI撞上了一堵难以逾越的“算力墙”。除此之外,大模型还面临诸多问题,例如能耗过高、资金消耗巨大、难以消除的幻觉、知识更新速率有限、上下文宽度有限以及高昂的运营成本等,这些问题都让外界对大模型的发展前景充满忧虑。那么,在如此棘手的困境与难题面前,大模型的未来到底该朝着哪个方向发展呢?

在“算力墙”这种背景下,由于模型效果边际收益递减以及训练和运营成本高昂等因素,目前像奥特曼、盖茨、小扎、吴恩达、李彦宏等众多行业大佬对于“在这个时间节点,最好的AI产品会是什么”这一问题给出了相同的答案——智能体(AI Agent)。并且预测2025年将会是智能体元年。那到底什么是智能体呢?目前业界普遍认可的公式是“智能体 = LLM + 记忆 + 规划 + 工具”。相应地,在算力层方面,短时间内的主题依旧会围绕着“半通用化”“高算力”“低能耗”展开。

还有一个现象值得关注,早有机构预测,人类社会可利用的训练数据将在2026年耗尽,这或许还是一个比较乐观的估计。光头哥Tibor Blaho曾爆料,OpenAI用于训练“猎户座”的数据中,已经包含了由GPT - 4和O1产出的合成数据。这不仅仅是因为自然存在的高质量文本数量匮乏,还因为智能体所需的数据可能需要明确地包含任务思考和规划的拆解信息。不过,针对合成数据的问题,学术界早就发出预警,模型可能会在合成数据的持续训练中崩坏【14】。

从这个角度去理解的话,多模态大模型很可能是通向真正AGI的必经之路。将多模态信号统一对齐,这是智能体与这个世界进行“无障碍”交互的前提,用一个比较新潮的词汇来说,就是我们所期待的“具身智能”。谁不想拥有一个属于自己的“Javis”呢?而多模态大模型的突破,同样也依赖于前面提到的算力和数据方面的沉淀。

文章最后还列出了一系列参考文献,包括【1】https://epoch.ai/blog/can - ai - scaling - continue - through - 2030等众多文献资料,以及作者简介,并配有相关图片。

本文总结了AI大模型领域的相关情况,包括过去一年的技术发展等多方面内容。重点阐述了大模型面临的“算力墙”等困境,提出在这样的背景下智能体可能成为下一代重要产品,2025年或许是智能体元年,还探讨了合成数据相关问题以及多模态大模型对通向AGI的重要性等。

原创文章,作者:Foster,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/13696.html

(0)
FosterFoster
上一篇 2025年2月10日
下一篇 2025年2月10日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注