GPT - 4.5登场,海外大模型竞争新态势

OpenAI推出的GPT - 4.5展开论述,探讨其在能力提升方面的表现,如“情商”更高、追随用户意图能力更强等,同时也会深入分析它昂贵的定价以及这一情况对市场格局的影响,包括对中国科技企业开拓海外市场的影响等内容。

每周都有新模型出现,Anthropic刚刚推出混合推理模型Claude 3.7 Sonnet,OpenAI就迅速推出了GPT - 4.5。在当地时间2月27日这一时刻,GPT - 4.5登上舞台。它在追随用户意图方面展现出了更强的能力,“情商”水平也更上一层楼。OpenAI的CEO山姆·奥特曼甚至将其描述为一种独特的智慧,一种有着特殊魔力的存在,这种魔力是他从未体会过的。

尽管GPT - 4.5作为非推理模型,在预训练进一步扩展后,能力有了明显的提升。在准确性方面有了提高,幻觉现象也减少了。然而,需要注意的是,在DeepSeek引发开源潮和降价潮之后,海外市场似乎并未受到太大的冲击。GPT - 4.5的定价相当之高,这使得很多人不禁感叹,普通大众可承受不起。不过从另一个角度看,这也让中国科技企业开拓海外市场显得更加必要了。

GPT - 4.5的“情商”更高,对暗示的理解也更到位。据相关信息,GPT - 4.5在扩展预训练和后训练规模上有了新的进展。OpenAI通过对无监督学习和推理这两个互补范式的扩展,来提升人工智能的能力。扩展推理能够让模型在做出回应之前进行思考,并且产生一系列的思维链,如此一来,复杂的逻辑问题就能得到解决。无监督学习则提高了世界模型的准确性和直觉能力,GPT - 4.5识别模式、建立联系以及在无需推理的情况下产生创造性见解的能力也得到了增强。

OpenAI宣称,与OpenAI o1和OpenAI o3 - mini模型相比,GPT - 4.5是一个通用性更强、天生更加智能的模型。早期的测试表明,与GPT - 4.5进行交互更为自然。GPT - 4.5有着更广泛的知识基础,更强的追随用户意图的能力以及更高的“情商”,这使得它在提升写作、编程以及解决实际问题等任务上卓有成效。它能够更好地理解人类的意图,并且以更加细致的差别和“情商”来解读那些微妙的暗示或者隐含的期望。

快思慢想研究院院长、原商汤智能产业研究院创始院长田丰指出,GPT - 4.5的推出,证明了美国的大模型继续遵循“大力出奇迹”的尺度定律路线,其算力、数据以及模型都是顶级配置,通过更大的算力、更多的数据,训练出效果更优的模型。“GPT - 4.5的预训练阶段算力极大,是用10倍的算力来进行训练的。”

“神仙”之间按月竞争,重视技术储备也是当下的态势。田丰表示:“今年大模型之间将会出现你追我赶的节奏,OpenAI现在采取的策略像是‘领先半步’。”

在GPT - 4.5推出之前,OpenAI内部至少在对两个模型版本进行迭代,也就是针对GPT - 4.5和GPT - 5开展测试、工程优化、产品化对齐等工作。田丰表示:“OpenAI有资金、人力和算力来做双版本的储备,其他公司若要跟上节奏,也必须做到这一点。”他还指出,在当前竞争周期不断拉长的情况下,不管是国外的Anthropic,还是国内的DeepSeek,都需要投入更多的技术储备。

“头部大模型公司按季度更新模型版本,最慢100天,快的话30天,‘神仙打架’已经是按月进行了,一个季度就像是一场巡回赛。如果跟不上这个节奏,那就得在产业链上找到自身的优势。”田丰说,“大模型厂家如果不能每隔一两个月推出一个新版本,也可以憋大招,憋个三五个月憋出一个好版本来追上现有的大模型也是可行的。”

田丰认为,当前国外最值得关注的大模型是OpenAI的GPT - 4.5、Anthropic的Claude 3.5、马斯克旗下AI公司xAI的Grok 3,尤其是对这三者之间的逻辑推理能力进行对比更具价值。其中,Anthropic日前推出的混合推理模型Claude 3.7 Sonnet具备“系统一”和“系统二”两套系统,既能够快速回答用户的问题,也能够针对复杂问题启动“系统二”进行深度思考,思考时间会更长,这就如同人类的思考模式一样。从这个角度来看,Claude 3.7 Sonnet在架构的双系统层面具有一定的领先性和启发意义,“在数据和算力遇到瓶颈时,就会把创新集中在模型架构层面,探索方法上的创新、工程化的创新以及架构上的创新。”

田丰表示,GPT - 4.5等模型将会加速补全基础模型通用知识领域,增强复杂推理的质量和情绪感知能力,基础模型负责高水平的通用能力,AI应用负责行业逻辑。Grok3会在空间智能领域发力,加速具身智能体的“ChatGPT时刻”的到来。垂直领域的专业模型也将成为中国大模型的竞技场,中国在机器人产量和使用规模方面更具优势。

在对GPT - 4.5的性能给予高度评价的同时,山姆·奥特曼也提到这是一个“庞大且昂贵”的模型。

据悉,调用GPT - 4.5的API,目前的输入价格为75美元/百万token,输出价格为150美元/百万token,这不仅高于GPT以往的模型,也高于市场上的其他模型。以Claude 3.7为例,调用其API,输入百万token的收费为3美元,输出则为15美元。

与国内模型相比更是差距明显,DeepSeek - V3最近推出了错峰优惠政策,在凌晨时段,调用DeepSeek - V3的API输入百万token只需要0.25元,即便在非优惠时段也不过是0.5元;输出百万token的优惠价格是4元,标准时段价格为8元,这里的定价都是人民币。

在业内人士看来,OpenAI定价如此之高,一方面是其算力成本确实很高,另一方面也表明海外市场和国内市场的定价策略遵循不同的逻辑,OpenAI仍然能够凭借技术优势获取更高的溢价。

田丰表示,OpenAI目前也面临GPU不够用的难题,GPT - 4.5推理成本高、算力开支大,这就导致用户使用成本昂贵,难以向全民推广和使用。

OpenAI的CEO山姆·奥特曼在社交媒体上坦言:“我们真的很想同时为Pro用户和Plus用户推出,但我们发展得太快了,GPU已经用完了。我们将在下周增加数以万计的GPU,向Plus用户推出服务。”ChatGPT Pro的月费是200美元。GPT - 4.5目前还不支持ChatGPT中的语音模式、视频和屏幕共享等多模式功能。

Hugging Face工程师王铁震认为,OpenAI的定价策略之所以没有被DeepSeek“卷”到,是因为国内市场和海外市场原本就有不同的定价策略。另有大模型从业人士认为,OpenAI仍然遵循的是“高服务定价 - 高企业估值”的业务逻辑,“追求技术快人一步,然后享受技术溢价”。

田丰认为,相对于美国企业的“大力出奇迹”,国内目前的大模型路线是以极致性价比来实现更好的模型效果,“两边的发展方向会越来越不同,但最终都会在一个竞技场上去竞争。”

本文总结了OpenAI推出的GPT - 4.5在能力提升方面的表现,包括“情商”提高、追随用户意图能力增强等,同时详细阐述了其高昂的定价,对比了与其他模型在价格上的差异,分析了背后的原因,如算力成本高、海外市场定价逻辑不同等。还探讨了这一情况对市场格局的影响,如中国科技企业开拓海外市场的必要性,以及国内外大模型发展路线的差异等内容。

原创文章,作者:Wonderful,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/26561.html

(0)
WonderfulWonderful
上一篇 2025年2月28日
下一篇 2025年2月28日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注