OpenAI紧急上线其目前成本效益最高的推理模型o3 - mini,该模型在性能方面有所提升且价格下降,在ChatGPT和API中向所有用户开放使用权限。然而,与DeepSeek相比,其在价格等方面仍存在差距,这也反映出开源与闭源在大模型竞争中的不同态势,同时提到OpenAI高层对一些问题的看法以及相关产品的进展,还有DeepSeek在行业内引发的一系列连锁反应等。
OpenAI最新推出的推理模型o3 - mini火速上线了。这一模型可是OpenAI当下成本效益达到最高的推理模型呢。和以往不一样的是,OpenAI这次大方地向全体用户开放了o3 - mini在ChatGPT以及API中的使用权限。不得不说,很难讲OpenAI的这个举动没有受到DeepSeek的压力影响。从性能方面来看,o3 - mini无论是编程能力,还是知识水平,都全方位超越了之前的推理模型。就拿2024年美国数学邀请赛(AIME 2024)的测试来说吧。在低努力的情况下,o3 - mini的准确率能达到60%,这个数据和o1 - mini相差无几,但是它的速率更快哦。要是处于中等努力水平呢,o3 - mini的准确率就能够攀升到79.6%,这就和o1模型差不多了。而当处于最高努力水平的时候,o3 - mini的准确率更是能进一步提升到87.3%呢。而且啊,o3 - mini不仅把推理过程(思考过程)公之于众,还把价格大幅降低了。它的输入每百万tokens定价1.10美元(要是使用缓存输入的话,费用还能减半呢),输出每百万tokens定价4.40美元。这个价格比起o1 - mini可是低了63%呢,和完整版o1相比,更是低了93%。可是,OpenAI即便为盈利如此努力,与DeepSeek R1比起来,价格还是偏高了些。DeepSeek R1的定价是:输入每百万tokens只要0.14美元,输出每百万tokens只要0.55美元。也难怪DeepSeek一直稳稳占据各大应用商店下载榜的首位呢。近期,就连一些国际顶尖大学的研究员都把DeepSeek当作首选了。在当天o3 - mini发布会之后,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)带着一帮高管,在社交平台Reddit上回答了网友们提出的各种问题。奥特曼在回答是否会公开一些大模型权重的问题时表示:“我个人觉得在(开闭源)这个问题上,我们站在了历史的错误一方,得找出一个不一样的开源策略。不过呢,不是所有OpenAI的人都认可这个观点,而且目前这也不是我们最优先考虑的事情。”想当初OpenAI刚成立的时候,就像它的公司名字所表示的那样,它的研究应该是开放的。但是随着商业化进程不断深入,这家公司却选择了闭源。这也是马斯克和奥特曼分道扬镳并且马斯克一直对OpenAI颇有微词的重要原因。Meta的首席AI科学家杨立昆(Yann LeCun)近期说过:“正确的解读是:‘开源模型正在超越专有模型’。他们(DeepSeek)提出了新的想法,并且在其他人的工作基础上进行构建。因为他们的工作是公开且开源的,所以每个人都能从中受益,这就是开放研究和开源的力量。”2024年的时候,国内外的科技界就大模型到底是开源好还是闭源好这个问题,有过非常激烈的争论。如今,开源的DeepSeek引领了全球AI的重要研究方向,这几乎等于给这个话题画上了句号。而一直在创新、安全与商业化之间小心翼翼探索前行的OpenAI,也不得不重新思考它的闭源策略了。在回答网民提出的DeepSeek对OpenAI未来模型发展计划有什么影响的时候,奥特曼坦诚地说,DeepSeek R1是“非常好的模型”。虽然OpenAI在未来还是会开发出更厉害的模型,但是它的领先优势相比往年肯定会有所减少。随后,奥特曼还透露了几个产品的进展情况:完整版o3最快会在几个星期内发布,最慢也就是几个月内发布。语音模式的更新马上就要来了,不过大家都很关注的大模型GPT - 5目前还没有一个明确的时间表呢。首席产品官Kevin Weil宣称,将会推出基于4o的图像生成器。工程副总裁Srinivas Narayanan称,公司的推理模型未来能够使用包括检索在内的不同工具。DeepSeek在人工智能领域所引发的震动效应还在持续扩大。微软、英伟达、亚马逊等巨头之前就已经宣布上线搭载了DeepSeek - R1的软件服务。2月1日晚上的时候,华为云也宣布,要和硅基流动联合首发并且上线基于华为云昇腾云服务的DeepSeek R1 / V3推理服务。就像知名播客主持人莱克斯·弗里德曼(Lex Fridman)说的那样,任何具有重大革新意义的新事物的出现,不可能没有争议。尽管以后还会有更好的模型不断出现,但是“DeepSeek时刻”是真实存在的,“我觉得5年后它仍然会作为科技史上的关键事件被人们铭记。”
本文总结了OpenAI推出o3 - mini模型的相关情况,包括其性能、价格等方面的优势与劣势,阐述了与DeepSeek在市场竞争中的不同表现,揭示了开源与闭源策略对大模型发展的影响,还讲述了OpenAI高层对一些关键问题的回应以及产品的发展计划,最后强调了DeepSeek在人工智能领域的影响力以及其引发的一系列连锁反应等。
原创文章,作者:Daniel Adela,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/7395.html