OpenAI于当地时间1月31日正式发布推理模型o3 - mini的相关情况,包括该模型的推理难度设置、不同用户的使用权限、与之前模型o1 - mini在功能和性能上的对比,还涉及OpenAI核心团队对网友相关问题的解答,以及公司的融资情况等内容。
在经过数日的行业竞争态势发展之后,OpenAI终于有了大动作。当地时间1月31日,人工智能领域的巨头OpenAI重磅推出了其推理模型o3 - mini。这个模型可不简单,它支持low(低)、medium(中)和high(高)三种不同的推理难度,这就像是为不同需求的用户量身定制了不同的解决方案。
那哪些用户可以使用这个新模型呢?ChatGPT Plus、团队和Pro用户现在就可以直接上手使用o3 - mini了。企业用户也别着急,在2月就可以使用了。对于所有的付费用户来说,他们还能在模型中选择o3 - mini - high这个选项,不过要注意的是,这个高智能版本生成回复的时间会稍长一点。而专业用户在使用上就更自由了,可以无限制地使用o3 - mini和o3 - mini - high。
更值得一提的是,免费用户也有机会体验这个新模型。他们可以通过勾选“推理”这个选项来使用o3 - mini,这可是ChatGPT首次向免费用户提供推理模型呢,这无疑是OpenAI向更广泛用户群体推广推理技术的一个重要举措。
作为这次升级的一部分,OpenAI在用户的使用速率限制方面也做了调整。Plus和团队用户的速率限制从o1 - mini的每天50条信息提升到了o3 - mini的每天150条信息。这就意味着用户能够在相同时间内获取更多的服务。而且o3 - mini还有一个很实用的功能,它能够通过搜索功能查找最新的答案,并且还会提供相关的网络链接。OpenAI表示,这其实是公司在推理模型中整合搜索功能的早期原型,这或许是OpenAI在提升模型智能性和实用性方面的又一次探索。
OpenAI还强调o3 - mini是公司推理系列里最新的,也是最具成本效益的模型,其目的在于推动高性价比推理的发展。
从性能方面来看,o3 - mini和o1有很多相似之处,特别是针对STEM(科学、技术、工程、数学)推理进行了优化。o3 - mini - medium在数学、编码和科学方面的能力和o1相当,但是响应速度却更快。专家测试人员经过评估发现,和o1 - mini相比,o3 - mini给出的答案更加准确、清晰,推理能力也更强。在测试过程中,测试人员在56%的时间里更倾向于o3 - mini的回答,并且还观察到在困难的现实问题上,o3 - mini出现重大错误的情况比o1 - mini减少了39%。o3 - mini - medium在一些最具挑战性的推理和智力评估方面,例如AIME竞赛数学和GPQA博士水平的专家推理上,表现和o1相当。同时,o3 - mini的响应速度比o1 - mini快24%,平均响应时间为7.7秒,而o1 - mini为10.16秒。不过o3 - mini目前还不支持视觉功能,如果开发者有视觉推理任务的话,就需要继续使用o1了。
模型发布之后,OpenAI的核心团队也没闲着,开始密集地回答网友们提出的各种问题。
对于DeepSeek这个竞争对手,OpenAI的CEO山姆·奥特曼(Sam Altman)评价说:“这是一个非常好的模型!我们将生产出更好的模型,但领先优势将不会像前几年那么大了。”从他的话里可以看出,在这个竞争激烈的人工智能领域,各个模型之间的差距正在逐渐缩小。
在另一个问答环节中,奥特曼还谈到了开源权重模型和研究成果的问题。他表示:“我个人认为,我们已经站在了历史的错误一边,需要制定不同的开源策略。不过OpenAI并非所有人都认同这一观点,这也不是我们当前最首要的事项。”这反映出OpenAI内部在开源策略上存在一定的分歧。
当被问到递归自我改进是一个渐进的过程还是一个艰难的起飞过程时,奥特曼认为快速起飞比几年前想的更有可能,这也显示出他对人工智能技术发展速度的一种新的看法。
值得注意的是,这次新发布的o3 - mini在回答提问的时候还展示了思考逻辑。对于思维链展示,有网友询问后续是否能看到模型思考的所有token,奥特曼表示很快就会展示一个更有用、更详细的版本,并且还感谢了R1提供的最新信息。
有网友提出o3 - mini价格与DeepSeek和Gemini相比仍然没有竞争力,OpenAI API研究主管米歇尔·波克拉斯(Michelle Pokrass)回应说:“o3 - mini与美国托管的DeepSeek版本相比具有竞争力。我们认为对于这种级别的智能来说,这是一个真正实惠的选择。”
此外,奥特曼还透露将会在推理模型中增加文件附件功能,同时,随着时间的推移,会考虑减少Plus会员价格的提高。这对于用户来说,无疑是两个好消息。
根据之前发布会上的说法,o3将会在mini正式发布后上线。但是关于满血版o3究竟什么时候上线呢?奥特曼依旧没有给出一个确切的时间,只是说“我猜会是几周以上,几个月以下”。这也让大家对o3的上线充满了期待。
在此之前,据外媒报道,OpenAI正以3000亿美元的估值寻求新一轮400亿美元的融资。本轮融资由软银领投,软银计划最多向OpenAI投资250亿美元。这一融资规模要是达成的话,可就要打破OpenAI上一轮创下的硅谷单轮融资纪录了,而且公司的估值相较于上一轮的1500亿美元可是足足翻了一倍呢。
当地时间2月1日,奥特曼还在o3 - mini正式发布的消息下面跟帖表示:“很多人更喜欢这个而不是o1,而且它只是mini版本的模型。”这也从侧面反映出o3 - mini受到了不少用户的欢迎。
OpenAI发布o3 - mini推理模型,在用户使用权限、功能、性能等多方面有新特点,与o1 - mini对比有诸多优势。同时,OpenAI核心团队解答网友问题涉及与竞争对手关系、开源策略等。公司有融资计划,且o3 - mini受到一定欢迎,o3上线时间仍不确定。
原创文章,作者:购物狂魔,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/7717.html