DeepSeek网页/API不可用:新模型爆火后的“甜蜜烦恼”,DeepSeek爆火后遇“宕机”,雷军欲挖角的“天才少女”何许人也?

国内AI初创公司DeepSeek的相关情况,包括其网页/API不可用的消息,新模型发布后的用户访问量激增导致服务“宕机”,以及DeepSeek - V2的关键开发者罗福莉被称为“天才少女”且雷军欲以千万元年薪招揽她等多方面内容,还会涉及到DeepSeek在模型性能、成本、应用榜排名以及公司招聘等方面的情况。

红星资本局在1月27日发布消息称,当日国内的AI初创公司DeepSeek的官网显示,其网页/API处于不可用的状态。其实在1月26日的时候,DeepSeek就已经有过短时闪崩的现象发生了。

DeepSeek针对这一情况做出回应,表示此次服务再次“宕机”,是因为新模型发布之后,大量的用户蜂拥而至,访问量急剧增加,从而导致服务器不堪重负。

在2024年底的时候,DeepSeek推出了新一代的大语言模型DeepSeek - V3,并且宣布将其开源。这一模型在AI领域迅速走红,使得DeepSeek - V2的关键开发者之一罗福莉开始被大众所熟知,她被人们赞誉为95后AI“天才少女”。有消息表明,就在DeepSeek - V3发布的前几天,小米创始人雷军就已经开出了高达千万元的年薪,想要把罗福莉招揽到小米,让她来领导小米的AI大模型团队。

从这种情况来看,用户访问量的激增是导致DeepSeek“宕机”的一个重要因素,而雷军对罗福莉的青睐也显示出这位“天才少女”在AI领域的非凡价值。

早在1月20日的时候,DeepSeek发布了新模型DeepSeek - R1,并且同步开源了模型权重,这一举措再次在全球的AI科技圈引起了广泛的关注。

据界面新闻报道,1月26日DeepSeek出现短时闪崩现象。DeepSeek对此回应称,当天下午确实存在局部的服务波动,不过好在仅仅在数分钟之内就把问题解决了。他们分析这次事件的原因,大概率是新模型发布之后,用户访问量突然猛增,服务器一时间无法满足这么多用户的并发需求。

DeepSeek网页/API不可用:新模型爆火后的“甜蜜烦恼”,DeepSeek爆火后遇“宕机”,雷军欲挖角的“天才少女”何许人也?

(图据界面新闻)

其实在此之前,DeepSeek就已经在业内吸引过一波关注目光了。

2024年底发布的DeepSeek - V3这个新一代大语言模型,在同时宣布开源之后,就在多项基准测试当中取得了优异的成绩。它的成绩超越了主流的开源模型,甚至和世界顶尖的闭源模型相比也毫不逊色。

而且由于DeepSeek - V3的训练成本非常低,所以它还被人们亲切地称为“AI界拼多多”。

公开资料显示,DeepSeek是来自杭州深度求索人工智能基础技术研究有限公司(以下简称为“深度求索公司”)。这家公司专注于开发先进的大语言模型以及相关的技术,它是由国内知名的量化资管巨头幻方量化在2023年7月创立的,也正因为如此,它得到了资本市场的广泛关注。

在那个时候,DeepSeek - V2的关键开发者罗福莉就已经火出圈了,被大家称为95后AI“天才少女”。根据公开资料,罗福莉本科是在北京师范大学就读计算机专业,硕士则毕业于北京大学计算语言学专业。

DeepSeek网页/API不可用:新模型爆火后的“甜蜜烦恼”,DeepSeek爆火后遇“宕机”,雷军欲挖角的“天才少女”何许人也?

(图据“罗福莉”微信公众号)

硕士毕业之后,罗福莉先是进入了阿里达摩院从事人工智能方面的研究工作,主要是进行预训练语言模型相关的工作,并且负责阿里达摩院AliceMind开源项目,主导开发了多语言预训练模型VECO。在2022年的时候,罗福莉加入了幻方量化,从事深度学习相关策略建模和算法研究,之后又跳槽到DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek - V2。

DeepSeek爆火之后,它开发的应用登顶了苹果中国和美国应用商店免费APP下载排行榜,成功超越了ChatGPT。

DeepSeek公众号显示,DeepSeek - R1 API服务定价为每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。

据澎湃新闻报道,在国外大模型排名榜Chatbot Arena上,DeepSeek - R1的基准测试排名已经上升到全类别大模型第三,与OpenAI的ChatGPT - 4o最新版并列。不过,DeepSeek - R1的预训练费用为557.6万美元,还不到OpenAI GPT - 4o模型训练成本的十分之一。

红星资本局通过招聘网站发现,深度求索公司的北京子公司正在进行招聘工作,总共放出了52个岗位,这些岗位包括深度学习研究员、核心系统研发工程师以及资深ui设计师等,而且都是14薪。

在这些岗位当中,薪资最高的是核心系统研发工程师(校招),其薪资范围在6万元 - 9万元;除了这个岗位之外,大部分岗位的起薪都在2万元及以上。

值得一提的是,该公司正在招聘实习生,AGI大模型实习生的工资为500元/天 - 1000元/天,数据百晓生实习生为500元/天 - 510元/天。

DeepSeek网页/API不可用:新模型爆火后的“甜蜜烦恼”,DeepSeek爆火后遇“宕机”,雷军欲挖角的“天才少女”何许人也?

(截图自BOSS直聘)

DeepSeek公司的一系列事件。首先是其新模型发布后网页/API不可用的情况,原因是用户访问量激增导致“宕机”。同时介绍了被雷军看重的“天才少女”罗福莉的相关背景以及她在DeepSeek的工作经历。还提到了DeepSeek模型的性能表现、成本优势、在应用商店的排名情况以及公司的招聘信息等多方面内容。这些事件都从不同角度反映了DeepSeek在AI领域的影响力以及发展态势。

原创文章,作者:Daniel Adela,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/3774.html

(0)
Daniel AdelaDaniel Adela
上一篇 2025年1月27日
下一篇 2025年1月27日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注