上海的人工智能企业阶跃星辰与吉利汽车集团的新动作,即在2月18日宣布将两款多模态大模型向全球开发者开源,这两款模型分别是目前全球参数量最大、性能最好的开源视频生成模型阶跃Step - Video - T2V以及行业内首款产品级开源语音交互大模型阶跃Step - Audio,并且介绍了此次开源行动的意义,还对阶跃Step - Video - T2V模型的参数量和生成效果进行了阐述,最后引用了阶跃星辰创始人的话表达开源的初心。
上海的人工智能领域又掀起了新的波澜。
在2月18日这一天,澎湃新闻(www.thepaper.cn)的记者从上海市经信委那里得到消息,有一个重大的新闻事件发生。AI初创公司阶跃星辰,这家在2023年成立的企业,而且还是吉利汽车集团的科技生态战略合作伙伴,与吉利汽车集团携手做出了一个重大决定。它们共同宣布,要把双方合作开发的两款Step系列多模态大模型向全球的开发者开源。这两款模型可不得了,其中一个是阶跃Step - Video - T2V,这个模型在全球范围内来说,它的参数量是最大的,性能也是非常出色的,是一款开源的视频生成模型;还有一个是阶跃Step - Audio,这可是行业内首款产品级的开源语音交互大模型呢。从即日起,开发者们就可以在跃问App内去体验这两款强大的模型了。
这次阶跃星辰和吉利汽车集团联合进行开源的行动,可不是随随便便就做的,这背后有着深远的意义。这一行动的目的是为了促进大模型技术能够在全球范围内进行共享,并且鼓励更多的创新。这就像是在大模型技术的海洋里投入了一颗石子,激起层层创新的涟漪,推动着人工智能朝着普惠发展的方向大步前进。这个举动可不简单,在DeepSeek、Minimax之后,它成为了在大模型开源世界里又一股来自中国的强大力量。
经过了解,我们知道这是阶跃星辰第一次把它的Step系列基座模型进行开源。根据这个企业发布的技术报告来看,阶跃Step - Video - T2V模型真的很强大。它的参数量居然达到了300亿之多,这是一个非常惊人的数字。而且这个模型能够直接生成204帧的视频,视频的分辨率可以达到540P呢。从这个模型的生成效果来看,它在很多方面都具备很强的能力。比如说在处理复杂运动场景的时候,它能够生成很自然的效果;在刻画美感人物方面,它可以让人物看起来非常生动;在视觉想象力方面,它能够给人意想不到的惊喜;在基础文字生成方面,它的准确性很高;在原生中英双语输入方面,它也能够很好地兼容;在镜头语言方面,它也有着独特的表现。这些强大的功能,能够高效地帮助那些视频创作者们,让他们能够更精准地呈现自己的创意。
阶跃星辰的创始人兼CEO姜大昕也表达了他对于开源的看法。他说:“我们开源的初心,一方面是我们想要把我们最新的技术成果分享给大家,让整个开源社区都能受益,也算是为开源社区贡献我们的一份力量;另一方面呢,我们深信多模态模型是通往AGI(通用人工智能)的必经之路,但是目前这个领域还处于早期的发展阶段,我们非常期待和社区里的开发者们一起集思广益,共同去拓展这个模型的技术边界,并且推动这个技术在产业方面的落地。”
本文总结了上海人工智能企业阶跃星辰与吉利汽车集团联合开源多模态大模型的事件,包括开源的模型种类、此次开源的意义、阶跃Step - Video - T2V模型的参数量和生成效果,以及阶跃星辰创始人的开源初心。这一事件是中国在大模型开源世界里的又一重要力量,对推动人工智能普惠发展有着积极意义。
原创文章,作者:Sorrowful,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/19347.html