国内权威医疗大模型评测平台MedBench更新榜单,蚂蚁医疗大模型再度夺得双料冠军,介绍了其测评表现、技术能力、安全性保障以及在医疗AI领域的应用进展等情况。
近日,记者留意到,国内颇具权威性的医疗大模型评测平台MedBench在其官网对榜单进行了更新。此次更新吸引了众多目光,多个医疗AI产品以及研究团队成功入榜。其中,由蚂蚁AI健康管家团队精心研发的蚂蚁医疗大模型表现格外亮眼,以评测榜单97.5、自测榜单98.2的优异高分,再度荣膺双料冠军。
(MedBench评测榜单截图)
(MedBench自测榜单截图)
根据MedBench的测评结果可知,蚂蚁医疗大模型在医学知识问答、医学语言生成、复杂医学推理这三类单项中均位居榜首。同时,在医学语言理解以及医疗安全和伦理等维度也有着十分突出的表现。值得一提的是,在之前的榜单综合测评中,蚂蚁医疗大模型就长期稳居综合榜第一名。
我们都知道,医疗行业是一个复杂度极高的领域,在这样的领域中,医疗大模型实时评估体系对于应用的稳定落地起着尤为关键的作用。MedBench为中文医疗大语言模型提供了一个公平、透明且科学的评估标准。而蚂蚁医疗大模型能够登顶榜单,这充分意味着其当前的技术能力在转化为医疗AI产品时,具备高度的专业度和领先性。
据相关了解,蚂蚁医疗健康团队近期成功完成了基于强化学习的新一代医疗推理模型研发。在AI引擎升级之后,这个垂直行业大模型可不简单,它不仅具备“医学思维”推理能力,还能够完成“图、文、音视频等”多模态交互。基于这样强大的功能,蚂蚁医疗大模型添加了百亿级中英文图文、千亿级医疗文本语料以及千万级高质量医疗知识图谱进行专业知识训练。并且,经过了医患诊疗、药厂等真实场景问答的多任务微调,还有数百个专业医学团队、医生标注数据的强化学习。就以医学报告、药品、毛发等图像识别为例,目前该模型的准确率已经达到了90%以上。
在安全性方面,蚂蚁医疗大模型充分集合了蚂蚁集团在隐私安全风控方面的技术优势,并且在数据使用的去标识化方面严格遵循安全隐私标准。自去年7月推出以来,它还面向行业开放了配套的“可信一体机 可信云”解决方案,以此来保障数据隐私与算力效率,为医院、医疗机构提供可靠的本地部署与数据保护支持。
据悉,蚂蚁医疗健康成立至今已经有10年的时间了。从2023年开始,它正式进军医疗AI领域。除了大力投入垂直领域大模型技术研发之外,在AI应用层面同样取得了快速的进展。
公开资料显示,蚂蚁医疗健康与浙江卫健委联合推出了全国首个省级官方AI健康应用“安诊儿”,这款应用已经累计服务了近3000万人次,覆盖了浙江省内1000余家医疗机构。去年7月,蚂蚁医疗健康与国内头部三家医院、权威医疗机构成立了AI医疗创新应用“联盟”。自成立以来,蚂蚁医疗健康已经与各地卫健委、医保局、医院、医生合作研发了近百个医生智能体。在完成对好大夫在线的收购之后,双方在AI辅助医生工作方面展开了积极探索,推出了“AI科普助手”等系列产品。截至目前,蚂蚁医疗大模型已经成为业内应用场景最丰富、与医疗机构、医生、医院共建最深的垂类大模型之一。
本文介绍了蚂蚁医疗大模型在MedBench评测中再度夺冠,其在多项测评中表现优异,技术能力领先。同时阐述了该模型在技术研发、安全性保障方面的优势,以及蚂蚁医疗健康在医疗AI应用层面的诸多成果,展现了蚂蚁医疗大模型在医疗AI领域的强大实力和广泛影响力。
原创文章,作者:东海凝丝,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/34380.html