谷歌发布的AI协作科学家,包括其基于多智能体系统的架构、在实际测试中的成果、多智能体协作进行科研的方式以及在解决超高难度科研问题方面的表现等内容。
谷歌推出的AI协作科学家基于多智能体系统,犹如一个虚拟的科研合作者。它能帮助科学家生成新颖的假设和研究提案,就像一位智慧的伙伴在科研道路上并肩前行。从实际测试来看,AI协作科学家的表现相当惊人。它独立提出了有关细菌基因转移机制(耐药性)的新颖假设,还发现了白血病治疗再利用候选药物,并且识别出肝纤维化治疗的遗传学靶点。这些成果都是前所未有的,足以证明它是自主得出这些见解的。而且它所完成的科研任务被专业人员判定为中等到超高难度。科学家们表示,虽然AI不能进行验证假设的实验,但如果在项目开始就能得到假设,能节省数年的工作。AI协作科学家能够生成并验证研究假设,通过模拟辩论和完善假设,构建知识网络并让假设不断进化,最终生成研究概述供科学家审查。值得一提的是,它并不是要完全取代人类科学家,人类能够全程参与并指导其推理过程,从而满足科研的实际需求。目前,谷歌已经将AI协作科学家测试版免费提供给研究人员,并且还将发布一个API接口,方便网站使用其基础技术。科学发现一直依赖跨学科合作,这种模式催生了许多重大突破。随着大语言模型发展和AI多模态理解能力提升,科学家可利用这些技术跨越学科界限整合知识和数据。像AlphaFold能预测蛋白质结构节省研究时间,但现有的AI系统在科学发现应用中存在局限性,如依赖回顾性数据、缺乏端到端验证或者在生成新假设方面能力不足。而谷歌的AI协作科学家通用性更强,适用于多个研究领域,它能进行文献探索、假设验证,还能通过模拟科学辩论和自我批判完善假设,加速科学发现进程,并且结合专家反馈和实验室验证确保假设新颖且可行。其目标是打造强大的AI协作者,通过自然语言交互和专家反馈机制让科学家全程参与指导推理过程。AI协作科学家系统由多个智能体组成,各司其职。自然语言交互界面让科学家通过自然语言与之交互,定义目标、提供反馈等;异步任务执行框架采用异步任务队列管理智能体工作流程;专用智能体包括生成、反思、排名、进化、相似性、元评审等智能体共同协作生成高质量研究假设和方案;上下文记忆存储和检索智能体状态支持长周期计算和推理;工具使用能调用外部工具增强假设依据和质量;科学家反馈可让科学家参与推理过程;研究概述生成由元评审智能体将排名靠前的假设总结供科学家评估。这个系统的高质量回答得益于测试时计算,关键推理步骤包括基于自博弈的科学辩论、排名锦标赛和质量改进的“进化”过程,系统的Agent性质促进递归自我批评。其自我提升依赖于Elo自动评估指标,在GPQA diamond基准测试上,更高的Elo评级与正确率正相关。在科研问题测试中,AI协作科学家超越了其他智能体和推理模型。扩展测试时计算展现出随着推理和改进时间增加,自动评估结果质量提升并超越其他模型和人类专家。虽然样本量小,但专家认为AI协作科学家在新颖性和影响力方面潜力更高且更信任其输出结果,这与Elo自动评估指标一致。谷歌在生物医学领域对AI协作科学家进行了端到端实验室验证,包括药物再利用、提出新治疗靶点和阐释抗菌素耐药性机制等。在急性髓系白血病的药物再利用方面,AI为其提出新的再利用候选药物且后续实验验证有效;在肝纤维化的靶点发现中,AI协作科学家识别出表观遗传学靶点;在抗菌素耐药性机制阐释方面,它独立提出cf - PICIs通过与多种噬菌体尾部相互作用扩大宿主范围的假设且已被之前实验验证。这展示了它作为辅助技术能利用文献做出新判断的价值。最后,谷歌研究团队表示未来会增强AI协作科学家在文献综述、事实核查、连贯性检查方面的能力,让更多领域专家参与改进以提升可用性和可信度,并且探索强化学习、多模态数据整合、实验室自动化集成等方向进一步提升系统能力,加速科学发现。
本文总结了谷歌AI协作科学家的相关情况,包括其功能、优势、多智能体协作方式、在科研测试中的表现以及在生物医学领域的验证成果等,还提及了谷歌对其未来的改进计划。
原创文章,作者:Sorrowful,如若转载,请注明出处:https://www.gouwuzhinan.com/archives/20795.html