
新智元报说念
裁剪:LRS
【新智元导读】AI co-scientist系统基于Gemini 2.0赞助,大要协助科研东说念主员生成新的量度假定、制定实验决议,并通过自我纠正耕种限度质地。在生物医学应用中,AI co-scientist收效计算了药物再诈欺倡导、建议新的调理靶点,并解说了抗菌耐药机制。
在科学探索的过程中,量度东说念主员需要对以往发表的文件进行不雅察回来,建议一些新颖、可行的量度倡导,临了通过全面的实验进行idea考证。
科研东说念主员需要对探索的宽度和深度进行均衡,由于元气心灵有限,不行探索过多的量度倡导,同期还要保证对倡导主题的量度深度。
最近,、斯坦福大学等机构的量度东说念主员赞助了一个多智能体、基于Gemini 2.0的AI协同科研(AI co-scientist)系统,具备跨复杂主题的详细能力和进行长久狡计、推理的能力,除了传统的文件综述、回来功能除外,还不错辅助科研东说念主员建议新的、原创学问,或是基于先前的后果制定量度假定(hypotheses)和琢磨(proposal)。

论文衔接:https://storage.googleapis.com/coscientist_paper/ai_coscientist.pdf
AI co-scientist系统的输入为一段用当然言语描述的量度倡导,输出为全新的量度假定、防护的量度概述和实验决议。
根据科研行动自己的特质,赞助者想象了多个专用智能体用来「生成、反念念、排行、进化、左近性检查、元审查(meta review)」,使用自动反馈信号来迭代生成、评估和纠正假定,组成了一个自我修正、纠正的轮回机制,逐步生成质地更高、立异性更好的假定。

系统的中枢念念路等于「协助科研」,是以赞助者想象了多种形势让量度东说念主员与系统进行互动,比如「班师提供种子想法」进行探索或是对生成的限度提供「当然言语反馈」。
系统还用到了外部用具,如收罗搜索和专用AI模子,以增强生成假定的依据和质地。
AI co-scientist将分拨的倡导认知为量度琢磨建立,由监督智能体(supervisor agent)肃穆将专用智能体分拨到责任部队并分拨资源,使得系统大要纯真膨大筹划能力,并迭代地提高其科学推理能力,以竣事指定的量度倡导。

测试时筹划(test-time compute)
AI co-scientist使用「测试时筹划」时期来迭代推理、进化和纠正输出,如进行自我对弈(self-play)科学申辩以生成新假定,对所有假定进行质地排行对比,或是束缚进化假定等,不错让智能体束缚进行自我品评,使用用具进行反馈以细化假定和提案。

论文衔接:https://arxiv.org/abs/2408.03314
系统的自我耕种能力主要依赖于Elo自动评估方针,通过对模子的输出进行对比竞赛,最终不错取得一个Elo值,量度东说念主员分析了Elo自动评级与GPQA中diamond set(有难度的问题集结)准确率的匹配度,限度发现Elo评级与输出质地呈正相干。

AI co-scientist(蓝色线)和Gemini 2.0(红色线)的平均准确率对比,按Elo评级分组
七位范畴巨匠在其专科范畴内尽心挑选了15个盛开量度倡导和最好惩处决议,使用自动化的Elo方针,限度发现AI co-scientist在复杂问题上的发扬优于其他开头进的智能体和推理模子。
跟着系统在推理和纠正上破耗更多时刻,限度的自我评估质地提高,并高出了模子和无助的东说念主类巨匠。
限度也考证了「使用从科学才略中归纳出的先验学问」进行「测试时筹划」膨大的上风:系统在推理和纠正上破耗的时刻越多,限度的自我评估质地越高,最终高出了其他模子和东说念主类巨匠。


AI co-scientist的性能会跟着系统在筹划上破耗时刻更多而逐步提高
在11个量度倡导的小子集上,巨匠们评估了AI co-scientist生成限度相干于其他基线模子在新颖性(novelty)和影响后劲(impact)的总体偏好,固然样本量较小,但巨匠们大量以为AI co-scientist更受宽饶,与之前引入的Elo自动评估方针一致。


信得过场景应用

药物再诈欺调理急性髓系白血病
药物研发是一个耗时且端淑的进程,新的调理才略需要重新开动发现和赞助进程,以调理不同的得当症或疾病。
药物再诈欺(drug repurposing)通过发现现存药物超出其原始预期用途的新调理当用来克服该发愤,但由于任务复杂,需要等闲的跨学科专科学问。
量度东说念主员使用AI co-scientist来辅助计算潜在的药物再诈欺量度倡导,模子建议了针对急性髓系白血病(AML)全新的、可再诈欺的候选药物,随后与合营团队通过筹划生物学、巨匠临床大夫反馈和体外实验考证了模子的计算限度,说明该药物在多个AML细胞系中,在临床相干浓度下大要扼制肿瘤活力。

三种新式AI合科学家计算的 AML 再诈欺药物之一的有用剂量反馈弧线;KIRA6在临床相干浓度下扼制KG-1(AML细胞系)的存活,大要在较低药物浓度下裁减癌细胞存活,减少了脱靶反作用的可能性
鼓励肝纤维化倡导发现
识别新式调理靶点比药物再诈欺更复杂,常常会导致假定遴荐效用低下、体外及体内实验优先级排序不当。东说念主工智能辅助靶点发现存助于简化实验考证过程,裁减赞助时刻老本。
AI co-scientist通过识别基于临床前凭证并具有显贵抗纤维化活性的表不雅遗传学靶点(3D、多细胞组织培养,由东说念主类细胞繁衍并想象来模拟东说念主类肝脏的结构和功能),展现了其在建议、排序和生成针对发现假定的假定和实验决议方面的后劲,相干论述行将与合营者斯坦福大学共同发布。

AI co-scientist建议的调理决议与纤维化指引剂(阴性对照)和扼制剂(阳性对照)的调理效果对比
解说抗菌药物耐药机制
量度东说念主员指令AI co-scientist探索小组内还是进行过新颖发现但尚未公开的课题,解说囊膜酿成噬菌体指引的染色体岛(cf-PICIs)如安在多种细菌物种中存在?
「微生物进化出的抵牾感染调理药物的机制」波及到集中基因更始(接合、转导和调整)的分子机制,以及推动抗菌药物耐药性(AMR)基因传播的生态和进化压力。
AI co-scientist系统独处建议,cf-PICIs 与多种噬菌体尾部相互作用以扩大宿主范围,在之前进行的实验中取得了考证,进一步证明AI co-scientist当作辅助时期的价值,大要诈欺数十年前的量度限度。

AI co-scientist重新发现新式基因更始机制的时刻线。蓝色:cf-PICI发实践验量度进程时刻线。红色:AI co-scientist在莫得先验学问的情况下发展和重现这些重要发现
参考贵寓:
https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/