谷歌 DeepMind 与 MIT 联合开发 AI 代理 CoDaS:可自主进行科学研究,写论文只需 8 小时

robot
摘要生成中

AI 不只会聊天,现在还会自己做研究写论文!由 Google DeepMind 与 MIT 联合开发的 AI 科学家「CoDaS」近期震撼学术界。它能自主分析上千人的智慧穿戴数据,不仅自动揪出「深夜末日滑手机(doomscrolling)」是抑郁症的潜在指标,更能自行验证、撰写科学论文。原本需要专家耗时一个多月的研究,CoDaS 只要 6 到 8 小时就能搞定。
(前情提要:何一演讲:靠AI提升10倍效能,我们要服务全球30亿用户)
(背景补充:一个没人看的开源AI工具,12天前就预警了Kelp DAO的2.92亿美元漏洞)

本文目录

切换

  • 没有人类指导,AI 自己发现「深夜滑手机」引发忧郁
  • 内建「对抗式验证」,自动打假防翻车
  • 37 天工作量缩减至 8 小时,论文盲测获专家认可

随着人工智能技术突飞猛进,AI 的角色正从单纯的「辅助工具」进化为能独立作业的「科学研究员」。

近期,由 Google Research、Google DeepMind 与麻省理工学院(MIT)联合发表的一项重磅研究,展示了一个名为 CoDaS(AI Co-Data-Scientist) 的多代理 AI 系统,它成功实现了完全自主的科学发现流程。知名科技社区意见领袖 Wes Roth 与 Samuel Schmidgall 也在 X 平台上大力转发这项极具突破性的学术成果。

来自 Google Research、Google DeepMind 和 MIT 的联合团队介绍了 CoDaS,这是一个多代理 AI 系统,旨在自主运行整个生物标志物发现生命周期,从分析原始穿戴传感器数据、生成假设,到进行统计分析和… https://t.co/KLgxFT4OSq pic.twitter.com/4ursWqeo7l

— Wes Roth (@WesRoth) 2026年4月20日

没有人类指导,AI 自己发现「深夜滑手机」引发忧郁

CoDaS 是一个专门用来从「可穿戴装置(wearable sensors)」原始数据中,自主发现健康生物标记物(biomarkers)的系统。它的运作流程涵盖了:假设生成、统计分析、对抗式验证到文献基础推理,最终还能产出完整的科学论文草稿。

在测试中,研究团队喂给 CoDaS 涵盖近万名参与者的大型穿戴数据集(包含睡眠、活动、心率、手机使用习惯等)。在完全没有人类提示的情况下,AI 发现了多个有意义的健康特征,其中最引人注目的是一项心理健康指标:

AI 发现,夜间过度浏览社群或负面新闻的行为,与抑郁症严重程度呈现显著正相关(相关系数 ρ = 0.177,p < 0.001,样本数 n = 7,497)。

令人拍案叫绝的是,AI 甚至自主为这个行为命名为「late-night doomscrolling(深夜末日滑手机)」。除了心理健康,它也成功找出了每日步数与静息心率之比值,与代谢疾病(胰岛素阻抗)之间的负相关性。

内建「对抗式验证」,自动打假防翻车

为了避免 AI 产生常见的「科学幻觉」或做出无意义的统计推论,CoDaS 内建了强大的对抗式验证机制(Adversarial Validation)

举例来说,在寻找代谢健康特征时,系统曾提出用「葡萄糖的平方」来预测胰岛素阻抗。虽然这个公式在统计上看起来相关性极高,但 CoDaS 的验证机制立刻侦测出这是毫无科学意义的「循环论证(tautology)」,并果断拒绝了这个特征。这项机制大幅提升了 AI 输出的科学可靠度与临床潜力。

37 天工作量缩减至 8 小时,论文盲测获专家认可

CoDaS 的工作效率与产出质量彻底颠覆了传统的研究模式。根据论文数据,一项原本需要人类专家耗费 37 个工作日(person-days) 的庞大数据分析与写作任务,CoDaS 只需 6 到 8 小时 就能完成。

更具说服力的是,在领域专家的盲测评审中:

  • CoDaS 生成的论文获得了高达 86% 的「非拒绝率」(即接受、小修或大修)。
  • 相比之下,其他基准 AI 科学代理的论文拒绝率则高达 85% 至 100%。

这项研究证明了多代理 AI 系统如何将被动的消费级穿戴数据,高效转化为具备临床价值的洞见。作为「代理式 AI(Agentic AI)」在数字健康领域的代表性进展,CoDaS 预示着一个由人类与 AI 共同主导科学发现的全新时代,或许已经到来。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论