AI 科學家組團搞科研，爆肝萬字報告震驚醫學家，Nature 獨刊揭秘細節

新智元·2025 年 07 月 03 日 15：50

AI 科學家重塑科研範式，人類合作現爭議

【導讀】谷歌、斯坦福等陸續推出「AI 科學家」，協助人類科學家推動科研範式革新。科學家親身試用後或震驚其洞察之深，或質疑其缺乏靈感與人性溫度，AI 能代替人類思考嗎？

斯坦福大學的病理學家 Thomas Montine 在 4 月的某個周日早晨，按照「慣例」舉辦了一次會議。

他先是給幾位「神經科學家」、一位「神經藥理學家」和一位「藥物化學家」分配了任務——研究阿爾茲海默病的潛在治療方法。

幾分鐘后，他就得到了一份一萬多字的研究報告。

在這場會議中，沒有人打斷、沒有人跑題，更沒有人玩手機，「它們」是如何交流的？

歡迎來到 AI 主導下的科學家日常——「虛擬 AI 科學家」，一種前所未有的，重構科研的基本單元。

借助 LLM，「AI 科學家」正在重塑科研過程。

從谷歌、斯坦福到上海人工智慧實驗室，科學家們正在測試由虛擬科學家組成的 AI 小組。

這些由「聊天機器人」組成的科研團隊正在協助科學家們進行頭腦風暴、實驗設計、文獻整合乃至提出研究假設。

這種新型人和 AI「共研」方式是否能成為未來科研範式的雛形？

斯坦福大學計算生物學家的團隊於 2024 年 11 月宣佈了 Virtual Lab 系統，Montine 使用的正是該系統的某個版本。

論文位址：https://www.biorxiv.org/content/10.1101/2024.11.11.623004v1.full.pdf

無獨有偶，上海人工智慧實驗室的一個研究小組在 2024 年 10 月也推出了一種類似的虛擬科學家系統，VirSci。

開源位址：https://github.com/open-sciencelab/Virtual-Scientists?tab=readme-ov-file

論文位址：https://arxiv.org/pdf/2505.12039

探索這一概念最突出的是谷歌的研究人員。

今年 2 月，谷歌推出一款基於 Gemini 2.0 構建的多智慧體 AI 系統，作為「虛擬科學合作者」。

這些「虛擬科學家」説明真正的科學家生成新穎的假設和研究方案，從而加快科學和生物醫學發現的進程。

論文位址：https://arxiv.org/pdf/2502.18864

在以上這類系統中，AI 科學家們不僅僅能交流「想法」，它們還能聯網、寫代碼。

多個「AI 科學家」可以組合成一個更大的系統，能夠專注於屬於各自的問題而不被分散注意力。

伊利諾伊州芝加哥大學和阿貢國家實驗室的計算機科學家 Rick Stevens 說：

從某種意義上說，這在本質上與擁有更多同事並沒有太大不同。

只不過它們不會疲倦，而且接受了全方位的訓練。

最近，「Nature」在一篇文章，深入探討了科學家對於這些「AI 科學家」的最真實感受。

一個完全由 AI 聊天機器人組成的「科研團隊」，開會的時候是什麼風格？滿屋子的諾獎得主？還是一群本科生？

這些「AI 科學家」只是簡單的聊天機器人，背後還是具有更複雜的技術？

三家「AI 協同科學家」系統有何區別？

斯坦福大學的這個系統，是 James Zou 團隊利用 GPT-4o 打造的。

它裡面預設有兩個 AI 在幹活：一個當「首席調查研究員」，負責帶頭想點子; 另一個當「評論家」，專門提一些有用的改進建議。

開源位址：https://github.com/zou-group/virtual-lab

谷歌這套系統則是 DeepMind 的 Alan Karthikesalingam 和 Vivek Natarajan 等用 Gemini 2.0 創建的。

與斯坦福的系統相比，它比較學術派，專門搞生物醫學領域研究。

系統架構如下：

AI 協同科學家系統

在劈柴看來，它是一個能利用先進的推理能力來綜合大量文獻，為科學家在「生成新穎假設」和提出詳細的「研究策略」方面，加速科研突破的——「科學家的虛擬助手」。

谷歌與斯坦福的系統區別在於，前者不允許使用者為智慧體分配科學專長。

簡單說，谷歌這個 AI 系統能幹好幾件事;

出點子、分析和挑毛病、把舊點子變出新花樣、檢查想法是不是太像了、給所有點子排個名，最後還能自己反思一下整個工作幹得好不好。

上海人工智慧實驗室的 VirSci 系統由 Nanqing Dong 等人提出。

它類似於一個召集人，專門協同「集團軍」搞事情。

據團隊介紹，VIRSCI 包括五個關鍵步驟：合作者選擇、選題討論、點子生成、新穎性評估和摘要生成。

可以看到，這些系統中的 LLM 不僅會互相交流想法，還會搜索互聯網、執行代碼並與其它軟體工具交互，這使它們成為「自主 AI」的一部分。

那它與人類科學家有何區別呢？

阿貢國家實驗室的計算機科學家 Rick Stevens 直言，在某種意義上，這跟擁有更多同事本質上沒啥區別。

他們能24小時不知疲倦的工作，還接受過全面的訓練。

人類科學家 VS「AI 科學家」

當人類科學家真正開始與這些「虛擬同事」共事，會發生什麼？

AI 科學家所提出的思路，是富有啟發、令人驚豔，還是僅僅邏輯自洽但缺乏實際價值？

它們的存在，是靈感放大的助推器，還是變成了另一種形式的資訊噪音？

Gary Peltz：我差點從椅子上掉下來

斯坦福大學的醫學研究員 Gary Peltz 經常使用人工智慧，他是谷歌人工智慧合作科學家專案的首批體驗者。

他希望利用該系統尋找治療肝纖維化的藥物。

當時谷歌這個系統還沒有開發完成，他把自己的要求發給了谷歌一名工作人員。

大約一天后，他就收到了谷歌人工智慧合作科學家系統的輸出，以下為部分摘錄。

「當我讀到它時，我差點從椅子上跌了下來」，Peltz 說。

Peltz 剛剛寫了一份提案，重點闡述表觀遺傳變化在肝纖維化中的重要性，而這個「AI 聯合科學家」針對其建議的治療方案竟然也瞄準了相同的主題。

AI 聯合科學家提出了三種藥物，而佩爾茨又提出了另外兩種（所有這些藥物已經獲批用於治療其他疾病）。

為了加速系統研發和測試，谷歌聘請了 Peltz。

在接下來的幾個月里，佩爾茨的實驗室在其人類類器官模型中測試了這五種藥物。

AI 提出的三種建議中有兩種顯示出促進肝臟再生和抑制纖維化的潛力，而佩爾茨提出的兩種均未奏效。

Peltz 說，這次經歷讓他印象深刻：「這些大語言模型（LLM）對於早期人類社會而言，就如同火一般重要」。

當然，並不是所有人都認同，其他肝臟研究人員表示，該人工智慧提出的藥物建議既不特別創新，也不夠深入。

西奈山伊坎醫學院的研究員認為「這些建議相當符合常識，並沒有太多深刻的見解」。

但 Peltz 表示，「尤其令他感到震驚的是，AI 並沒有把我所重視的事情放在優先位置」。

閱讀人工智慧報告的感覺與他同博士後交流的情形類似。

「AI 看待問題的方式和我完全不同。」

Francisco Barriga：AI 想的和我一樣

Francisco Barriga 來自巴塞羅那瓦爾德希布倫腫瘤研究所的癌症基因組。

Francisco Barriga 是一名生物化學家，職業是一名小鼠模型專家和基因組工程師，完全不會變成，也幾乎沒有 AI 方面的經驗。

他抱著猶豫的心態參與了這次試驗，懷疑自己會充當一個技術不精通的對照組角色。

Barriga 讓 AI 設計小鼠模型實驗，以測試特定生物化合物在使用最少數量小鼠的情況下對腫瘤或免疫細胞的影響能力。

這是一個他非常熟悉的主題。

Barriga 表示，「AI 科學家」團隊提出的方案與他會做的完全一致：

AI 科學家團隊選擇了「正確的模型、正確的實驗」。

不過，Barriga 表示他總覺得這個過程缺少了一些關鍵的東西。

「這個過程絕對沒有人類參與」。

這些 AI 智慧體輪流「發言」，常常使用編號清單，並且從不會無禮、打斷他人或爭論不休。

「它缺少了那種直覺的飛躍，比如你在下午三點偶然在走廊喝咖啡時，與某個植物生物學家隨意交談中所能獲得的那種靈感。」

當然，Barriga 可以在自己的虛擬團隊中加入一位植物生物學家——或者是一位量子物理學家，或任何其他人，但他尚未嘗試這樣做。

「也許它可以用來碰撞想法。但它會改變常的工作方式嗎？我對此表示懷疑，」Barriga 補充說。

這個系統或許可以成為他的博士生在遇到困難時的一種參考：

如果他們遇到了問題而我又太忙無法顧及時，也許我可以被替代。

Peltz 和 Barriga 代表了真正的人類科學家對於「AI 科學家」的兩種態度——驚訝和遲疑。

就像 Barriga 調侃的那樣，也許 AI 科學家頂多能代替我，給我的博士生出點建議。

另外一位來自馬薩諸塞州波士頓兒童醫院研究罕見疾病的 Catherine Brownstein 或許更懂得如何和這些「AI 科學家」相處。

大語言模型（LLM）可以提升速度、效率並拓寬思維方式。

但她提醒道，使用者通常必須具備專業知識，以便能夠發現錯誤。

你必須大致瞭解自己所談論的內容，否則很容易被完全誤導。

雖然 Brownstein 的態度似乎處於「中庸」的狀態，但她非常感激這些「虛擬科學家」。

當 Brownstein 使用 AI 對她正在撰寫的一篇論文進行審閱時，AI 建議她去詢問患者。

患者認為研究的下一步應該朝哪個方向發展。

這一建議令她既驚訝又感激。 AI 似乎比人更具有人情味，亦或者 AI 考慮的更全面。

她說，自己本應想到這一點，但事實上卻沒有。

我當時感到很尷尬，我停下來看著螢幕整整一分鐘，心想：

天哪，我怎麼會偏離了最初專注於以患者為中心的研究熱情如此之遠？

這類體驗，似乎描繪出一種新型合作的雛形：AI 不是要取代科學家，而是成為一個時刻在線、始終專注、不帶偏見的思維合作者。

或許，科學的未來並非一直由 AI 主導的，而是一個充滿了人類「不完美」的爭論、直覺與 AI「完美」的計算、分析相互碰撞。

最終的偉大發現，可能就誕生於 AI 助手與人類科學家有序與無序的交響之中。

參考資料：

https://www.nature.com/articles/d41586-025-02028-5

https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

https://x.com/sundarpichai/status/1892254274895184244

本文來自微信公眾號 “新智元”，編輯：YHluck 定慧，36 氪經授權發佈。

該文觀點僅代表作者本人，36氪平臺僅提供資訊存儲空間服務。

AI 科學家組團搞科研，爆肝萬字報告震驚醫學家，Nature 獨刊揭秘細節

三家「AI 協同科學家」系統有何區別？

人類科學家 VS「AI 科學家」

Gary Peltz：我差點從椅子上掉下來

Francisco Barriga：AI 想的和我一樣

最近內容

企服圈子

企服軟體推薦

下一篇