80电影天堂网,少妇高潮一区二区三区99,jαpαnesehd熟女熟妇伦,无码人妻精品一区二区蜜桃网站

搜索:  
復旦大學李劍鋒團隊:首個理論模擬科研全流程自動化AI智能體
2025-01-25  來源:高分子科技

圖1. 自動模擬智能體ASA(autonomous simulation agent)通過LLM提示工程設計,實現了從實驗設計到報告生成的全模擬科研流程自動化。通過使用命令 do prj1.txt 提交研究計劃文件,ASA 將自動執(zhí)行所有任務,無需任何人工干預。


  在科學研究中,理論模擬是一個至關重要的環(huán)節(jié),尤其是在材料科學、化學和物理等領域。傳統(tǒng)的模擬研究流程通常包括編寫模擬程序、上傳到遠程服務器執(zhí)行、數據分析和報告生成等步驟。這些步驟在確定研究計劃后往往是標準化的,但通常需要研究人員手動操作,耗時且繁瑣。隨著人工智能(AI)技術的快速發(fā)展,特別是大型語言模型(LLMs,如ChatGPT)的崛起,利用AI實現科學研究自動化、簡化工作流程并提高科研效率的設想逐漸成為可能。然而,如何實現從實驗設計到報告生成的全流程自動化,仍然是一個亟待解決的重大挑戰(zhàn)。


  針對這一挑戰(zhàn),復旦大學李劍鋒課題組首次提出了一種基于LLM提示詞工程設計的自動模擬助手(ASA),能夠根據研究計劃(RP)自動完成從編寫程序、遠程執(zhí)行到數據分析和報告撰寫的全流程模擬研究。這一工作標志著理論模擬科研全流程自動化的首次實現,為未來的科學研究自動化提供了新的思路。ASA的核心亮點在于,它能根據簡短的描述自動設計詳細的RP并執(zhí)行。例如,研究人員要求ASA選擇兩種機器學習方法預測材料性能,ASA自動建立了神經網絡和隨機森林模型并進行了訓練,驗證集R-squared值分別達到0.9589和0.9236,且生成了高質量報告比較兩種方法的特點。此外,ASA-GPT-4o和ASA-Claude-3.5展現了出乎意料的智能表現,如主動整理文件、分析理論與模擬偏差、用豐富圖表呈現數據等,展示了ASA的自主性。


  未來,科研自動化是重要方向,ASA的成功應用展示了AI在這一領域的巨大潛力該研究以“Toward Automated Simulation Research Workflow through LLM Prompt Engineering Design”為題發(fā)表于《Journal of Chemical Information and Modeling》。本文的第一作者為復旦大學高分子科學系2021級博士研究生劉之菡,通訊作者為復旦大學高分子科學系李劍鋒教授。該研究得到國家自然科學基金等項目的支持。


1. 全流程自動化的實現


  大語言模型(LLMs)能夠根據提示生成多樣內容,但無法保證代碼完全正確,且可能忽略復雜任務中的子任務。此外,LLMs無法直接控制本地計算機執(zhí)行程序。為解決這些問題,本文開發(fā)了一個自動化系統(tǒng),能夠在本地運行LLM生成的代碼,并通過提示工程和多輪交互指導LLM調試錯誤、檢查任務完整性。最終構建了一個端到端的自動模擬助手(ASA)。ASA可以通過一行命令如“do prj.txt”啟動,自動讀取任務,分解任務,并執(zhí)行,甚至能將程序上傳至遠程服務器進行模擬,這是基于網頁的LLM無法實現的。


圖2. (A) AI自動化流程示意圖。研究人員提供研究計劃(RP)給自動模擬助手ASA。ASA生成模擬程序,上傳至遠程服務器,執(zhí)行模擬計算并收集數據,最終撰寫報告。(B) ASA與LLM對話流程圖。研究人員僅在開始時輸入RP,隨后ASA根據RP和與LLM的對話歷史采取行動,實現全流程自動化。


2. 不同LLM驅動的ASA在標準問題上的可靠度測試


  為評估ASA在自動化研究中的可行性和可靠性,本文基于已知結果的高分子物理問題,設計了3個標準測試問題。研究人員向ASA提供詳細RP,要求其執(zhí)行編寫程序、遠程模擬、整理數據、繪圖及撰寫報告等任務。


圖3. 高分子物理標準問題。本文設計了三個聚合物鏈模擬RP,包含模擬、繪圖和報告撰寫等步驟。RP 1和RP 3要求ASA生成Python程序并在本地運行模擬;RP 2要求ASA修改程序并在遠程服務器運行模擬。圖中省略了模擬程序和服務器信息。


  研究人員制定了多項評估標準(如模擬、作圖、標度關系等),以測試ASA在無人干預下能否正確執(zhí)行任務,并比較了不同LLM(如GPT-4o、GPT-4-Turbo、Claude-3.5等)驅動的ASA表現。其中,ASA-GPT-4o、ASA-GPT-4-Turbo、ASA-Claude-3.5和ASA-Gemini-1.5-Pro表現較好。ASA-GPT-4o和ASA-Claude-3.5在生成詳細報告(超1000字)和精確引用文獻方面表現突出。此外,它們展現了出乎意料的智能行為,比如它們會在RP沒有要求的情況下,自動將生成的同類型文件歸到一個文件夾中ASA-Claude-3.5會在報告中主動引用經過理論推導和實驗驗證的準確自回避行走標度關系,并附帶模擬結果偏差的簡要分析;此外,ASA-GPT-4o 會以更豐富的圖表呈現實驗數據,例如端到端距離的頻率分布圖和基于網頁的交互式圖表。這些結果展示了ASA在處理復雜任務時的自主性。這些結果展示了ASA處理復雜任務的自主性。


圖4. 搭載不同LLM的ASA對RP 1-3的完成度統(tǒng)計。(A) 測試的LLM模型表。(B) 各ASA在20次實驗中滿足評估標準的次數統(tǒng)計。每個RP設定了七個標準,統(tǒng)計了達標次數(部分零結果未顯示)。(C) 使用EWM和TOPSIS方法計算各ASA在RP 1-3中的相對得分。(D) ASA-GPT-4o為RP 1生成的Word報告示例,包括四個章節(jié)、鏈構象圖和標度關系擬合圖。


  本文通過天體引力模擬問題進一步測試了ASA處理復雜任務的能力。該任務要求ASA模擬太陽系天體運行并評估隕石對地球的威脅,即使對物理系畢業(yè)生也具有挑戰(zhàn)性。ASA自動獲取太陽系參數,編寫程序計算小行星軌跡,并生成了報告。這一結果證明了LLM提示工程和自動化程序設計策略的有效性,展示了ASA跨領域解決問題的能力。


圖5. 引力模擬標準問題。(A) RP S1要求模擬引力公式修改后的行星軌跡,RP S2要求模擬太陽系行星及小行星軌跡,并評估小行星撞擊地球的風險。(B1) ASA-GPT-4o生成的RP S1軌跡圖。(B2) 模擬地球軌道與實際軌道對比,兩者完全重合,證明ASA編寫的引力模擬程序正確。(C) ASA-GPT-4o生成的RP S2中地球、火星和小行星的軌跡投影圖(左)及地球與小行星距離曲線(右)。


  本文還探索了通過多AI協(xié)作和多層RP設計提升復雜任務執(zhí)行質量的方法。例如,引入管理者AI和執(zhí)行者AI協(xié)作模式,管理者AI分解任務,執(zhí)行者AI完成子任務,以平衡全局與局部注意力。此外,通過雙層RP嵌套,主AI生成20個次級AI重復執(zhí)行任務,最終主AI收集文件并分析完成度,執(zhí)行長流程任務。實驗中,ASA-GPT-4-Turbo獨立編寫了66個程序(含26個錯誤版本),進行了20多次模擬,生成120張圖像,并撰寫了超5000字的20份報告,全程無需人工干預。這展示了多層RP結構處理大規(guī)模任務的能力。


圖6. (A) 管理者AI的回復示例。管理者AI將RP分解為子任務,生成以“<<< prompt”開頭、“end >>>”結尾的子RP,并傳遞給執(zhí)行者AI執(zhí)行。(B) 錯誤和不完整的子RP示例。黑框標出缺少必要信息(如服務器用戶名和密碼),紅框標出無關信息。(C) RP 4內容。命令“python AI4SCI_VE13.py -s p1.txt -n i”生成次級AI執(zhí)行RP 1任務,其中AI4SCI_VE13.py是ASA自動程序,p1.txt為RP 1文本文件,i表示第i次執(zhí)行。


  此外,本文還探討了ASA處理長任務時的共性問題和局限性:(1)遺漏任務要求。ASA可能會忽略部分任務要求,需提高關鍵信息優(yōu)先級;(2)缺乏專業(yè)領域知識。通用LLM缺乏專業(yè)知識,需在RP中補充信息;(3)錯誤循環(huán)。LLM可能依賴先前內容持續(xù)犯錯,需內存管理策略;(4)全局與局部平衡。確保ASA兼顧全局概覽和細節(jié)專注是挑戰(zhàn);(5)信息傳遞準確性。確保信息正確理解和使用仍存在問題。這些局限性為改進LLM驅動的AI科學研究提供了重要參考。


圖7. 提高自動化模擬研究流程可靠度的策略。通過與LLM迭代對話并遵循特定設計邏輯,自動化流程的成功率和效率顯著提高。左右兩圖分別展示了未實施和實施策略的場景對比。


3. 自主設計研究計劃


  在上述工作基礎上,本文開發(fā)了Brief-RP ASA,增強了AI的自主性和靈活性。Brief-RP ASA能根據一兩句話的問題描述自動生成詳細AI RP。例如,研究人員要求Brief-RP ASA用兩種機器學習方法預測聚合物粘度,Brief-RP ASA自動設計了AI RP,將數據集按8:2劃分,通過神經網絡和隨機森林進行訓練和預測,R-squared值分別達到0.9589和0.9236。此外,它還分析了隨機森林的特征重要性,并強調了其可解釋性優(yōu)勢,展示了其在自動化科研中的強大潛力。


圖8. 簡短任務描述以及Brief-RP ASA設計的AI RP,用于設計預測聚合物粘度的機器學習訓練和驗證流程。


圖9. Brief-RP ASA根據AI RP設計的流程自動執(zhí)行得到的結果報告。報告包含豐富和文字和圖表信息,提到使用神經網絡和隨機森林兩種方法進行了訓練和預測,準確率R-squared值分別達到0.9589和0.9236。此外報告中還對隨機森林模型進行了特征重要性分析,并強調了其在可解釋性方面的優(yōu)勢。


  除上述例子外,Brief-RP ASA還可廣泛應用于其他研究問題,如文中給出的自然災害頻率對草地生態(tài)系統(tǒng)的影響,以及幾何受限下的聚合物鏈構象問題例子。盡管其在新問題上的結果可靠性需進一步驗證,但隨著LLM能力的提升,Brief-RP ASA的潛力無限。


這項研究的亮點總結如下:


  1. 首次實現理論模擬科研全流程AI自動化:ASA能根據研究計劃(RP)自動完成從實驗設計到報告生成的全流程,無需人工干預,展示了其在科研自動化中的強大能力。
  2. 智能表現突出:ASA在實驗中展現了超出RP要求的自主性,如主動整理文件、分析模擬偏差、用豐富圖表(如概率分布圖和交互式圖表)呈現數據等,體現了ASA的強大智能。
  3. 自主設計研究計劃:ASA能根據簡短描述自動生成詳細AI RP并執(zhí)行。例如,它成功設計了基于機器學習的聚合物粘度預測模型、草地生態(tài)系統(tǒng)模擬及受限聚合物鏈構象研究等跨領域任務,并根據能夠成功執(zhí)行設計流程,生成豐富的數據和詳細的圖文報告。
  4. 推動科研自動化發(fā)展:本工作的意義在于,科研領域的未來方向之一是自動化整合。ASA的成功應用展示了AI在科研中的巨大潛力,能夠實現從實驗設計到報告生成的全流程自動化,提供高效、可靠的解決方案。未來,通過優(yōu)化AI算法、提升任務準確性和擴展應用領域,科研自動化將迎來更廣闊的發(fā)展空間,顯著提高效率,并為探索復雜科學問題提供新工具,推動科研邁向智能化、自動化的新階段。


  原文鏈接:https://doi.org/10.1021/acs.jcim.4c01653

版權與免責聲明:中國聚合物網原創(chuàng)文章?锘蛎襟w如需轉載,請聯系郵箱:info@polymer.cn,并請注明出處。
(責任編輯:xu)
】【打印】【關閉

誠邀關注高分子科技

更多>>最新資訊
更多>>科教新聞