托卡馬克內部的等離子體。圖片來源:“深度思維”公司
“這是強化學習在現實世界系統中最具挑戰性的應用之一,”深度思維研究員馬丁·利德米勒表示。而“人工智能,特別是強化學習,特別適合解決托卡馬克中控制等離子體的復雜問題。”所謂托卡馬克,是一種可以容納核聚變反應的容器,其內部呈現出一種特殊且混亂的狀態:氫原子在極端高溫下“擠作一團”,產生旋轉著、翻滾著、比太陽表面還要熾熱的等離子體湯,而磁場線圈會限制等離子體粒子,以使等離子體達到聚變所需的條件。換句話說,控制和約束這種等離子體的方法,就是核聚變邁向成功的關鍵,也將是人類社會未來清潔能源的源泉。
在最新論文中,“深度思維”詳細介紹了可自主控制等離子體的AI。控制等離子體需要不斷監測和操縱磁場,團隊訓練其強化學習算法在模擬中執行此操作,一旦它學會了如何控制和改變虛擬反應堆內等離子體的形狀,研究人員就讓它控制了托卡馬克中的磁體,他們發現,人工智能無需任何額外的微調就能控制真正的反應堆。
研究人員表示,使用AI算法控制等離子體,將使在反應堆內進行不同條件的實驗變得更加容易,并可能加快商業核聚變的發展。AI在這其中學會了通過以人類以前從未嘗試過的方式,調整磁鐵來控制等離子體,這意味著,也可能會有一種新的反應堆配置可供探索。
總編輯圈點
在地球上控制核聚變很難。但現在,經過訓練的AI神經網絡,可以每秒接收90次不同的測量值來描述等離子體的形狀和位置,并相應地調整磁體中的電壓。這個強化學習算法,處理速度比以往任何方式都要快得多。對科學家來說,這是朝著一個非常令人興奮的方向邁出的重要的第一步,因為如果確定有一個控制系統可以讓我們如此接近極限但又不會超出極限,那么,人類就有了探索更多可能性的平臺,也有了更強的信心,將AI用于推動人類文明的進步。