上海AI實驗室開源發布科學大模型“浦科化學”(上海浦科投資控股有限公司)
1月26日,上海人工智能實驗室(上海AI實驗室)開源發布首個科學大模型浦科化學(ChemLLM),拓展了大模型助力科學研究的探索路徑。
基于書生·浦語2.0強大的基座模型能力,浦科化學通過注入海量化學專業數據,使大模型獲得了理解和處理化學相關專業任務的知識與能力。同時,研究人員發現,隨著化學能力的獲得,大模型的數理學科及推理能力也得到增強。
浦科化學現已開源,并提供免費商用。
開源鏈接:
https://huggingface.co/AI4Chem/ChemLLM-7B-Chat
專注核心:化學知識注入,專業能力突出
為了評估浦科化學的專業能力,上海AI實驗室的研究人員對其在三種相關任務上的表現進行了測試:分子名稱轉換、分子性質預測和反應產物預測——這些任務分別涉及化學物質的表示、性質和轉化,是化學研究的基礎和核心。
分子名稱轉換方面,要求模型能夠在不同分子表示方式之間進行準確轉換,如SMILES、IUPAC名稱、分子式等;
分子性質預測方面,要求模型能根據分子的結構和組成,預測其化學性質,如沸點、密度、溶解度等;
反應產物預測方面,要求模型能根據給定的反應物和反應條件預測反應產物的結構。
測試結果顯示,浦科化學在這三項任務上均表現出色,分別獲得22.0、49.0和7.0的分數,遠超過其他同規模模型的水平,并超越了GPT-3.5,證明浦科化學在理解和處理化學知識方面具備強大能力。
依托書生·浦語2.0基座模型優秀的多語言能力,浦科化學在經過專業化學知識訓練后,還具備了優秀的化學專業中英文翻譯能力,可幫助化學研究者跨越語言障礙,準確地翻譯化學文獻中的專有名詞,獲取更多的化學知識。
下圖展示了浦科化學翻譯的一篇2024年1月16日發表在《自然·化學》雜志上論文的摘要。
在專業化學知識訓練之外,浦科化學也進行了初高中知識的學習。在回答初高中化學題目時,不僅能給出答案,還能給出具體的解釋,下圖展示了例子:
齊頭并進:邏輯推理增強,泛理科能力涌現
專項能力的增強,是否以犧牲其他能力為代價?實踐證明,浦科化學不僅在化學領域表現出色,其在數學、物理及推理等方面能力均得到增強。
研究人員使用MMLU(大規模多任務語言理解數據集)作為測試集來評估浦科化學在通用場景下的性能,對語言模型的多項任務能力進行測試評估,并將浦科化學與其他同等規模的模型進行比較,以評估化學訓練數據對基礎模型的影響。
評測結果顯示,浦科化學在大學化學任務上得分為47.0,超越了所有其他模型,這體現了它在回答化學問題及處理復雜化學任務的能力。研究人員發現,盡管沒有對浦科化學進行數學和物理學科的訓練,
有趣的是,浦科化學在道德場景、人文科學類、社會科學類等分項任務上也展現了優異的平均性能,這說明,對大模型進行專業某個學科的知識訓練,不僅不會讓大模型“分心”,反而有助于其道德水平及一般任務水平的提升。
舉一反三:擴展大模型應用,助推科研新范式
對大語言模型進行化學專項訓練,不僅擴展了大模型的應用空間,更為AI for Science相關研究開啟了新的探索路徑。
上海AI for Science團隊面向化學、物理、生命、地球等科學領域,通過深入研究各學科基礎理論,結合最新人工智能理論,探索AI驅動重大科學問題的研究范式,加速人工智能在化學、藥物研發、新材料、氣象等領域的滲透與落地,賦能各行業發展。其中,AI for Chemistry方面的研究以語言模型為核心,通過大模型連接智能化實驗設備,全方位提升實驗效率,從而實現化學研究的自動化和智能化。相關研究范式的創新,將助推科學發現速度,實現更大的社會效益。
未來,基于浦科化學模型,人工智能可為化學研究提供智能化輔助,如化學合成路徑規劃、化學反應條件優化、實驗結果自動化分析等,從而提升化學研究的效率和質量。