2024年諾貝爾化學(xué)獎(jiǎng)與物理學(xué)獎(jiǎng)花落人工智能(AI)相關(guān)研究項(xiàng)目,這一標(biāo)志性事件不僅彰顯了AI技術(shù)的成熟度,更預(yù)示著它正以革新之勢(shì)重塑科學(xué)研究的固有范式。在化工與材料研發(fā)領(lǐng)域,眾多企業(yè)敏銳捕捉到這一技術(shù)變革的浪潮,紛紛投身其中,或自主探索,或攜手科技企業(yè),借助AI技術(shù)賦能科研開(kāi)發(fā),力求推動(dòng)行業(yè)從傳統(tǒng)模式向“預(yù)測(cè)性設(shè)計(jì)”和“精準(zhǔn)創(chuàng)制”的智能化方向大步邁進(jìn)。
人工智能技術(shù)在化工材料研發(fā)領(lǐng)域的應(yīng)用
當(dāng)下,AI技術(shù)在化工材料研發(fā)領(lǐng)域已展現(xiàn)出巨大的應(yīng)用潛力,不少企業(yè)已收獲顯著成果。
巴斯夫引入高性能超級(jí)計(jì)算機(jī)Quriosity,將AI融入分子與化合物模擬計(jì)算流程。這一舉措大幅提升了計(jì)算效率,能夠快速篩選聚合物結(jié)構(gòu),加速新型分子和化合物的開(kāi)發(fā)進(jìn)程。曾經(jīng)需要耗時(shí)一年的計(jì)算任務(wù),如今僅需短短數(shù)天即可完成,而且還能挖掘出傳統(tǒng)方法難以察覺(jué)的潛在關(guān)聯(lián)性,為研發(fā)工作開(kāi)辟新思路。
陶氏化學(xué)與微軟達(dá)成合作,將AzureAI和機(jī)器學(xué)習(xí)技術(shù)深度整合到聚氨酯等材料研發(fā)中。其構(gòu)建的AI模型宛如智能大腦,能夠在短短幾秒內(nèi)對(duì)數(shù)百萬(wàn)種配方組合進(jìn)行分析篩選,并給出極具針對(duì)性的優(yōu)化建議。原本需要4~6個(gè)月才能完成的實(shí)驗(yàn)室探索工作,現(xiàn)在僅需30秒就能完成,效率提升約20萬(wàn)倍,大大縮短了新材料差異化解決方案的上市時(shí)間,使企業(yè)在市場(chǎng)競(jìng)爭(zhēng)中搶占先機(jī)。
萬(wàn)華化學(xué)借助AI技術(shù)在催化劑篩選環(huán)節(jié)實(shí)現(xiàn)了重大突破。面對(duì)14000多種備選方案,AI算法迅速篩選出156種具有潛力的選項(xiàng),隨后進(jìn)一步優(yōu)化至4種,精準(zhǔn)推薦分子合成實(shí)驗(yàn),極大縮短了研發(fā)周期,讓科研效率得到質(zhì)的飛躍。
寧德時(shí)代則另辟蹊徑,將材料機(jī)理、大數(shù)據(jù)分析與AI算法有機(jī)結(jié)合,加速電解液、正極、包覆等電池材料的開(kāi)發(fā)。通過(guò)這種創(chuàng)新模式,不僅研發(fā)周期縮短了30%,研發(fā)成本也降低了30%,在提升產(chǎn)品性能的同時(shí),有效提升了企業(yè)的經(jīng)濟(jì)效益。
晶泰科技利用量子物理模擬、AI算法與云計(jì)算技術(shù)搭建智能化藥物研發(fā)平臺(tái),在藥物研發(fā)領(lǐng)域大放異彩。在項(xiàng)目初期,該平臺(tái)可生成百萬(wàn)量級(jí)的虛擬分子,并快速篩選出關(guān)鍵候選分子。在與輝瑞合作研發(fā)新冠口服藥PAXLOVID時(shí),AI預(yù)測(cè)算法結(jié)合實(shí)驗(yàn)驗(yàn)證,僅用6周就成功確定優(yōu)勢(shì)藥物晶型,而傳統(tǒng)方法則需要數(shù)月以上的時(shí)間,充分展示了AI技術(shù)在藥物研發(fā)領(lǐng)域的高效性。
從這些案例不難看出,AI技術(shù)與多學(xué)科知識(shí)的深度融合,能夠在海量方案中快速篩選出可行選項(xiàng),并進(jìn)一步優(yōu)化,顯著縮短實(shí)驗(yàn)和研發(fā)周期,提高研發(fā)效率。同時(shí),它還能更加精準(zhǔn)地實(shí)現(xiàn)材料設(shè)計(jì)、性能預(yù)測(cè)和工藝優(yōu)化,為研發(fā)決策提供科學(xué)、可靠的依據(jù),加速新材料的發(fā)現(xiàn)與應(yīng)用,為化工材料領(lǐng)域的創(chuàng)新發(fā)展注入強(qiáng)勁動(dòng)力。
人工智能技術(shù)在化工材料研發(fā)領(lǐng)域面臨的挑戰(zhàn)
盡管AI技術(shù)在化工材料研發(fā)領(lǐng)域前景廣闊,但在實(shí)際應(yīng)用過(guò)程中,仍面臨著諸多嚴(yán)峻挑戰(zhàn)。
01 | 在數(shù)據(jù)層面,主要面臨數(shù)據(jù)稀缺、異構(gòu)化、質(zhì)量缺陷等困境
目前,大量有價(jià)值的有效數(shù)據(jù)分散存儲(chǔ)于企業(yè)內(nèi)部,且多以非結(jié)構(gòu)化形式存在,這使得數(shù)據(jù)的流通與整合困難重重。尤其是在新型材料研發(fā)方面,由于缺乏歷史數(shù)據(jù)作為支撐,AI技術(shù)面臨著嚴(yán)重的“冷啟動(dòng)”難題。此外,單純依靠實(shí)驗(yàn)獲取數(shù)據(jù)不僅耗時(shí)費(fèi)力,成本也極高,嚴(yán)重制約了數(shù)據(jù)的廣泛收集與應(yīng)用。
在新材料設(shè)計(jì)過(guò)程中,需要融合多種不同類(lèi)型的數(shù)據(jù),如分子結(jié)構(gòu)【簡(jiǎn)化分子線性輸入規(guī)范(SMILES)】、光譜數(shù)據(jù)(紅外、拉曼)以及工藝參數(shù)(溫度、壓力)等。同時(shí),還需實(shí)現(xiàn)從微觀數(shù)據(jù)到宏觀性能的跨尺度數(shù)據(jù)關(guān)聯(lián),這對(duì)數(shù)據(jù)處理技術(shù)與整合方法提出了極高的要求。然而,不同機(jī)構(gòu)在材料成分標(biāo)注(如質(zhì)量分?jǐn)?shù)與摩爾分?jǐn)?shù)混用)、實(shí)驗(yàn)條件記錄等方面缺乏統(tǒng)一規(guī)范,導(dǎo)致數(shù)據(jù)融合與模型訓(xùn)練效率低下。
實(shí)驗(yàn)過(guò)程中不可避免地會(huì)產(chǎn)生各種誤差,如設(shè)備測(cè)量誤差、批次誤差等,這些誤差嚴(yán)重影響了數(shù)據(jù)的準(zhǔn)確性。此外,不同實(shí)驗(yàn)室對(duì)于同一現(xiàn)象的定義往往存在較大差異,導(dǎo)致數(shù)據(jù)標(biāo)注的一致性難以保障,數(shù)據(jù)的可靠性與可用性大打折扣。數(shù)據(jù)質(zhì)量還體現(xiàn)在數(shù)據(jù)的不均衡性上,在化工材料研發(fā)數(shù)據(jù)中,某些性能優(yōu)良或特殊的材料數(shù)據(jù)占比極少,這使得模型在訓(xùn)練時(shí)難以充分學(xué)習(xí)少數(shù)類(lèi)數(shù)據(jù),從而影響對(duì)稀有但重要材料特性的預(yù)測(cè)和分析。
02 | 在算法和模型層面,面臨模型可解釋性矛盾、多尺度建模時(shí)空鴻溝、小樣本學(xué)習(xí)瓶頸等挑戰(zhàn)
深度神經(jīng)網(wǎng)絡(luò)在材料性能預(yù)測(cè)方面雖然能夠達(dá)到較高的準(zhǔn)確率,但其內(nèi)部物化機(jī)制的解釋度卻很低,形成了典型的“黑箱模型困境”。究其原因,現(xiàn)有AI模型大多以數(shù)據(jù)驅(qū)動(dòng)為主,缺乏對(duì)質(zhì)量守恒、熱力學(xué)定律等基礎(chǔ)物理規(guī)律的有效嵌入,導(dǎo)致預(yù)測(cè)結(jié)果可能與科學(xué)常識(shí)相悖。因此,如何在保證模型復(fù)雜度的同時(shí),提高其物理可解釋性,成為亟待解決的關(guān)鍵難題。
材料研發(fā)需要跨越從飛秒級(jí)分子動(dòng)力學(xué)到年尺度老化實(shí)驗(yàn)的12個(gè)數(shù)量級(jí)的時(shí)間維度,同時(shí)關(guān)聯(lián)量子計(jì)算與反應(yīng)器級(jí)的空間特征。盡管目前有一些模型框架?chē)L試通過(guò)多尺度理論建模來(lái)縮小這一鴻溝,但在實(shí)際應(yīng)用中仍受到計(jì)算資源與算法效率的雙重制約。
在新材料研發(fā)場(chǎng)景中,可用數(shù)據(jù)量往往非常有限,通常小于100個(gè)樣本數(shù)量,這使得傳統(tǒng)模型的泛化誤差較大。對(duì)于未經(jīng)驗(yàn)證的體系,零樣本探索的預(yù)測(cè)失效率更高。雖然遷移學(xué)習(xí)等技術(shù)為解決這一問(wèn)題提供了一些思路,但數(shù)據(jù)噪聲與領(lǐng)域差異仍然顯著影響著模型的遷移效果。
03 | 在人才層面,跨學(xué)科知識(shí)融合不足、人才培養(yǎng)體系不完善、人才吸引力和留存問(wèn)題皆不容忽視
化工材料研發(fā)涉及化學(xué)、物理等多學(xué)科知識(shí),而AI技術(shù)則需要計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等領(lǐng)域的專(zhuān)業(yè)知識(shí)。這兩種知識(shí)體系之間存在較大差異,導(dǎo)致既懂化工材料又精通AI技術(shù)的復(fù)合型人才極度稀缺。此外,AI算法專(zhuān)家與化工材料領(lǐng)域?qū)<抑g存在明顯的知識(shí)壁壘,雙方溝通協(xié)作困難,也阻礙了算法模型與化工材料研發(fā)的深度融合。
當(dāng)前,許多從事AI技術(shù)的人才缺乏化工材料研發(fā)的實(shí)際項(xiàng)目經(jīng)驗(yàn),對(duì)研發(fā)流程、需求和痛點(diǎn)了解不夠深入。同時(shí),化工材料AI研發(fā)領(lǐng)域的實(shí)踐平臺(tái)和項(xiàng)目剛剛開(kāi)始,人才在實(shí)踐中積累經(jīng)驗(yàn)、提升能力還不夠,這也在一定程度上制約了AI技術(shù)在該領(lǐng)域的應(yīng)用與發(fā)展。
AI領(lǐng)域高端人才競(jìng)爭(zhēng)異常激烈,與互聯(lián)網(wǎng)、金融等熱門(mén)行業(yè)相比,化工材料行業(yè)因研發(fā)環(huán)境相對(duì)艱苦、待遇水平不高等因素,在吸引和留住人才方面面臨較大壓力,人才流失現(xiàn)象也較為嚴(yán)重。
利用AI技術(shù)加速化工材料研發(fā)的思考建議
加速AI技術(shù)在化工材料研發(fā)中的落地應(yīng)用,可以從數(shù)據(jù)、算法和模型、人才三個(gè)關(guān)鍵層面著手應(yīng)對(duì)挑戰(zhàn)。
01 | 在數(shù)據(jù)層面,加強(qiáng)數(shù)據(jù)整合與共享,建立和完善數(shù)據(jù)標(biāo)準(zhǔn)化,提升數(shù)據(jù)質(zhì)量,挖掘數(shù)據(jù)實(shí)現(xiàn)增值
應(yīng)建立企業(yè)內(nèi)部統(tǒng)一的數(shù)據(jù)管理平臺(tái),將各業(yè)務(wù)部門(mén)、子公司分散的數(shù)據(jù)資源進(jìn)行有效整合,打破數(shù)據(jù)孤島,實(shí)現(xiàn)數(shù)據(jù)的集中存儲(chǔ)與共享,讓數(shù)據(jù)在企業(yè)內(nèi)部自由流通。同時(shí),積極與外部科研機(jī)構(gòu)、高校開(kāi)展合作,建立數(shù)據(jù)共享機(jī)制,廣泛獲取更多維度的外部數(shù)據(jù),豐富數(shù)據(jù)來(lái)源,為AI模型訓(xùn)練提供充足的數(shù)據(jù)支持。
制定涵蓋材料成分標(biāo)注、實(shí)驗(yàn)條件記錄等方面的統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)和規(guī)范,確保不同來(lái)源的數(shù)據(jù)具有一致性和可比性,便于后續(xù)的數(shù)據(jù)融合與模型訓(xùn)練,提升數(shù)據(jù)的可用性和價(jià)值。
構(gòu)建全面的數(shù)據(jù)質(zhì)量評(píng)估體系,對(duì)數(shù)據(jù)的準(zhǔn)確性、完整性、一致性等進(jìn)行嚴(yán)格評(píng)估與監(jiān)控。加強(qiáng)數(shù)據(jù)清洗和預(yù)處理工作,去除數(shù)據(jù)中的噪聲和錯(cuò)誤數(shù)據(jù)。同時(shí),優(yōu)化實(shí)驗(yàn)設(shè)計(jì)和操作流程,從源頭上減少誤差,保障數(shù)據(jù)質(zhì)量。
充分利用數(shù)據(jù)挖掘技術(shù),從海量的歷史數(shù)據(jù)中挖掘潛在的規(guī)律和知識(shí),為新材料研發(fā)提供有價(jià)值的參考。通過(guò)數(shù)據(jù)分析預(yù)測(cè)新的市場(chǎng)需求和研發(fā)方向,為企業(yè)的戰(zhàn)略決策提供有力支撐,實(shí)現(xiàn)數(shù)據(jù)的價(jià)值最大化。
02 | 在算法和模型層面,增強(qiáng)模型可解釋性,多尺度優(yōu)化建模,突破小樣本學(xué)習(xí)技術(shù)
研發(fā)將物理規(guī)律、化學(xué)原理等有效嵌入其中的AI模型,使模型的預(yù)測(cè)結(jié)果具有科學(xué)依據(jù)且可解釋。同時(shí),加強(qiáng)對(duì)模型的驗(yàn)證與評(píng)估,確保其可靠性和準(zhǔn)確性,為研發(fā)決策提供可靠的支持。
開(kāi)展多尺度建模技術(shù)研究,建立從微觀到宏觀的跨尺度模型,實(shí)現(xiàn)不同尺度數(shù)據(jù)的融合與分析。通過(guò)優(yōu)化模型的算法和計(jì)算方法,提高模型的計(jì)算效率和精度,降低誤差累積,提升模型在化工材料研發(fā)中的實(shí)用性和可靠性。
積極探索適合小樣本數(shù)據(jù)的學(xué)習(xí)方法,如遷移學(xué)習(xí)、元學(xué)習(xí)等,提高模型在小樣本數(shù)據(jù)下的泛化能力和預(yù)測(cè)性能。加強(qiáng)數(shù)據(jù)增強(qiáng)技術(shù)研究,通過(guò)數(shù)據(jù)增強(qiáng)方法擴(kuò)充小樣本數(shù)據(jù)集,提升模型的訓(xùn)練效果,有效解決小樣本數(shù)據(jù)帶來(lái)的挑戰(zhàn)。
03 | 在人才層面,建設(shè)高效的人才培養(yǎng)體系,跨學(xué)科融合培養(yǎng),著力吸引和留住人才
建立跨學(xué)科的人才培養(yǎng)體系,加強(qiáng)化工材料專(zhuān)業(yè)與計(jì)算機(jī)科學(xué)、數(shù)學(xué)、統(tǒng)計(jì)學(xué)等專(zhuān)業(yè)的交叉融合,培養(yǎng)既懂化工材料又精通AI的復(fù)合型人才。鼓勵(lì)員工積極參與跨學(xué)科的學(xué)習(xí)和培訓(xùn),提升員工的綜合素質(zhì)和跨學(xué)科能力,為企業(yè)的AI技術(shù)應(yīng)用提供堅(jiān)實(shí)的人才保障。
加強(qiáng)高校與企業(yè)的合作,建立實(shí)習(xí)基地和實(shí)踐平臺(tái),為高校學(xué)生提供更多接觸實(shí)際項(xiàng)目的機(jī)會(huì),培養(yǎng)學(xué)生的實(shí)踐能力和創(chuàng)新意識(shí)。同時(shí),加強(qiáng)企業(yè)內(nèi)部人才培養(yǎng),通過(guò)內(nèi)部培訓(xùn)、項(xiàng)目實(shí)踐等方式,提升員工的AI技術(shù)水平和應(yīng)用能力。
制定具有競(jìng)爭(zhēng)力的人才政策,提高化工材料行業(yè)對(duì)人才的吸引力。為人才提供良好的工作環(huán)境和廣闊的發(fā)展空間,給予他們具有挑戰(zhàn)性的項(xiàng)目任務(wù),激發(fā)人才的創(chuàng)新活力。加強(qiáng)企業(yè)文化建設(shè),增強(qiáng)人才的歸屬感和忠誠(chéng)度,留住優(yōu)秀人才,打造一支穩(wěn)定、高素質(zhì)的人才隊(duì)伍。
只有積極應(yīng)對(duì)挑戰(zhàn)并采取切實(shí)有效的措施,加速AI技術(shù)在化工材料研發(fā)中的落地應(yīng)用,提升企業(yè)的創(chuàng)新能力與核心競(jìng)爭(zhēng)力,企業(yè)才能在激烈的市場(chǎng)競(jìng)爭(zhēng)中脫穎而出,引領(lǐng)化工材料研發(fā)行業(yè)的創(chuàng)新發(fā)展。
轉(zhuǎn)載自:化工好料到haoliaodao.com
來(lái)源:中國(guó)化工信息周刊