以“智聯(lián)世界、元生無(wú)界”為主題的2022 世界人工智能大會(huì )(WAIC)于9月3日在上海圓滿(mǎn)落幕。WAIC作為全球人工智能的“科技風(fēng)向標、應用展示臺、產(chǎn)業(yè)加速器、治理議事廳”,是全球人工智能領(lǐng)域最具影響力的行業(yè)盛會(huì )。
「WAIC 2022 · AI 開(kāi)發(fā)者日」作為WAIC大會(huì )最重要的技術(shù)論壇之一,以“AI開(kāi)發(fā)者所真正關(guān)注的”為主題,匯聚了2021 年圖靈獎得主、中外院士、世界級技術(shù)專(zhuān)家與科技企業(yè)創(chuàng )始人等 15 位學(xué)術(shù)界和產(chǎn)業(yè)界重磅嘉賓。九章云極DataCanvas公司開(kāi)源技術(shù)副總裁、D-Lab主任楊健受邀出席論壇,并圍繞如何運用完整的、綜合性、端到端因果學(xué)習工具包解決“因果發(fā)現、因果量識別、因果效應估計、反事實(shí)推斷和策略學(xué)習”五大關(guān)鍵問(wèn)題,發(fā)表了《YLearn:因果學(xué)習,從預測到?jīng)Q策》的精彩主題演講。
因果學(xué)習:人工智能發(fā)展的技術(shù)突破口
隨著(zhù)機器學(xué)習和深度學(xué)習在發(fā)展過(guò)程中遇到技術(shù)瓶頸,人工智能發(fā)展速度逐漸放緩,究其原因,一方面是機器學(xué)習存在著(zhù)泛化能力較弱、解釋性不強、決策支持能力不足的關(guān)鍵性問(wèn)題;另一方面政府和企業(yè)提出“智能決策”的需求,即以數據驅動(dòng)的方式實(shí)現自動(dòng)化決策來(lái)提高整體運營(yíng)效率。
隨著(zhù)機器學(xué)習建模越來(lái)越多的應用,人工智能技術(shù)從預測性分析向指導性分析升級轉移,自動(dòng)化“決策”成為政府和企業(yè)在數智化時(shí)代的核心需求,決策者需要一個(gè)可理解的AI決策邏輯以及具有可信度、可解釋的決策結果。而當前機器學(xué)習主要是完成預測性任務(wù),難以滿(mǎn)足政府和企業(yè)自動(dòng)化決策的需求。
Gartner發(fā)布的《2022年新興技術(shù)成熟度曲線(xiàn)》中提到,因果人工智能是加速AI自動(dòng)化的關(guān)鍵技術(shù)之一。因果學(xué)習成為補充機器學(xué)習問(wèn)題的關(guān)鍵技術(shù),人工智能發(fā)展極具潛力的技術(shù)突破口,引發(fā)業(yè)界的廣泛關(guān)注和熱點(diǎn)研究。
YLearn:因果學(xué)習,從預測到?jīng)Q策
2019年圖靈獎得主Yoshua Bengio先生曾提到,“因果關(guān)系對于機器學(xué)習的下一步進(jìn)展非常重要”。從2019年開(kāi)始,因果學(xué)習的學(xué)術(shù)研究新成果不斷出現,發(fā)表的相關(guān)論文數量每年都在翻倍增長(cháng)。目前,從國內外關(guān)于因果學(xué)習的研發(fā)來(lái)看,出現了很多因果學(xué)習的工具,例如DoWhy、圍繞解決因果效應評估類(lèi)問(wèn)題的EconML,用來(lái)完成uplift建模的CausalML以及專(zhuān)注解決因果發(fā)現問(wèn)題的Causal Learn。但這些工具都只能解決因果學(xué)習中的部分問(wèn)題,又因為不同的工具所依賴(lài)的理論框架和結構體系不同,導致工具包之間也難以融合使用。因果學(xué)習領(lǐng)域則是缺少系統、完整的、綜合性、端到端的工具包。
九章云極DataCanvas公司自主研發(fā)的一站式處理因果學(xué)習完整流程的開(kāi)源算法工具包YLearn,是目前首款端到端、較完整、較系統的因果學(xué)習算法工具包,率先解決了因果學(xué)習中“因果發(fā)現、因果量識別、因果效應估計、反事實(shí)推斷和策略學(xué)習”五大關(guān)鍵問(wèn)題,降低“決策者”使用門(mén)檻,不斷滿(mǎn)足政府和企業(yè)自動(dòng)化“決策”的需求。
YLearn由CausalDiscovery、CausalModel、EstimatorModel、Policy、Interpreter、Whatif等部件組成,各部件支持獨立使用,也支持統一封裝。為幫助用戶(hù)更直觀(guān)地理解數據、調整策略,YLearn提供了因果圖、因果效應解釋、決策樹(shù)等重要模塊的可視化輸出。
與國內外因果學(xué)習工具相比,九章云極DataCanvas公司的YLearn具有一站式、新而全、用途廣的特點(diǎn)。
·一站式
通常的因果學(xué)習流程包括從數據中發(fā)現因果結構,對因果結構建立因果模型,使用因果模型進(jìn)行因果效應識別和對從數據中對因果效應進(jìn)行估計。YLearn一站式地支持這些功能,使用戶(hù)以最低的學(xué)習成本使用與部署因果學(xué)習。
·新而全
YLearn實(shí)現了多個(gè)近年來(lái)在因果學(xué)習領(lǐng)域中發(fā)展出的各類(lèi)算法,例如Meta-Learner、Double Machine Learning等。也將一直致力于緊跟前沿進(jìn)展,保持因果識別與估計模型的先進(jìn)和全面。
·用途廣
YLearn支持對估計得到的因果效應進(jìn)行解釋、根據因果效應在各種方案中選取收益最大的方案并可視化決策過(guò)程等功能。除此之外,YLearn也支持將因果結構中識別出的因果效應的概率分布表達式以L(fǎng)aTex的形式輸出等小功能,幫助用戶(hù)將因果學(xué)習與其他方向交叉。
結合政府和企業(yè)在決策任務(wù)上的需求,YLearn將與九章云極DataCanvas公司的自動(dòng)機器學(xué)習平臺相結合,通過(guò)與AutoML技術(shù)的融合,提高機器學(xué)習的魯棒性、泛化能力和解釋性,實(shí)現因果學(xué)習的自動(dòng)調參和優(yōu)化,進(jìn)一步降低使用門(mén)檻。同時(shí),YLearn解決了市場(chǎng)上缺失功能強大且完整的因果學(xué)習工具包這一“卡脖子”難題,將技術(shù)回歸業(yè)務(wù),支持決策類(lèi)業(yè)務(wù)場(chǎng)景,為客戶(hù)提供多種決策方案。
因果學(xué)習助力人工智能邁向新階段
人工智能技術(shù)作為新一輪科技革命和產(chǎn)業(yè)變革的核心力量,正處于從預測邁向決策的新發(fā)展階段。因果學(xué)習在這一階段發(fā)揮著(zhù)重要作用,彌補機器學(xué)習的理論缺陷,逐步解決從“是什么”到“為什么”的問(wèn)題,從政府和企業(yè)的需求出發(fā),提升“AI決策”的可信度和可用度,將AI能力更進(jìn)一步交為業(yè)務(wù)所用。
為了更好的帶動(dòng)國內因果學(xué)習領(lǐng)域的發(fā)展,推動(dòng)因果學(xué)習的多元化發(fā)展,九章云極DataCanvas公司聯(lián)合世界人工智能大會(huì )組委會(huì )辦公室、機器之心、上海市人工智能行業(yè)協(xié)會(huì )、天池共同舉辦黑客松「因果學(xué)習和決策優(yōu)化挑戰賽」,為全球各路開(kāi)發(fā)者精英們提供同臺競技的平臺。挑戰賽以“如何優(yōu)化干預方案能使因果效應最大”為主題,將因果學(xué)習中的普適性問(wèn)題具化,旨在考察選手使用因果推斷在決策方案制定問(wèn)題上的估計能力。
作為業(yè)界首個(gè)面向「因果推斷全流程」的賽事,收到來(lái)自全國各地包括運用人工智能相關(guān)技術(shù)賦能數智化升級的企業(yè)、結合人工智能技術(shù)進(jìn)行創(chuàng )新探索的科研單位、高等院校的團隊及專(zhuān)業(yè)開(kāi)發(fā)者等近四千支隊伍報名參賽。參賽隊伍經(jīng)過(guò)23天的同臺競技,不斷探索因果學(xué)習領(lǐng)域的技術(shù)高峰,刷新成績(jì)紀錄,角逐出TOP18具有雄厚的AI技術(shù)實(shí)力以及富有創(chuàng )造力的優(yōu)勝隊伍。
未來(lái),九章云極DataCanvas公司將不斷創(chuàng )新研發(fā)開(kāi)源工具,將政府和企業(yè)的業(yè)務(wù)需求與技術(shù)實(shí)踐相結合,助力政府和企業(yè)數智化升級,推動(dòng)人工智能向新階段。
相關(guān)稿件