5月21日,阿丘科技CEO黃耀應邀參加北京機器視覺(jué)助力智能制造創(chuàng )新發(fā)展大會(huì ),并發(fā)表《AI+工業(yè)視覺(jué)探索與展望》主題演講,下文根據黃耀先生的主題演講主要內容撰寫(xiě)而成??牲c(diǎn)擊文末“閱讀原文”下載原版PPT資料。
一、AI+工業(yè)檢測的難點(diǎn)與挑戰
現代制造業(yè)中,質(zhì)量管控是一個(gè)至關(guān)重要但充滿(mǎn)挑戰的環(huán)節。制造企業(yè)使用AI的具體場(chǎng)景中,“質(zhì)量檢測”占據了約40%的比例。在質(zhì)量管控中,面對大規模的產(chǎn)量,企業(yè)需要管理眾多的工藝控制點(diǎn)。
這導致單個(gè)產(chǎn)品的檢測參數量多,總體檢測的參數量大,給質(zhì)量控制帶來(lái)了極大的壓力。其次,極限制造的環(huán)境下,對產(chǎn)品的精度和品質(zhì)要求極為嚴格。不僅生產(chǎn)線(xiàn)上對過(guò)檢和漏檢的指標控制非常嚴格,同時(shí)產(chǎn)線(xiàn)速度的加快進(jìn)一步增加了檢測的難度。
此外,缺陷的種類(lèi)復雜多變,許多缺陷非常微小,區分度低,使得檢測工作更加困難。最后,傳統的質(zhì)量管控方式需要投入大量的人力和財力,即使如此,仍然存在漏檢的風(fēng)險。這些因素共同構成了質(zhì)量管控的主要難點(diǎn),亟需通過(guò)技術(shù)創(chuàng )新和改進(jìn)來(lái)解決。
工業(yè)AI視覺(jué)檢測作為制造業(yè)中新興的領(lǐng)域,在高速發(fā)展的同時(shí)也一直面臨著(zhù)一系列難點(diǎn)與挑戰。
第一,嚴苛的性能指標。 工業(yè)場(chǎng)景對AI檢測提出了極為嚴苛的性能指標,要求極高的準確度、AI模型高度的穩定性和魯棒性,適應復雜多變的工業(yè)環(huán)境。
第二,工業(yè)場(chǎng)景的數據基礎薄弱。 工業(yè)數據往往數量有限且私有化,導致數據的獲取和應用面臨高度碎片化的難題。數據基礎的薄弱是制約工業(yè)AI發(fā)展的重要因素,缺乏數據、數據質(zhì)量差或數據量不足的問(wèn)題,都嚴重影響了AI模型的訓練和優(yōu)化效果。
第三,工業(yè)場(chǎng)景的AI大多需要與硬件緊密結合。 這不僅增加了系統的復雜性,還可能引入各種干擾因素,對AI的性能造成影響。
第四,AI+工業(yè)人才缺乏。 人才缺乏是工業(yè)AI發(fā)展中的另一個(gè)瓶頸,既懂得AI技術(shù)又熟悉工業(yè)領(lǐng)域的復合型人才十分稀缺,很大程度上限制了AI技術(shù)在工業(yè)場(chǎng)景中的應用和推廣。
二、工業(yè)AI視覺(jué)進(jìn)入2.0時(shí)代
中國工業(yè)AI視覺(jué)的落地大約始于2019年,經(jīng)過(guò)5年的積累、迭代,正在從1.0進(jìn)入2.0時(shí)代。
工業(yè)AI視覺(jué)進(jìn)化論
1、工業(yè)AI視覺(jué)1.0時(shí)代:聚焦工業(yè)場(chǎng)景的AI算法,實(shí)現“可用”
在工業(yè)AI視覺(jué)1.0時(shí)代,由于沒(méi)有足夠的數據,通常需要通過(guò)小樣本技術(shù)來(lái)解決問(wèn)題。
這一時(shí)期的工業(yè)AI視覺(jué)主要表現為以下3個(gè)特征:
第一,小樣本學(xué)習。 在工業(yè)生產(chǎn)環(huán)境中,訓練AI模型可用的標注圖像樣本采集、標注耗時(shí)耗力,往往數量非常有限,所以此時(shí)的AI算法訓練只能夠在有限的數據基礎上進(jìn)行。
第二,高精度。 工業(yè)質(zhì)檢的標準要求AI檢測系統以很高的準確度檢測、識別和分類(lèi)圖像中的目標對象,如缺陷檢測、尺寸測量、物體識別和分類(lèi)等任務(wù)。高精度是工業(yè)視覺(jué)檢測系統的一個(gè)關(guān)鍵性能指標,它對生產(chǎn)效率、產(chǎn)品質(zhì)量和企業(yè)信譽(yù)都有直接影響。
第三,低算力依賴(lài)。 在實(shí)際的生產(chǎn)環(huán)境中, AI檢測系統在執行圖像處理和分析任務(wù)時(shí)可用的計算資源相對較少,工業(yè)級AI視覺(jué)算法經(jīng)過(guò)專(zhuān)門(mén)的優(yōu)化,可以在相對性能有限的計算資源上完成高性能檢測。
這一時(shí)期的典型客戶(hù)群體主要是對新技術(shù)持開(kāi)放態(tài)度的企業(yè),它們通常面臨明顯的生產(chǎn)或質(zhì)量管控痛點(diǎn),并且愿意投資于前沿技術(shù)以獲得競爭優(yōu)勢。這些企業(yè)通常對AI有清晰的認識,能夠定義明確的需求邊界,并有能力進(jìn)行有效的數據和模型管理。
工業(yè)AI視覺(jué)1.0時(shí)代
在這一時(shí)期,從AI全面落地的角度,也僅僅算是解決了工業(yè)視覺(jué)中“可用”的問(wèn)題。
首先,數據困局明顯。 由于工業(yè)缺陷數據難以搜集,外加清洗、標注等成本偏高,使得AI模型的訓練和整理都變得充滿(mǎn)挑戰。
其次,部署周期長(cháng)。 較長(cháng)的上線(xiàn)部署周期,嚴重延緩了企業(yè)所需的應用速度。
而且,未知缺陷無(wú)法識別。 一些新的缺陷類(lèi)型難以識別,很大程度限制了AI的應用。
最后,昂貴的成本。 高昂的AI落地成本門(mén)檻使得只有具備一定支付能力的企業(yè)才可能采用這項技術(shù)。
總體而言,工業(yè)AI視覺(jué)1.0時(shí)代為工業(yè)AI視覺(jué)技術(shù)的未來(lái)發(fā)展奠定了基礎,盡管存在諸多挑戰,但通過(guò)不斷的技術(shù)創(chuàng )新和市場(chǎng)適應,AI視覺(jué)技術(shù)逐步從可用走向成熟。
2、工業(yè)AI視覺(jué)2.0時(shí)代:生成式AI及垂直細分通用模型,達到“好用”
工業(yè)AI視覺(jué)2.0時(shí)代的來(lái)臨,標志著(zhù)工業(yè)AI視覺(jué)技術(shù)的重要演進(jìn)。
基于Transformer神經(jīng)網(wǎng)絡(luò )的技術(shù)也在工業(yè)AI領(lǐng)域迅速發(fā)展,更強的通用性和泛化能力,可以把過(guò)去針對單一場(chǎng)景解決問(wèn)題擴展到可應對垂類(lèi)場(chǎng)景解決問(wèn)題。
具體來(lái)說(shuō),包括單場(chǎng)景的規模復制和多場(chǎng)景模型的泛化遷移,這為工業(yè)AI視覺(jué)的應用提供了更大的靈活性和擴展性,同時(shí)也大大降低了AI落地的成本。
同時(shí),這些轉變也會(huì )涉及到成像模組、算法模組以及自動(dòng)化模組的創(chuàng )新和簡(jiǎn)化,使得AI解決方案更加易于開(kāi)發(fā)及落地。
工業(yè)AI視覺(jué)2.0時(shí)代的客戶(hù)群體更加普遍,即客戶(hù)有明確的痛點(diǎn)、關(guān)注性?xún)r(jià)比,他們可從AI成本的進(jìn)一步下降中受益,使得AI視覺(jué)技術(shù)的應用擴展到更大規模。
工業(yè)AI視覺(jué)2.0時(shí)代
在工業(yè)AI視覺(jué)2.0時(shí)代,三大關(guān)鍵技術(shù)起到了重要作用。
(1)關(guān)鍵技術(shù)一:智能良品學(xué)習
阿丘科技認為,工業(yè)AI視覺(jué)2.0時(shí)代的關(guān)鍵技術(shù)之一即智能良品學(xué)習,它包括非監督分割和非監督分類(lèi)兩種模塊。這項技術(shù)可有效應對產(chǎn)線(xiàn)中出現的未知新缺陷,以及需要在極短的時(shí)間內完成模型部署和上線(xiàn)的問(wèn)題。
智能良品學(xué)習的核心優(yōu)勢在于,它只需利用良品圖像,就能夠對所有已知和未知的缺陷進(jìn)行像素級別的檢測和整圖分類(lèi),從而實(shí)現快速的上線(xiàn)驗證。目前,阿丘科技已將智能良品學(xué)習技術(shù)應用在數十個(gè)實(shí)際場(chǎng)景中,尤其適用于一些產(chǎn)線(xiàn)良品率高、樣本收集周期長(cháng)、可能面臨未知缺陷,以及產(chǎn)線(xiàn)上異常類(lèi)別檢測等場(chǎng)景。
然而,對于小缺陷場(chǎng)景,智能良品學(xué)習技術(shù)的效果仍有待提升。
關(guān)鍵技術(shù)一
智能良品學(xué)習技術(shù)展示了AI在工業(yè)視覺(jué)檢測領(lǐng)域中的巨大潛力,尤其是在快速適應產(chǎn)線(xiàn)變化和提高生產(chǎn)效率等方面。
(2)關(guān)鍵技術(shù)二:生成式AI——智能缺陷數據生成
在工業(yè)AI視覺(jué)2.0時(shí)代中的另一項關(guān)鍵技術(shù)即生成式AI——智能缺陷數據生成。
在以往方式中,搜集缺陷樣本數據需要花費數天甚至是數月時(shí)間,一旦產(chǎn)品換型,整個(gè)搜集過(guò)程又必須重新開(kāi)始。此外,搜集那些不常出現的長(cháng)尾缺陷(一年可能只出現一次),也為樣本收集帶來(lái)了巨大挑戰。
為了解決這些問(wèn)題,阿丘科技通過(guò)多年來(lái)在工業(yè)AI視覺(jué)領(lǐng)域的探索和實(shí)踐,利用積累的大量場(chǎng)景和經(jīng)驗,構建出預訓練模型。基于預訓練模型,結合具體場(chǎng)景的缺陷特征描述,通過(guò)Stable Diffusion框架,即可生成真實(shí)缺陷的仿真圖像。
這意味著(zhù),AI可以創(chuàng )造出接近真實(shí)情況的目標缺陷圖像,并能適應復雜結構缺陷、背景變化、缺陷邊緣處理等多樣場(chǎng)景,高度還原真實(shí)缺陷紋理、立體度和色彩細節等。
智能缺陷生成技術(shù)為工業(yè)視覺(jué)檢測系統提供了一個(gè)強大的工具,以便于在缺乏實(shí)際缺陷樣本的情況下,也能訓練和優(yōu)化模型,顯著(zhù)提高了模型的泛化能力與適應性。
關(guān)鍵技術(shù)二
(3)關(guān)鍵技術(shù)三:工業(yè)視覺(jué)大模型
關(guān)鍵技術(shù)三為工業(yè)視覺(jué)大模型,即專(zhuān)門(mén)針對工業(yè)應用領(lǐng)域而設計的算法模型,其構建和訓練需要利用Transformer,以及大量的領(lǐng)域特定數據。
工業(yè)視覺(jué)大模型具備領(lǐng)域泛化能力,能夠適應多變的工業(yè)環(huán)境,特別是單場(chǎng)景的規模復制和多場(chǎng)景模型的泛化遷移。
工業(yè)視覺(jué)大模型具有一定的垂直場(chǎng)景通用性,在特定領(lǐng)域可以有效降低AI算法開(kāi)發(fā)、訓練的成本,因此在智能制造和自動(dòng)化質(zhì)量控制方面的應用非常迅速。
關(guān)鍵技術(shù)三(部分素材來(lái)源Landing.AI)
從工業(yè)AI視覺(jué)1.0時(shí)代向工業(yè)AI視覺(jué)2.0時(shí)代轉變的過(guò)程,也是工業(yè)AI視覺(jué)從“可用”邁向“好用”的過(guò)程。
在“可用”的時(shí)代, “算法驅動(dòng)”是破局的關(guān)鍵,小樣本、AI算法、軟件工具鏈、AI落地方法論這些成為企業(yè)開(kāi)發(fā)和應用工業(yè)AI視覺(jué)的關(guān)鍵點(diǎn)。
在“好用”的時(shí)代, “以數據為中心”逐漸成為共識。高質(zhì)量的數據開(kāi)始作為構建強大AI算法的基礎,同時(shí),生成式AI算法能夠利用有限的數據樣本生成更多的可用數據,從而可以低成本達成AI模型訓練。
而且,工業(yè)AI視覺(jué)2.0時(shí)代將更強調平臺化,構建的AI平臺將包裹并整合以往的軟件、工具鏈和方法論等內容,解決企業(yè)中碎片化場(chǎng)景的應用問(wèn)題,助力AI技術(shù)在企業(yè)各個(gè)分支工廠(chǎng)、不同場(chǎng)景的落地應用。
在工業(yè)AI視覺(jué)2.0時(shí)代的革新浪潮中,阿丘科技希望能夠推動(dòng)工業(yè)AI視覺(jué)平臺及行業(yè)基礎模型在工業(yè)視覺(jué)領(lǐng)域的垂直應用,降低企業(yè)AI落地成本和難度,幫助企業(yè)實(shí)現智能化升級。
工業(yè)視覺(jué)AI從1.0時(shí)代到2.0時(shí)代
三、工業(yè)AI垂直行業(yè)視覺(jué)大模型的實(shí)踐落地
從2017年創(chuàng )業(yè)以來(lái),阿丘科技始終致力于將先進(jìn)的人工智能、機器視覺(jué)等技術(shù)應用于工業(yè)領(lǐng)域的智能化檢測。目前,已落地800+工廠(chǎng),標準工業(yè)AI視覺(jué)軟件批量部署套數10000+,獲得3C電子、動(dòng)力電池、PCB等行業(yè)50+標桿客戶(hù)的認可。在充滿(mǎn)生機的工業(yè)AI視覺(jué)2.0時(shí)代,阿丘科技秉持開(kāi)放的心態(tài),將已實(shí)際落地的AI垂直行業(yè)視覺(jué)大模型實(shí)踐與同行分享。
以工業(yè)視覺(jué)大模型在PCB行業(yè)中的實(shí)踐為例。
PCB(Printed Circuit Board,印制電路板)是現代電子產(chǎn)品制造中的核心組成部分,被廣泛用于計算機、手機、醫療設備、汽車(chē)、航空航天等眾多領(lǐng)域,PCB的設計和制造質(zhì)量直接影響到電子產(chǎn)品的性能。
隨著(zhù)技術(shù)的發(fā)展,PCB的設計工藝越來(lái)越復雜,缺陷種類(lèi)多達上百種,根據產(chǎn)品應用場(chǎng)景不同,其檢測情況也存在差異。
由于背景復雜,工藝屬性強,產(chǎn)品尺寸規格多樣,算法兼容適配難度大。PCB生產(chǎn)廠(chǎng)早期均采用基于傳統算法的AOI(自動(dòng)光學(xué)檢測)和 AVI(自動(dòng)視覺(jué)檢測)設備檢測PCB缺陷,設備調試復雜且誤報率高,需要大量人工對假點(diǎn)復判。平均一臺設備需要配置3-6名質(zhì)檢人員,人工復判的成本高、一致性差,質(zhì)量難以把控。
針對這些難點(diǎn),阿丘科技通過(guò)構建PCB行業(yè)垂直視覺(jué)大模型,通過(guò)三大步驟,落地實(shí)踐。
步驟一,數據積累。 阿丘科技收集了大量PCB行業(yè)現場(chǎng)的私有化部署缺陷數據,并進(jìn)行了部分缺陷的仿真,不僅實(shí)現了行業(yè)場(chǎng)景數據的積累,還覆蓋了上百種缺陷、細分類(lèi)別,準確率達到95%以上。同時(shí),基于阿丘科技AIDG智能缺陷生成工具,低成本、快速生成大量的缺陷樣本數據,滿(mǎn)足大模型訓練的需求。
步驟二:標準定義。 阿丘科技對各類(lèi)出貨檢測標準進(jìn)行匯總、整理和分級,逐步探索并確定了適用于PCB各交付場(chǎng)景的檢測標準。
步驟三:預制模型訓練。 在A(yíng)OI和AVI等場(chǎng)景中,阿丘科技使預制模型的覆蓋度達到了90%以上。
這一過(guò)程極大地提升了交付效率,將原本需要120天的流程縮短至14天。不僅極大縮短了數據處理時(shí)間,還使得模型可以更快更穩地上線(xiàn)。截止目前,阿丘科技AI垂直行業(yè)視覺(jué)大模型在PCB行業(yè)已經(jīng)導入了超過(guò) 100個(gè)工廠(chǎng),累計升級設備數超過(guò)1000臺,Top30的PCB客戶(hù)覆蓋率達到70%以上。
PCB行業(yè)案例
阿丘科技通過(guò)數據積累、標準定義和預制模型訓練,成功將AI垂直行業(yè)視覺(jué)大模型應用于PCB行業(yè),提升了PCB行業(yè)的工業(yè)視覺(jué)檢測效率,縮短了交付周期,通過(guò)流程優(yōu)化,提高了數據處理速度及模型穩定性。同時(shí),阿丘科技也會(huì )繼續擴大在工業(yè) AI 垂直行業(yè)的技術(shù)能力,進(jìn)一步深化和拓展其視覺(jué)大模型的應用范圍,實(shí)現更高效的模型訓練和更精準的缺陷檢測,以滿(mǎn)足市場(chǎng)對快速響應和高效生產(chǎn)的需求。
作為AI+工業(yè)先行者,阿丘科技將繼續保持創(chuàng )新,不斷將最前沿的AI技術(shù)應用于工業(yè)領(lǐng)域,為行業(yè)帶來(lái)驚艷的AI產(chǎn)品解決方案,推動(dòng)AI從可用變得好用。攜手行業(yè)伙伴一同推動(dòng)AI for Every Factory!
相關(guān)稿件