數字時(shí)代,以大模型為代表的新一代人工智能作為國家重大戰略需求,是支撐并強化更高水平人機智能協(xié)同的關(guān)鍵技術(shù)方向。特別地,大模型在數據、信息、知識、智慧的跨鏈增值上,已呈現“智能涌現”的規?;瘍?yōu)勢,并且這些功能可以輔助并強化人類(lèi)工作的知識性助益?;诖竽P偷闹R助手,是當前商業(yè)價(jià)值最大化而潛在風(fēng)險最小化的大模型落地場(chǎng)景,能夠廣泛提升人與AI應用協(xié)同工作的體驗與效率,實(shí)現工作效益的切實(shí)變革。
北京中關(guān)村科金技術(shù)有限公司(簡(jiǎn)稱(chēng)“中關(guān)村科金”),已實(shí)現大模型知識助手在企服賽道的成功切入。中關(guān)村科金通過(guò)自主研發(fā)的領(lǐng)域大模型、大數據智能搜索、多模態(tài)文檔解析等關(guān)鍵技術(shù),在知識問(wèn)答、知識構建、知識歸納、知識推薦等核心場(chǎng)景,實(shí)現高效率、低成本、規?;膹娙斯ぶ悄軇?chuàng )新應用,打通企業(yè)知識應用的“最后一公里”。
一、大模型時(shí)代下的新型人機協(xié)同,知識助手成功開(kāi)啟商業(yè)藍海
當前,以大模型為代表的通用人工智能正在飛速演進(jìn),正在成為重組數據要素資源、重塑人機協(xié)同新型生產(chǎn)關(guān)系的關(guān)鍵力量。較短時(shí)間內,基礎大模型的研究和發(fā)布呈蓬勃發(fā)展態(tài)勢,接下來(lái)將進(jìn)一步呈現商業(yè)落地的競速比拼。
然而,大模型的落地時(shí)間表還與具體場(chǎng)景要求息息相關(guān)。大模型的商業(yè)化變現仍面臨幻覺(jué)傾向、數據偏向、準確率不足等挑戰,需根據具體商用場(chǎng)景甄別實(shí)際風(fēng)險,從而制定相關(guān)技術(shù)路線(xiàn)和制度規范體系。
根據落地場(chǎng)景的容錯性和通用性要求,大模型知識助手將率先開(kāi)啟商業(yè)藍海。具體而言,可以按照容錯性、通用性?xún)蓚€(gè)維度將應用場(chǎng)景劃分為以下四個(gè)象限(如圖1所示)。其中,服務(wù)企業(yè)內部員工的知識助手,既具備專(zhuān)業(yè)性、又具有較高的容錯性,是短時(shí)間內大模型技術(shù)落地應用的最佳切入點(diǎn)。
圖1:應用場(chǎng)景劃分
二、聚焦效率與體驗,大模型知識助手已成三大應用模式
基于大模型的知識助手,能夠提供面向搜索的精準問(wèn)答,從而打造企業(yè)知識應用的新范式。尤其是,對比傳統企業(yè)知識庫、QA機器人等傳統知識管理手段,大模型知識助手能夠帶來(lái)知識歸納、構建、問(wèn)答、推薦等全流程效率和體驗變革。一方面降低知識歸納和構建過(guò)程的成本,特別是現有信息抽取模型技術(shù)的大量標注、定制化開(kāi)發(fā)模型時(shí)間長(cháng)、純人工總結的私域數據規模太大等難題;另一方面提升服務(wù)問(wèn)答和推薦環(huán)節的問(wèn)題覆蓋范圍,避免語(yǔ)義理解環(huán)節的匹配度低、無(wú)法覆蓋長(cháng)尾等問(wèn)題。
圖2:傳統知識庫架構
大模型知識助手,可以由淺至深分為三種應用模式,如圖3所示:
一是“通用大模型+提示工程”。對于知識總量有限、專(zhuān)業(yè)性要求不高的企業(yè),可以直接使用通用大模型,針對企業(yè)具體的場(chǎng)景需求,由業(yè)務(wù)專(zhuān)家探索出提示詞,此時(shí)企業(yè)需要的是一套靈活好用的提示詞管理工具。
二是“通用大模型+領(lǐng)域知識庫+提示工程”。對于長(cháng)尾碎片知識(如SKU)較多的企業(yè),需要在通用大模型的基礎上,外掛領(lǐng)域知識庫,針對具體場(chǎng)景、企業(yè)特有的問(wèn)題可以讓大模型去知識庫里找答案,最后再在提示詞的引導與約束下返回輸出結果。
三是“領(lǐng)域大模型+領(lǐng)域知識庫+提示工程”。對于領(lǐng)域常識總量大的企業(yè),需要構建企業(yè)專(zhuān)屬的領(lǐng)域大模型,將領(lǐng)域里的通識輸入到大模型的“大腦”里,既保持通用的常識和推理,又具備領(lǐng)域內的專(zhuān)業(yè)知識和技能,讓大模型由本科生變成領(lǐng)域專(zhuān)家。
圖3:大模型知識助手的三種模式與四項挑戰
目前,中關(guān)村科金基于領(lǐng)域大模型的知識助手產(chǎn)品已在和諾亞財富的合作中得以應用。中關(guān)村科金通過(guò)融合自研的金融領(lǐng)域大模型、智能客服等人工智能技術(shù),為諾亞財富打造的智能知識庫,具備多模態(tài)文檔分析、QA問(wèn)答對自動(dòng)抽取、知識內容自動(dòng)標簽化處理能力。通過(guò)集成諾亞財富的企業(yè)微信和旗下財富管理平臺iNoahAPP應用,為其員工和用戶(hù)提供基于企業(yè)知識文檔的智能問(wèn)答查詢(xún)功能。通過(guò)大模型技術(shù)為智能客服產(chǎn)品賦能,大幅提升客服系統問(wèn)答意圖識別準確率和回復準確率,預期后期可減少70%以上的系統運營(yíng)工作,有效幫助企業(yè)降本增效。
三、風(fēng)險與價(jià)值的雙向平衡,核心攻關(guān)四大技術(shù)能力
中關(guān)村科金憑借領(lǐng)先的AI技術(shù)實(shí)力、系統的解決方案能力、深度的行業(yè)服務(wù)經(jīng)驗,研發(fā)與企業(yè)用例的整體風(fēng)險容忍度相一致的知識助手,并且完善相關(guān)技術(shù)路線(xiàn)和參與共建行業(yè)制度規范以減輕相應風(fēng)險。在知識助手的基礎上,公司研發(fā)“基于大規模語(yǔ)言模型的營(yíng)銷(xiāo)助手”,榮獲中國信通院2023可信AI案例大模型研發(fā)應用和工具平臺優(yōu)秀案例,并且設計“企業(yè)超級員工”成功入選“2023WAIC全球創(chuàng )新項目路演TOP20榜單”。目前,中關(guān)村科金可為企業(yè)提供開(kāi)箱即用、系統無(wú)縫銜接、成本可負擔的大模型服務(wù)。
圖4:知識助手產(chǎn)品示意圖
中關(guān)村科金聚焦形成四項核心技術(shù)能力,以平衡大模型的風(fēng)險防范與價(jià)值創(chuàng )造。
一是避免產(chǎn)生幻覺(jué)(Hallucination)傾向的外掛知識庫技術(shù)?;糜X(jué)傾向是指大模型經(jīng)常生成一些看似合理、實(shí)在不符合事實(shí)的語(yǔ)句。有時(shí)杜撰出來(lái)的信息一看便知真假,有時(shí)則讓人一時(shí)無(wú)法分清事實(shí)?;糜X(jué)是目前大模型的一項固有屬性,中關(guān)村科金通過(guò)外掛知識庫在很大程度上杜絕該現象。
二是領(lǐng)先的多模態(tài)文檔解析技術(shù)。企業(yè)內高頻、事實(shí)性知識(KnowWhat)往往存儲于結構化數據庫中,流程性知識(KnowHow)和一些低頻事實(shí)性知識往往存在于非結構文檔中,如:產(chǎn)品手冊、操作規章、培訓視頻等。這類(lèi)數據以往只能打上一些粗粒度標簽,中關(guān)村科金通過(guò)自研的ASR、OCR等預處理后,能夠做結構化的解析和表示,輸入到大模型中實(shí)現細粒度的語(yǔ)義理解和流程挖掘。
三是基于大數據智能的思維鏈歸納技術(shù)。企業(yè)內外部真實(shí)問(wèn)答場(chǎng)景中,往往流程性知識問(wèn)答占比較高,中關(guān)村科金通過(guò)自主研發(fā)的領(lǐng)域大模型,從文檔中的顯性文字描述中理解這類(lèi)知識、從日志中的隱性事件中挖掘出這類(lèi)知識,實(shí)現了優(yōu)于傳統技術(shù)的增值點(diǎn)。
四是避免災難性遺忘的領(lǐng)域模型訓練技術(shù)。領(lǐng)域常識注入通用大模型的過(guò)程中,往往造成大模型通用能力的下降,中關(guān)村科金通過(guò)訓練數據和訓練任務(wù)等一系列技巧,可以使其在具體任務(wù)上性能顯著(zhù)提升且保持通用性。
大模型是大勢所趨,所有業(yè)務(wù)或場(chǎng)景都會(huì )涉及其中。目前,知識助手是企業(yè)服務(wù)賽道上最佳的切入點(diǎn)。未來(lái),在其合規性、安全性、可解釋性等得到保障并贏(yíng)得用戶(hù)的數字信任后,可進(jìn)一步布局營(yíng)銷(xiāo)、客服、運營(yíng)等全鏈業(yè)務(wù)生態(tài),實(shí)現新型人機協(xié)同的價(jià)值釋放。
相關(guān)稿件