近日,北京市經(jīng)濟和信息化局舉辦了AIGC(生成式人工智能)產(chǎn)業(yè)鏈專(zhuān)精特新企業(yè)融通路演活動(dòng),并正式發(fā)布《AIGC產(chǎn)業(yè)鏈北京市專(zhuān)精特新企業(yè)圖譜》(下稱(chēng)《圖譜》)。云測數據憑借豐富的高質(zhì)量人工智能數據服務(wù)經(jīng)驗和前沿數據平臺技術(shù)能力,入選《圖譜》數據層代表企業(yè)。
《圖譜》顯示,在A(yíng)IGC產(chǎn)業(yè)鏈領(lǐng)域,北京市走在全國前列,在算力、數據、場(chǎng)景、投資、人才等方面優(yōu)勢顯著(zhù),并有57家優(yōu)質(zhì)專(zhuān)精特新企業(yè)處在重要產(chǎn)業(yè)節點(diǎn),包括算力層14家、數據層11家、模型層10家、應用層22家。北京市經(jīng)濟和信息化局表示,入選《圖譜》的專(zhuān)精特新企業(yè)致力于突破算力芯片、中文數據集、深度學(xué)習框架等領(lǐng)域的卡點(diǎn)和堵點(diǎn),為AIGC產(chǎn)業(yè)鏈強鏈、補鏈、固鏈貢獻力量,推動(dòng)中國AIGC行業(yè)高質(zhì)量發(fā)展。
云測數據作為人工智能產(chǎn)業(yè)發(fā)展的重要參與者和建設者,正在不斷用前沿技術(shù)推動(dòng)AI訓練數據服務(wù)領(lǐng)域加速發(fā)展,自成立以來(lái)始終堅持以技術(shù)創(chuàng )新加速行業(yè)發(fā)展為己任,立足扎根市場(chǎng)的實(shí)踐積累,在保障數據隱私和安全合規的前提下,進(jìn)行前瞻業(yè)務(wù)布局與前沿技術(shù)能力探索,持續為智能駕駛、智慧城市、智能家居、智慧金融等眾多領(lǐng)域提供高質(zhì)量數據集、數據采集/數據標注服務(wù)、數據標注平臺&數據管理工具等,全方位支持文本、語(yǔ)音、圖像、視頻等各類(lèi)型數據的處理。
當前,5G、邊緣計算等新基礎設施建設加速,自動(dòng)駕駛、智慧醫療、智能制造等領(lǐng)域對人工智能的廣泛應用需求,大模型作為當前人工智能技術(shù)發(fā)展的關(guān)鍵方向,正在引領(lǐng)產(chǎn)業(yè)變革和產(chǎn)生深遠影響。與此同時(shí),大模型也面臨訓練成本高、應用場(chǎng)景單一、缺乏高質(zhì)量細分領(lǐng)域數據等難題。,海量高質(zhì)量AI數據的獲取和處理能力,將直接影響一個(gè)機構在大模型技術(shù)上的競爭力。此前,云測數據已推出垂直行業(yè)大模型AI數據解決方案,為行業(yè)大模型提供從持續預訓練、任務(wù)微調、評測聯(lián)調測試到應用發(fā)布的端到端過(guò)程中的高質(zhì)高效數據。
多年的人工智能數據服務(wù)經(jīng)驗與技術(shù)積累,云測數據早已打造了豐富的數據樣本資源池以及多維數據采集工具和流水線(xiàn)作業(yè)化的數據清洗工作平臺,可以基于企業(yè)要求提供定向垂直場(chǎng)景的數據服務(wù),為大模型持續訓練賦能。云測數據垂直行業(yè)大模型數據解決方案,可以為行業(yè)客戶(hù)深度定制數據采集方案,助力獲取高價(jià)值數據,在面對微調任務(wù)會(huì )根據大模型落地場(chǎng)景特點(diǎn),提供包含QA-instruct、prompt等文本類(lèi)任務(wù)項目和多模態(tài)大模型的相關(guān)能力支持。在完成微調后,云測數據通過(guò)垂直領(lǐng)域的人員和專(zhuān)家積累+評測體系和服務(wù),幫助企業(yè)對各個(gè)垂直應用落地領(lǐng)域進(jìn)行評估。并通過(guò)以集成數據底座為核心的數據標注平臺,將難例數據回流完成清洗標注,為更有效率的模型調優(yōu)做準備。
目前,云測數據已率先形成了人工智能數據的“采、標、管、存一站式服務(wù)”,結合豐富的行業(yè)經(jīng)驗、產(chǎn)研技術(shù)投入、管理體系等,持續為計算機視覺(jué)、語(yǔ)音識別、自然語(yǔ)言處理、知識圖譜等AI主流技術(shù)領(lǐng)域提供高價(jià)值數據支持。深度合作伙伴覆蓋了多個(gè)行業(yè),包括汽車(chē)、安防、手機、家居、金融、教育、新零售、生態(tài)系統等。
相關(guān)稿件