人民網
人民網>>上海頻道

世界人工智能大會舉辦首場語料論壇,開啟中國AI新時代

2024年07月06日17:39 | 來源:人民網-上海頻道
小字號

人民網上海7月6日電 (記者唐小麗)高質量、大規(guī)模、安全可信的語料數(shù)據資源是AI時代的重要基石。7月6日上午,2024世界人工智能大會語料主題論壇在上海世博中心舉辦。

論壇現(xiàn)場。人民網記者 王初攝

上海市各相關部門代表、上海人工智能實驗室、人民網、上海報業(yè)、上海圖書館、上海信投、上海算法創(chuàng)新研究院、中國信通院、復旦大學、華東師范大學以及近1000家大模型語料生態(tài)企業(yè)參會。

本次論壇以“語料筑基,智生時代”為主題,圍繞高質量語料數(shù)據如何高效供給賦能大模型產業(yè)發(fā)展,向市場傳遞專業(yè)化、鏈接型、前瞻性的語料生態(tài)設計理念。

大模型與大數(shù)據庫雙輪驅動,讓其成長為符合人類共同價值的“好孩子”

隨著AI技術的不斷進步和生態(tài)合作的深化,未來數(shù)據庫將更加智能、靈活和強大,為人工賦能千行百業(yè)的實體經濟發(fā)展提供堅實基礎。

主旨演講環(huán)節(jié)中,中國科學院院士鄂維南帶來主題為“大模型與大數(shù)據庫雙輪驅動的人工智能方法”的演講。鄂維南院士分享了如何將大模型方法和高性能的通用AI數(shù)據庫方法相結合,來建立高效率、高準確率、低門檻、低成本的人工智能系統(tǒng)。

鄂維南發(fā)表主旨演講。人民網記者 王初攝

與價值對齊是大模型可持續(xù)演進的基石。主旨演講環(huán)節(jié)中,人民網黨委書記、董事長葉蓁蓁分享了“基于價值對齊的模型發(fā)展與語料數(shù)據的創(chuàng)新供給”。他重點分享了人民網在主流價值對齊方面的實踐與經驗,基于多維度價值對齊體系的語料庫,讓大模型像人一樣“有德、有趣、有序、有品、有用”,成長為符合人類共同價值的“好孩子”。

語料運營平臺1.0上線,首批十大高質量語料產品發(fā)布

今天的論壇上,發(fā)布了“語料運營平臺1.0”,實現(xiàn)了面向語料數(shù)據“采、洗、標、測、用”五位一體的工具鏈能力。旨在對照最高標準、最好水平,打造世界一流的語料樞紐,實現(xiàn)更高效率、更高質量的語料供給。

語料運營平臺1.0發(fā)布。大會主辦方供圖

為打響高質量語料品牌,進一步激發(fā)市場主體語料創(chuàng)新活力,增強供給側能級,加速醫(yī)療健康、城市交通、消費零售等重點行業(yè)的大模型產業(yè)發(fā)展,會上,上海庫帕思科技有限公司攜手咪咕視頻、寶信軟件、復旦大學智能醫(yī)學研究院、上海工創(chuàng)中心等集中發(fā)布了十大語料數(shù)據產品。

語料數(shù)據產品發(fā)布。人民網記者 王初攝

首個語料庫建設導則面世,三大領域技術白皮書發(fā)布

語料數(shù)據是人工智能研究和應用不可或缺的資源,高質量語料庫更是人工智能賦能新質生產力的關鍵。大模型賦能千行百業(yè),需要構建與場景適配的語料體系,需要規(guī)則與實踐的“并跑”。本次論壇中還發(fā)布了金融、生命健康、教育三項行業(yè)語料技術白皮書。

三大領域語料技術白皮書發(fā)布。人民網記者 王初攝

為實現(xiàn)“語料數(shù)據資源共建共享”“鼓勵多元主體共同推動高水平語料數(shù)據要素建設”的目標,庫帕思公司會同覆蓋多模態(tài)數(shù)據資源供應、加工、應用和運營全鏈的近二十家企業(yè)共同發(fā)布了團體標準《語料庫建設導則》。

《語料庫建設導則》發(fā)布。人民網記者 王初攝

50余家單位共同發(fā)起語料倡議,2024語料風云榜發(fā)布

為進一步強化語料生態(tài)全產業(yè)鏈各主體間的交流合作,營造有利于我國大模型產業(yè)生態(tài)健康發(fā)展的環(huán)境,會上,50余家單位共同發(fā)起“語料生態(tài)服務大模型可持續(xù)發(fā)展倡議”,共同倡導攜手為我國大模型產業(yè)發(fā)展持續(xù)提供高質量語料。

50余家單位共同發(fā)起語料倡議。大會主辦方供圖

為加速促進大模型語料生態(tài)企業(yè)按照高標準發(fā)現(xiàn)“好產品”、培育“好企業(yè)”,本次論壇上,大模型語料數(shù)據聯(lián)盟正式發(fā)布“2024語料風云榜”,該榜單經過前期征集,嚴格評選,最終遴選出10家上榜企業(yè)。分別是:上海恒生聚源數(shù)據服務有限公司、上海本原智數(shù)科技有限公司、北京云測信息技術有限公司、上海蜜度科技股份有限公司、星環(huán)信息科技(上海)股份有限公司、數(shù)據堂(北京)科技股份有限公司、整數(shù)智能信息技術(杭州)有限責任公司、標貝(青島)科技有限公司、北京海天瑞聲科技股份有限公司、天娛數(shù)字科技(大連)集團股份有限公司。

2024語料風云榜發(fā)布。人民網記者 王初攝

共話未來,我們需要怎樣的語料供給?

企業(yè)案例分享環(huán)節(jié)中,上海階躍星辰智能科技有限公司副總裁李璟、游族網絡CEO陳芳兩家大模型語料生態(tài)企業(yè)代表,從企業(yè)如何在生成式人工智能時代通過提升高質量語料的開發(fā)利用來賦能業(yè)務發(fā)展。

圓桌論壇現(xiàn)場。人民網記者 王初攝

語料數(shù)據在大模型開發(fā)中起到了決定性作用,是模型能力提升的關鍵基礎。在提升通用大模型及垂直行業(yè)模型應用能力方面,什么樣的語料供給是最有價值又最被需要的?

在圓桌環(huán)節(jié)中,來自上海本原智數(shù)的創(chuàng)始人李逆勇作為圓桌主持人,提出了大模型的出現(xiàn)對于語料供給帶來了哪些新的機會和挑戰(zhàn)、數(shù)據的自動化標注與人工標注現(xiàn)況趨勢及合成數(shù)據的未來三個問題。華為上海代表處戰(zhàn)略官房思哲,北京星塵紀元智能科技有限公司總裁章磊,標貝(青島)科技有限公司聯(lián)合創(chuàng)始人、首席技術官李秀林,智境云創(chuàng)創(chuàng)始人、CEO王智武,中云開源數(shù)據技術(上海)有限公司創(chuàng)始人、CEO陳剛進行了觀點分享和思想碰撞。

(責編:唐小麗、軒召強)

分享讓更多人看到

返回頂部