首個語料庫建設導則面世!近二十家企業(yè)共同發(fā)布
人民網(wǎng)上海7月6日電 (記者唐小麗)高質(zhì)量、大規(guī)模、安全可信的語料數(shù)據(jù)資源是AI時代的重要基石。7月6日上午,2024世界人工智能大會語料主題論壇在上海世博中心舉辦。
本次論壇以“語料筑基,智生時代”為主題,圍繞高質(zhì)量語料數(shù)據(jù)如何高效供給賦能大模型產(chǎn)業(yè)發(fā)展,向市場傳遞專業(yè)化、鏈接型、前瞻性的語料生態(tài)設計理念。
《語料庫建設導則》發(fā)布。人民網(wǎng)記者 王初攝
為實現(xiàn)“語料數(shù)據(jù)資源共建共享”“鼓勵多元主體共同推動高水平語料數(shù)據(jù)要素建設”的目標,上海庫帕思科技有限公司會同覆蓋多模態(tài)數(shù)據(jù)資源供應、加工、應用和運營全鏈的近二十家企業(yè)共同發(fā)布了團體標準《語料庫建設導則》。
本次論壇中還發(fā)布了金融、生命健康、教育三項行業(yè)語料技術(shù)白皮書。
三大領(lǐng)域語料技術(shù)白皮書發(fā)布。人民網(wǎng)記者 王初攝
《高質(zhì)量金融語料技術(shù)白皮書》聚焦銀行、證券、保險、基金等行業(yè)實踐,重新定義了高質(zhì)量金融語料數(shù)據(jù)集的內(nèi)涵和外延,形成了基于金融領(lǐng)域知識體系的“語料魔方”方法論。
《教育人工智能大模型數(shù)據(jù)治理與共享技術(shù)白皮書》對標國內(nèi)外教育數(shù)據(jù)的系列政策、標準,確立了教育行業(yè)語料數(shù)據(jù)的標準用例與價值體系,形成了一套教育AI大模型數(shù)據(jù)治理與共享技術(shù)標準。
《高質(zhì)量生命健康語料技術(shù)白皮書》從基礎醫(yī)學、藥物研發(fā)、臨床醫(yī)學、健康管理、中醫(yī)中藥五個方向確立了生命健康語料庫的路線圖,創(chuàng)新了從尋源、清洗到標注、測試的工具體系。
分享讓更多人看到