人民網(wǎng)
人民網(wǎng)>>上海頻道>>要聞

大江東|誰將“生成未來”?聽業(yè)界大咖展望人工智能新趨勢

人民日報中央廚房-大江東工作室謝衛(wèi)群 黃曉慧 沈文敏
2023年07月10日08:59 |
小字號

大模型將引領新一輪的科技革命還是一陣風的投資泡沫?大模型訓練需要海量數(shù)據(jù)和強勁算力支撐,擁有優(yōu)質(zhì)的數(shù)據(jù)資源就勝券在握了嗎?作為人工智能領域的行業(yè)盛會,每年的世界人工智能大會都是觀察產(chǎn)業(yè)方向的觀測臺和找準行業(yè)航標的瞭望塔,今年亦是如此。

2023世界人工智能大會以“智聯(lián)世界 生成未來”為主題。把“生成”寫入主題,呼應了當前人工智能領域的一大熱點。無論世博展覽館5萬平方米主展覽區(qū)內(nèi)超400家企業(yè)展示的硬核炫技,還是1400多名業(yè)界大咖、頂尖大腦云集的上百場論壇活動,嘉賓觀眾、場內(nèi)場外,三句話不離“大模型”,大模型與生成式人工智能(AIGC)無疑是本屆世界人工智能大會當仁不讓的絕對主角。

且聽海內(nèi)外專家學者、領軍企業(yè)如何展望人工智能新趨勢。

“群模大戰(zhàn)”誰主沉???人類原創(chuàng)思想無可取代,核心技術(shù)競爭將更激烈

上海世博中心,2023世界人工智能大會現(xiàn)場人頭攢動

自2022年11月ChatGPT引爆“生成式人工智能熱”以來,能夠根據(jù)提示生成文本、圖像或其他信息的人工智能系統(tǒng),就成為國內(nèi)各大科技公司競逐的新賽道,不少科技公司都公布了自己的大模型。5月底,科技部新一代人工智能發(fā)展研究中心等機構(gòu)發(fā)布的《中國人工智能大模型地圖研究報告》顯示,當前國內(nèi)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個。僅從大模型數(shù)量上看,中國有“群模大戰(zhàn)”之勢,但尚未出現(xiàn)現(xiàn)象級的“突圍”大模型。

2023世界人工智能大會啟明創(chuàng)投論壇發(fā)布的報告《生成式AI》認為,生成式人工智能,在中國似乎受到了更加熱情的接納:政府鼓勵發(fā)展通用人工智能;任何一家大企業(yè)都無法不關注它;許多從事知識工作的中小企業(yè),已經(jīng)先用起來再說。面對這一革命性的技術(shù),許多企業(yè)都被卷入。它們節(jié)奏不同,介入程度不同,成為新技術(shù)浪潮下的守成者、創(chuàng)新者、采納者。

有專家認為,中國經(jīng)濟對高質(zhì)量發(fā)展的需求,從過去資源驅(qū)動發(fā)展升級到數(shù)智創(chuàng)新驅(qū)動的應用,都在推動數(shù)智技術(shù)廣泛落地應用,顛覆性AI產(chǎn)品的相繼出現(xiàn),使得從基礎軟硬件架構(gòu)、核心算法到應用場景等領域的核心技術(shù)競爭將更加激烈。

在大會產(chǎn)業(yè)發(fā)展論壇上,由中國科學技術(shù)信息研究所發(fā)布的《2022全球人工智能創(chuàng)新指數(shù)報告》顯示,中國在網(wǎng)絡基礎、人才、教育、創(chuàng)新制度、專利等方面排名上升,其中科學和工程博士占比、人工智能專利授權(quán)量、AI上市企業(yè)數(shù)量等多個指標進步顯著,躍升榜首。但同時,數(shù)據(jù)和網(wǎng)絡基礎指標表現(xiàn)較弱,公共數(shù)據(jù)質(zhì)量和開放度不高,網(wǎng)絡基礎多個指標仍處于參評國家的中等偏下水平。

南洋理工大學計算機科學與工程學院助理教授潘新鋼在科學前沿論壇上表示,大模型擅長模仿人的推理,可以替代人的機械勞動、推理任務,但還達不到人類從0到1的創(chuàng)新能力,大模型的出現(xiàn)更加彰顯人類原始創(chuàng)新能力的不可替代性和重要性。

大模型參數(shù)規(guī)模持續(xù)倍增,優(yōu)質(zhì)數(shù)據(jù)、澎湃算力更為重要

上海世博展覽館,觀眾觀看機器人群舞表演

一個優(yōu)秀的大模型需要大量優(yōu)質(zhì)數(shù)據(jù)和優(yōu)質(zhì)反饋。ChatGPT的出現(xiàn)和大模型的涌現(xiàn),在很多人看來是石破天驚之舉,但在微軟全球資深副總裁侯陽看來,這是全世界無數(shù)優(yōu)秀科研人員日復一日的研究基礎以及海量計算資源的投入,才造就的創(chuàng)新成果。

侯陽表示,從2019年開始,微軟就跟OpenAI展開深度合作,以海量的云計算資源,支持OpenAI大語言模型的研究,也正是微軟智能云提供的基礎架構(gòu)和算力支持,才有了OpenAI ChatGPT的突破。

隨著生成式人工智能走向通用人工智能(AGI)時代,優(yōu)質(zhì)數(shù)據(jù)“投喂”與“訓練”在呈指數(shù)級增長?!癈hatGPT-3計算量約有幾千億個數(shù)據(jù)點,單次訓練耗電量1287兆瓦時,從能耗來說相當于開車往返地球到月球一次,約花費500萬-1000萬美元。ChatGPT-1的訓練只有1.7億個數(shù)據(jù)點,到了ChatGPT-4超過1萬億個數(shù)據(jù)點,生成式人工智能對算力的需求是指數(shù)級的增長。”在大會人工智能應用創(chuàng)新論壇上,哈工大人工智能研究院院長劉劼教授以ChatGPT的迭代“進化”為例,說明生成“生成式人工智能”所消耗之巨大——大模型研發(fā)依然是一件很“燒錢”的事。

在“雙碳”的時代背景下,模型在算力層面對能源和環(huán)境的影響尤為值得關注。在大會主論壇科學前沿全體會議上,圖靈獎得主大衛(wèi)·帕特森也表達了近似的觀點:當前訓練某一模型需要產(chǎn)生大量碳排放,如果進一步提升模型準確度,排放數(shù)字可能會更大。而在未來,研究人員有望從模型、硬件、數(shù)據(jù)中心能效、數(shù)據(jù)中心位置等四方面協(xié)同著手,大幅降低機器學習的能耗與碳排放。

高質(zhì)量的數(shù)據(jù)對大模型訓練至關重要,不僅會提升訓練的效率,還能降低能耗,劉劼提醒說,“盡管各個大模型用的訓練數(shù)據(jù)不盡相同,但大多數(shù)都把高質(zhì)量、成熟的文獻作為訓練的基礎,訓練數(shù)據(jù)大多采用從網(wǎng)站上、標準對話數(shù)據(jù)集收集而來的新聞、科學文獻、代碼,基本上不會采用社交網(wǎng)絡上的信息?!?/p>

賦能千行百業(yè),人工智能應用落地將更快更高效

工作人員展示使用動捕設備驅(qū)動虛擬人

ChatGPT的橫空出世,讓人們對生成式人工智能、具身智能等賦能千行百業(yè)、延伸人間百態(tài),抱著無盡的期許。誠然,AI吟詩作畫、下棋陪聊、看病抓藥早已不是什么吸引眼球的新鮮技能,如華為輪值董事長胡厚崑在大會開幕式上所言,人工智能的發(fā)展,關鍵要“走深向?qū)崱?,賦能產(chǎn)業(yè)升級,服務好千行百業(yè)、服務好科學研究。

NewOrigin大模型的研發(fā)領軍人、清華大學智能產(chǎn)業(yè)研究院卓越訪問教授、分子之心創(chuàng)始人許錦波教授表示,AI蛋白質(zhì)生成大模型瞄準創(chuàng)新藥設計、合成生物學等真實產(chǎn)業(yè)應用需求,將用一個模型滿足蛋白質(zhì)生成全流程需求,未來大分子藥、新生物材料等蛋白質(zhì)設計可實現(xiàn)“一鍵定制”。

據(jù)介紹,NewOrigin大模型通過學習千億級多模態(tài)大數(shù)據(jù),可實現(xiàn)多模態(tài)定向生成,單模型就能滿足序列生成、結(jié)構(gòu)預測、功能預測、從頭設計等蛋白質(zhì)生成全流程需求,解決產(chǎn)業(yè)應用所需的特定功能蛋白質(zhì)生成難題,并在真實的產(chǎn)業(yè)環(huán)境中評估效果與價值。

騰訊集團高級執(zhí)行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生認為,大模型正推動AI在產(chǎn)業(yè)中的應用進入“深水區(qū)”,“AI可以成為我們的智能助手,比如客服助手、代碼助手、工業(yè)質(zhì)檢助手等,在質(zhì)量與效率都可以做到更好?!?/p>

在世博展覽館,國網(wǎng)智能電網(wǎng)研究院發(fā)布了電力設備知識計算及服務引擎等三項新成果。如何在大模型時代讓全世界規(guī)模最龐大的電力系統(tǒng)變得更加聰明、綠色,是國網(wǎng)智能電網(wǎng)研究院計算及應用研究所所長周飛一直思考的問題?!拔覈娏ο到y(tǒng)是世界上規(guī)模最大、結(jié)構(gòu)最復雜、能源轉(zhuǎn)型最快的人造巨系統(tǒng),在電力平衡、系統(tǒng)調(diào)控、設備運維、人員作業(yè)等方面存在諸多挑戰(zhàn),需借助先進人工智能技術(shù)提升狀態(tài)感知、運行認知、控制決策的智能化水平。”他認為,數(shù)字化和能源科技革命兩股浪潮的疊加帶來新的機遇,能源行業(yè)與大模型公司合作,“量身”訓練能源領域的大模型,將為數(shù)實融合尋找可行的新路徑。

有關專家指出,基于大模型的應用程序編程接口服務(API),會為下游廣泛的行業(yè)應用和創(chuàng)新生態(tài)提供數(shù)智化能力。隨著AI技術(shù)的迭代發(fā)展,開源大模型和生成式人工智能社區(qū)的建設,AI落地效率將進一步提升。具備通用領域能力的大模型將顯著降低針對特定領域進行定制化開發(fā)的成本,提高AI算法的應用效果。各行業(yè)應用AI技術(shù)的門檻將大幅降低,廣大AI從業(yè)者甚至技術(shù)“小白”們都可以便捷使用最新的AI技術(shù),解決生活中、工作上遇到的問題。

湯道生認為,AI產(chǎn)業(yè)應用將邁向“寬場景”,開放共建、合作共贏是實現(xiàn)AI大規(guī)模產(chǎn)業(yè)落地的關鍵。未來,隨著很多企業(yè)逐步邁向智能化,AI的應用從老百姓的吃喝玩樂、衣食住行,到企業(yè)工廠的生產(chǎn)、銷售、服務、辦公都會覆蓋,場景足夠?qū)拸V?!安粫幸患夜灸軌虬鼣埲抗ぷ鳎珹I生態(tài)特別需要合作開放。同時,AI也是一個‘長期賽道’,不是短暫的風口,耐心和信心一樣重要?!睖郎鷱娬{(diào)。

AI會被“教唆使壞”?治理和規(guī)范需要AI生態(tài)更加開放多元

7月6日,在2023世界人工智能大會上,美國國家工程院外籍院士沈向洋、電氣與電子工程師協(xié)會主席兼首席執(zhí)行官賽義夫·拉曼進行對話

大模型的誤導、以假亂真、指鹿為馬,虛假信息的傳播,信息裸奔導致隱私泄露......甚至有專家擔心AI會被教唆使壞,如果“投喂”給大模型的數(shù)據(jù)有問題,大模型很快會被教壞了,因為它自身并沒有像人類一樣的價值判斷體系和法律監(jiān)管體系。

今年4月,國家網(wǎng)信辦正式發(fā)布《生成式人工智能服務管理辦法(征求意見稿)》,這是我國首次針對生成式AI產(chǎn)業(yè)發(fā)布的規(guī)范性政策。

“現(xiàn)在看到的生成式換臉、聲音合成很逼真,這些生成的內(nèi)容如果有知識產(chǎn)權(quán),到底歸誰?是提供模型的人還是提問的人,或是最早提供數(shù)據(jù)的人?這很難界定。”劉劼認為,針對大模型面臨道德倫理、欺騙性、知識產(chǎn)權(quán)等可信危機,需要打造具備安全性和魯棒性、可解釋性、問責和可審計、環(huán)境保護、隱私保護、非歧視和公平性等的可靠、可信、可解釋的AI。

湯道生認為,數(shù)據(jù)是大模型的原材料,模型最終要在真實場景落地,達到理想的服務效果,往往需要把企業(yè)自身的數(shù)據(jù)也用起來。在這一過程中,如果數(shù)據(jù)保護不當,可能造成企業(yè)核心數(shù)據(jù)、敏感數(shù)據(jù)的泄漏。行業(yè)大模型和模型開發(fā)工具可以通過私有化部署等方式,讓模型訓練更放心,也可以避免員工訪問模型時,發(fā)生企業(yè)敏感數(shù)據(jù)的外泄。

自參與業(yè)界聯(lián)名呼吁暫停訓練大型AI模型后,特斯拉CEO埃隆·馬斯克在大會開幕式上,再次表達自己對深度而全面的人工智能的擔憂。他說,“這樣的超級智能有強大的能力,比人類要強大,這是一種風險和擔憂。它可能會有很積極的未來,但也有概率出現(xiàn)一些負面的未來?,F(xiàn)在需要有一些監(jiān)管,對它們進行監(jiān)督,我們要盡可能確保這些消極的未來不發(fā)生,積極的未來會發(fā)生?!?/p>

對于如何實現(xiàn)AI的治理和規(guī)范,圖靈獎得主、被譽為“深度學習三劍客”之一的Meta AI基礎人工智能研究團隊首席人工智能科學家楊立昆認為,可以通過可控的方法、設置安全護欄等使它們不會出現(xiàn)欺騙和支配人類的行為。

但是,楊立昆并不贊同“任何人可用人工智能做任何事,情況可能會非常危險,所以需要嚴格監(jiān)管人工智能”這一說法。他認為,嚴格監(jiān)管人工智能發(fā)展并不能保證AI安全,從長遠看,開源才能讓AI保持安全、良善。“想象一下,未來10年或15年后,我們每個人都通過人工智能助手與數(shù)字世界互動,如果技術(shù)被少數(shù)公司控制,這不是好事。未來的人工智能系統(tǒng)應該成為人類所有知識的寶庫,它們的訓練方式必須基于眾多的源頭,我希望看到更多的開源AI系統(tǒng)?!?/p>

侯陽表示,要打造負責任的AI,需要遵循六大原則,也就是公平、可靠、安全、透明、隱私以及包容,“我們倡導全球科技企業(yè)通過合作,形成共識,確保AI技術(shù)造福全人類。”

(本文圖片均為王初攝)

(責編:嚴遠、軒召強)

分享讓更多人看到

返回頂部