在剛剛過去的2020世界人工智能大會(huì)(WAIC)上,除了海內(nèi)外大咖的云端共話,以及AI“女團(tuán)”的歌舞表演,還有一位來自商湯科技的AI數(shù)字人“小糖”在場(chǎng)館現(xiàn)場(chǎng)的AI應(yīng)用場(chǎng)景展臺(tái)上吸引了參會(huì)嘉賓的關(guān)注和駐足。
這位數(shù)字人“小糖”由全球領(lǐng)先的人工智能平臺(tái)公司商湯科技定制化打造,是現(xiàn)場(chǎng)“AI上!(yīng)用場(chǎng)景”展臺(tái)的專屬講解員。依托于展臺(tái)前的滑動(dòng)屏幕,“小糖”可以在五大應(yīng)用展項(xiàng)前任意移動(dòng),栩栩如生、惟妙惟肖地為觀眾介紹和講述AI技術(shù)在醫(yī)療、教育、文博、工業(yè)、科研等領(lǐng)域的應(yīng)用和落地故事。
商湯的數(shù)字人由AI生成虛擬人物,從語言表達(dá)方式、嘴型、表情、眼神及全身動(dòng)作,都做到了非常高的擬真程度。并且相較傳統(tǒng)的人工介紹方式,AI數(shù)字人形式新鮮,講解精準(zhǔn),能夠更好地吸引到場(chǎng)的觀眾。
或許人們已經(jīng)習(xí)慣了人臉識(shí)別,對(duì)自動(dòng)駕駛也不再感到陌生,但當(dāng)栩栩如生的數(shù)字人來到大家面前時(shí),總會(huì)激起好奇心,猜想它什么時(shí)候會(huì)成為我們生活和工作的一部分。這正是商湯科技定制打造這樣一個(gè)展臺(tái)的重要原因之一,“數(shù)字人”也是商湯科技在AI賦能道路上的最新方向。
具體來說,數(shù)字人是在AI深度學(xué)習(xí)技術(shù)驅(qū)動(dòng)下,通過學(xué)習(xí)大量的真人會(huì)話、表情和動(dòng)作,生成惟妙惟肖的擬人效果。這位數(shù)字人導(dǎo)覽員“小糖”,其形象就來自一位漂亮的上海女演員,商湯科技的開發(fā)人員通過對(duì)她的表情、說話語氣和動(dòng)作進(jìn)行了大量的三維數(shù)據(jù)采集,通過AI技術(shù)學(xué)習(xí)到了她說話時(shí)的樣子,生成和她一樣的數(shù)字人替身,代替她進(jìn)行會(huì)話和表演。
憑借高仿真的人物形象,輔以語音識(shí)別和人臉識(shí)別等技術(shù),“數(shù)字人”可以在許多場(chǎng)景替代人工提供重復(fù)性的服務(wù),目前已經(jīng)在銀行、線上客服、博物館、商場(chǎng)、機(jī)場(chǎng)等場(chǎng)景開始落地應(yīng)用。在今年2月疫情期間,商湯就攜手虎牙直播,推出基于數(shù)字人技術(shù)的AI數(shù)字醫(yī)生,在線上直播間,通過彈幕聊天這種互動(dòng)問答的形式,普及大眾最為關(guān)切的公共健康知識(shí),提升全民個(gè)人防護(hù)意識(shí),更好地起到科普作用。
不僅如此,商湯科技的“數(shù)字人”解決方案,還可支持遠(yuǎn)程接管服務(wù)。當(dāng)NLP級(jí)別的自動(dòng)會(huì)話無法解決實(shí)際問題的時(shí)候,數(shù)字人會(huì)自動(dòng)尋找遠(yuǎn)程客服,遠(yuǎn)程客服就可以直接通過語音或文字驅(qū)動(dòng)數(shù)字人,讓它說出相應(yīng)回答。
展望未來,數(shù)字人技術(shù)將擁有廣泛的應(yīng)用前景,是AI技術(shù)在擬人化圖形動(dòng)畫領(lǐng)域的重要落地應(yīng)用。在AI的不斷進(jìn)步下,未來也許可以讓每個(gè)人都擁有自己的數(shù)字人,讓它陪伴家人、指引顧客,或是服務(wù)客戶,逐步改變我們未來的生活方式,驅(qū)動(dòng)多種場(chǎng)景提供服務(wù)和體驗(yàn)升級(jí),從而進(jìn)入一個(gè)全新的人機(jī)共生時(shí)代,甚至為社會(huì)的發(fā)展帶來變革。
(來源:商湯科技)