第五屆全國(guó)人工智能大賽,由鵬城實(shí)驗(yàn)室主辦,新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟(AITISA)承辦,華為技術(shù)有限公司、華為云計(jì)算技術(shù)有限公司、中國(guó)移動(dòng)通信集團(tuán)有限公司、鵬城實(shí)驗(yàn)室科教基金會(huì)協(xié)辦。
大賽設(shè)200余萬(wàn)元獎(jiǎng)金,圍繞真實(shí)產(chǎn)業(yè)難題發(fā)布賽題,吸引了來(lái)自中國(guó)、美國(guó)、德國(guó)、新加坡等全球10余個(gè)國(guó)家5346名選手參賽,在“AI+圖像編碼”、“AI+增強(qiáng)視頻質(zhì)量評(píng)價(jià)”、“AI+數(shù)智創(chuàng)新”三大賽道中產(chǎn)生了一批創(chuàng)新成果。賽后,大賽組委會(huì)對(duì)獲獎(jiǎng)團(tuán)隊(duì)進(jìn)行了采訪。本期,我們一起看看三等獎(jiǎng)團(tuán)隊(duì)的參賽分享。
細(xì)心研究,大膽探索|“CompressBit”團(tuán)隊(duì)
“CompressBit”團(tuán)隊(duì)隊(duì)長(zhǎng)陳搏,是電氣工程博士,出于對(duì)“AI+圖像編碼”賽道技術(shù)領(lǐng)域的興趣選擇獨(dú)立參賽。他已多次參加全國(guó)人工智能大賽,曾在第四屆大賽獲得“AI+視覺(jué)特征編碼”賽道冠軍的好成績(jī)。
“CompressBit”團(tuán)隊(duì)在決賽現(xiàn)場(chǎng)
“在復(fù)賽最后幾天,大家突然發(fā)力、瘋狂沖榜,原來(lái)實(shí)時(shí)排行榜前三的團(tuán)隊(duì)甚至都被沖擊到十幾名之外,競(jìng)爭(zhēng)非常激烈。研究排行榜分布后,我決定使用田忌賽馬的策略,短期內(nèi)放棄PSNR和SSIM指標(biāo),但努力把LPIPS和DISTS分?jǐn)?shù)拉到很高,使總名次適當(dāng)提升。”這個(gè)比賽策略,使陳搏得以順利入圍決賽。他繼續(xù)補(bǔ)充說(shuō):“深刻理解大賽規(guī)則、比賽任務(wù)是獲獎(jiǎng)的關(guān)鍵,在初賽、復(fù)賽期間,我并沒(méi)有一味追求客觀分?jǐn)?shù),而是重點(diǎn)致力于提高人眼感知質(zhì)量,最終在決賽取得了不錯(cuò)的MOS評(píng)分。”
為了提高開(kāi)發(fā)效率,陳搏在本次比賽中創(chuàng)新性地探索了大模型和Agent工具的使用,保證短時(shí)間內(nèi)能夠深入理解賽題、充分開(kāi)展試驗(yàn)。“這次比賽讓我加深了對(duì)圖像壓縮問(wèn)題的理解,發(fā)現(xiàn)可學(xué)習(xí)圖像壓縮算法較傳統(tǒng)算法在比特率上有明顯超越、潛力巨大。”陳搏表示會(huì)繼續(xù)研究,爭(zhēng)取為該領(lǐng)域進(jìn)步做出貢獻(xiàn)。
以賽促研,潛力無(wú)限|“風(fēng)調(diào)雨順”團(tuán)隊(duì)
“風(fēng)調(diào)雨順”團(tuán)隊(duì)的王闊音是氣象領(lǐng)域的一名高級(jí)工程師,也是獨(dú)立參賽。
“風(fēng)調(diào)雨順”團(tuán)隊(duì)在決賽現(xiàn)場(chǎng)
在初賽快結(jié)束時(shí),王闊音才決定投入更多精力深入探索“AI+圖像編碼”賽道,因?yàn)闀r(shí)間緊張,那幾天他幾乎通宵加班。經(jīng)過(guò)對(duì)模型參數(shù)的不斷調(diào)試、持續(xù)優(yōu)化壓縮效果,最終在最后一刻完成了作品提交。他說(shuō):“雖然過(guò)程很累,但看到結(jié)果達(dá)到預(yù)期、成功晉級(jí)復(fù)賽時(shí),真的非常激。這段經(jīng)歷讓我深刻體會(huì)到堅(jiān)持和專注的力量,也讓我更加相信自己的技術(shù)能力。單人參賽雖然壓力大,但也鍛煉了我的獨(dú)立思考和解決問(wèn)題的能力。”
王闊音的研究方向是氣象衛(wèi)星與雷達(dá)數(shù)據(jù)壓縮應(yīng)用,他表示,本次大賽讓他更深入掌握了圖像壓縮核心技術(shù),對(duì)他的研究具有重要價(jià)值。他期待壓縮算法在保障質(zhì)量的前提下進(jìn)一步提升效率,尤其看好深度學(xué)習(xí)在該領(lǐng)域的潛力,相信其在復(fù)雜數(shù)據(jù)處理和高壓縮需求場(chǎng)景中必將超越傳統(tǒng)方法,推動(dòng)行業(yè)邁向更高水平。
志同道合,靈活遷移|“不知道叫啥”團(tuán)隊(duì)
不同于前兩個(gè)團(tuán)隊(duì)的孤軍奮戰(zhàn),“不知道叫啥”團(tuán)隊(duì),由4名志同道合、熱愛(ài)AI與編碼的小伙伴組成。他們?cè)诳萍紙@機(jī)緣巧合下認(rèn)識(shí),相互學(xué)習(xí)、分享技術(shù)。大家都密切關(guān)注端到端圖像與視頻壓縮的前沿發(fā)展,留意到“AI+圖像編碼”賽道并投入研究,希望能夠讓AI改變生活。
“不知道叫啥”團(tuán)隊(duì)代表在決賽現(xiàn)場(chǎng)
“我們能獲獎(jiǎng)的關(guān)鍵主要是成員們齊心協(xié)力,思維都比較開(kāi)放,愿意積極探討。”團(tuán)隊(duì)隊(duì)長(zhǎng)宋杰強(qiáng)調(diào),團(tuán)隊(duì)參賽時(shí)應(yīng)該盡可能發(fā)揮每個(gè)成員的能力,讓效率最大化,避免交叉冗余。要通過(guò)合理的安排,讓大家在有限的時(shí)間里盡可能多地做嘗試和實(shí)驗(yàn)。
宋杰還表示,打比賽一定要有靈活遷移的能力。了解工業(yè)界、學(xué)術(shù)界的最新方法后,要結(jié)合賽題任務(wù)不斷思考,多考慮多嘗試其它方向的方法。遷移過(guò)來(lái),也許就能有奇效。他舉例說(shuō):“面對(duì)低復(fù)雜度的要求,要不斷壓縮模型性能。為了在滿足復(fù)雜度的情況下包保持壓縮性能,我們團(tuán)隊(duì)嘗試了很多方法,最終是在超分領(lǐng)域相關(guān)的文章中受到啟發(fā),最終解決了問(wèn)題。”
臨危不亂,以賽促學(xué)|“最是人間留不住”團(tuán)隊(duì)
“最是人間留不住”團(tuán)隊(duì)獲得了“AI+圖像編碼”賽道優(yōu)勝獎(jiǎng)。該團(tuán)隊(duì)是由西安電子科技大學(xué)、華東交通大學(xué)組成的高校聯(lián)隊(duì)。成員學(xué)科背景多樣、知識(shí)結(jié)構(gòu)互補(bǔ),具備良好的科研素養(yǎng)與實(shí)踐能力。
“最是人間留不住”團(tuán)隊(duì)在決賽現(xiàn)場(chǎng)
“打比賽要目標(biāo)清晰、分工明確、快速迭代,不僅要完成賽項(xiàng)任務(wù),更要在效果和工程實(shí)現(xiàn)之間找到最優(yōu)平衡。”團(tuán)隊(duì)隊(duì)長(zhǎng)聶佳睿分享說(shuō):“一定要臨危不亂、快速調(diào)整!”比賽時(shí),他們發(fā)現(xiàn)原模型在新測(cè)試數(shù)據(jù)上的表現(xiàn)很糟糕。時(shí)間緊迫,緊急討論后,我們果斷決定推翻原有方案并重構(gòu)模型。經(jīng)過(guò)連續(xù)幾天的高強(qiáng)度調(diào)整,終于在提交截止前做出了效果更好、運(yùn)行更快的版本。”這段獨(dú)特經(jīng)歷,也讓他們真正體會(huì)到了團(tuán)隊(duì)協(xié)作和技術(shù)應(yīng)變的力量。
聶佳睿說(shuō):“通過(guò)比賽,我不僅加深了對(duì)圖像編碼技術(shù)和人工智能融合應(yīng)用的理解,也切實(shí)提高了自己在模型設(shè)計(jì)、數(shù)據(jù)處理和工程實(shí)現(xiàn)方面的能力。以往在課堂上學(xué)習(xí)的圖像處理和深度學(xué)習(xí)知識(shí),大多停留在理論層面,而這次比賽讓我有機(jī)會(huì)將它們應(yīng)用到實(shí)際項(xiàng)目中,從數(shù)據(jù)預(yù)處理到模型訓(xùn)練,再到性能評(píng)估與優(yōu)化,每一個(gè)環(huán)節(jié)都讓我感受到技術(shù)與實(shí)際需求之間的緊密聯(lián)系。”
理性備賽,深度思考|“ABS-AITeam”團(tuán)隊(duì)
“ABS-AITeam”團(tuán)隊(duì)參加了“AI+增強(qiáng)視頻質(zhì)量評(píng)價(jià)”賽道并獲得三等獎(jiǎng)。團(tuán)隊(duì)成員來(lái)自國(guó)家廣播電視總局廣播電視科學(xué)研究院和中國(guó)傳媒大學(xué),主要開(kāi)展視頻質(zhì)量評(píng)價(jià)關(guān)鍵技術(shù)研究,具備扎實(shí)的理論基礎(chǔ)與豐富的實(shí)踐經(jīng)驗(yàn)。
“ABS-AITeam”團(tuán)隊(duì)代表在答辯現(xiàn)場(chǎng)
談及比賽經(jīng)驗(yàn),團(tuán)隊(duì)隊(duì)長(zhǎng)劉慶同說(shuō):“我們團(tuán)隊(duì)采用理論建模、數(shù)據(jù)優(yōu)化、算法迭代的技術(shù)攻關(guān)策略。在模型架構(gòu)設(shè)計(jì)階段,通過(guò)構(gòu)建多尺度時(shí)空注意力機(jī)制,有效融合視頻的局部細(xì)節(jié)與全局語(yǔ)義特征。針對(duì)訓(xùn)練數(shù)據(jù)不足的挑戰(zhàn),基于數(shù)據(jù)特性進(jìn)行旋轉(zhuǎn)、壓縮、超分等數(shù)據(jù)增強(qiáng)方法擴(kuò)充訓(xùn)練樣本。”
劉慶同還分享了他對(duì)技術(shù)的發(fā)展思考:“本次參賽,推動(dòng)了我們團(tuán)隊(duì)在視覺(jué)感知建模領(lǐng)域的理論突破。從技術(shù)發(fā)展角度看,視頻質(zhì)量評(píng)價(jià)正呈現(xiàn)三個(gè)趨勢(shì):(1)從全參考向無(wú)參考范式演進(jìn);(2)評(píng)價(jià)指標(biāo)與編碼標(biāo)準(zhǔn)的深度融合;(3)個(gè)性化QoE預(yù)測(cè)成為新方向。期待未來(lái)能建立開(kāi)放動(dòng)態(tài)的基準(zhǔn)平臺(tái),支持基于用戶行為反饋的評(píng)價(jià)模型持續(xù)進(jìn)化,推動(dòng)5G+8K時(shí)代超高清視頻技術(shù)的標(biāo)準(zhǔn)化進(jìn)程。”
剖析任務(wù),持續(xù)領(lǐng)先|“CMIT001”團(tuán)隊(duì)
“CMIT001”團(tuán)隊(duì)來(lái)自中移(動(dòng))信息技術(shù)有限公司智能交互數(shù)字人研發(fā)團(tuán)隊(duì)。他們?nèi)藛T結(jié)構(gòu)合理,技術(shù)能力全面,全面掌握了產(chǎn)品設(shè)計(jì)、架構(gòu)規(guī)劃、AI算法研發(fā)等全流程的研發(fā)能力。
“CMIT001”團(tuán)隊(duì)代表在答辯現(xiàn)場(chǎng)
該團(tuán)隊(duì)在“AI+數(shù)智創(chuàng)新”賽道的“AI+數(shù)智人能力及客服應(yīng)用”賽題中獲得三等獎(jiǎng)。團(tuán)隊(duì)成員符殷銘說(shuō):“我們團(tuán)隊(duì)的策略是盡可能地提高賽題中的客觀分?jǐn)?shù)部分,著重優(yōu)化渲染生成圖像的人臉相似度、聲音復(fù)刻模塊的生成速度等關(guān)鍵指標(biāo)。”符殷銘繼續(xù)補(bǔ)充道:“我們?cè)诔踬愲A段就保持了較高的實(shí)時(shí)榜單分?jǐn)?shù),說(shuō)明我們的策略是成功的。”
符殷銘對(duì)大賽賽道設(shè)置評(píng)價(jià)很高,他說(shuō):“本賽道賽題對(duì)于AIGC技術(shù)在3D數(shù)字人生產(chǎn)管線的生產(chǎn)應(yīng)用具有很高的價(jià)值,相當(dāng)于是對(duì)自動(dòng)化生成3D數(shù)字人的Demo應(yīng)用開(kāi)發(fā),也是對(duì)AIGC技術(shù)在3D數(shù)字人生產(chǎn)應(yīng)用的可行性探索。”
雙線作戰(zhàn),一舉智勝|“MediaAILab”團(tuán)隊(duì)
“MediaAILab”團(tuán)隊(duì)非常特別,在隊(duì)長(zhǎng)薛子育的帶領(lǐng)下,同時(shí)參加了“AI+增強(qiáng)視頻質(zhì)量評(píng)價(jià)”和“AI+數(shù)智創(chuàng)新”賽道的“AI+數(shù)智空間”賽題,均獲得三等獎(jiǎng)。
“MediaAILab”團(tuán)隊(duì)由國(guó)家廣播電視總局廣播電視科學(xué)研究院、南開(kāi)大學(xué)、中國(guó)傳媒大學(xué)組成,專注于廣播電視和網(wǎng)絡(luò)視聽(tīng)領(lǐng)域人工智能關(guān)鍵技術(shù)的研究與應(yīng)用,根據(jù)賽項(xiàng)的不同調(diào)整隊(duì)伍成員組成與分工。
“MediaAILab”團(tuán)隊(duì)代表在答辯現(xiàn)場(chǎng)
雙線作戰(zhàn)避免不了時(shí)間的緊張,隊(duì)長(zhǎng)薛子育坦言,時(shí)間管理是最大的挑戰(zhàn)。“尤其是在決賽階段,需要在有限的時(shí)間內(nèi)完成功能實(shí)現(xiàn)、優(yōu)化和答辯準(zhǔn)備。我們通過(guò)細(xì)化任務(wù)清單、每日進(jìn)度復(fù)盤(pán)來(lái)提高效率,同時(shí)合理分配精力,避免過(guò)度消耗。尤為關(guān)鍵的是,保持冷靜的心態(tài),以應(yīng)對(duì)突發(fā)問(wèn)題。”薛子育說(shuō):“當(dāng)然,也會(huì)造成一些遺憾。比如AI+增強(qiáng)視頻質(zhì)量賽道,未能?chē)L試更優(yōu)的解決方案;AI+數(shù)智空間賽題中,團(tuán)隊(duì)語(yǔ)義分割引導(dǎo)的紋理生成模塊未能充分優(yōu)化。面對(duì)時(shí)間不足,只能做出妥協(xié)和選擇。”
薛子育表示本次比賽對(duì)他的學(xué)習(xí)和工作都有很大幫助,不僅提升了技術(shù)實(shí)踐能力,還鍛煉了團(tuán)隊(duì)協(xié)作和抗壓能力。“更重要的是,這次比賽徹底刷新了我對(duì)三維數(shù)字化的認(rèn)知!”他繼續(xù)補(bǔ)充說(shuō):“參加數(shù)智空間賽題,讓我不僅掌握了神經(jīng)輻射場(chǎng)(NeRF)、高斯?jié)姙R(Gaussian Splatting)等前沿技術(shù),還驚喜得發(fā)現(xiàn)三維重建正從‘幾何還原’轉(zhuǎn)向‘語(yǔ)義理解’。”
智勝之后:創(chuàng)新永不落幕
第五屆人工智能大賽,既是一場(chǎng)技術(shù)比拼的盛會(huì),也是一個(gè)觀察當(dāng)代青年技術(shù)人才的獨(dú)特窗口。從獨(dú)立攻關(guān)的孤勇者到多學(xué)科融合的聯(lián)合團(tuán)隊(duì),從傳統(tǒng)算法突破到生成式AI的深度探索,從實(shí)驗(yàn)室理論推演到產(chǎn)業(yè)痛點(diǎn)的精準(zhǔn)破解——這些獲獎(jiǎng)團(tuán)隊(duì)的故事,無(wú)不體現(xiàn)著銳意創(chuàng)新與堅(jiān)持不懈。
現(xiàn)場(chǎng)決賽選手合影留念
拼搏向前過(guò)、全力以赴過(guò),獲得什么獎(jiǎng)項(xiàng)已不是最重要的,畢竟參與大賽的經(jīng)歷本身就是一份特別的禮物。期待所有大賽選手,用數(shù)據(jù)與代碼編織智能時(shí)代的經(jīng)緯線,為中國(guó)人工智能技術(shù)發(fā)展與創(chuàng)新繼續(xù)前行!
關(guān)鍵詞: