4月25日,“生成式人工智能(AIGC)賦能視聽產(chǎn)業(yè)發(fā)展論壇”在第三十屆中國國際廣播電視信息網(wǎng)絡展覽會(CCBN2024)期間圓滿舉辦。本次論壇由國家廣播電視總局科技司指導,國家廣播電視總局廣播電視科學研究院主辦。國家廣播電視總局科技司副司長苗勃出席論壇并致辭。國家廣播電視總局廣播電視科學研究院信息安全技術研究所所長郭沛宇主持論壇。
論壇現(xiàn)場
國家廣播電視總局科技司副司長 苗勃
國家廣播電視總局廣播電視科學研究院
信息安全技術研究所所長 郭沛宇
國家廣播電視總局科技司副司長苗勃在致辭中指出,廣播電視作為信息傳播的重要載體,是推動社會文化經(jīng)濟發(fā)展的重要生產(chǎn)力。廣電全行業(yè)全系統(tǒng)要主動融入國家戰(zhàn)略,深化人工智能的關鍵技術研究和高質量音視頻數(shù)據(jù)收集建設,積極推動深層次人工智能在內(nèi)容生產(chǎn)領域和日常經(jīng)營領域的探索應用,進一步為創(chuàng)意策劃、信息獲取、內(nèi)容生產(chǎn)、渠道分發(fā)、運營效果評估、內(nèi)容治理等各環(huán)節(jié)提供數(shù)智化的解決方案。
國家廣播電視總局廣播電視科學研究院總工程師 解偉
國家廣播電視總局廣播電視科學研究院總工程師解偉介紹了廣播電視科學研究院在人工智能領域的研究進展。據(jù)他介紹,人工智能技術在廣電行業(yè)的應用主要是在內(nèi)容創(chuàng)作、智能交互與監(jiān)管審核環(huán)節(jié)。廣科院在人工智能領域的研究主要有七個方向:一是基于AIGC的三維虛擬場景生成技術研究與應用;二是虛擬拍攝;三是智能化融媒制作系統(tǒng)研究;四是修復增強視頻生成技術與效果質量評估技術研究;五是電視智能操控;六是生成式人工智能應用于視頻生成的安全評估技術研究;七是深度偽造鑒別技術研究。未來廣科院將著眼共建“國家廣播電視網(wǎng)工程技術中心-廣電認知智能大模型中心”,開展認知大模型技術研究,打造“廣電認知智能大模型”,推動實現(xiàn)“科技創(chuàng)新驅動智慧廣電業(yè)務能力和服務能力顯著提升”的發(fā)展目標,深化人工智能、云計算、大數(shù)據(jù)等新一代信息技術在廣播電視和網(wǎng)絡視聽領域的應用,廣泛開展智慧廣電新技術、新產(chǎn)品、新服務的創(chuàng)新合作。
上海廣播電視臺、上海文化廣播影視集團有限公司副總裁
陳雨人
上海廣播電視臺、上海文化廣播影視集團有限公司副總裁陳雨人分享了上海運用生成式人工智能賦能媒體融合,加快形成新質生產(chǎn)力的豐富實踐。他提出,技術進步促進了傳統(tǒng)媒體和新媒體、大屏和小屏的融合,增加了技術和內(nèi)容的深度,應整合“政用產(chǎn)學研”五個領域的優(yōu)秀資源,共同建立生成式人工智能研發(fā)應用產(chǎn)業(yè)聯(lián)盟,打造引領傳播新范式、具備廣泛市場接受度的全新內(nèi)容產(chǎn)品,拓展傳播場域,共同引領產(chǎn)業(yè)高質量發(fā)展。
阿里云計算有限公司通義實驗室XR團隊負責人 薄列峰
阿里云計算有限公司通義實驗室XR團隊負責人薄列峰以《人物視頻生成新范式》為分享主題,梳理了從Midjourney到Sora的視覺大模型的演進之路。他認為,實現(xiàn)文生視頻,需要文字與視頻具有非常高的匹配度,它依賴于視頻到文字的一個理解過程,而文生視頻的進化是一個雙向的過程。隨后,他詳細介紹了人物動作、換裝、替身、唱演四個人物視頻生成范式,以及這些玩法在“通義千問”中對應的四套框架,即:Animate Anyone人物動作框架、Outfit Anyone人物換裝視頻生成框架、Motionshop人物角色替換框架、Emote Portrait Alive人物唱演視頻生成框架。
中國傳媒大學信息與通信工程學院黨委書記 金立標
中國傳媒大學信息與通信工程學院黨委書記金立標以《智能賦新聲:媒體內(nèi)容生產(chǎn)的AI革新之旅》為題,分享了中國傳媒大學信息與通信工程學院近年來在人工智能領域的探索。他認為,應遵循優(yōu)化改善傳統(tǒng)直播流程的思路和對策,在采、編、審、播、存、傳等環(huán)節(jié)進行系統(tǒng)升級,智能賦新聲,以期實現(xiàn)從“智拍”“智作”到“智審”的目標效果。當前是人工為主、智能為輔的制作方式,未來則可能發(fā)展成人工為輔、智能為主的方式,AI會重構媒體內(nèi)容的生產(chǎn)流程。
成都索貝數(shù)碼科技股份有限公司專業(yè)媒體解決方案總監(jiān)
陳竹
成都索貝數(shù)碼科技股份有限公司的專業(yè)媒體解決方案總監(jiān)陳竹,以《探索AIGC引領的媒體智能創(chuàng)新》為主題,深入分享了媒體行業(yè)在面臨技術快速更新迭代的挑戰(zhàn)時,如何借助索貝的解決方案——明眸語言模型(MILM),迎接風險并抓住機遇。他強調(diào),索貝明眸語言模型(MILM)的應用,如內(nèi)容制作場景中的小明同學和智能運維場景中的容器云Copilot,能夠補充并優(yōu)化傳統(tǒng)工作習慣的不足。這些應用貫穿選題策劃、稿件撰寫、節(jié)目制作、新媒體生產(chǎn)等全流程,為媒體行業(yè)的內(nèi)容生產(chǎn)帶來全面的智能化輔助,從而推動媒體行業(yè)的創(chuàng)新與發(fā)展。
中央廣播電視臺技術局高級工程師 黃卓偉
中央廣播電視臺技術局高級工程師黃卓偉以《大模型驅動價值傳播:總臺算法創(chuàng)新實踐》為題展開了主題分享。他認為:“總臺算法不同于商業(yè)媒體,其是既符合主流價值導向,又考慮到用戶個性喜好的算法推薦!痹诜窒碇,他詳細地向大家展示了總臺算法的流量模型、應用場景、技術體系,以及基于大模型的認知算法與集成式應用,從而以AIGC助力內(nèi)容創(chuàng)作、驅動價值傳播。同時,他還分別從“電視端+廣播端”以及“OTT+IPTV”兩方面介紹了總臺的知識庫與訓練集。
深圳市酷開網(wǎng)絡科技股份有限公司副總裁 李晶
深圳市酷開網(wǎng)絡科技股份有限公司副總裁李晶以《AIOS-重新定義智能視聽》為題,分享了酷開AIOS模型是如何基于生成式人工智能來打造行業(yè)垂類大模型的具體實踐的。她認為,未來我們將見證文生物的產(chǎn)生。同時,她還分析了垂類大模型與通用大模型的區(qū)別:垂類大模型的壁壘在于非公開的數(shù)據(jù),真正能替代人的是垂類大模型,酷開AIGC大模型致力于打造最懂中國家庭用戶的智能大屏行業(yè)大模型。
北京智譜華章科技有限公司副總裁 陳雪松
北京智譜華章科技有限公司副總裁陳雪松介紹了智譜大模型及其多模態(tài)應用實踐。他認為,算力與數(shù)據(jù)是目前智譜大模型發(fā)展的兩大挑戰(zhàn)。智譜AI形成了語言、代碼、多模態(tài)等大模型矩陣。在大模型框架之外,智譜率先開源,成為中文領域最大的開源模型應用之一。之后,他還詳細介紹了智譜AI的團隊核心技術線及全線產(chǎn)品,展示了智譜AI新一代多模態(tài)理解大模型GLM-4V,以及可視化方法CogCartoon,闡述了能源制造、智能汽車、醫(yī)療健康、金融證券、消費零售、文化旅游、游戲娛樂、通用辦公等八個具體應用場景。
國家廣播電視總局廣播電視科學研究院
互聯(lián)網(wǎng)視聽技術研究所工程師 郝洺
國家廣播電視總局廣播電視科學研究院互聯(lián)網(wǎng)視聽技術研究所工程師郝洺以《AIGC在廣電領域的應用初探》為題進行了主題分享。據(jù)他介紹,近年來,人工智能在技術發(fā)展趨勢中模型參數(shù)越來越高,呈現(xiàn)出高模態(tài)、強智能、高泛化的特點,這與低成本、高壁壘、多模塊的應用發(fā)展趨勢呈現(xiàn)出截然相反的態(tài)勢。而通用大模型的產(chǎn)生,正是為了適應在不同領域中進行應用切換的需要。人工智能在廣電領域的應用場景可概括為“源-傳-端-監(jiān)”四位一體架構。在源端,大模型可以豐富內(nèi)容生成,解放創(chuàng)作生產(chǎn)力。在傳端,大模型可以實現(xiàn)全維數(shù)據(jù)洞察,提升網(wǎng)絡運維效能。在終端,大模型可以實現(xiàn)多元人機交互,解決電視操作復雜問題。在監(jiān)管側,大模型可以強化內(nèi)容,監(jiān)管保障內(nèi)容安全。
此次論壇吸引了來自全國的媒體領域從業(yè)者與媒體記者500余人參會,政用產(chǎn)學研各方代表進行了深入研討與交流。代表們一致認為,大模型人工智能的普及和開發(fā)應用,將對廣電行業(yè)產(chǎn)生深遠影響,行業(yè)同仁應秉持“融合、開放、創(chuàng)新”的發(fā)展理念,創(chuàng)新應用前沿技術,共繪廣電視聽更美好的未來。