近日, GSXR重要成員NOLO在其自媒體賬號發(fā)布了其關于手勢識別技術的演示片段。從視頻內容可以看出,工作人員佩戴NOLO即將發(fā)售的設備NOLO SONIC 2,裸手流暢的進行點、按、捏、拖拽、滑動等動作。NOLO官方表示該項技術不僅搭載于NOLO SONIC 2設備,還將對外開發(fā)合作。憑借更加自然和直觀的操作方式,NOLO的手勢識別技術將作為GSXR標準下交互輸入的技術方案的新范式補充。
2021年3月,由中國移動牽頭,聯合產業(yè)伙伴發(fā)起的中國XR通用標準(GSXR)正式對外發(fā)布,并在CCSA擴展現實產業(yè)及標準推進委員會引領下在產業(yè)中快速推廣,該標準旨在構建起中國的XR跨平臺互通體系,使得行業(yè)參與者基于該標準開展硬件、平臺、內容開發(fā),即可確保所開發(fā)的軟件應用均可運行在針對該標準做過適配的硬件上。此標準的正式施行極大的降低了XR軟硬件適配難度,加速推動了行業(yè)發(fā)展。
GSXR標準的正式實施,不僅為XR行業(yè)提供了通用接口規(guī)范,降低了開發(fā)者接入成本;同時將軟件功能集成SDK的形式,服務于XR行業(yè)。
騰訊搜狗輸入法正是通過此種路徑成為GSXR標準內首個「中文輸入」解決方案,也是標準內重要的人機交互解決方案之一。騰訊搜狗輸入法為XR系統(tǒng)提供專屬、智能和高效的語音輸入和鍵盤輸入模式,還能能根據系統(tǒng)輸入框類型匹配多形態(tài)鍵盤。其中行業(yè)首創(chuàng)的語音輸入,讓用戶解放雙手,動動嘴就能打字;搜狗通過軟硬件結合的方式進行創(chuàng)新,優(yōu)化手柄輸入體驗,提升輸入效率;結合手勢算法能力,還可進行裸手輸入,讓用戶體驗到更沉浸,更智能的輸入方式。當下搜狗VR輸入法已服務于中國XR行業(yè)的硬件產品,并在中國移動 x NOLO聯合品牌VR終端中作為首個基線產品實現應用落地。
NOLO發(fā)布的手勢追蹤技術同樣基于GSXR標準協議研發(fā),開發(fā)者可以通過GSXR的通用API接口,使用XR特性模塊中的手勢識別、骨骼節(jié)點、捏合姿態(tài)、手部追蹤等功能用于XR應用開發(fā)。同時,為了方便開發(fā)者快速上手開發(fā)XR應用,GSXR提供了Unreal SDK、Unity SDK詳細的說明文檔以及論壇討論功能。對接完畢后,用戶可在XR設備內實現裸手進行點、按、選擇、拖拽等更加自然和沉浸的操作。
提及該項技術的研發(fā)過程,NOLO相關技術負責人表示:“NOLO技術團隊憑借人工智能的深度學習技術,借助真實手部圖像和3D生成手部圖像進行數據融合訓練。用數百萬張手部圖像訓練了一個專門的深度神經網絡,其中手腕和手指擁有3D空間位姿;由此生成的手勢數據通過GSXR協議傳輸到3D圖形引擎渲染,再顯示到VR眼鏡中,最終達成了現實世界和VR世界的手勢同步。同時為了保證識別的實時性,NOLO深度優(yōu)化網絡結構,保障在驍龍XR2芯片上單幀識別速度達到5ms以下;深度學習算法通過動態(tài)提取多幀數據中的手勢信息,提高動作連貫性,以此達到流暢絲滑的識別效果!
對于該項技術是否對外開放,NOLO相關負責人表示:“該項手勢追蹤技術除了用于NOLO SONIC 2,以不斷豐富用戶的體驗感受。作為GSXR工作組的一員,我們持開放的態(tài)度,將此技術合作開放給CCSA擴展現實產業(yè)及標準推進委員會的成員,助力中國XR產業(yè)的快速發(fā)展!
GSXR標準已執(zhí)行2年,CCSA擴展現實產業(yè)及標準推進委員會將進一步推動擴展現實標準實施與落地,研發(fā)適合產業(yè)發(fā)展的測試解決方案,開展產品的測試認證,探索新應用模式,服務應用開發(fā)者,建設健康可持續(xù)的產業(yè)生態(tài)。接下來,中國移動(終端公司及咪咕文化)將依托GSXR統(tǒng)一標準,匯聚全領域內容,提供“標準-內容(應用)-平臺”的一站式服務,打造“一個平臺、N個內容資源、N個應用服務”的“1+N+N”服務體系,對外開放XR通用能力,提供端到端的解決方案。從標準、內容、終端等多方面,構建全領域XR矩陣,將XR技術賦能應用在教育、醫(yī)療、工業(yè)、體育、演藝等多個領域與場景。并以開放的態(tài)度,與產業(yè)伙伴一道共同建設健康的XR大生態(tài),助力中國XR產業(yè)快速發(fā)展。