新型軟件實現(xiàn)用戶與3D人物角色對話

來源:投影時代 更新日期:2010-09-25 作者:pjtime資訊組

    名古屋工業(yè)大學 (Nagoya Institute of Technology) 的語音處理實驗室 (Speech Processing Laboratory) 已經(jīng)打造出一款用于建立在個人電腦上運行的語音互動系統(tǒng)的軟件工具包 “MMDAgent” 。用 “MMDAgent” 建立的語音互動系統(tǒng)使得個人電腦用戶可以與顯示器上顯示的 3D(三維)人物角色對話,效果逼真,仿佛與真人聊天一樣。 “MMDAgent” 軟件工具包融合了語音識別、語音合成、 3D 角色顯示和語音交互控制等多項單元技術(shù)。其功能包括:

    “MMDAgent” 是自主開發(fā)的、先進的語音合成和語音識別技術(shù)的高水平整合。它由該實驗室經(jīng)過長時間開發(fā)并推出的語音合成工具包 HTS (基于隱馬爾可夫模型 (HMM) 的語音合成系統(tǒng))和具備高速、準確和極富表現(xiàn)力的對話能力的語音識別引擎 Julius 相結(jié)合。

    該工具包擁有基于 OpenGL 的先進的 3D 描繪功能。它通過采用卡通描繪和陰影映射來實現(xiàn)真實的 3D 描繪,并利用一個物理引擎來達到呈現(xiàn)逼真表情的目的。

    該工具包的語音互動控制部分可以使不懂專業(yè)知識的用戶應對各種內(nèi)部條件和外部環(huán)境(包括語音輸入等)的變化,描述出細膩豐富的語音對話場景。

    “MMDAgent” 預定作為開源軟件發(fā)布。由于其各種模型等的數(shù)據(jù)格式符合開源規(guī)格,用戶可以對人物角色的 3D模型、動作和聲音以及整個對話場景進行自定義,而且可以使用現(xiàn)有的模型和數(shù)據(jù)。

    “MMDAgent” 將在2010年日本高新技術(shù)博覽會 (CEATEC Japan) (10月5日在幕張國際會展中心 (Makuhari Messe) 拉開帷幕)上亮相,該系統(tǒng)將被置入一個大的顯示屏,演示其用于實物大小的數(shù)字標牌的功能。在展會上,參觀者將能夠與流行的 3D 角色逼真對話。該語音處理實驗室作為一個專門的項目實驗室,致力于名古屋工業(yè)大學的國際語音語言處理研究, Tokuda & Lee Laboratory 在其中發(fā)揮主要作用。該實驗室一流的語音技術(shù)研究成果已經(jīng)以開源軟件的形式對外公布。

    應用實例:

    數(shù)字標牌

    娛樂

    服務(wù)臺引導系統(tǒng)

    宣傳

    參考圖:

    該系統(tǒng)的外觀(人物角色是“Mei-chan”,出現(xiàn)在名古屋工業(yè)大學校園信息導向系統(tǒng)的屏幕上)。

    Crypton Future Media, Inc. 創(chuàng)造的人物角色“初音未來” (Miku Hatsune) ,顯示在執(zhí)行屏幕上。

   

廣告聯(lián)系:010-82755684 | 010-82755685 手機版:m.pjtime.com官方微博:weibo.com/pjtime官方微信:pjtime
Copyright (C) 2007 by PjTime.com,投影時代網(wǎng) 版權(quán)所有 關(guān)于投影時代 | 聯(lián)系我們 | 歡迎來稿 | 網(wǎng)站地圖
返回首頁 網(wǎng)友評論 返回頂部 建議反饋
快速評論
驗證碼: 看不清?點一下
發(fā)表評論