Email:[email protected]
,提供了跨設備和平臺的手勢交互的通用框架和規(guī)范,涵蓋了手勢識別、生成和理解的通用方法,標準清單見表5。
表5 ISO/IEC 30113系列標準清單
標準號 | 標準名稱 |
ISO/IEC 30113-1:2015 | 信息技術 用戶界面 跨設備和方法的基于手勢的界面 第1部分:框架 |
ISO/IEC 30113-5:2019 | 信息技術 用戶界面 跨設備和方法的基于手勢的界面 第5部分:手勢界面標記語言(GIML) |
ISO/IEC 30113-11:2017 | 信息技術 跨設備和方法的基于手勢的界面 第11部分:通用系統(tǒng)操作的單點手勢 |
ISO/IEC 30113-12:2019 | 信息技術 用戶界面 跨設備和方法的基于手勢的界面。第12部分:通用系統(tǒng)操作的多點手勢 |
ISO/IEC 30113-60:2020 | 信息技術 跨設備和方法的基于手勢的界面 第60部分:屏幕閱讀器手勢的通用指南 |
ISO/IEC 30113-61:2020 | 信息技術 跨設備和方法的基于手勢的界面 第61部分:屏幕閱讀器的單點手勢 |
語音識別方面,全國信標委用戶界面分委會(TC28/SC35)制定了智能語音交互GB/T 36464和GB/T 41813系列標準,規(guī)定了智能語音交互系統(tǒng)通用功能架構、移動智能語音交互系統(tǒng)的術語定義和系統(tǒng)框架以及要求和測試方法。
《國家新一代人工智能標準體系建設指南》和《國家人工智能產業(yè)綜合標準化體系建設指南(2024版)》都提出要建設自然語言處理、智能語音、計算機視覺、生物特征識別、人機交互/人機混合增強現實等關鍵技術標準,推動人工智能技術創(chuàng)新和應用。
3
生成式AI技術
2024年2月,OpenAI發(fā)布了文生視頻人工智能模型Sora,引起了廣泛關注。OpenAI將ChatGPT所用的Transformer算法,與擴散模型相融合,形成了新的底層算法模型DiT,使Sora實現了對語言的深刻理解,在視頻生成上表現出了很強的“涌現”能力。
創(chuàng)建豐富和高體驗度的虛擬和虛實結合內容與場景,需要投入高昂的人力、物力和時間成本,極大限制了創(chuàng)新速度和規(guī)模,是元宇宙發(fā)展的關鍵瓶頸。生成式AI技術將為XR的3D模型、場景、動作和腳本的創(chuàng)建提供前所未有的自由度,讓開發(fā)者能夠專注于用戶體驗創(chuàng)新,實現高質量XR內容、場景和虛擬世界的快速構建。
此外,XR中的虛擬場景、人物,需要與用戶進行有效的實時交互,提供高度定制化的體驗感。傳統(tǒng)方法只能實現預設式的基本交互功能,而