元宇宙与人工智能(vr元宇宙概念)

(报告监制:华泰证券)
1元的应用对硬件提出了更明确的要求,将推动人机交互的逐步升级。我们认为VR/AR/脑机接口是下一代人机交互平台,它包括微显示器、传感器、芯片和算法。回顾人机交互的整个发展过程,可以看到人机交互的指令输入形式和反馈输出形式都在向更低的操作门槛和更高的交互效率进化。目前,我们正站在智能手机时代和下一个交互形式的交界处。我们认为,虽然VR/AR与上一代交互设备相比,在输入技术(传感)和输出技术(显示)上有了显著的飞跃,但仍处于发展初期。随着元宇宙应用的发展和内容生态的完善,元宇宙对硬件的需求逐渐清晰,这将推动VR/AR/脑机接口设备的逐步升级,最终有望出现可媲美PC和智能手机的下一代硬件。从人机交互的历史来看,我们目前处于什么阶段?低操作门槛和高交互带宽是人机交互平台的核心发展方向。我们梳理了人机交互不同发展阶段输入输出形式的特点和演变趋势,认为操作便捷、交互带宽高的AR/VR/脑机接口将有望引领下一代交互模式。人机交互主要指人与系统交互的循环过程。具体来说,人类在接收和处理信息后,通过行为输出指令,计算机接收指令后改变系统的形态,然后通过显示输出反馈信息并被人类感知,从而触发人脑的信息处理和下一步的人机交互过程。回顾人机交互的发展历程,过去的人机交互主要经历了卡带式交互、问答式交互、视听式交互三个阶段,输入输出形式不断进化接近人类本能。
从指令输入形式的演变来看,在卡式交互的最早期,人们只能用穿孔卡片向计算机单向传输数字指令,指令单一,使用门槛极高;随着主机的出现,人类可以通过在键盘上键入命令语句来实现与计算机的问答(对应命令行界面)。虽然打字效率较上一代输入设备有所提高,但仍需要操作人员记忆大量命令语言;随着个人PC时代(图形用户界面GUI)的到来,通过使用鼠标和键盘的组合,结合“点击/轻击、滚动、拖放”等动作,操作者可以轻松实现快速切换和精确定位,显著降低操作门槛;手机时代,物理按键的消失,音频输入和触摸屏的出现,进一步丰富了用户的输入方式,简化了交互过程。我们看到人机交互的输入形式已经从机器语言发展到机器语言,再到自然语言。从反馈输入形式来看,人机交互经历了“命令行界面(CLI)-图形用户界面(GUI)-自然用户界面(NUI)”的过程,相应的视觉输出内容从单调的一维句子变为二维图形,最终有望以三维空间物体的形式呈现。同时,使用声学设备来增强听觉输出效果。此外,输出设备也从主机、桌面屏幕显示发展到笔记本电脑、手机甚至微投,逐渐移动化。随着元宇宙的出现,有望带动VR/AR/BCI的蓬勃发展。我们认为VR/AR/BCI将是下一个交互时代的代表性操作平台,主要是因为它高度符合输入输出形式的演进趋势。在输入角度上,VR/AR取消了之前的物理按键,主要结合手势输入、眼球追踪、面部表情识别和语音操控,而脑机接口则进一步从肌电输入转化为脑电输入;从输出上看,VR将构建一个集视觉、听觉、触觉等多维感官体验于一体的移动虚拟空间。对于用户来说,而AR会将其与现实空间叠加,充分实现虚实融合。VR/AR最初的概念分别在20世纪50年代和60年代提出,历经20年,经历了漫长的实验室发展和B端商业探索。随着波动的上升,产品形态也在不断向轻量化、小型化、深度沉浸的方向迭代。2010年后,随着互联网和智能手机终端的逐渐成熟以及消费终端的不断渗透,ARVR应用开始探索C端落地。21世纪的第二个十年,元宇宙被预言是互联网的下一个形态,ARVR也有望成为元宇宙中一个全新的人机交互平台。Qculus quest 2推动VR出货量首次达到1000万。2020年9月Oculus quest 2上市后,迅速成为爆款,销量持续火爆。2021年,在这款VR产品的带动下,VR的销量接近1000万台,创历史新高,其设计范式也被国内厂商模仿。未来我们会看到,随着应用生态的不断成熟,对VR硬件的升级也提出了相应的要求。我们认为,下一代显示单元的清晰度将从目前的4K提高到8K,重量将从近500g降低到约300g g,同时目镜的厚度将降低到目前的1/3,并且还将配备更多的传感器,以实现更多的交互方式,如眼球跟踪和手势跟踪。
AR技术的路径很多,micro-LED衍射光波导有望,但短期内很难出成熟产品。现阶段AR还处于探索期。从出货量来看,2020-2021年将维持在20-30万件之间(IDC数据);在产品形态上,依然以大厂为主,以一体机产品为主流;从技术上看,目前有很多路径,但都存在性能、良率、体积等问题。微LED衍射光波导被认为是最有希望大规模商用的AR光学系统。但由于micro-LED的技术问题,短时间内难以实现大规模商用。元宇宙应用场景将依次落地,或将定义下一代VR/AR/BCI的升级方向。我们相信,随着元宇宙应用场景的清晰,VR/AR/BCI未来的发展方向会逐渐清晰。VR/AR早期的硬件设备受限于应用场景和内容的单一化,用户对硬件设备的体验不完善。第一代VR/AR没有实现大规模增长。目前,我们看到游戏、电子商务、协同办公、社交互动、健身、医疗、视频和模拟训练(教育)等超宇宙的应用场景逐渐清晰,这对VR/AR/脑机接口的硬件端提出了更高的要求,有望带动多项底层技术,包括微显示技术、3D重建、生物传感器、肌电/脑电处理、全身追踪和空间定位等不断完善。
元宇宙时代的应用比移动互联网时代更强调沉浸感和互动性,不同的应用对两种效果的侧重也不同。其中,沉浸感可以通过更丰富的声音和画面效果、更多维度的感官交互获得,如借助场景渲染、沉浸声场、温度模拟、触觉感知等技术创建逼真的虚拟场景,使大脑有“亲近周围”的感觉;交互感要求各种输入方式降低人机交互的门槛,如通过识别语音或读取手势直接连接传达指令,无需打字或操作鼠标和键盘/按钮,以增强交互效率。我们认为根据不同应用对沉浸感和交互的要求,可以分为三个层次:1)逐渐成熟:视频和模拟训练(教育)。其中,模拟训练(教育)包括安全教育、公共安全演练、思想政治教育等。对沉浸感和交互要求最低。目前有商业案例;而视频领域对沉浸感的要求相对更高,但随着流媒体平台的内容生态已经相对完善,随着VR配套硬件向C端的渗透,我们认为视频会是最先成熟的领域之一。2)发展中:电商、社交、游戏、办公、健身。其中,电子商务和游戏更侧重于沉浸感的追求,而社交和协同办公对交互的要求更高。3)萌芽期:医疗,具体包括疾病监测、辅助微创手术、信号读取、刺激干预和仿生学等。随着心电、血糖、血氧等生物传感技术的成熟,疾病监测有望加速发展,而辅助手术、刺激干预、仿生学对输入输出的精度要求极高,相关企业和医疗机构仍在探索中。游戏:强调“沉浸感”的元宇宙游戏需要多平台/VRAR/云原生技术作为底层技术支撑。目前,游戏具有超宇宙的虚拟身份、朋友、经济系统等特征。但它们未能完全给玩家带来“沉浸感”。硬件主要受限于不成熟的近眼显示和多维感官感知技术。未来,超宇宙游戏将朝着沉浸感更强、内容生态更丰富的方向发展。需要借助成熟的场景渲染和沉浸声场技术增强声音和画面效果,借助全身运动跟踪、传感器、空间定位等技术增强临场感。我们相信
电子商务:虚实交融的沉浸式购物模式,为近眼显示、AI芯片、传感器带来发展机遇。传统电商平台仍以图片、视频等扁平化形式展示产品为主。近年来,尽管兴起了电商直播、AR试妆等形式,但一定程度上弥补了传统电商在购物上单薄的感知体验。但对于服装等SKU丰富的非标产品,用户仍然无法在线测试。在“在线当下”的终极需求驱动下,元宇宙时代的电子商务有望进一步突破物质世界的壁垒,通过AR/VR/MR等新一代人机交互平台,实现视听、甚至触觉等多感官交互的购物体验,打造3D虚拟商场、数字展厅等消费者购买场景。我们认为,这一过程主要取决于近眼显示、3D重建、触觉传感乃至虚拟现实等技术的成熟,这些技术将为相关微显示、传感器、芯片企业带来增长空间。协同办公/社交:在手势追踪、语音识别、眼球追踪、虚拟化身的帮助下,未来的超宇宙办公/社交有望突破物理空间的限制,为职场中的工作和朋友带来最近距离的面对面体检,提升办公制作、交流、协作的效率。目前,在移动互联网阶段,远程办公与理想模式有一定差距,在工作效率和沟通效果上仍有局限性。超宇宙办公/社交强调的是互动感。比如用户全程通过手势操作,可以满足在VR虚拟空间中举手、竖起大拇指的功能,显著降低人机交互平台的操作门槛,实现无距离交互。这一场景的实现将主要依靠手势读取、眼球追踪、语音识别、空间定位等VR/AR底层技术。
医疗和健康:VR/AR/大脑计算机硬件将配备先进的生物监测和脑电信号处理技术。在VR/AR中,虽然目前已经出现了拳击、攀岩、球类等辅助健身应用,但是糟糕的硬件佩戴体验限制了用户的使用时间。一方面,VR设备的眩晕感还没有完全消除,运动健身应用中高速变化的场景会进一步加剧不适;另一方面,目前主流的VR头戴设备重量大多在300g以上,VR一体机甚至普遍超过500g,大大增加了佩戴者运动时的负担。所以显示技术和轻薄是硬件厂商的重点方向。我们看好硅基有机发光二极管的发展机会(索尼、Vision等。)具有超薄、高清、低功耗、低延迟的特点,以及眼内AR设备(InWith和Mojo Vision等。)具有不敏感、不妨碍正常视线的优点。在生物监测方面,随着心率监测、血氧检测技术的成熟,一些智能手环、手表都推出了医疗级的功能。我们认为向更专业的医疗设备演进将是智能穿戴的一个重要发展方向。未来智能穿戴产品有望大规模搭载心电、无创血糖检测等新功能,为老年人、慢性病患者提供更专业的服务,这也对血糖、血氧等生物监测技术提出了更高的要求。从长远来看,人机交互硬件有望扩展到服务神经系统和肌肉系统瘫痪的患者(如脑部、脊髓疾病、中风、外伤等。)在医疗卫生领域。这种需求将为脑机接口技术创造可观的发展前景。视频:VR/AR技术带来高度沉浸式流媒体观看体验。传统影视作品、长视频、短视频仍然主要通过电视、影院、视频平台等媒介传播,受制于扁平化的表现形式。内容的表现力还有很大的提升空间。在元宇宙时代,观众有望用先进的VR/AR设备更沉浸地观看电影、直播秀、演唱会等内容,娱乐感和体验感将迎来质的飞跃。包括网飞、爱奇艺在内的长视频平台都在积极探索“元视频”的落地。比如网飞推出美剧《怪奇物语》的VR体验,爱奇艺推出以看电影为主要功能的手机盒子。借鉴移动互联网时代短视频生态的孵化过程,元宇宙作为互联网的下一站,也为视频创作提供了新的可能。比如通过建模、动作捕捉、人工智能制作的虚拟角色可以参与电视剧,影视内容创作有望迎来新的亮点期。
模拟/教育:将实现物理环境在虚拟空间中的模拟映射。模拟训练是指将现实场景再现到虚拟世界中,应用于军事训练、工业设计、教学训练、安全应急演练等复杂或高危领域。在工业领域,制造企业会充分利用虚拟仿真空间中的各种数据,优化工业生产中的设备工艺和作业流程。并且未来有望在虚拟场景中进行更大规模、更复杂的军事和应急训练,以达到节约训练成本、提高安全性的目的。例如,满恒科技开发了上海浦东机场VR消防应急演练系统,利用VR和5G云渲染技术模拟机场火灾突发事件以及机场消防人员如何在危险场景下进行消防应急救援,帮助提升机场系统整体应急能力。鉴于模拟训练的特殊性,其对沉浸感和交互性的要求相对较低,无需依赖高端硬件设备。目前,满恒科技、宜川城等企业已经实现商业化。
2 AR/VR:下一代人机交互平台VR: Oculus Quest 2开创爆炸范式,技术创新路径清晰。VR是虚拟现实(Virtual Reality)的简称,指的是计算机图形技术、计算机仿真技术、传感器技术、显示技术等科学技术,在多维信息空间中创造一个虚拟的信息环境。它是一种全新的人机交互方式,为用户提供视觉、听觉、触觉等感官的模拟,能使用户产生身临其境的感觉,与环境有完美的交互能力。目前常见的VR由头戴式显示设备和手柄组成。其中,头戴式显示设备集成了显示、计算、传感器等设备。它通过关闭人的外部视觉和听觉,将左右眼的图像分别显示在左右眼屏幕上,引导用户在虚拟环境中产生立体感。手柄负责跟踪用户手的位置,提供交互式按键和简单的触觉振动反馈。
VR头显经历了VR盒子、VR头盔、VR一体机三个阶段,爆款产品继续主导硬件消费市场。Q 21产品全球出货量达212.6万台,同比增长136.4%,其中Oculus Quest 2出货量占比75%,继续占据市场主导地位。从2014年开始,以爆款产品为主的行业销售特征并没有改变(2015-2017年三星VR盒子,2016-2018年PS VR,2019年至今Oculus一体机)。1)三星Gear VR:VR盒子时代的主流产品。三星与Oculus合作打造。推出的时候是和Galaxy系列捆绑销售的。2016年全年销量最高,近400万台。怎么用就是把手机放在VR盒子前面,用专用APP看电影。但由于发热、头晕等问题,其实体验并不出色。2)PS VR:VR头盔时代销量第一。VR头盔时代的HTC/Valve等产品其实性能比PS VR好,但主要是商用,价格高,出货量低。PS VR价格相对较低,捆绑PS 4,年销量100-200万台。3)Oculus Quest 2:VR一体机的爆发。为大量其他VR品牌打下产品模型。
Oculus Quest 2是一款充满妥协艺术的产品,在成本、硬件性能、消费者体验的多向平衡下,实现了VR产品的基本功能设想。相比VR头盔,我们认为Quest成功的原因包括以下几点:1)虽然会增加设备(电池芯片)的重量,但也会节省用户花费近万元购买PC主机的成本,降低用户的入门门槛。2)去掉了连接主机的连接线,提高了用户的移动空间和使用场景。用户不再需要一个独立的空间并配备一台主机,只需要室内的任何闲置空间即可使用。3)在跟踪方式上,摒弃了传统的由外向内的方式,因此不需要外置垂直的发射器和接收器。取而代之的是采用基于摄像机的由内向外的方法来实现6自由度的头部和手部跟踪。4)当芯片计算能力不足时,Quest 2还支持流式模式,可以作为PCVR使用,也满足了消费者对高渲染3A大作的需求。与上一代一体机如Quest 1: 1相比)与Oculus quest 1相比,第二代产品用Fast-LCD屏幕取代了有机发光二极管,简化了设计,降低了成本。2)将芯片从骁龙835升级到XR2,提升了处理器、显示器、图像、AI的性能。改变后产品刷新率显著提升,分辨率提升,眩晕问题大幅改善,基本实现了一款入门级VR产品的想法。目前的VR硬件构成与智能手机供应链高度重合:通过Ifixit的拆解,我们可以看到Oculus quest 2头显的主要部件包括显示器、光学镜头、传感器、主板和电池产品:1)显示模块主要采用Fast-LCD显示,接近4K分辨率,刷新率为90-120hz;2)光学系统使用菲涅耳透镜进行软件预处理,以提供具有宽视场、几乎没有失真和色差的正确图像;3)传感器:包括四个摄像头,用于追踪头部和手部动作,显示灰白色透视图像;4)主板:包括高通的SoC芯片XR2、电源管理芯片、DRAM(三星、梦龙、海力士)、NAND(闪迪)、WiFi等芯片;5)电源:3640mAh。
2022年VR将迎来一波创新技术潮流,MetaVR产品将升级,苹果将推出高端产品。据digitimes报道,我们推测Meta的下一代VR升级产品将于明年推出,将引入pancake光学模块和更多传感器,实现产品轻量化并升级手势识别、眼球追踪等功能;而苹果也将在2022年底推出高端VR解决方案。这种高端产品可以重新定义VR的产品形态。预计这款产品将配备微型有机发光二极管显示屏、复合菲涅尔透镜的煎饼方案、全彩色图像透视和更多传感器,为消费者带来全新的混合现实体验。煎饼式短焦光学是公认的下一代VR升级方向,让VR头显越来越薄。在更早的Meta的pancake专利中,我们可以看到一个显示模块包括带有四分之一波片和部分反射面的第一透镜、带有反射偏振片的第二透镜和显示器,从而实现了头显的薄型化。我们相信苹果也在探索使用三个菲涅尔透镜堆叠形成薄透镜组的方案。改进光学镜头的VR产品将会轻薄,头显重量可能会从500g降到200-300g。元摄像头数量或升级,充分利用骁龙XR2芯片的计算能力。我们认为Meta的下一代VR产品和苹果的MR产品都会加入传感器,主要是摄像头的种类和数量。据高通官网介绍,高通骁龙XR2芯片最多可支持7个摄像头(2个眼球追踪,2个混合现实,2个6DoF的头部追踪,1个其他),可实现MR混合现实功能。我们认为下一代Meta可能会充分利用骁龙XR2的计算能力来升级产品。实现方法:Meta或使用快速液晶显示屏,而苹果或使用微型有机发光二极管提供升级的视觉体验。我们认为下一代Meta或FastLCD屏幕将与quest 2的分辨率差别不大,但像素级控制的高级背光可以显示与有机发光二极管一样的纯黑色背景;苹果要么使用高分辨率、高对比度、宽色域和快速响应的微有机发光二极管显示器,价格昂贵。新一代苹果MR产品的价格可能会达到1500-3000美元,高于目前Oculus quest 2 299美元的最低价格。
AR:产品处于概念阶段,Micro-LED衍射光波导技术突破有望。AR(增强现实)是一个比较新的技术内容,促进了真实世界信息和虚拟世界信息的融合。与VR不同,AR可以将现实环境和虚拟物体重叠,然后同时存在于同一个画面和空间中。AR中的关键技术包括跟踪定位技术、虚实融合技术、显示技术和交互技术。目前AR眼镜还可以分为一体式和分体式。从出货来看,目前的一体式是主流。分离意味着计算单元或电池与头显分离。例如,Nreal头显支持通过type-C接口与智能手机和PC连接,允许智能手机和PC的内容无缝传输到眼镜,用户可以在眼镜上查看内容。一体化AR产品将显示器、传感器、计算、人类理解、环境理解等系统集成在一个头显上,提供更便捷的体验。AR销量小,增速波动明显,还在概念期。据IDC预测,2020-2021年AR年出货量(不含无屏查看器)在20-30万之间,增速波动较大。从品牌来看,除了爱普生和微软,其他很多品牌都没有实现AR的持续大规模销售,往往在1-2个季度爆发后就销声匿迹了。消费市场没有标杆品牌。我们认为AR作为消费电子产品还处于概念阶段。
从长期AR增量潜力来看,C端市场还在等待成熟的技术解决方案。我们认为长期来看AR终端有望取代手机,年出货量超过10亿部(相比手机出货量超过13亿部),但目前要达到这个目标还为时尚早。从应用来看,AR产品仍然没有杀手级的应用场景。从技术角度来说,虽然有机发光二极管水盆方案已经比较成熟,但是类似太阳镜的设计由于透光性差,无法支持整个环境的使用。其他微显示系统,如LBS/LCoS/DLP,仍在探索过程中。先说要求:一副合格的AR眼镜需要什么样的配置显示:微显示单元和光机模块决定了亮度、对比度、刷新率、分辨率等指标。目前市场上ar眼镜的近眼显示系统采用微显示器作为图像源器件,产生图像后投射到自由曲面/光波导等光学模块,再进入人眼。由于AR图像源产生的图像会随着太阳光一起进入人眼,如果在户外不戴太阳镜,眼睛的亮度应该超过2000尼特,甚至达到5000尼特,这样才能在各种天气条件下清晰显示图像。根据我们的估算,目前一款光波导眼镜的光效率约为3-5%,即像源的亮度至少要达到10万尼特左右才能满足AR眼镜的亮度要求。此外,75Hz以上的刷新率,25视野720P的分辨率,支持局部刷新,低功耗下保持静止图像,都是AR眼镜的及格线。人、机、环境有效互动:SLAM传感器AI用于理解环境,理解用户,实现虚拟信息与现实世界的结合。为了实现虚拟信息和真实场景的叠加,需要实现用户的空间位置和虚拟物体在真实空间中的位置。除此之外,为了将虚拟信息与输入的真实场景无缝结合,提升AR用户的体验,还需要考虑虚拟事物与真实事物之间的遮挡关系,实现几何一致性、模型真实性、光照一致性和色调一致性。从80年代至今,SLAM传感器、算法和技术框架的不断完善,是实现自我态度评价和虚拟图像反馈,构建人与虚拟内容有效互动的主要手段。
其他:能耗、适应性、体积、重量。一般来说,一款成熟的AR产品还需要满足其他要求,包括-40 ~ 80的温度适应范围,5000小时以上的整体使用寿命,合适的配重,300g左右的重量等。这些要求也将限制其他组件的选择,例如微显示系统、电池和光学模块。微显示技术:Micro-LED有望成为AR主流。目前提出的微显示技术包括有机发光二极管(有机发光二极管)/LCoS(硅上液晶)/DLP(数字光处理)/LBS(激光束扫描仪),但这些技术无法兼顾成熟度、性能、成本等指标。MicroLED是业界公认的最佳AR显示解决方案,但存在技术不成熟、难以量产等问题。真正大规模商用可能在2025年左右。LCoS ——局限性多,逐渐淡出LCoS作为微显示技术,局限性明显,逐渐淡出微显示领域。LCO的优点是技术成熟、成本低、每英寸像素高、功耗低,在早期的AR器件中应用广泛,如灵犀灵犀AR (LCoS几何光波导)、Magic Leap One (LCoS衍射光波导)。但是缺点也比较明显,比如对比度低,尤其是大入射角的情况下;由于必须配合PBS使用,限制了整个光机的小型化和轻量化(目前体积较小的digilens的LCoS光机体积为2.5立方厘米);低温没办法工作,环境适应能力差。因此,大量厂商积极寻求LBS/DLP等解决方案替代LCoS,搭载LCoS的新机型逐渐淡出aft
基于硅的有机发光二极管——亮度较低,目前难以应用于室外AR场景。基于硅的有机发光二极管的缺点很明显,它的应用仅限于VR和类似的设备。目前市面上主流硅基有机发光二极管产品的亮度都在3000尼特以下,与10万尼特的要求相差甚远,很难应用到户外ar场景中。同时,由于产品的制作工艺更加复杂,其价格比LCoS贵50%以上,但在高亮度模式下使用寿命会低于3000小时,而且很有可能会烧屏,因此整体性价比较低。因此,尽管一些AR制造商已经使用硅基有机发光二极管而不是LCoS,但它仍然不是AR图像源的最佳解决方案。LBS ——激光二极管对温度敏感,分辨率差。与LCoS等其他显示技术相比,LBS技术优势明显。LBS系统主要由激光器、光学器件和MEMS反射镜组成。由于LBS采用激光光源逐像素渲染,相比其他非激光、逐帧渲染方案,LBS自然具有低延迟(激光纳秒vs普通光源毫秒)、画面停留时间短、亮度高、能耗低、色彩丰富等优势。此外,为了获得更大的视角和更高的分辨率,其他技术必须增加微镜的数量并扩大产品尺寸。而LBS方案只能通过改变MEMS微镜的振动频率和反转角度来实现,因此更容易实现光机的轻量化和小型化。(目前LBS光机体积约为0.5-1.5立方厘米)。LBS技术可能的局限性来自于低分辨率和图像质量。目前主流LBS产品的分辨率都在720P左右,提高分辨率可能成本更高。硬件/软件公司Rave的首席科学家卡尔古塔格(Karl Guttag)对LBS的HoloLens 2和LCoS的HoloLens 1进行了对比测试,发现虽然HoloLens 2的垂直视角比第一代增加了近一倍(30度vs 17.5度),但在分辨率和色彩均匀性方面的表现却更差。此外,HoloLens 2的实拍色彩饱和度较低,观感模糊,雾感较大。
DLP ——对温度比较敏感,所以DLP很难小型化。由于其成本高、体积大,在AR场景中的应用受到限制。DLP(数字光处理)系统的核心是TI专利的DMD芯片(数字微镜器件),由百万个独立的高反射铝制微透镜组成。每个镜头由大量超小型数字光学开关控制。这些开关可以接受以电子信号表示的数据字节,然后产生光字节输出,将输入到DMD的视频或图形信号转换成高清、高灰度的图像。DLP投影系统比其他所有的显示系统都有更强的亮度,因为DLP是基于透镜的,提高了光传输效率。但由于其设计难度大、结构复杂、制作成本高、体积大等缺点,目前在AR、HUD等设备中应用并不广泛。MircoLED ——还处于早期阶段,还有很多技术问题需要解决。MicroLED产品性能卓越,是业界公认的最佳AR显示解决方案。Micro LED是LED小型化技术,通过将传统的LED阵列和小型化转移到电路基板上,形成超小间距LED,可以将毫米级LED的长度进一步缩小到微米级(约50um,为原有LED的1%)。与其他技术相比,MicroLED产品在亮度、对比度、工作温度范围、刷新率、分辨率、色域、功耗、延时、体积、寿命等方面都有很大的优势。有望成为下一代主流显示技术的重要路径。
MicroLED发展的瓶颈在于微米级像素尺寸和间距给量产和全彩方案带来的巨大挑战。MicroLED生产包括芯片和背板制造、质量转移、键合、驱动、检测和维护等。由于其晶粒尺寸为微米级,需要加工数百万甚至数千万颗晶粒才能生产出单一成品,这对技术效率和成品率提出了极其严格的要求,现有的技术水平无法满足其量产要求。但是,微LED晶粒的发光效率、波长一致性和成品率还没有达到微LED彩色显示的要求。基于此,现有的MicroLED屏幕价格昂贵,单个芯片的价格超过1000美元。2018年,三星展示了采用microLED技术的墙壁电视。146英寸版本的价格高于10万美元。光学模块:从几何光学到纳米光学,AR眼镜和VR的区别在于,AR眼镜需要透视,不仅是真实的外界,还有虚拟的信息。因此,成像系统不能阻碍实现,这需要添加一个或多个光学组合,通过层压将虚拟信息与真实场景融合。该设计包括自由曲面、光波导等。制作方法从几何光学到纳米光学。光学镜片的传统加工方法有切割/注塑/镀膜/抛光等。然而,随着光波导等光模块的复杂化,传统的加工工艺带来了生产流程复杂、成品率低等问题。国内外厂商包括Digilens、WaveOptics、智格科技、龙晶光电等。已经开始探索诸如纳米压印和紫外光处理的处理方案。自由曲面解决方案:自由曲面棱镜/反射镜,水盆。微显示器的光源来自眼睛上方:1)水盆方案:分光镜同时反射和投射光线,使用户在看清现实世界物理场景的同时,也能看到微显示器产生的数字图像。位于分束器一侧的凹面镜用于反射光线并将其重定向到眼睛。水盆结构的AR眼镜通常尺寸较大,视场角适中(50左右)。由于分光镜是半透半反镜,光线通过分光镜时会被多次反射,每次反射会产生50%的光损失,所以能量损失严重。2)自由曲面镜:仅使用一个曲面镜来收集来自微显示器和真实世界的光。自由曲面镜面结构的AR眼镜体积也很大,可以达到50 ~ 100的视场角,但视场角取决于光源的大小。由于光只被反射一次,自由曲面镜结构的光损耗明显减少。3)自由曲面棱镜:将两个折射面、一个全内反射面和一个部分反射面巧妙地组合成一个元素,增加了结构的自由度。这种结构可以增大视角,提高成像质量,但光学元件厚度较大,通常需要校正棱镜来消除自由曲面棱镜对环境光的折射。光波导技术解决方案:几何/阵列光波导、浮雕光栅光波导、布拉格光栅光波导。光波导技术是响应增强现实需求而诞生的一种独特的光学元件。由于其轻薄和对外部光的高穿透性,它被认为是消费者AR眼镜的必要光学方案。AR眼镜透光的关键是“全反射”。实际上,波导技术并不是什么新发明。光纤是一种波导,但它传输的是不可见的红外光。光-机成像过程完成后,波导将光耦合到自身的玻璃基底中,通过“全反射”原理将光传输到眼前后释放,从而完成图像的传输。
视角的要求需要玻璃基板材料。视角越大,玻璃基板的折射率越高。因此,传统玻璃制造商,如GLW美国和肖特(未上市),近年来一直在开发用于近眼显示市场的特殊高折射率和薄玻璃基板,并仍在试图不断增加晶体尺寸以降低波导生产的单位成本。具体来说,目前的光波导技术可以分为以下三种:1)几何/阵列光波导。这个概念和专利已经由以色列公司Lumus提出,并不断优化迭代。基本原理是反射表面或棱镜通常用于将光耦合到波导中。经过几轮全反射后,当光线到达眼镜前方时,会遇到“半透半反”的镜面阵列,将光线耦合出波导。目前几何/阵列光波导只能实现一维瞳孔放大。这里的“半透半反”反射镜阵列相当于在水平方向上复制出瞳的多个副本,每个出瞳输出相同的图像,这样眼睛在横向移动时就能看到图像。这是一维瞳孔放大技术(1DEPE)。几何/阵列光波导工艺流程复杂,提高良率难度极大。在“半透半反”反射镜阵列的镀膜过程中,由于光线在传输的过程中会越来越少,阵列中的五个或六个反射镜中的每一个都需要不同的反射透过率(R/T)来保证整个动眼框架内的均匀光输出。而且由于几何波导传输的光通常是偏振的,每个反射镜的镀膜层数可能达到十几层甚至几十层。这些反射镜经过镀膜后一层一层叠起来,用特殊的胶水粘合,然后斜着切割出波导的形状。在这个过程中,反射镜之间的平行度和切割角度会影响成像质量。所以即使每道工序都能达到高产,这几十道工序的总产率也是一个挑战。每道工序的失败都可能导致成像的缺陷,如背景上的黑条纹、光线亮度不均、鬼影等。
2)浮雕光栅衍射光波导。用平面衍射光栅代替传统的光学结构,浮雕在材料表面的峰谷在材料内部形成折射率的周期性变化。通过设计光栅的参数(折射率、光栅形状、厚度、占空比等。),可以将某一衍射级次(即某一方向)的衍射效率优化到最高水平,使得大部分光在衍射后主要沿该方向传播。二维扩瞳可以通过衍射光栅实现,digilens和WaveOptics分别有两种技术方案。HoloLens I,Vuzix Blade,Magic Leap One,DigiLens等使用的方法。当入射光栅将光耦合到波导中时,它将进入旋转光栅的区域。这个区域的光栅沟壑方向与入射光栅成一定角度,所以它会像镜子一样反射来自X方向的光,然后沿着Y方向传播。另一种实现二维扩瞳的方法是直接使用二维光栅,即光栅在至少两个方向上具有周期,将单向的“沟壑”变成柱状阵列。波动光学采用这种结构。从入射光栅耦合进波导的光直接进入二维柱状阵列发射区,可以同时在X和Y两个方向扩展光,同时一部分光在传播的同时被耦合出进入人眼。
3)布拉格光栅衍射光波导(也叫全息光栅光波导)。光学全息术是利用点光源的干涉条纹记录在记录材料的薄膜上,然后经过加工制成具有光栅条纹结构的薄膜光学元件,具有光束准直、聚焦和偏转功能。光的衍射符合布拉格定律,只有满足布拉格条件的入射光才会被衍射,不满足布拉格条件的入射光不会被衍射。目前做全息体光栅(VHG)波导方案的厂商很少,包括十年前为美国军工做AR头盔的Digilens,曾经生产单色AR护目镜的索尼,被苹果收购的Akonia。优势显著,不断探索。该技术具有体积薄、重量轻的优点,可以同时记录多张全息图,使得取代棱镜、立方体分束器、光栅等许多传统光学元件成为可能,进一步缩小AR头戴显示器的体积。由于可用材料的限制,体积光栅可以实现有限的折射率差,这导致它没有达到与FOV的表面浮雕光栅相同的水平,光效率和清晰度。但由于其在设计壁垒、技术难度、制造成本等方面的优势,业界从未停止对这一方向的探索。SLAM:了解环境和用户,实现虚拟信息和现实世界的结合。SLAM(Simulated Localization and Mapping),同步定位与建图,是指在运动过程中通过反复观察环境特征来定位自己的位置和姿态,然后根据自己的位置建立周围环境的增量地图,从而达到同时定位和建图的目的。现代SLAM系统可以分为前端和后端。前端传感器实现数据关联,研究帧间变换关系,主要完成实时姿态跟踪,处理输入图像,计算姿态变化。后端主要是对前端的输出结果进行优化,得到最佳的姿态估计和地图。
SLAM传感器、算法、技术框架等等不断完善,实现自我态度评价和虚拟图像反馈,构建人与虚拟内容的有效互动。从上世纪80年代开始到其出现,采用SLAM算法的传感器出现了视觉(单目、双目、RGBD、ToF等相机)、惯性/磁力(IMU等传感器)、声纳、2D/3D激光雷达等一系列解决方案。SLAM算法也从最初的基于滤波的方法(EKF、PF等)发生了变化。)到基于优化的方法,技术框架也从最初的单线程发展到多线程。SLAM在ARVR中有很多应用。AR主要侧重于1)真实物体与虚拟物体的有效交互,2)实现语义理解,优化智能辅助功能:实现虚拟世界与真实世界的坐标叠加,实现几何和物理信息交互。与电脑、平板、手机的3D显示不同,AR更注重虚拟信息与真实信息的无缝融合,即图像的平面位置和景深准确,带来良好的沉浸感体验。这就需要SLAM算法精确叠加虚拟坐标系和真实坐标系。同时现实环境中有起伏,有障碍,有遮挡物,AR可以让虚拟信息在这些现实环境中与物理信息进行交互。
实现语义理解,优化智能辅助功能。随着机器学习和深度学习的发展,虚拟信息可以“理解”现实世界,使得两者的融合更加自然。目前计算机已经可以识别图片的内容,但是并不理解内容之间的关系。目前的一个研究方向是应用SLAM AI技术,通过特征提取实现机器的语义理解,优化AR系统的辅助功能。传感器:交互方式和应用场景的升级促进了传感器升级AR中交互方式的升级,带来了更多的信息需求。随着人机交互从2D发展到3D,交互方式逐渐多样化,向人的本能发展。手势交互、手势交互、眼动交互、语音交互,甚至生物信号与周围环境交互的结合都在不断发展,需要更多种类的信息。用户运动信息、生物信息和其他环境信息将为人机交互提供底层支持。大量的信息需求为体育、生物、环境等各种传感器提供了增量机会。目前,苹果手机和手表中广泛使用了多种运动和生物传感器。相比之下,VR爆款产品Oculus quest 2头显只配备了四个黑白摄像头,手柄配备了两组陀螺仪加速度传感器。未来,为了实现更深的沉浸感和更便捷的交互,测距摄像头、眼球追踪摄像头、精细化的压力传感器,甚至生物和环境传感器都将逐步配备。
3脑机接口:我们离科幻电影还有多远?对于大多数人来说,最早接触脑机接口这个概念来自科幻电影。无论是《X-战警》中博士的心灵控制,还是《黑客帝国》中的锡安通过接口连接电脑,快速学习各种知识和技能,进入黑客帝国的虚拟世界,还是《沙丘》中的人通过脑科学的探索不断开发大脑潜能,训练出来的领航员的大脑可以与大型计算机相媲美。人脑的潜力:超级计算机?用电子计算机模拟人脑需要172PFlops。人脑有近860亿个神经元,每个神经元有10000个连接点,负责人的运动、听觉、语言、嗅觉、记忆、思维、性格、情感等功能。据我们估算,如果要用计算机模拟人脑活动,需要172PFlops(对应神威太湖之光的93PFlops,美国Summit的122.3PFlops)。人脑的潜力可以达到超级计算机的计算能力。脑机接口或支撑人脑潜能的可持续发展。马斯克提出的一个经典论点是“人类不能被AI淘汰,要和AI融合,创造大脑和计算机的接口”。随着我们对脑科学的不断了解,以及脑机接口技术下人类肢体限制的突破,人类大脑的潜力可能会得到释放。
脑机接口:应该如何定义?脑机接口(BCI)是由UCLA的Jacques J. Vidal于1976年提出的。一个完整的BCI过程包括四个步骤:信号采集、信息解码、信号输出/执行和反馈。脑机接口可以通过电、磁、光、声来采集和反馈信号,脑电技术是目前主流的探索方向。事实上,有许多方法可以收集中枢神经系统信号来监测大脑活动,包括脑电图、功能近红外光谱(FNIR)、功能磁共振成像(FMRI)等。反馈技术还包括电、磁、声、光。在这些监测技术中,脑电信号以其时间分辨率高、价格低廉、便于携带等优点,逐渐成为脑机接口最主流的研究方向。1)脑电采集:脑电采集是BCI的关键步骤,采集效果、信号强度、稳定性、带宽直接决定了后续的处理和输出。由于大脑中枢神经元膜电位的变化会产生棘波或动作电位,神经细胞突触间传递的离子运动会形成场电位,因此通过在大脑皮层运动神经中外接或植入微电极,可以采集并放大这些神经生理信号。2)信号解码处理:信号处理是将大脑活动转化为电信号,去除干扰无线电波等信号,对目标进行分类处理,转换成相应的可以输出的信号。3)信号输出与执行:信号输出是指将采集处理后的脑电波信号作为基本的数据处理内容传输到连接的设备,或者反馈到终端机器形成指令,甚至直接交互。4)反馈:信号执行后,装置会产生动作或显示内容,参与者通过视觉、触觉或听觉感受到第一步产生的脑电波已被执行,并触发反馈信号。
根据脑电信号的采集方式,目前的脑机接口可以分为有创、无创和无创三种,更多用于消费端的脑电监测。无创方法是在人/动物大脑外部佩戴脑机接口设备,通过采集脑电和神经电来获取大脑信息。然而,信息的准确性和分辨率较低,可以用于简单的信号判断和反馈,但难以传达复杂的指令,例如帮助身体残疾的人通过思维操纵机械骨骼,或用于VR/AR游戏应用中的基本手势控制。无创方法根据采集的信息不同可以分为EEG(采集脑电图)和MEG(采集磁场)。1)脑电:Ag/AgCI电极通过导电胶固定在头皮上,测量头皮脑电信号,但一般只能监测到0-50Hz相对较窄频段的信息。2) MEG:通过测量细胞内离子电流产生的小磁场来获得信号,但由于成本高,操作方法繁琐(电磁封锁环境,保持绝对静止),MEG并不是理想的解决方案。有创脑机接口主要应用于医疗康复领域。侵入式装置直接植入人/动物大脑的灰质或颅腔内,可以获得相对高频、准确的神经信号。它不仅可以通过读取脑电信号来控制外部设备,还可以通过精确的电流刺激使大脑产生特定的感觉。侵入式脑机接口可分为ECoG、LFP、SUA等类型。1) ECoG:测量大脑皮层的电位,类似脑电图技术,但可以监测更大带宽的信息;2)SUA LFP:测量大脑皮层的场电位和棘波电位可以通过Mircowire阵列、Michigan阵列、Utah阵列、神经营养电极等多种传感器实现。侵入式方法采用电信号,空间分辨率高,信噪比好,频带较宽。但目前仍面临入侵引发的安全问题、难以获得长期稳定的记录、医护人员长期连续观察等问题。目前,它的应用还仅限于医疗康复领域。
侵入式工具也作为一种新的非开颅植入方案出现。2021年8月,来自美国加州大学伯克利分校的Synchron公司研发的微创脑机接口获得食品药品监督管理局(FDA)批准进行人体临床试验。它的脑机设备很小,可以安全地穿过血管。因此,BCI直接通过颈静脉植入,该装置通过导管手术输送到大脑和脊柱。该设备可以在两小时内植入患者大脑,无需开颅。由于不需要开颅,这种传感器可以灵活地布置在大脑的许多位置,以捕捉各种类型的信号。连接到传感器的BrainPort接收器被植入患者的胸部。它没有内置电池,而是无线提供电源和数据传输,进一步提高了安全性。通过Synchron开发的BrainOS操作系统,可以将传感器读取的信号转换成通用信号与外界进行交互,从而实现用大脑与外界的交流。
应用持续拓展支撑起近千亿美元商用市场医疗、消费市场应用的持续拓展或支撑起千亿市场规模。随着人们对大脑的认知、电极设计、和人工智能算法的精进,脑机接口领域应用也持续拓展,并向更加精细化发展。脑机接口相关的研发已经在仿生学、医疗诊断与干预、消费电子等多个领域进行持续探索,我们认为相关产品可能将在未来20-30 年内陆续商业化,支撑起近千亿美元的市场规模。二十世纪七十年代到九十年代末,脑机接口技术经历了从概念期到科学论证期的发展。二十世纪七十年代至八十年代,“脑机接口”专业术语出现,1977 年Jacques J. Vidal 开发了基于视觉事件相关电位的脑机接口系统,通过注视同一视觉刺激的不同位置实现了对4 种控制指令的选择。1980 年德国学者提出了基于皮层慢电位的脑机接口系统。 二十世纪八十年代后,少数先驱研发了实时且可执行的脑机接口系统,并定义了至今仍在使用的几种范式:1) 1988 年L.A. Farewell 和E.Donchin 提出了著名且广泛使用的脑机接口范式P300 拼写器,表明系统有望帮助严重瘫痪患者与环境进行通信和交互。不久后研究人员都开发出基于感觉运动节律的脑机接口系统,该系统可以控制一维光标向使用者反馈运动节律幅度,从而通过训练实现通过想象控制小球向上或向下移动。2) 1990 年左右Gert Pfurtscheller 开发出另一种基于感觉运动节律的脑机接口,用户必须明确地想象左手或右手运动,并通过机器学习将其转化为计算机命令,这定义了基于运动想象的脑机接口。3) 1992 年Erich E. Sutter 提出了一种高效的基于视觉诱发电位的脑机接口系统,在该系统中设计了8×8 拼写器,利用从视觉皮层采集的视觉诱发电位识别用户眼睛注视方向来确定他选择拼写器中的哪一个符号。肌萎缩侧索硬化症患者可以实现10 个单词/分钟的通信速度。二十一世纪以来脑机接口技术高速成长,新范式、新算法、新设备层出不穷,早期范式性能明显提高。新型脑机接口实验范式相继涌现,如听觉脑机接口、言语脑机接口、情感脑机接口以及混合脑机接口。先进的脑电信号处理和机器学习算法被应用于脑机接口,如空间模式算法、xDAWN 算法等,新型的脑信号获取方法如功能核磁共振成像测量的血氧水平依赖信号以及功能近红外光谱测量的皮层组织血红蛋白浓度等被用于构建非侵入式脑机接口。除此之外,早期开发的基于P300 和视觉诱发电位的脑机接口性能得到了明显提高,并在初步的临床试验中证明适用于肌萎缩侧索硬化症、脑卒中以及脊髓损伤患者。近十年脑机接口研究范围和规模持续扩大。规模上看,2018 年第七届国际脑机接口会议聚集了221 个研究团队。从技术普及方面看,消费级脑电传感器和脑机接口系统问世并进入市场,免费开源的脑机接口软件也不断更新,脑电信号处理算法的性能显著提高,同时提出了脑机接口人因工程,从用户层面(即用户体验、心理状态、用户训练)提高脑机接口的满意度和实用性。目前脑机接口应用已经超过临床医学领域,拓展应用到情绪识别、虚拟现实和游戏等非医学领域,被动脑机接口、协同脑机接口、互适应性脑机接口、认知脑机接口、多人脑-脑接口等众多范式涌显。应用场景#1:医疗健康领域是脑机接口当前最接近商业化的领域脑机接口可以帮助实时监控和测量神经系统状态,辅助临床判读。
“监测”型脑机接口应用方向十分多样,包括评测陷入深度昏迷患者的意识等级,测量视/听觉障碍患者神经通路状态协助医生定位病因等等。除此之外,通过结合脑电、视频等多元信息进行诊疗,能够辅助医生判读脑损伤、脑发育等多种临床适应症。监测到的脑电信息可以用于加工、反馈,针对多动症、中风、抑郁症等做对应的恢复训练。 例如,对于运动皮层相关部位受损的中风病人,脑机接口可以从受损的皮层区采集信号, 然后刺激失能肌肉或控制矫形器,改善手臂运动;运动想象类脑机接口可以用于孤独症儿童的康复训练,提升他们对于感觉运动皮层激活程度的自我控制能力,从而改善孤独症的症状,也可以通过脑电信号的反馈,训练使用者的专注力。
基于电、声、光、磁刺激进行神经调控的脑机接口已经实现商业化。相关应用包括:通过电刺激治疗进行神经康复,主要针对脑卒中、 帕金森等中枢神经或周围神经损伤所致的运动功能障碍,如偏瘫、肌萎缩、肌力低下、步行障碍、手功能障碍;通过颅磁刺激治疗抑郁症,以及对脑卒中所致的言语功能障碍、吞咽障碍、认知功能障碍进行治疗。经颅磁刺激用于抑郁症治疗已在美国、 加拿大、新西兰、以色列等国家明确获批,与药物治疗相比, 经颅磁刺激具有副作用小、安全性高、无痛苦、不易成瘾、不会影响认知功能等优势。非侵入式脑机接口智能义肢已经实现消费端使用。BrainCo 强脑科技在2019 年推出世界上第一款可以意识控制每一根手指的非侵入式智能仿生手后,在今年再次推出一款适合不同伤残等级的仿生腿产品。根据公司介绍,这款产品每秒可提取2 万个肌电神经电数据,因此能快速、准确地识别用户意图,并根据环境、肌肉接口技术在义肢方向的应用。脑机接口也可以使丧失说话能力的人能够恢复沟通能力。通过脑机接口输出文字,或通过 语音合成器发生,帮助脊髓侧索硬化症患者、重症肌无力患者、以及事故导致高位截瘫患 者等重度运动障碍患者群体,通过脑机接口系统将自己脑中所想表达出来。
应用场景#2:消费电子与 AIoT 领域展开消费端应用脑机接口技术可以与消费产品相结合,提供更直觉交互体验。早在 2014 年,加难道公司 Thalmic Labs 就推出了一款臂带式控制器 Myo,通过感知肌肉的生物电活动,可以让使用 者只需要动动手指就可以无线控制身边的计算机和其他数字产品。随着技术的持续升级, 当前臂带式控制器可以实现通过识别活动意念带来的电流进行控制,意念打字、意念操作 玩具等已经不是幻想。在脑机接口的支持下,游戏玩家可以用意念来控制 VR 界面的菜单导航和选项控制,获得了 独立于传统游戏控制方式之外的新的操作体验;同时人们也可以用意念控制开关等,甚至 控制家庭服务机器人,实现全新意义上的智能家居。渗透率或随 AR 及其他可穿戴产品普及持续提升。当前更加简单形式的控制,比如眼动追 踪摄像头、触摸控制等或限制脑机接口交互需求。我们认为未来随着一系列可穿戴设备比 如 AR 眼镜的普及,以及元宇宙的持续建设,基于脑机接口技术的消费电子产品渗透率将持 续提升。
(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)精选报告来源:【未来智库】。未来智库 – 官方网站

其他教程

设计师提升审美的网站(比较有设计感的网站)

2022-8-16 17:19:12

其他教程

高达闪光的哈萨维电影(高达闪光的哈萨维bd)

2022-8-16 17:21:19

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索