杀鸡焉用牛刀?3D手势识别不是VR交互的唯一选择

  3. 多角成像(Multi-camera)

  多角成像这一技术的代表产品是Leap Motion公司的同名产品和Usens公司的Fingo。

  这种技术的基本原理是使用两个或者两个以上的摄像头同时摄取图像,就好像是人类用双眼、昆虫用多目复眼来观察世界,通过比对这些不同摄像头在同一时刻获得的图像的差别,使用算法来计算深度信息,从而多角三维成像。

  在这里我们以两个摄像头成像来简单解释一下:

  双摄像头测距是根据几何原理来计算深度信息的。使用两台摄像机对当前环境进行拍摄,得到两幅针对同一环境的不同视角照片,实际上就是模拟了人眼工作的原理。因为两台摄像机的各项参数以及它们之间相对位置的关系是已知的,只要找出相同物体(枫叶)在不同画面中的位置,我们就能通过算法计算出这个物体(枫叶)距离摄像头的深度了。

  多角成像是三维手势识别技术中硬件要求最低,但同时是最难实现的。多角成像不需要任何额外的特殊设备,完全依赖于计算机视觉算法来匹配两张图片里的相同目标。相比于结构光或者光飞时间这两种技术成本高、功耗大的缺点,多角成像能提供“价廉物美”的三维手势识别效果。

  四、杀鸡不用牛刀,VR中的交互到底应该如何抉择?

  轻度交互

  移动端VR设备一般无法运行重度体验的VR内容,对于交互的需求基本保留在轻量级别。3D的手势识别用在轻度VR交互上实际有点杀鸡用牛刀的感觉,绝大部分人日常接触最多的就是2D触摸屏,而大部分UI也是2D设计,3D手势识别加入的深度信息对于大部分人来说太超前,而且大部分人臂展不超过1米,深度信息在这里没法体现出相对2D平面的不同。

  所以,一个普通单摄像头通过边缘识别的简单手势交互系统能满足目前大部分VR场景的交互需求,降低手势交互的门槛,从而快速普及手势交互概念,如果还能够配合语音交互功能,就能快速满足短期内VR应用的交互需求。

  重度交互

  PC端VR设备,成本高技术含量高,能够运行重度体验的VR内容,因而对于交互的需求也是重量级别。3D的手势识别用在重度VR交互上才是真正的好钢用到了刀刃上,能够满足用户的重度交互需求,还能够提供较好的反馈和沉浸感。用户置身的三维场景中,要跟三维场景里面的物品进行交互,没有深度信息是不可能做到的。

  现在Oculus和HTC Vive其实都采用的是手柄的解决方案,但是3D的手势交互其实是一种更自然、更舒服的方式。对于复杂的3D场景,3D的手势交互是不可缺少的,而且更加真实和沉浸式的3D场景体验,才是VR内容的未来。而在重度VR体验内容中,空间的深度信息更为复杂,应用场景的变化也更加多样化,只有3D的手势识别能够较好的满足精度、延迟和沉浸的要求。

 

  至于未来如何发展,历史总是由人民书写的,消费者的选择才是技术方向的选择。