计算机视觉和计算机图形学


计算机视觉

计算机视觉涉及使用计算机软件和硬件建模和复制人类视觉。如果我们正式定义计算机视觉,那么它的定义就是计算机视觉是一门研究如何根据场景中存在的结构的属性从 2D 图像重建、中断和理解 3D 场景的学科。

为了理解和刺激人类视觉系统的运作,需要以下领域的知识。

  • 计算机科学
  • 电气工程
  • 数学
  • 生理
  • 生物学
  • 认知科学

计算机视觉层次结构

计算机视觉分为以下三个基本类别:

低级视觉:包括用于特征提取的过程图像。

中级视觉:包括物体识别和3D场景解释

高层次视觉:包括对场景的概念描述,如活动、意图和Behave。

相关领域

计算机视觉与以下领域有显着重叠:

图像处理:它专注于图像处理。

模式识别:它研究对模式进行分类的各种技术。

摄影测量:它涉及从图像中获得准确的测量结果。

计算机视觉与图像处理

图像处理研究图像到图像的转换。图像处理的输入和输出都是图像。

计算机视觉是根据物理对象的图像对物理对象进行明确、有意义的描述。计算机视觉的输出是 3D 场景中结构的描述或解释。

应用示例

  • 机器人技术
  • 药品
  • 安全
  • 运输
  • 工业自动化

机器人应用

  • 定位-自动确定机器人位置
  • 导航
  • 避障
  • 组装(钉孔、焊接、喷漆)
  • 操纵(例如PUMA机器人操纵器)
  • 人机交互(HRI):与人类互动和服务的智能机器人

医药应用

  • 分类和检测(例如病变或细胞分类和肿瘤检测)
  • 2D/3D 分割
  • 3D人体器官重建(MRI或超声波)
  • 视觉引导机器人手术

工业自动化应用

  • 工业检验(缺陷检测)
  • 集会
  • 条形码和包装标签读取
  • 对象排序
  • 文档理解(例如 OCR)

安全应用

  • 生物识别(虹膜、指纹、人脸识别)
  • 监视——检测某些可疑活动或Behave

交通应用

  • 自动驾驶汽车
  • 安全,例如驾驶员警惕性监控

电脑图像

计算机图形是使用计算机创建的图形,以及计算机在专门的图形硬件和软件的帮助下对图像数据的表示。从形式上来说,我们可以说计算机图形学是几何对象(建模)及其图像(渲染)的创建、操作和存储。

计算机图形学领域随着计算机图形硬件的出现而发展起来。如今,计算机图形学几乎应用于各个领域。人们已经开发了许多强大的工具来可视化数据。当公司开始在视频游戏中使用计算机图形学领域时,它变得更加流行。如今,它已成为一个价值数十亿美元的产业,也是计算机图形学发展背后的主要推动力。一些常见的应用领域如下:

  • 计算机辅助设计 (CAD)
  • 演示图形
  • 3D动画
  • 教育和培训
  • 图形用户界面

计算机辅助设计

  • 用于建筑、汽车、飞机和许多其他产品的设计
  • 用于制作虚拟现实系统。

演示图形

  • 常用于总结财务、统计数据
  • 用于生成幻灯片

3D动画

  • 皮克斯 (Pixar)、DresmsWorks 等公司在电影行业大量使用
  • 在游戏和电影中添加特效。

教育和培训

  • 计算机生成的物理系统模型
  • 医学可视化
  • 3D 磁共振成像
  • 牙科和骨扫描
  • 用于培训飞行员等的刺激器

图形用户界面

  • 它用于制作图形用户界面对象,如按钮、图标和其他组件