计算机视觉作业

历史记录

清除记录

猜你想搜

AcWing热点
App
登录/注册

计算机视觉作业

作者：

cxd , 2022-09-17 13:42:53 , 所有人可见 , 阅读 305

什么是计算机视觉？计算机视觉要完成的主要任务是什么？
- 计算机视觉=采集+处理+识别。
- 计算机视觉的任务是：
  - 用图像创建或恢复现实世界模型，然后认知现实世界。
  - 让计算机（算法）具有对周围世界的空间物体进行传感、抽象、判断的能力，从而达到识别、理解的目的。
  - 使计算机的算法具有生物视觉的功能：理解、控制、模拟及表达
请说明解释：目标识别为什么不是图像处理的任务，而是计算机视觉研究的任务。
- 目标识别:根据预先存贮的模型知识以及形状、色彩等特征,对于图像中目标进行识别
- 很明显目标识别有 “采集”+“处理”+“识别”三个过程
- 而图像处理只包含 “处理” 一个阶段
- 所以目标识别不是图像处理任务,二十计算机视觉研究的任务
请根据计算机视觉的概念，举出5个计算机视觉的任务或者应用问题。
- 芯片缺陷检测/医学图像分析/假币识别/嫌犯追捕/自动化驾驶
- 人群密度计数：
  控制人流, 用于预防可能发生的恶性事件（踩踏事件/火灾疏散）
- 人脸识别(抑郁症干预(fake facial expression)/核酸检测/各高校/小区门禁)
- VQA (Visual Question Answering, 根据图像或视频,结合问题进行回答)
- Document Layout Analysis, 可以对文档进行版面分析(图表/文字)和识别,古籍修复。
图像金字塔和滤波器有什么关系？
- 滤波器：利用图像中现有部分像素进行组合（变换），目的是对损失像素进行计算，以达到修补的目的
  - 滤波器作用:
    - 图像的增强处理：去噪、修复、超分辨率增强
    - 特征提取：从图像中提取有用的特征信息：边缘、角点信息
  - 卷积运算
    - 先上下翻转,再左右翻转, 相乘再相加
- 图像金字塔：是图像中多尺度（多层次）表达的一种，金字塔是一系列以金字塔形状排列的图像集
  - 图像金字塔应用: 图像分割、目标识别、图像理解
  - 基本结构：原始图像为level0(第0层），而其它层图像是低分辨率的采样，层级越高，则图像越小，分辨率越低。
  - 上采样（Up-sampling）：由第k层图像产生第k-1层图像，图像尺寸加倍
  - 下采样（Down-sampling）：由第k层图像产生第k+1层图像，图像尺寸减半
如果要识别一个人是高个子还是矮个子，利用图像金字塔的高层还是低层图像好一些？为什么？
- 需要轮廓信息, 利用图像金字塔的高层

计算机视觉作业

0 评论