-
什么是计算机视觉?计算机视觉要完成的主要任务是什么?
- 计算机视觉=采集+处理+识别。
- 计算机视觉的任务是:
- 用图像创建或恢复现实世界模型,然后认知现实世界。
- 让计算机(算法)具有对周围世界的空间物体进行传感、抽象、判断的能力,从而达到识别、理解的目的。
- 使计算机的算法具有生物视觉的功能:理解、控制、模拟及表达
-
请说明解释:目标识别为什么不是图像处理的任务,而是计算机视觉研究的任务。
- 目标识别:根据预先存贮的模型知识以及形状、色彩等特征,对于图像中目标进行识别
- 很明显目标识别有 “采集”+“处理”+“识别”三个过程
- 而图像处理只包含 “处理” 一个阶段
- 所以目标识别不是图像处理任务,二十计算机视觉研究的任务
-
请根据计算机视觉的概念,举出5个计算机视觉的任务或者应用问题。
- 芯片缺陷检测/医学图像分析/假币识别/嫌犯追捕/自动化驾驶
- 人群密度计数:
控制人流, 用于预防可能发生的恶性事件(踩踏事件/火灾疏散) - 人脸识别(抑郁症干预(fake facial expression)/核酸检测/各高校/小区门禁)
- VQA (Visual Question Answering, 根据图像或视频,结合问题进行回答)
- Document Layout Analysis, 可以对文档进行版面分析(图表/文字)和识别,古籍修复。
-
图像金字塔和滤波器有什么关系?
- 滤波器:利用图像中现有部分像素进行组合(变换),目的是对损失像素进行计算,以达到修补的目的
- 滤波器作用:
- 图像的增强处理:去噪、修复、超分辨率增强
- 特征提取:从图像中提取有用的特征信息:边缘、角点信息
- 卷积运算
- 先上下翻转,再左右翻转, 相乘再相加
- 滤波器作用:
- 图像金字塔:是图像中多尺度(多层次)表达的一种,金字塔是一系列以金字塔形状排列的图像集
- 图像金字塔应用: 图像分割、目标识别、图像理解
- 基本结构:原始图像为level0(第0层),而其它层图像是低分辨率的采样,层级越高,则图像越小,分辨率越低。
- 上采样(Up-sampling):由第k层图像产生第k-1层图像,图像尺寸加倍
- 下采样(Down-sampling):由第k层图像产生第k+1层图像,图像尺寸减半
- 滤波器:利用图像中现有部分像素进行组合(变换),目的是对损失像素进行计算,以达到修补的目的
-
如果要识别一个人是高个子还是矮个子,利用图像金字塔的高层还是低层图像好一些?为什么?
- 需要轮廓信息, 利用图像金字塔的高层