导言

2021-10-3 About 1 min

# 计算机视觉面临的挑战

  • 人眼接受的视觉数据极其多,且大部分是冗余的
  • 视皮层会压缩信息,大脑高级中枢只处理一部分抽象的数据,但仍比其他信息多至少两个数量级
  • 大脑有约100亿个细胞,每个细胞有大量突触,处理能力非常强
  • 人类可以通过积极的使用和训练对眼脑系统进行动态"编程"

  • 训练集不充分,无法代表实际情况
  • 要提供充分的训练集,存储是个问题,参数增加导致的组合爆炸也是问题

  • 图像处理
    • 将图像转换为包含相同比特数据的更容易处理的形式
    • 分类,抽象

# NMS

NMS是大部分深度学习目标检测网络所需要的,大致算法流程为:

  1. 对所有预测框的置信度降序排序
  2. 选出置信度最高的预测框,确认其为正确预测(下次就没有他了,已经被确认了),并计算他与其他预测框的IOU
  3. 根据2中计算的IOU去除重叠度高的,IOU>threshold就删除
  4. 剩下的预测框返回第1步,直到没有剩下的为止
Last update: 2021年12月13日 23:53