导言
2021-10-3 About 1 min
# 计算机视觉面临的挑战
- 人眼接受的视觉数据极其多,且大部分是冗余的
- 视皮层会压缩信息,大脑高级中枢只处理一部分抽象的数据,但仍比其他信息多至少两个数量级
- 大脑有约100亿个细胞,每个细胞有大量突触,处理能力非常强
- 人类可以通过积极的使用和训练对眼脑系统进行动态"编程"
- 训练集不充分,无法代表实际情况
- 要提供充分的训练集,存储是个问题,参数增加导致的组合爆炸也是问题
- 图像处理
- 将图像转换为包含相同比特数据的更容易处理的形式
- 分类,抽象
# NMS
NMS是大部分深度学习目标检测网络所需要的,大致算法流程为:
- 对所有预测框的置信度降序排序
- 选出置信度最高的预测框,确认其为正确预测(下次就没有他了,已经被确认了),并计算他与其他预测框的IOU
- 根据2中计算的IOU去除重叠度高的,IOU>threshold就删除
- 剩下的预测框返回第1步,直到没有剩下的为止