卷积神经网络的学习过程虽然不需要手工选取特征,可以实现对图像特征的自动化学习,但是这种学习需要以大量的学习资料作为基础,即数据集。然而目前物体识别领域已有的经典数据集,如imagenet和voc,数量庞大,物体种类繁多,对本文的研究并不具有针对性。因此为了针对性地提升识别效果,我们需要建立基于卡口图像的车型数据库。
参照标准图像分类数据集,安防监控公司对数据集进行车辆区域和车辆类型的标注,其中,车辆区域用一个矩形框标定,包括左上角顶点的横纵坐标以及右下角顶点的横纵坐标;车辆类型分为小轿车和大客车两大类, 一个图像的标注结果。本文原始数据集中共标定了2800张图像,其中2000张小轿车,800张大客车。本文选取1900张小轿车,700张大客车作为训练集,余下100张小轿车,100张大货车作为验证集。由于两类训练数据并不均衡,且训练集数据对于卷积神经网络的训练是远远不足的,因此在原有已标定数据集的基础上,我们又进行了数据的增广具体的数据增广
方式如下: