首页 理论教育 COCO深度解析:一个值得探究的图像处理工具

COCO深度解析:一个值得探究的图像处理工具

时间:2023-06-21 理论教育 版权反馈
【摘要】:有不到20%的样本在COCO数据集中只含有一个种类,而这个统计量对ImageNet和PASCAL VOC数据集来说都高于60%。图10.18COCO数据集示意我们对检测目标在图像中的尺寸进行了统计。从图10.19中可以发现,COCO与SUN数据集含有较多小目标,因此检测算法在COCO与SUN数据集上的准确率较低。

COCO深度解析:一个值得探究的图像处理工具

COCO数据集[92]是微软团队提出的一个用于图像识别、图像分割、图像标注任务的数据集。COCO数据集的特点有:①包含实例分割;②包含上下文识别;③每幅图像包含多个对象;④数据集中有超过30万幅图像;⑤有超过200万个实例;⑥共有91个对象类别;⑦每幅图像有5个说明文字;⑧有10万幅人的关键点数据。数据集中的标注信息不仅有类别、位置信息,还有对图像语义文本的描述。数据集的提出主要是为了解决现有数据集的3方面不足:①缺乏物体非标志性视角的检测数据;②物体间的上下文推理较弱;③缺乏物体精确的二维坐标。同时,数据集在实例分割水平的标注是独一无二的,如图10.17所示。

图10.17 COCO数据集标记的独特之处(书后附彩插)

(a)图片分类;(b)目标定位;(c)语义分割;(d)COCO

COCO数据集有91个常见物体类,其中有82个类包含超过5000个标注的实例,部分图像如图10.18所示。数据集中总计有328000幅图像和2500000个标记的实例。

接下来,对COCO数据集与ImageNet、PASCAL VOC和SUN数据集做统计比对。COCO数据集与PASCAL VOC数据集都可以用来完成目标分类、检测任务,COCO数据集有91个类,而PASCAL VOC数据集有20个类。COCO数据集与PASCAL数据集每个类中样本个数的比较如图10.19(a)所示,可以发现,COCO数据集在数据类别数量和实例数上都要远超PASCAL VOC数据集;整个数据集的类别数与平均每个类的实例数如图10.19(d)所示,显然COCO数据集的每个类别中含有更多的实例。除此之外,COCO数据集的一个重要特性就是在图像都复合自然场景的前提下,尽可能多地收集非标志性图像,这使得每幅图像都包含了多个目标。这可以通过统计单幅图像中的目标种类个数和实例个数来实现,统计结果如图10.19(b)、(c)所示。图中,横坐标表示单幅图像含有种类或实例的个数,纵坐标表示含有该种类的图像数量在数据集中所在比例,图例表示在这个数据集中每幅图像平均含有的种类或实例的个数。对于COCO数据集来说,平均每幅图像有7.7个实例,它们平均来自3.5个种类。这个结果高于ImageNet数据集和PASCAL VOC数据集。有不到20%的样本在COCO数据集中只含有一个种类,而这个统计量对ImageNet和PASCAL VOC数据集来说都高于60%。

图10.18 COCO数据集示意(www.zuozong.com)

我们对检测目标在图像中的尺寸进行了统计。通常来说,越小的目标越难以识别并且需要更多的上下文信息来进行推理。从图10.19(e)中可以发现,COCO与SUN数据集含有较多小目标,因此检测算法在COCO与SUN数据集上的准确率较低。

图10.19 COCO数据集与其他数据集的统计比较

(a)每个种类的样本数量

图10.19 COCO数据集与其他数据集的统计比较(续)

(b)每幅图像中的种类数量;(c)每幅图像中的实例数量;(d)种类的数量与实例的数量;(e)实例的尺寸大小

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈

相关推荐