炼数成金 门户 商业智能 机器学习 查看内容

谷歌公布大型图像数据集Image V5并开展第二届开放图片挑战赛

2019-5-10 13:17| 发布者: 炼数成金_小数| 查看: 16173| 评论: 0|来自: 人工智能和大数据

摘要: 5月9日消息,谷歌在其AI博客公布大型图像数据集Image V5并宣布将于ICCV 2019开展开放图像挑战赛。据了解,Image V5建立在谷歌2016年推出的涵盖9百万张标注图片的图像数据集Open Image基础之上,新数据集涵盖了350个 ...

数据库 工具 模型 计算机 计算机视觉

5月9日消息,谷歌在其AI博客公布大型图像数据集Image V5并宣布将于ICCV 2019开展开放图像挑战赛。据了解,Image V5建立在谷歌2016年推出的涵盖9百万张标注图片的图像数据集Open Image基础之上,新数据集涵盖了350个类别中280万个对象实例的分段掩码。与仅识别对象所在区域的边界框不同,分割掩模不仅标记对象的轮廓,还将其空间范围表征为更高级别的细节。在宣布该数据集的同时,谷歌也宣布将在ICCV 2019开展第二届开放图片挑战赛,此挑战将基于上述数据来创建新的实例分段轨道,与上一届挑战赛相同,本届挑战赛也将具有大型物体检测轨道以及用于检测特定关系中的物体对的视觉关系检测轨迹。

这已经是自2016年以来,谷歌第三次开放大规模的图像数据集。
2016年时,谷歌发布了图片数据库Open Images,包含了900万标注数据,标签种类超过6000种。当时,谷歌在官方博客中写到,这比只拥有1000个分类的ImageNet 更加贴近实际生活。对于想要从零开始训练计算机视觉模型的人来说,这些数据远远足够了。

2018年4 月 30 日,谷歌在其官方博客上发文称将开放 Images V4 数据库,并同时开启 ECCV 2018 公开图像挑战赛。全文如下:
2016 年,我们发布了一个包含大约 900 万张图片、标注了数千个对象类别标签的数据集 Open Images。发布之后,我们一直在努力更新和改进数据集,以便为计算机视觉社区提供有用的资源来开发新模型。

今天,我们很高兴地宣布开放 Open Images V4,它包含在 190 万张图片上针对 600 个类别的 1540 万个边框盒,这也是现有较大的具有对象位置注释的数据集。这些边框盒大部分都是由专业注释人员手动绘制的,确保了它们的准确性和一致性。另外,这些图像是非常多样化的,并且通常包含有多个对象的复杂场景(平均每个图像 8 个)。

此同时,我们还将宣布启动 Open Images 挑战赛,这将是在 2018 计算机视觉欧洲会议(ECCV 2018)上举办的一场新的对象检测挑战赛。Open Images 挑战赛将遵循 PASCAL VOC、ImageNet 和 COCO 等赛事的传统,但是其规模将是空前的。

声明:本文版权归原作者所有,文章收集于网络,为传播信息而发,如有侵权,请联系小编及时处理,谢谢!

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括:各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-9-17 18:24 , Processed in 0.167677 second(s), 23 queries .