40个类别生活垃圾图片数据集(2021)

摘要:

合集:AI案例-CV-环保
数据集:四十个类别生活垃圾图片数据集(2021)
数据集价值:垃圾分类

一、问题描述

垃圾分类图片数据集在多个方面具有显著的价值,不仅对学术研究有用,还能在实际应用中产生深远的影响。

价值:

  • 学术研究价值:垃圾分类图片数据集为研究人员提供了丰富的资源,用于开发和训练机器学习模型,提高垃圾识别和分类的准确性。
  • 实际应用价值:这些数据集可以应用于基于图像识别的垃圾分类应用、垃圾处理设备的智能识别系统以及垃圾回收站的自动分类系统等,从而提高垃圾处理的效率和质量。
  • 经济价值:例如,泰州市数产集团与海陵区海发控股集团完成的“海陵区垃圾分类回收数据集”经评估价值近800万元,显示了数据集在商业化方面的巨大潜力。

垃圾分类图片数据集的应用场景:

  • 开发和训练模型:用于自动垃圾分类和分类的机器学习模型。
  • 分析视觉特征:研究不同废料的视觉属性,如颜色、形状、纹理和大小。
  • 算法性能评估:在受控和实际设置中评估和基准测试算法的准确性和稳健性。

通过这些数据集,研究人员和企业可以开发出更加精准、高效的垃圾分类算法,为环保事业的发展提供有力支持。

二、数据集内容

垃圾分类图片数据集训练和测试图片均来自生活场景。总共四十个类别,类别和标签对应关系在训练集中的train/garbage_dict.json文件里。垃圾的类别名称的格式是“一级类别/二级类别”。

  • 一级类别有四种类别:可回收物、厨余垃圾、有害垃圾和其他垃圾。
  • 二级类别是具体的垃圾物体类别,也就是训练数据中标注的类别,比如一次性快餐盒、果皮果肉、旧衣服等。

数据结构

数据文件包括训练集(有标注)和测试集(无标注)。

四十个类别数据样例:train/garbage_dict.json

{
  "0": "其他垃圾/一次性快餐盒",
  "1": "其他垃圾/污损塑料",
  "2": "其他垃圾/烟蒂",
  "3": "其他垃圾/牙签",
  "4": "其他垃圾/破碎花盆及碟碗",
  "5": "其他垃圾/竹筷",
  "6": "厨余垃圾/剩饭剩菜",
  "7": "厨余垃圾/大骨头",
  "8": "厨余垃圾/水果果皮",
  "9": "厨余垃圾/水果果肉",
  "10": "厨余垃圾/茶叶渣",
  "11": "厨余垃圾/菜叶菜根",
  "12": "厨余垃圾/蛋壳",
  "13": "厨余垃圾/鱼骨",
  "14": "可回收物/充电宝",
  "15": "可回收物/包",
  "16": "可回收物/化妆品瓶",
  "17": "可回收物/塑料玩具",
  "18": "可回收物/塑料碗盆",
  "19": "可回收物/塑料衣架",
  "20": "可回收物/快递纸袋",
  "21": "可回收物/插头电线",
  "22": "可回收物/旧衣服",
  "23": "可回收物/易拉罐",
  "24": "可回收物/枕头",
  "25": "可回收物/毛绒玩具",
  "26": "可回收物/洗发水瓶",
  "27": "可回收物/玻璃杯",
  "28": "可回收物/皮鞋",
  "29": "可回收物/砧板",
  "30": "可回收物/纸板箱",
  "31": "可回收物/调料瓶",
  "32": "可回收物/酒瓶",
  "33": "可回收物/金属食品罐",
  "34": "可回收物/锅",
  "35": "可回收物/食用油桶",
  "36": "可回收物/饮料瓶",
  "37": "有害垃圾/干电池",
  "38": "有害垃圾/软膏",
  "39": "有害垃圾/过期药物"
}

训练集的所有图片分别保存在train文件夹下面的0-39个文件夹中,文件名即类别标签,例如:2/img_827.jpg。

测试集共有400张待分类的垃圾图片在test文件夹下,testpath.txt保存了所有测试集文件的名称,格式为:name+编号.jpg。

数据样例:testpath.txt

test1.jpg
test2.jpg
test3.jpg
...
test399.jpg
test400.jpg

数据集版权许可协议

Deed – CC0 1.0 通用 – Creative Commons

数据源作者

Emma_LiuYang

三、参考资料

泰州完成全国首个“垃圾分类”数据资产入表_腾讯新闻

四、获取案例套装

文件包大小:580 MB

获取:社会基础服务计算机视觉案例套装

发表评论