摘要:
合集:AI案例-CV-环保
数据集:四十个类别生活垃圾图片数据集(2021)
数据集价值:垃圾分类
一、问题描述
垃圾分类图片数据集在多个方面具有显著的价值,不仅对学术研究有用,还能在实际应用中产生深远的影响。
价值:
- 学术研究价值:垃圾分类图片数据集为研究人员提供了丰富的资源,用于开发和训练机器学习模型,提高垃圾识别和分类的准确性。
- 实际应用价值:这些数据集可以应用于基于图像识别的垃圾分类应用、垃圾处理设备的智能识别系统以及垃圾回收站的自动分类系统等,从而提高垃圾处理的效率和质量。
- 经济价值:例如,泰州市数产集团与海陵区海发控股集团完成的“海陵区垃圾分类回收数据集”经评估价值近800万元,显示了数据集在商业化方面的巨大潜力。
垃圾分类图片数据集的应用场景:
- 开发和训练模型:用于自动垃圾分类和分类的机器学习模型。
- 分析视觉特征:研究不同废料的视觉属性,如颜色、形状、纹理和大小。
- 算法性能评估:在受控和实际设置中评估和基准测试算法的准确性和稳健性。
通过这些数据集,研究人员和企业可以开发出更加精准、高效的垃圾分类算法,为环保事业的发展提供有力支持。
二、数据集内容
垃圾分类图片数据集训练和测试图片均来自生活场景。总共四十个类别,类别和标签对应关系在训练集中的train/garbage_dict.json文件里。垃圾的类别名称的格式是“一级类别/二级类别”。
- 一级类别有四种类别:可回收物、厨余垃圾、有害垃圾和其他垃圾。
- 二级类别是具体的垃圾物体类别,也就是训练数据中标注的类别,比如一次性快餐盒、果皮果肉、旧衣服等。
数据结构
数据文件包括训练集(有标注)和测试集(无标注)。
四十个类别数据样例:train/garbage_dict.json
{
"0": "其他垃圾/一次性快餐盒",
"1": "其他垃圾/污损塑料",
"2": "其他垃圾/烟蒂",
"3": "其他垃圾/牙签",
"4": "其他垃圾/破碎花盆及碟碗",
"5": "其他垃圾/竹筷",
"6": "厨余垃圾/剩饭剩菜",
"7": "厨余垃圾/大骨头",
"8": "厨余垃圾/水果果皮",
"9": "厨余垃圾/水果果肉",
"10": "厨余垃圾/茶叶渣",
"11": "厨余垃圾/菜叶菜根",
"12": "厨余垃圾/蛋壳",
"13": "厨余垃圾/鱼骨",
"14": "可回收物/充电宝",
"15": "可回收物/包",
"16": "可回收物/化妆品瓶",
"17": "可回收物/塑料玩具",
"18": "可回收物/塑料碗盆",
"19": "可回收物/塑料衣架",
"20": "可回收物/快递纸袋",
"21": "可回收物/插头电线",
"22": "可回收物/旧衣服",
"23": "可回收物/易拉罐",
"24": "可回收物/枕头",
"25": "可回收物/毛绒玩具",
"26": "可回收物/洗发水瓶",
"27": "可回收物/玻璃杯",
"28": "可回收物/皮鞋",
"29": "可回收物/砧板",
"30": "可回收物/纸板箱",
"31": "可回收物/调料瓶",
"32": "可回收物/酒瓶",
"33": "可回收物/金属食品罐",
"34": "可回收物/锅",
"35": "可回收物/食用油桶",
"36": "可回收物/饮料瓶",
"37": "有害垃圾/干电池",
"38": "有害垃圾/软膏",
"39": "有害垃圾/过期药物"
}
训练集的所有图片分别保存在train文件夹下面的0-39个文件夹中,文件名即类别标签,例如:2/img_827.jpg。

测试集共有400张待分类的垃圾图片在test文件夹下,testpath.txt保存了所有测试集文件的名称,格式为:name+编号.jpg。
数据样例:testpath.txt
test1.jpg
test2.jpg
test3.jpg
...
test399.jpg
test400.jpg
数据集版权许可协议
Deed – CC0 1.0 通用 – Creative Commons
数据源作者
Emma_LiuYang
三、参考资料
四、获取案例套装
文件包大小:580 MB