摘要:
合集:AI案例-CV-林业
数据集:PlantVillage2015v3植物病害图像数据集,包括彩色、灰度、分割图像三种。
数据集价值:实现早期病害诊断,减少农药滥用和产量损失(预估可降低经济损失10%-30%)。
一、问题描述
人类社会需要在2050年前将粮食产量增加约70%,以养活预计将超过90亿的人口。目前,传染病平均降低了40%的潜在产量,许多发展中国家的农民经历了高达100%的产量损失。
智能手机在全球农作物种植者中的广泛分布,预计到2020年将达到50亿部,这提供了将智能手机转变为种植粮食的不同社区宝贵工具的潜力。一个潜在的应用是通过机器学习和众包开发移动疾病诊断。通过现有的在线平台PlantVillage发布超过50,000张精心策划的健康和感染作物叶片的图像。我们描述了数据和平台。这些数据是一个正在进行的众包努力的开始,旨在使计算机视觉方法能够帮助解决由于传染病导致的作物植物产量损失的问题。
二、数据集内容
PlantVillage-v3是一个植物病害图像数据库,常作为基础数据集用于农作物病害及植物病害的相关研究。 该数据库的图像都是在实验室中拍摄的, 目前数据集中有 54,305 张植物病害叶片图像,其中包含 13 种植物共 26 类病害叶片。 该数据集中 有38 个类别的样本图像。Plant Village过去在网站上公开过本数据集中的图片,但是目前不开放下载。
数据结构
PlantVillage-v3数据集目录plantvillage dataset包含的三个子目录 color
, grayscale
, 和 segmented
分别代表了图像的不同处理和预处理版本。具体来说:
- color(彩色图像):
- 这个目录包含的是原始的彩色图像,通常是 RGB 彩色图像。这些图像在拍摄时通常会保留植物的颜色信息,包含了植物的不同部位(叶子、果实、花朵等)以及病害的表现。
- 每个图像都是三通道的(红、绿、蓝),能够提供丰富的颜色信息,有助于区分植物种类和病害的不同特征。
- grayscale(灰度图像):
- 这个目录包含的是将彩色图像转换为灰度图像后的版本。灰度图像只包含亮度信息,去除了颜色的维度,通常通过取 RGB 值的平均值或使用其他转换方法生成。
- 在某些情况下,灰度图像能帮助减少计算的复杂度,特别是当颜色信息不太重要时,或者当你只关心形状、纹理等视觉特征时,灰度图像可能更加有效。
- segmented(分割图像):
- 这个目录包含的是经过图像分割处理的图像,通常是将感兴趣的目标(例如植物叶子或病变区域)从背景中提取出来,生成了一个更清晰的图像,其中目标区域与背景区分开来。
- 分割图像常用于图像处理和计算机视觉任务,如物体检测和语义分割。在
segmented
目录中,图像的前景(植物部分或病变部分)会与背景(如土壤、天空等)分开,可能会采用掩码(mask)的形式表现出来。
这些不同的图像类型为不同的研究和任务提供了不同的视角和数据处理方式。选择哪个数据集取决于你的具体任务需求和模型的目标。
该数据集中 有38 个类别的样本图像,分别存储在38个文件目录中。以下表格为:文件目录名和对应的图片个数:
38个类别 | 图片数 |
---|---|
Orange__Haunglongbing(Citrus_greening) | 5,507 |
Tomato___Tomato_Yellow_Leaf_Curl_Virus | 5,357 |
Soybean___healthy | 5,090 |
Peach___Bacterial_spot | 2,297 |
Tomato___Bacterial_spot | 2,127 |
Tomato___Late_blight | 1,909 |
Squash___Powdery_mildew | 1,835 |
Tomato___Septoria_leaf_spot | 1,771 |
Tomato___Spider_mites Two-spotted_spider_mite | 1,676 |
Apple___healthy | 1,645 |
Tomato___healthy | 1,591 |
Blueberry___healthy | 1,502 |
Pepper,_bell___healthy | 1,478 |
Tomato___Target_Spot | 1,404 |
Grape__Esca(Black_Measles) | 1,383 |
Corn(maize)___Common_rust | 1,192 |
Grape___Black_rot | 1,180 |
Corn_(maize)___healthy | 1,162 |
Strawberry___Leaf_scorch | 1,109 |
Grape__Leaf_blight(Isariopsis_Leaf_Spot) | 1,076 |
Cherry_(including_sour)___Powdery_mildew | 1,052 |
Potato___Late_blight | 1,000 |
Tomato___Early_blight | 1,000 |
Potato___Early_blight | 1,000 |
Pepper,_bell___Bacterial_spot | 997 |
Corn_(maize)___Northern_Leaf_Blight | 985 |
Tomato___Leaf_Mold | 952 |
Cherry_(including_sour)___healthy | 854 |
Apple___Apple_scab | 630 |
Apple___Black_rot | 621 |
Corn_(maize)___Cercospora_leaf_spot Gray_leaf_spot | 513 |
Strawberry___healthy | 456 |
Grape___healthy | 423 |
Tomato___Tomato_mosaic_virus | 373 |
Raspberry___healthy | 371 |
Peach___healthy | 360 |
Apple___Cedar_apple_rust | 275 |
Potato___healthy | 152 |
38 个类别的样本,总共图片数为54,305个。为了区分健康和有害的叶子,通常通过文件目录的命名和类别标签来实现。目录名称中通常包含关键词“Healthy”表示健康的叶子,其他名称则表示不同的疾病。每个目录名称通常包含以下信息:
- 植物种类:如番茄、马铃薯、苹果等。
- 疾病名称 或 “healthy” 表示健康。
例如:
Tomato_Healthy
: 表示健康的番茄叶子。Tomato_Late_blight
: 表示患有晚疫病的番茄叶子。Apple_Black_rot
: 表示患有黑腐病的苹果叶子。
数据集版权许可协议
Deed – Attribution-NonCommercial-ShareAlike 4.0 International – Creative Commons
数据集引用要求
@article{DBLP:journals/corr/HughesS15,
author = {David P. Hughes and
Marcel Salath{\'{e} } },
title = {An open access repository of images on plant health to enable the
development of mobile disease diagnostics through machine
learning and crowdsourcing},
journal = {CoRR},
volume = {abs/1511.08060},
year = {2015},
url = {http://arxiv.org/abs/1511.08060},
archivePrefix = {arXiv},
eprint = {1511.08060},
timestamp = {Mon, 13 Aug 2018 16:48:21 +0200},
biburl = {https://dblp.org/rec/bib/journals/corr/HughesS15},
bibsource = {dblp computer science bibliography, https://dblp.org}
}
三、获取案例套装
文件大小:约 2.15 GB