PlantVillage2015v3植物病害图像数据集

摘要:

合集:AI案例-CV-林业
数据集:PlantVillage2015v3植物病害图像数据集,包括彩色、灰度、分割图像三种。
数据集价值:实现早期病害诊断,减少农药滥用和产量损失(预估可降低经济损失10%-30%)。

一、问题描述

人类社会需要在2050年前将粮食产量增加约70%,以养活预计将超过90亿的人口。目前,传染病平均降低了40%的潜在产量,许多发展中国家的农民经历了高达100%的产量损失。

智能手机在全球农作物种植者中的广泛分布,预计到2020年将达到50亿部,这提供了将智能手机转变为种植粮食的不同社区宝贵工具的潜力。一个潜在的应用是通过机器学习和众包开发移动疾病诊断。通过现有的在线平台PlantVillage发布超过50,000张精心策划的健康和感染作物叶片的图像。我们描述了数据和平台。这些数据是一个正在进行的众包努力的开始,旨在使计算机视觉方法能够帮助解决由于传染病导致的作物植物产量损失的问题。

二、数据集内容

PlantVillage-v3是一个植物病害图像数据库,常作为基础数据集用于农作物病害及植物病害的相关研究。 该数据库的图像都是在实验室中拍摄的, 目前数据集中有 54,305 张植物病害叶片图像,其中包含 13 种植物共 26 类病害叶片。 该数据集中 有38 个类别的样本图像。Plant Village过去在网站上公开过本数据集中的图片,但是目前不开放下载。

数据结构

PlantVillage-v3数据集目录plantvillage dataset包含的三个子目录 color, grayscale, 和 segmented 分别代表了图像的不同处理和预处理版本。具体来说:

  1. color(彩色图像):
    • 这个目录包含的是原始的彩色图像,通常是 RGB 彩色图像。这些图像在拍摄时通常会保留植物的颜色信息,包含了植物的不同部位(叶子、果实、花朵等)以及病害的表现。
    • 每个图像都是三通道的(红、绿、蓝),能够提供丰富的颜色信息,有助于区分植物种类和病害的不同特征。
  2. grayscale(灰度图像):
    • 这个目录包含的是将彩色图像转换为灰度图像后的版本。灰度图像只包含亮度信息,去除了颜色的维度,通常通过取 RGB 值的平均值或使用其他转换方法生成。
    • 在某些情况下,灰度图像能帮助减少计算的复杂度,特别是当颜色信息不太重要时,或者当你只关心形状、纹理等视觉特征时,灰度图像可能更加有效。
  3. segmented(分割图像):
    • 这个目录包含的是经过图像分割处理的图像,通常是将感兴趣的目标(例如植物叶子或病变区域)从背景中提取出来,生成了一个更清晰的图像,其中目标区域与背景区分开来。
    • 分割图像常用于图像处理和计算机视觉任务,如物体检测和语义分割。在 segmented 目录中,图像的前景(植物部分或病变部分)会与背景(如土壤、天空等)分开,可能会采用掩码(mask)的形式表现出来。

这些不同的图像类型为不同的研究和任务提供了不同的视角和数据处理方式。选择哪个数据集取决于你的具体任务需求和模型的目标。

该数据集中 有38 个类别的样本图像,分别存储在38个文件目录中。以下表格为:文件目录名和对应的图片个数:

38个类别图片数
Orange__Haunglongbing(Citrus_greening)5,507
Tomato___Tomato_Yellow_Leaf_Curl_Virus5,357
Soybean___healthy5,090
Peach___Bacterial_spot2,297
Tomato___Bacterial_spot2,127
Tomato___Late_blight1,909
Squash___Powdery_mildew1,835
Tomato___Septoria_leaf_spot1,771
Tomato___Spider_mites Two-spotted_spider_mite1,676
Apple___healthy1,645
Tomato___healthy1,591
Blueberry___healthy1,502
Pepper,_bell___healthy1,478
Tomato___Target_Spot1,404
Grape__Esca(Black_Measles)1,383
Corn(maize)___Common_rust1,192
Grape___Black_rot1,180
Corn_(maize)___healthy1,162
Strawberry___Leaf_scorch1,109
Grape__Leaf_blight(Isariopsis_Leaf_Spot)1,076
Cherry_(including_sour)___Powdery_mildew1,052
Potato___Late_blight1,000
Tomato___Early_blight1,000
Potato___Early_blight1,000
Pepper,_bell___Bacterial_spot997
Corn_(maize)___Northern_Leaf_Blight985
Tomato___Leaf_Mold952
Cherry_(including_sour)___healthy854
Apple___Apple_scab630
Apple___Black_rot621
Corn_(maize)___Cercospora_leaf_spot Gray_leaf_spot513
Strawberry___healthy456
Grape___healthy423
Tomato___Tomato_mosaic_virus373
Raspberry___healthy371
Peach___healthy360
Apple___Cedar_apple_rust275
Potato___healthy152

38 个类别的样本,总共图片数为54,305个。为了区分健康和有害的叶子,通常通过文件目录的命名和类别标签来实现。目录名称中通常包含关键词“Healthy”表示健康的叶子,其他名称则表示不同的疾病。每个目录名称通常包含以下信息:

  1. 植物种类:如番茄、马铃薯、苹果等。
  2. 疾病名称 或 “healthy” 表示健康。

例如:

  • Tomato_Healthy: 表示健康的番茄叶子。
  • Tomato_Late_blight: 表示患有晚疫病的番茄叶子。
  • Apple_Black_rot: 表示患有黑腐病的苹果叶子。

数据集版权许可协议

Deed – Attribution-NonCommercial-ShareAlike 4.0 International – Creative Commons

数据集引用要求

@article{DBLP:journals/corr/HughesS15,
author   = {David P. Hughes and
              Marcel Salath{\'{e} } },
title     = {An open access repository of images on plant health to enable the
              development of mobile disease diagnostics through machine
              learning and crowdsourcing},
journal   = {CoRR},
volume   = {abs/1511.08060},
year     = {2015},
url       = {http://arxiv.org/abs/1511.08060},
archivePrefix = {arXiv},
eprint   = {1511.08060},
timestamp = {Mon, 13 Aug 2018 16:48:21 +0200},
biburl   = {https://dblp.org/rec/bib/journals/corr/HughesS15},
bibsource = {dblp computer science bibliography, https://dblp.org}
}

三、获取案例套装

文件大小:约 2.15 GB

获取:农林牧副渔计算机视觉案例套装

发表评论