BirdCLEF2023鸟类声音识别数据集

摘要:

数据集:BirdCLEF2023鸟类声音识别数据集
AI问题:语音等多模态识别
数据集发布方:国际性的多语言信息检索与机器学习评测平台CLEF
数据集价值:通过音频数据识别鸟类物种,推动自动鸟类监测技术的发展,应用于生态保护、生物多样性研究等场景。

一、赛题描述

赛事背景

CLEF 2023(Conference and Labs of the Evaluation Forum) 是一个国际性的多语言信息检索与机器学习评测平台,其中的 BirdCLEF 2023 是针对鸟类声音识别的研究挑战赛,属于生物声学/Bioacoustics领域的经典数据集和竞赛任务。

赛事任务

鸟类鸣叫声识别挑战赛旨在增强自动鸟类鸣叫声识别技术,预测出每个测试音频中出现的鸟类物种(可多物种共存)。测试音频文件只包含单一的鸟类物种,预测在音频文件级别进行,不需要开始和结束的时间戳,属于单标签分类任务。

任务与挑战

难点:

  • 背景噪声(风声、虫鸣、人类活动等)。
  • 声音重叠:多物种同时鸣叫。
  • 数据不平衡:稀有物种样本少,常见物种样本多。
  • 地域偏差:数据以美洲物种为主,可能影响模型泛化性。

二、数据集内容

数据集摘要

物种数量:涵盖 约1,000种鸟类(主要来自美洲地区,部分全球分布物种)。 音频来源:

  • Xeno-canto(全球鸟类声音共享数据库,用户上传的野外录音)。
  • 专业监测设备(如自动录音单元,含环境噪声)。

数据类型:

  • 训练集:约15万条音频片段(含物种标签、录音时间/地点等元数据)。
  • 测试集:未标注的野外录音(需预测物种)。

音频特性:

  • 格式:.wav 或 .mp3(采样率通常为32kHz或44.1kHz)。
  • 长度:几秒至数分钟不等,含单物种鸣叫或多物种混合声音。

内容

train_audio:训练集

test_soundscapes:测试集

声音属性信息train_metadata.csv

数据样例:

primary_labelsecondary_labelstypelatitudelongitudescientific_namecommon_nameauthorlicenseratingfilename
abethr1[][‘song’]4.390638.2788Turdus tephronotusAfrican Bare-eyed ThrushRolf A. de ByCreative Commons Attribution-NonCommercial-ShareAlike 3.04abethr1/XC128013.ogg
abethr1[][‘call’]-2.952438.2921Turdus tephronotusAfrican Bare-eyed ThrushJames BradleyCreative Commons Attribution-NonCommercial-ShareAlike 4.03.5abethr1/XC363501.ogg
abethr1[][‘song’]-2.952438.2921Turdus tephronotusAfrican Bare-eyed ThrushJames BradleyCreative Commons Attribution-NonCommercial-ShareAlike 4.03.5abethr1/XC363502.ogg
abethr1[][‘song’]-2.952438.2921Turdus tephronotusAfrican Bare-eyed ThrushJames BradleyCreative Commons Attribution-NonCommercial-ShareAlike 4.05abethr1/XC363503.ogg

分类信息eBird_Taxonomy_v2021.csv

数据样例:

TAXON_ORDERCATEGORYSPECIES_CODEPRIMARY_COM_NAMESCI_NAMEORDER1FAMILYSPECIES_GROUPREPORT_AS
1speciesostric2Common OstrichStruthio camelusStruthioniformesStruthionidae (Ostriches)Ostriches
6speciesostric3Somali OstrichStruthio molybdophanesStruthioniformesStruthionidae (Ostriches)
7slashy00934Common/Somali OstrichStruthio camelus/molybdophanesStruthioniformesStruthionidae (Ostriches)

声音文件

训练集中包括以下子目录和对应声音文件数:

abethr1 15
abhori1 126
abythr1 28
afbfly1 18
afdfly1 31
afecuc1 90
affeag1 48
afgfly1 8
afghor1 72
afmdov1 37
afpfly1 104
afpkin1 1
afpwag1 81
afrgos1 57
afrgrp1 25
afrjac1 30
afrthr1 45
amesun2 43
augbuz1 12
bagwea1 24
barswa 500
bawhor2 47
bawman1 7
bcbeat1 81
beasun2 34
bkctch1 109
bkfruw1 28
blacra1 60
blacuc1 76
blakit1 262
blaplo1 50
blbpuf2 166
blcapa2 22
blfbus1 38
blhgon1 23
blhher1 16
blksaw1 13
blnmou1 26
blnwea1 17
bltapa1 11
bltbar1 7
bltori1 20
blwlap1 15
brcale1 10
brcsta1 3
brctch1 62
brcwea1 2
brican1 29
brobab1 22
broman1 38
brosun1 30
brrwhe3 8
brtcha1 1
brubru1 81
brwwar1 40
bswdov1 27
btweye2 67
bubwar2 9
butapa1 30
cabgre1 34
carcha1 153
carwoo1 43
categr 166
ccbeat1 13
chespa1 6
chewea1 8
chibat1 79
chtapa3 27
chucis1 29
cibwar1 113
cohmar1 425
colsun2 181
combul2 293
combuz1 477
comsan 500
crefra2 1
crheag1 36
crohor1 49
darbar1 32
darter3 7
didcuc1 79
dotbar1 3
dutdov1 8
easmog1 15
eaywag1 500
edcsun3 21
egygoo 152
equaka1 7
eswdov1 63
eubeat1 437
fatrav1 25
fatwid1 5
fislov1 15
fotdro5 137
gabgos2 34
gargan 136
gbesta1 45
gnbcam2 239
gnhsun1 19
gobbun1 81
gobsta5 3
gobwea1 5
golher1 2
grbcam1 94
grccra1 12
grecor 138
greegr 252
grewoo2 103
grwpyt1 26
gryapa1 28
grywrw1 20
gybfis1 10
gycwar3 51
gyhbus1 72
gyhkin1 53
gyhneg1 24
gyhspa1 46
gytbar1 9
hadibi1 129
hamerk1 30
hartur1 18
helgui 59
hipbab1 8
hoopoe 436
huncis1 16
hunsun2 5
joygre1 7
kerspa2 34
klacuc1 56
kvbsun1 9
laudov1 109
lawgol 68
lesmaw1 14
lessts1 40
libeat1 29
litegr 378
litswi1 72
litwea1 18
loceag1 15
lotcor1 1
lotlap1 3
luebus1 19
mabeat1 16
macshr1 6
malkin1 15
marsto1 6
marsun2 40
mcptit1 8
meypar1 32
moccha1 36
mouwag1 30
ndcsun2 24
nobfly1 16
norbro1 20
norcro1 21
norfis1 20
norpuf1 20
nubwoo1 22
pabspa1 7
palfly2 14
palpri1 4
piecro1 91
piekin1 121
pitwhy 52
purgre2 10
pygbat1 14
quailf1 44
ratcis1 172
raybar1 17
rbsrob1 281
rebfir2 47
rebhor1 28
reboxp1 21
reccor 56
reccuc1 122
reedov1 70
refbar2 12
refcro1 42
reftin1 59
refwar2 9
rehblu1 2
rehwea1 5
reisee2 25
rerswa1 227
rewsta1 28
rindov 116
rocmar2 22
rostur1 10
ruegls1 33
rufcha2 6
sacibi2 6
sccsun2 78
scrcha1 30
scthon1 25
shesta1 3
sichor1 45
sincis1 68
slbgre1 23
slcbou1 51
sltnig1 33
sobfly1 21
somgre1 199
somtit4 22
soucit1 21
soufis1 42
spemou2 41
spepig1 37
spewea1 32
spfbar1 13
spfwea1 12
spmthr1 94
spwlap1 59
squher1 48
strher 119
strsee1 33
stusta1 4
subbus1 90
supsta1 37
tacsun1 6
tafpri1 161
tamdov1 97
thrnig1 500
trobou1 98
varsun2 105
vibsta2 19
vilwea1 88
vimwea1 18
walsta1 34
wbgbir1 27
wbrcha2 132
wbswea1 78
wfbeat1 48
whbcan1 10
whbcou1 73
whbcro2 7
whbtit5 23
whbwea1 19
whbwhe3 34
whcpri2 9
whctur2 1
wheslf1 17
whhsaw1 1
whihel1 14
whrshr1 8
witswa1 5
wlwwar 500
wookin1 67
woosan 486
wtbeat1 28
yebapa1 106
yebbar1 34
yebduc1 17
yebere1 35
yebgre1 22
yebsto1 1
yeccan1 13
yefcan 75
yelbis1 19
yenspu1 12
yertin1 134
yesbar1 29
yespet1 15
yetgre1 27
yewgre1 108

数据集共享协议

Xeno-canto的CC-BY-NC-SA协议(非商业用途)。

三、获取案例套装

文件包大小:5GB

获取:语音等多模态案例套装

发表评论