语音处理案例
编号 | 标题 | AI问题 | 数据集价值 | 解决方案 | 文件 |
---|---|---|---|---|---|
1 | 科大讯飞2020婴儿啼哭声数据集和识别 | 语音等多模态识别 | 判别婴儿啼哭声所传递的信息 | 音乐信息检索(MIR)和语音处理librosa、Tensorflow框架 | AiS-NLP-Snd-iFLYTEK2020-Baby-Crying-Recognition-700MB |
2 | CCF-BDCI-2020-通用音频分类 | 语音等多模态识别 | 数据集涵盖30种不同音频,已分类训练集文件总数:57,886个。测试集文件总数:6,835个。支持音频分类。 | 音乐信息检索(MIR)和语音处理librosa、LightGBM框架 | AiS-NLP-Snd-CCF-BDCI-2020-General-Audio-Classification-1.9GB |
3 | RAVDESS-2018语音情感识别数据集 | 语音等多模态识别 | 支持语音情感识别研究 | — | AiS-NLP-Snd-RAVDESS2018-Emotion-Speech-80MB |
4 | GTzan音乐流派数据集(2002)和分类样例 | 语音等多模态识别 | GTzan数据集成为了音乐流派分类研究的标准数据集,许多基于机器学习和深度学习的音频分类研究都使用这个数据集进行验证。 | 音频特征提取与学习 | AiS-NLP-Media-Music-Genre-GTzan-2002-1.4GB |
5 | BirdCLEF2023鸟类声音识别数据集 | 语音等多模态识别 | 通过音频数据识别鸟类物种,推动自动鸟类监测技术的发展,应用于生态保护、生物多样性研究等场景。 | — | AiS-NLP-Animal-Snd-BirdCLEF2023-5GB |
说明
因公网带宽限制,用户获取已集成AI数据集+源码+文档+模型的案例资源包方式如下:
- 若资源包文件小于等于500MB,则默认支持网页下载。
- 若资源包文件大于500MB,则可通过以下两种方式之一获取:
- 方式一:微信文件传输。通过添加本平台官方店小二微信号:AiSelect.club店小二/18115143370。输入一个AI案例文件名,本平台把案例资源包分割成多个1GB文件进行分发。
- 方式二:通过淘宝店铺U盘分发:甲壳虫AI竞赛案例精选 https://shop293023998.taobao.com/ (同一合集的多个案例套件文件大小约20~64GB的打包成一U盘。U盘分发价格统一为50元=32GB/64GB的U盘市场价+国内快递费用+零毛利。)
本平台官方店小二微信号/手机号:AiSelect.club店小二/18115143370

获取大容量AI案例U盘套装:AI智能案例学习套装/自然语言处理-传媒行业-A-淘宝网