传统机器学习之分类问题案例套装

分类问题(Classification):是机器学习中的一种基本任务,它涉及识别数据项并归类到两个或多个预定义的类别或标签中。这个过程类似于我们日常生活中的决策和归类行为,比如将邮件分为“垃圾邮件”和“非垃圾邮件”,或者将图片分类为“猫”、“狗”或“车”。

1、竞赛活动案例

编号标题AI问题数据集解决方案文件包
1科大讯飞2021基于用户画像的商品推荐挑战赛分类问题支持基于用户画像的商品推荐使用回归器LGBMRegressor用于分类问题。AiS-ML-Class-Retail-iFLYTEK2021-User-Product-Recommendation-110MB
2科大讯飞2021移动设备用户年龄和性别的预测分类问题、分类问题基于移动设备信息、APP信息和事件信息对移动设备的用户进行性别和年龄的预测。使用LightGBM建立性别模型和年龄两个模型。AiS-ML-Class-Retail-iFLYTEK2021-Mobile-Phone-User-Gender-Age-Forcast-102MB
3科大讯飞2022电信客户流失预测暨各种模型比较分类问题某通信运营公司的3,333条客户信息和使用情况数据用于预测客户是否流失。多种分类方法AiS-ML-Class-Retail-iFLYTEK2022-Customer-Losing-Forecast-1MB
4科大讯飞2023-5G移动用户使用预测挑战赛二分类问题用户基本信息和通信相关数据预测是否为5G用户。LightGBMAiS-ML-Class-Retail-iFLYTEK2023-5G-Mobile-User-Forecast-122MB
5TwoSigma2017预测用户对房产的兴趣等级分类问题基于房产数据预测用户对房产的兴趣等级LightGBMAiS-ML-Class-Retail-TwoSigma2017-Rental-Listing-Inquiries-60MB
2AiWin2022发债企业违约风险数据集和分类预警分类问题发债企业的违约数据用于模型训练,预测发债企业发生违约风险的概率。LightGBM分类AiS-ML-Fin-AiWin2022-GuoTai-JunAn-Securities-Enterprises-Risk-66MB
3科大讯飞2023企业经营数据集和健康评估分类问题企业经营数据集用于企业经营健康评估。LightGBM分类。基于对抗验证(Adversarial Validation)思想筛选出AUC值低在训练集和测试集中分布相似的特征提高模型泛化能力。AiS-ML-Fin-iFLYTEK2023-Business-Operation-Health-Assessment-80MB
iFLYTEK2022糖尿病遗传风险检测挑战赛分类问题LightGBM模型AiS-ML-Medicine-iFLYTEK2022-Diabetes-Genetic-Risk-Detection
科大讯飞2021车辆贷款借款人数据集和违约预测分类问题包含52个特征字段的车辆贷款借款人数据集支持违约预测。LightGBMAiS-ML-Fin-iFLYTEK2021-Car-Loan-Default-8MB

2、经典案例

编号标题AI问题数据集解决方案文件包
1小麦种子数据集和分类样例分类问题AiS-ML-Agr-DataSet-Wheat-Seeds-2018
2Palmer企鹅数据集和分类样例分类问题AiS-ML-Animal-DatsSet-App-Palmer-Penguins-Classification-2020
3根据泰坦尼克号乘客数据集预测是否是幸存者分类问题AiS-ML-Human-DataSet-Titanic-Survival-Predict-1912
4Kaggle2024宇宙飞船泰坦尼克号乘客生存预测分类问题AiS-ML-Human-Spaceship-Titanic-Kaggle2024
5根据葡萄酒质量数据集进行线性回归预测分类问题AiS-ML-Agr-DataSet-Wine-Quality-2009
6Wisconsin州乳腺癌数据集和诊断预测分类问题AiS-ML-Medicine-DataSet-Breast-Cancer-Wisconsin-Diagnostic-1988
7Pima-Indians糖尿病检测数据集分类问题XGBoost预测模型AiS-ML-Medicine-DataSet-Pima-Indians-Diabetes-Predict-1990 TODO
8通过物理测量预测鲍鱼的年龄分类问题AiS-ML-Fishing-DataSet-Abalone-Age-Predict-2018
9基于岩石和地雷的声纳数据集进行二元分类分类问题AiS-ML-Mining-DataSet-Sornar-Binary-Classification-1990
10华盛顿共享单车租赁数据集(2011-2018)和应用AiS-ML-Trp-Dataset-WashingtonDC-Bike-Sharing-2011-2018
11摩拜共享单车2017年8月数据集和应用AiS-ML-Trp-DataSet-Mobai-Bike-Sharing-2017-08-43M
12Kirill2017银行客户流失预测模型分类问题银行客户流失预测模型数据集随机森林建模和预测AiS-ML-Fin-Kirill2017-Bank-Customer-Churn-Modelling-1MB
13Datawhale贷款记录数据集分类问题来自某信贷平台的贷款记录AiS-ML-Fin-DataSet-Datawhale-Loan-Credit-2024-60MB
142013年欧洲地区信用卡欺诈检测数据集分类问题2013年欧洲地区信用卡欺诈检测数据集用于信用卡欺诈检测PCA主要成分分析AiS-ML-Fin-2013-Euro-Fraud-Credit-Card-68MB

发表评论