回归预测问题(Regression):是指在机器学习和统计学中,你想要预测一个连续的数值型结果的问题。这与分类问题不同,分类问题是预测离散的标签或类别。回归模型的目标是找到输入特征变量/解释变量 X与连续型输出变量/响应变量 y 之间的关系,并用这种关系来预测新的数据点的输出值。
1、金融类竞赛活动
| 编号 | 标题 | AI问题 | 数据集价值 | 解决方案 | 文件包 |
|---|
| 1 | 清华大学iCenter2023-AI量化金融模型预测挑战赛 | 回归预测问题 | 利用过往及当前股票交易数据进行模型训练,预测未来中间价的移动方向。 | LightGBM框架 | AiS-ML-Fin-iFLYTEK2023-AI-Quantitative-Model-Forecast-170MB |
| 2 | 蚂蚁金服用户资金流入流出数据集(2013-2014) | 回归预测问题 | 蚂蚁金服用户资金流入流出数据集应用于头寸优化管理 | — | AiS-ML-Fin-Ant2013-2014-Purchase-Redemption-29MB |
| 3 | Allstate2016保险理赔成本预测 | 回归预测问题 | 16个特征变量是分类变量,11个特征变量是连续变量。预测保险理赔成本。 | XGBoost 框架 | AiS-ML-Fin-Allstate2016-Insurance-Claims-Severity-24MB |
2、宏观经济数据预测
| 编号 | 标题 | AI问题 | 数据集 | 解决方案 | 文件包 |
|---|
| 1 | AiWin2021机器学习在债券定价中的应用 | 回归预测问题 | 利用宏观数据、行情数据或者其它特色数据构建特征,进行机器学习建模,对中债10年期国债、中债10年期国开债、中债10年期AAA级地方政府债、中债10年期AAA级城投债以及中债10年期AAA级企业债到期收益率进行预测。 | 实现了一个基于CIR(Cox-Ingersoll-Ross)模型的蒙特卡洛模拟器,用于生成短期利率的模拟路径。 | AiS-ML-Fin-AiWin2021-GuoTai-JunAn-Securities-Bond-Pricing-1MB |
| 2 | GBA2022-B题-基于宏观经济周期的大类资产配置策略构建 | 特征提取 | 宏观经济数据应用于大类资产配置策略构建 | PCA降维和特征信息增益 | AiS-ML-Fin-GBA2022-Finance-Mathematics-Modeling-B-4MB |
| 3 | 美国联邦储备经济数据(到2023年) | — | 包括丰富的经济指标集合,如就业数字、通货膨胀率和住房统计数据。 | — | AiS-ML-Fin-DataSet-Federal-Reserve-Economic-To-2023-1MB |
3、非金融类竞赛活动
4、经典案例
| 编号 | 标题 | AI问题 | 数据集 | 解决方案 | 文件包 |
|---|
| 1 | 信用评分卡建模数据集和系统样例 | 回归预测问题 | 基于信用评分卡建模数据集,进行信用违约概率计算、信用评分。 | 特征筛选、随机森林算法、评分转换。 | AiS-ML-Fin-Credit-Card-Scoring-11MB |
| 2 | MinChunHuang2005台湾地区信用卡客户数据集和预测 | 回归预测问题 | MinChunHuang2005台湾地区信用卡客户数据集用于违约预测。 | 回归预测算法 | AiS-ML-Fin-MinChunHuang2005-UCI-Credit_Card-TaiWan-6MB |
| 3 | 使用线性回归模型预测加州房价 | 回归预测问题 | — | — | AiS-ML-Retail-Boston-CA-House-Prices-Predict-1990 |