合集:行业AI数据集精选
本文精选医疗行业最受欢迎100+机器学习数据集,这些数据集来自具有重要影响力的学会、会议、数据库、期刊、国内外AI竞赛组织方、Github和Kaggle等数据集托管方。
一、医学组织
参考文章:医疗行业最受欢迎100+计算机视觉数据集 – 甲壳虫AI案例数据集和论文
获取医疗行业众多具有重要影响力的学会、会议、数据库和期刊。
二、数据集明细
汇总
总仓库数: 203 个
星标数分布:
- ⭐ 1000+: 17 个 (8.4%)
- ⭐ 500-999: 22 个 (10.8%)
- ⭐ 100-499: 164 个 (80.8%)
MICCAI-医学图像计算与计算机辅助介入大会 (1个)
1. RSNA MICCAI PNG
- 星标数: ⭐ 225
- 简介: RSNA MICCAI竞赛数据以PNG格式呈现(从128 GB压缩至5.2 GB)。
- 主题: healthcare, health
- 协议: Unknown 所有者: Jonathan Besomi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/jonathanbesomi/rsna-miccai-png
临床医疗 (101个)
1. Pima Indians Diabetes Database
- 星标数: ⭐ 4,991
- 简介: 根据诊断指标预测糖尿病的发病情况。
- 主题: india, healthcare, earth and nature, health, diabetes
- 协议: CC0: Public Domain 所有者: UCI Machine Learning 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/uciml/pima-indians-diabetes-database
2. Breast Cancer Wisconsin (Diagnostic) Data Set
- 星标数: ⭐ 4,008
- 简介: 预测癌症是良性还是恶性
- 主题: healthcare, cancer
- 协议: CC BY-NC-SA 4.0 所有者: UCI Machine Learning 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/uciml/breast-cancer-wisconsin-data
3. Stroke Prediction Dataset
- 星标数: ⭐ 3,517
- 简介: 预测卒中事件的11项临床特征
- 主题: healthcare, public health, health, binary classification, health conditions
- 协议: Data files © Original Authors 所有者: fedesoriano 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fedesoriano/stroke-prediction-dataset
4. Medical Cost Personal Datasets
- 星标数: ⭐ 3,158
- 简介: 使用线性回归进行保险预测
- 主题: healthcare, education, finance, health, insurance
- 协议: Database: Open Database, Contents: Database Contents 所有者: Miri Choi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mirichoi0218/insurance
5. Heart Failure Prediction Dataset
- 星标数: ⭐ 3,138
- 简介: 预测心脏病事件的11项临床特征。
- 主题: healthcare, health, classification, health conditions, heart conditions
- 协议: Database: Open Database, Contents: © Original Authors 所有者: fedesoriano 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fedesoriano/heart-failure-prediction
6. Heart Failure Prediction
- 星标数: ⭐ 2,475
- 简介: 预测死亡事件的12项临床特征。
- 主题: healthcare, public health, health, tabular, heart conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Larxel 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/andrewmvd/heart-failure-clinical-data
7. Diabetes Dataset
- 星标数: ⭐ 1,698
- 简介: 糖尿病患者数据
- 主题: india, data visualization, tabular, diabetes, pandas
- 协议: CC0: Public Domain 所有者: Akshay Dattatray Khare 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset
8. Sign Language MNIST
- 星标数: ⭐ 1,687
- 简介: 手部手势识别任务中MNIST的即插即用替代方案
- 主题: languages, healthcare, linguistics, computer science
- 协议: CC0: Public Domain 所有者: tecperson 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/datamunge/sign-language-mnist
9. Cardiovascular Disease dataset
- 星标数: ⭐ 1,388
- 简介: 该数据集包含70,000条患者数据记录,涵盖11个特征变量及一个目标变量。
- 主题: healthcare, health, heart conditions
- 协议: Unknown 所有者: Svetlana Ulianova 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/sulianova/cardiovascular-disease-dataset
10. Malaria Cell Images Dataset
- 星标数: ⭐ 1,326
- 简介: 用于检测疟疾的细胞图像
- 主题: healthcare
- 协议: Unknown 所有者: Arunava 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/iarunava/cell-images-for-detecting-malaria
11. Mental Health in Tech Survey
- 星标数: ⭐ 1,225
- 简介: 2014年科技行业职场心理健康状况调查
- 主题: mental health, healthcare, genetics, earth and nature, employment
- 协议: CC BY-SA 4.0 所有者: Open Sourcing Mental Illness, LTD 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/osmi/mental-health-in-tech-survey
12. Medical Appointment No Shows
- 星标数: ⭐ 1,103
- 简介: 为什么有30%的患者会错过预约时间?
- 主题: brazil, healthcare, public health, health
- 协议: CC BY-NC-SA 4.0 所有者: JoniHoppen 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/joniarroba/noshowappointments
13. Indicators of Heart Disease (2022 UPDATE)
- 星标数: ⭐ 952
- 简介: 2022年度疾病控制与预防中心(CDC)关于40余万成年人健康状况的年度调查数据
- 主题: healthcare, health, data visualization, data analytics, binary classification
- 协议: CC0: Public Domain 所有者: Kamil Pytlak 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kamilpytlak/personal-key-indicators-of-heart-disease
14. mimic3-benchmarks
- 星标数: ⭐ 877
- 简介: 用于从MIMIC-III临床数据库构建基准机器学习数据集的Python套件。💊
- 主题: benchmark, clinical-data, deep-learning, machine-learning
- 协议: MIT License 所有者: YerevaNN 托管方: github
- 链接: https://github.com/YerevaNN/mimic3-benchmarks
15. COVID-19 Dataset
- 星标数: ⭐ 877
- 简介: COVID-19患者的症状、状况及既往病史。
- 主题: diseases, health, classification, covid19
- 协议: CC0: Public Domain 所有者: Meir Nizri 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/meirnizri/covid19-dataset
16. Diabetes prediction dataset
- 星标数: ⭐ 851
- 简介: 基于医疗与人口统计数据的糖尿病预测综合数据集
- 主题: healthcare, health, classification, binary classification, diabetes
- 协议: Data files © Original Authors 所有者: Mohammed Mustafa 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/iammustafatz/diabetes-prediction-dataset
17. Health Insurance Marketplace
- 星标数: ⭐ 716
- 简介: 探索美国医疗保险市场中健康与牙科计划的数据
- 主题: healthcare, dentistry, earth and nature, business, economics
- 协议: CC0: Public Domain 所有者: US Department of Health and Human Services 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/hhs/health-insurance-marketplace
18. Fetal Health Classification
- 星标数: ⭐ 684
- 简介: 利用CTG数据将胎儿健康状况分类为正常、可疑或病理状态。
- 主题: healthcare, public health, health, mortality, tabular
- 协议: Other (specified in description) 所有者: Larxel 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/andrewmvd/fetal-health-classification
19. Breast Cancer Dataset
- 星标数: ⭐ 653
- 简介: 乳腺癌类型的二元分类预测
- 主题: healthcare, classification, tabular, binary classification, cancer
- 协议: CC0: Public Domain 所有者: M Yasser H 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/yasserh/breast-cancer-dataset
20. Heartbeat Sounds
- 星标数: ⭐ 605
- 简介: 从听诊器音频中分类心跳异常
- 主题: music, healthcare, earth and nature, health, classification
- 协议: CC0: Public Domain 所有者: Ed King 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kinguistics/heartbeat-sounds
21. Cervical Cancer Risk Classification
- 星标数: ⭐ 595
- 简介: 癌症指标预测;请下载;运行内核并点赞
- 主题: healthcare, genetics, cancer
- 协议: Other (specified in description) 所有者: Gokagglers 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/loveall/cervical-cancer-risk-classification
22. CKG
- 星标数: ⭐ 587
- 简介: 临床知识图谱(CKG)是一个具有双重目标的平台:1)构建一个包含实验数据及从多种生物医学数据库导入数据的图数据库;2)利用图谱中所有信息实现知识发现的自动化。
- 主题: 未提供
- 协议: MIT License 所有者: MannLabs 托管方: github
- 链接: https://github.com/MannLabs/CKG
23. Respiratory Sound Database
- 星标数: ⭐ 560
- 简介: 利用音频记录检测呼吸系统疾病。
- 主题: healthcare, earth and nature, biology, health, multiclass classification
- 协议: Unknown 所有者: vbookshelf 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/vbookshelf/respiratory-sound-database
24. Logistic regression To predict heart disease
- 星标数: ⭐ 551
- 简介: 心脏病预测
- 主题: healthcare, health, logistic regression, regression, health conditions
- 协议: Unknown 所有者: Dileep 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/dileep070/heart-disease-prediction-using-logistic-regression
25. Ocular Disease Recognition
- 星标数: ⭐ 535
- 简介: 5000名患者的左右眼眼底照片
- 主题: health, image, eyes and vision
- 协议: Other (specified in description) 所有者: Larxel 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/andrewmvd/ocular-disease-recognition-odir5k
26. Disease Symptom Prediction
- 星标数: ⭐ 524
- 简介: 有助于构建疾病预测或医疗保健系统
- 主题: healthcare, diseases, health, classification, recommender systems
- 协议: CC BY-SA 4.0 所有者: Pranay Patil 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/itachi9604/disease-symptom-description-dataset
27. Diagnosis of COVID-19 and its clinical spectrum
- 星标数: ⭐ 495
- 简介: 人工智能与数据科学辅助临床决策(3月28日至4月3日)
- 主题: healthcare, public health, earth and nature, health, classification
- 协议: Unknown 所有者: Einstein Data4u 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/einsteindata4u/covid19
28. Student Stress Monitoring Datasets
- 星标数: ⭐ 488
- 简介: 压力、幸福因素、潜在原因及其影响的综合研究
- 主题: mental health, healthcare, health, artificial intelligence, computer science
- 协议: Apache 2.0 所有者: Sultanul Ovi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mdsultanulislamovi/student-stress-monitoring-datasets
29. Indian Liver Patient Records
- 星标数: ⭐ 480
- 简介: 从印度安得拉邦东北部收集的患者记录
- 主题: healthcare, health, medicine, health conditions, cancer
- 协议: CC0: Public Domain 所有者: UCI Machine Learning 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/uciml/indian-liver-patient-records
30. Heart Attack Prediction
- 星标数: ⭐ 454
- 简介: 此文件描述了心脏病目录的内容。
- 主题: healthcare, health, health conditions, heart conditions, benchmark dataset
- 协议: CC0: Public Domain 所有者: Nikhil Anand 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imnikhilanand/heart-attack-prediction
31. Polycystic ovary syndrome (PCOS)
- 星标数: ⭐ 436
- 简介: 多囊卵巢综合征数据集包含患者的所有生理和临床参数。
- 主题: research, diseases
- 协议: CC BY-NC-SA 4.0 所有者: prasoon kottarathil 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/prasoonkottarathil/polycystic-ovary-syndrome-pcos
32. National Health and Nutrition Examination Survey
- 星标数: ⭐ 431
- 简介: 2013-2014年美国国家健康与营养调查数据集
- 主题: healthcare, nutrition, earth and nature, health, drugs and medications
- 协议: Unknown 所有者: Centers for Disease Control and Prevention 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/cdc/national-health-and-nutrition-examination-survey
33. Hospital Beds Management
- 星标数: ⭐ 404
- 简介: 医院模拟数据集研究:工作量、患者流动与床位容量分析
- 主题: healthcare, health
- 协议: CC0: Public Domain 所有者: Weiwei Zhu 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/jaderz/hospital-beds-management
34. Medicare Data
- 星标数: ⭐ 399
- 简介: 医疗保险数据(BigQuery数据集)
- 主题: healthcare, health, bigquery, drugs and medications
- 协议: CC0: Public Domain 所有者: Centers for Medicare & Medicaid Services 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/cms/cms-medicare
35. UCI Heart Disease Data
- 星标数: ⭐ 389
- 简介: 来自UCI数据仓库的心脏病数据集
- 主题: healthcare, health, medicine, feature engineering, tabular
- 协议: Data files © Original Authors 所有者: Redwan Sony 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/redwankarimsony/heart-disease-data
36. Pfizer Vaccine Tweets
- 星标数: ⭐ 388
- 简介: 辉瑞与BioNTech疫苗相关推文
- 主题: healthcare, public health, health, drugs and medications
- 协议: CC0: Public Domain 所有者: Gabriel Preda 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/gpreda/pfizer-vaccine-tweets
37. Breast Cancer Proteomes
- 星标数: ⭐ 374
- 简介: 将乳腺癌患者划分为不同的亚类
- 主题: healthcare, biology, chemistry, health, cancer
- 协议: Unknown 所有者: kajot 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/piotrgrabo/breastcancerproteomes
38. Disease Symptoms and Patient Profile Dataset
- 星标数: ⭐ 339
- 简介: 揭示了患者与疾病之间在超过100种疾病中的复杂关系。
- 主题: medicine, computer science, exploratory data analysis, classification, health conditions
- 协议: MIT 所有者: Laksika Tharmalingam 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/uom190346a/disease-symptoms-and-patient-profile-dataset
39. awesome-cancer-variant-resources
- 星标数: ⭐ 325
- 简介: 一个由社区维护的癌症临床知识库和数据库集合,专注于癌症变异研究。
- 主题: awesome-list, bioinformatics, cancer, cancer-genomics, cancer-variants
- 协议: MIT License 所有者: seandavi 托管方: github
- 链接: https://github.com/seandavi/awesome-cancer-variant-resources
40. HEALTHCARE PROVIDER FRAUD DETECTION ANALYSIS
- 星标数: ⭐ 322
- 简介: 医疗保健提供者欺诈检测分析
- 主题: healthcare, insurance
- 协议: CC0: Public Domain 所有者: Rohit Anand Gupta 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/rohitrox/healthcare-provider-fraud-detection-analysis
41. awesome-healthcare-ai
- 星标数: ⭐ 313
- 简介: 精选的优质开源医疗工具、算法、数据集及研究论文列表。
- 主题: awesome-list, awesome-lists, healthcare, healthcare-application, healthcare-datasets
- 协议: Creative Commons Zero v1.0 Universal 所有者: medtorch 托管方: github
- 链接: https://github.com/medtorch/awesome-healthcare-ai
42. Genetic Variant Classifications
- 星标数: ⭐ 301
- 简介: 预测某个变异是否会导致临床分类上的冲突。
- 主题: healthcare, genetics, earth and nature, biology, medicine
- 协议: CC0: Public Domain 所有者: Kevin Arvai 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kevinarvai/clinvar-conflicting
43. Heart Attack Risk Prediction Dataset
- 星标数: ⭐ 292
- 简介: 利用多维度合成心脏病发作数据集解锁预测性洞察
- 主题: healthcare, public health, health, health conditions, heart conditions
- 协议: Other (specified in description) 所有者: Sourav Banerjee 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/iamsouravbanerjee/heart-attack-prediction-dataset
44. Dermnet
- 星标数: ⭐ 285
- 简介: 23类皮肤病的影像数据
- 主题: deep learning, image, hospitals and treatment centers
- 协议: Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) 所有者: Shubham Goel 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/shubhamgoel27/dermnet
45. Finding and Measuring Lungs in CT Data
- 星标数: ⭐ 283
- 简介: 一组CT图像,包含手动分割的肺部及2D/3D测量数据。
- 主题: healthcare, earth and nature, biology, image, health conditions
- 协议: Unknown 所有者: K Scott Mader 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kmader/finding-lungs-in-ct-data
46. Lower Back Pain Symptoms Dataset
- 星标数: ⭐ 271
- 简介: 收集物理脊柱数据
- 主题: healthcare, health conditions
- 协议: Unknown 所有者: sammy123 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/sammy123/lower-back-pain-symptoms-dataset
47. Diabetes 130 US hospitals for years 1999-2008
- 星标数: ⭐ 256
- 简介: 糖尿病 – 再入院
- 主题: healthcare, health, diabetes
- 协议: CC0: Public Domain 所有者: Humberto Brandão, Ph.D. 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/brandao/diabetes
48. MIAS Mammography
- 星标数: ⭐ 256
- 简介: 寻找乳腺癌
- 主题: healthcare, health, health conditions, cancer
- 协议: Other (specified in description) 所有者: K Scott Mader 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kmader/mias-mammography
49. Chronic illness: symptoms, treatments and triggers
- 星标数: ⭐ 235
- 简介: 治疗方法和环境压力如何影响症状表现?
- 主题: healthcare, diseases, health, medicine, health conditions
- 协议: CC BY-NC-SA 4.0 所有者: Flaredown 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/flaredown/flaredown-autoimmune-symptom-tracker
50. U.S. Healthcare Data
- 星标数: ⭐ 235
- 简介: 人口健康、疾病、药物、营养、健康计划
- 主题: united states, healthcare, diseases, nutrition, health
- 协议: CC0: Public Domain 所有者: BuryBuryZymon 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/maheshdadhich/us-healthcare-data
51. TSDB
- 星标数: ⭐ 233
- 简介: 一个Python工具箱仅需一行代码即可加载172个公开时间序列数据集,适用于机器学习和深度学习。这些数据集涵盖医疗健康、金融、电力、交通、天气等多个领域。
- 主题: classification, data-mining, database, deep-learning, forecasting
- 协议: BSD 3-Clause “New” or “Revised” License 所有者: WenjieDu 托管方: github
- 链接: https://github.com/WenjieDu/TSDB
52. Predict Diabetes
- 星标数: ⭐ 222
- 简介: 分析糖尿病数据库
- 主题: healthcare, health, exploratory data analysis, classification, diabetes
- 协议: CC0: Public Domain 所有者: Aman Chauhan 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/whenamancodes/predict-diabities
53. Hepatitis C Prediction Dataset
- 星标数: ⭐ 217
- 简介: 献血者与丙型肝炎患者的实验室检测值
- 主题: health and fitness, healthcare, cancer
- 协议: Database: Open Database, Contents: © Original Authors 所有者: fedesoriano 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fedesoriano/hepatitis-c-dataset
54. Body Fat Prediction Dataset
- 星标数: ⭐ 211
- 简介: 252名男性的体脂估算值与各项身体围度测量数据
- 主题: healthcare, public health, earth and nature, health, regression
- 协议: Data files © Original Authors 所有者: fedesoriano 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fedesoriano/body-fat-prediction-dataset
55. Skin Lesion Images for Melanoma Classification
- 星标数: ⭐ 207
- 简介: 共有9个类别,总计25,331张图像。
- 主题: arts and entertainment, healthcare, health, health conditions, cancer
- 协议: Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) 所有者: Larxel 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/andrewmvd/isic-2019
56. american-healthcare-conundrum
- 星标数: ⭐ 206
- 简介: 调查性数据新闻:逐项量化美国医疗体系中的可避免浪费。基于CMS、OECD及联邦数据集的开源分析。目前已识别出986亿美元的可节约资金。
- 主题: cms-data, data-journalism, drug-pricing, health-policy, healthcare
- 协议: MIT License 所有者: rexrodeo 托管方: github
- 链接: https://github.com/rexrodeo/american-healthcare-conundrum
57. Covid-19 Case Surveillance Public Use Dataset
- 星标数: ⭐ 200
- 简介: 探索美国向疾病控制与预防中心报告的COVID-19病例人口统计趋势。
- 主题: healthcare, public health, social science, tabular, covid19
- 协议: CC0: Public Domain 所有者: Möbius 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/arashnic/covid19-case-surveillance-public-use-dataset
58. COVID-19 patient pre-condition dataset
- 星标数: ⭐ 193
- 简介: 根据墨西哥政府数据集获得的数据
- 主题: health, logistic regression, covid19
- 协议: CC0: Public Domain 所有者: Tanmoy Mukherjee 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/tanmoyx/covid19-patient-precondition-dataset
59. DDSM Mammography
- 星标数: ⭐ 193
- 简介: 来自DDSM数据集的扫描图像的tfrecords文件。
- 主题: arts and entertainment, healthcare, biology, health, medicine
- 协议: CC0: Public Domain 所有者: Eric A. Scuccimarra 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/skooch/ddsm-mammography
60. Cirrhosis Prediction Dataset
- 星标数: ⭐ 187
- 简介: 用于预测肝硬化分期的18项临床特征
- 主题: healthcare, public health, health, multiclass classification, health conditions
- 协议: Data files © Original Authors 所有者: fedesoriano 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fedesoriano/cirrhosis-prediction-dataset
61. U.S. Opiate Prescriptions/Overdoses
- 星标数: ⭐ 184
- 简介: 能否通过预测模型挽救生命?
- 主题: healthcare, drugs and medications
- 协议: CC0: Public Domain 所有者: Alan “AJ” Pryor, Ph.D. 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/apryor6/us-opiate-prescriptions
62. Heart Attack Dataset
- 星标数: ⭐ 178
- 简介: 伊拉克埃尔比勒市Zheen医院
- 主题: healthcare, medicine, data visualization, data analytics, heart conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Fatemeh Mohammadinia 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fatemehmohammadinia/heart-attack-dataset-tarik-a-rashid
63. COVID-19 – Clinical Data to assess diagnosis
- 星标数: ⭐ 177
- 简介: Data Intelligence Team提供的Sírio-Libanês人工智能与分析数据
- 主题: business, health, social science, medicine, classification
- 协议: Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) 所有者: Hospital Sírio-Libanês 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/Sírio-Libanes/covid19
64. Cannabis Strains
- 星标数: ⭐ 169
- 简介: 大麻品种数据集
- 主题: healthcare, government, health
- 协议: Unknown 所有者: Liam Larsen 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kingburrito666/cannabis-strains
65. Healthcare Insurance
- 星标数: ⭐ 168
- 简介: 我的数据集涉及全球医疗保健领域的不安全感问题,目前正在开发中。
- 主题: exploratory data analysis, data visualization, neural networks, health conditions, numpy
- 协议: CC0: Public Domain 所有者: willian oliveira 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/willianoliveiragibin/healthcare-insurance
66. Diabetes Health Indicators Dataset
- 星标数: ⭐ 165
- 简介: 用于糖尿病风险分析的10万份患者记录综合数据集
- 主题: healthcare, classification, binary classification, regression, health conditions
- 协议: CC0: Public Domain 所有者: Mohan Krishna Thalla 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mohankrishnathalla/diabetes-health-indicators-dataset
67. Breast Cancer Gene Expression Profiles (METABRIC)
- 星标数: ⭐ 159
- 简介: 1904名患者的临床特征、mRNA水平Z分数及基因突变情况
- 主题: genetics, biology, health, cancer
- 协议: Database: Open Database, Contents: Database Contents 所有者: Raghad Alharbi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/raghadalharbi/breast-cancer-gene-expression-profiles-metabric
68. Anxiety and Depression Psychological Therapies
- 星标数: ⭐ 159
- 简介: 全国焦虑与抑郁临床审计 – 英国
- 主题: mental health
- 协议: Other (specified in description) 所有者: Marília Prata 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mpwolke/cusersmarildownloadsanxietycsv
69. Autism Screening
- 星标数: ⭐ 158
- 简介: 根据筛查结果对自闭症患者进行分类。
- 主题: universities and colleges, healthcare, education
- 协议: CC0: Public Domain 所有者: Faizunnabi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/faizunnabi/autism-screening
70. COVID-19 Clinical Trials dataset
- 星标数: ⭐ 152
- 简介: 全球范围内正在进行的与COVID-19相关的临床研究数据库
- 主题: healthcare, covid19
- 协议: Database: Open Database, Contents: Database Contents 所有者: Parul Pandey 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/parulpandey/covid19-clinical-trials-dataset
71. Thyroid Disease Data
- 星标数: ⭐ 151
- 简介: 患者人口统计学资料及血液检测结果,以及甲状腺疾病诊断。
- 主题: health, medicine, classification, tabular, cancer
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: jaina 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/jainaru/thyroid-disease-data
72. Employee Attrition for Healthcare
- 星标数: ⭐ 146
- 简介: 基于直观特征构建性能良好的机器学习模型。
- 主题: healthcare, people and society, health, classification
- 协议: CC0: Public Domain 所有者: JohnM 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/jpmiller/employee-attrition-for-healthcare
73. Hospital ratings
- 星标数: ⭐ 142
- 简介: Medicare.gov网站上用于医院质量比较的官方数据集
- 主题: public health, finance, health, hospitals and treatment centers
- 协议: CC0: Public Domain 所有者: Center for Medicare and Medicaid 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/center-for-medicare-and-medicaid/hospital-ratings
74. Hospitals and beds in India (Statewise)
- 星标数: ⭐ 142
- 简介: 印度各邦的床位和医院数量统计。
- 主题: india, health, hospitals and treatment centers, covid19
- 协议: CC0: Public Domain 所有者: Dheeraj M Pai 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/dheerajmpai/hospitals-and-beds-in-india
75. Cirrhosis Patient Survival Prediction
- 星标数: ⭐ 140
- 简介: 利用17项临床特征预测肝硬化患者的生存率
- 主题: healthcare, health, mortality, classification, binary classification
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Joakim Arvidsson 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/joebeachcapital/cirrhosis-patient-survival-prediction
76. Medical Speech, Transcription, and Intent
- 星标数: ⭐ 138
- 简介: 常见医学症状的音频话语与文本配对
- 主题: healthcare, public health, health, text
- 协议: Other (specified in description) 所有者: Paul Mooney 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/paultimothymooney/medical-speech-transcription-and-intent
77. Global Hospital Beds Capacity (for covid-19)
- 星标数: ⭐ 137
- 简介: 了解全球典型医院床位容量的基准
- 主题: healthcare, health, social science, covid19
- 协议: CC0: Public Domain 所有者: Igor Kiulian 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/ikiulian/global-hospital-beds-capacity-for-covid19
78. heart failure clinical records
- 星标数: ⭐ 130
- 简介: 心力衰竭临床记录
- 主题: health, heart conditions
- 协议: Other (specified in description) 所有者: Nima Pourmoradi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/nimapourmoradi/heart-failure-clinical-records
79. Thyroid Disease Data
- 星标数: ⭐ 130
- 简介: 患者人口统计学特征及甲状腺疾病诊断相关的血液检测结果
- 主题: medicine, exploratory data analysis, data cleaning, data visualization, classification
- 协议: CC0: Public Domain 所有者: Emmanuel F. Werr 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/emmanuelfwerr/thyroid-disease-data
80. Lung Cancer Detection
- 星标数: ⭐ 130
- 简介: 使用机器学习预测肺癌
- 主题: healthcare, public health, categorical, health, cancer
- 协议: CC0: Public Domain 所有者: Jillani SofTech 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/jillanisofttech/lung-cancer-detection
81. Adverse Food Events
- 星标数: ⭐ 128
- 简介: 90,000起与产品相关的用户报告不良医疗事件
- 主题: healthcare, government, medicine, software
- 协议: CC0: Public Domain 所有者: Food and Drug Administration 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/fda/adverse-food-events
82. Obesity Classification Dataset
- 星标数: ⭐ 119
- 简介: 多分类数据集
- 主题: health and fitness, healthcare, public health, health, health conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Sujith K Mandala 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/sujithmandala/obesity-classification-dataset
83. awesome-healthcare-datasets
- 星标数: ⭐ 117
- 简介: 一份精选的公共领域优质医疗数据集列表。
- 主题: 未提供
- 协议: MIT License 所有者: nickls 托管方: github
- 链接: https://github.com/nickls/awesome-healthcare-datasets
84. Lung Cancer Dataset
- 星标数: ⭐ 117
- 简介: 肺癌风险评估与分析详细患者档案
- 主题: healthcare, computer science, health conditions, cancer
- 协议: Database: Open Database, Contents: © Original Authors 所有者: Akash Nath 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/akashnath29/lung-cancer-dataset
85. awesome-healthcare-datasets
- 星标数: ⭐ 116
- 简介: 医疗保健与生物医学数据集,适用于人工智能/机器学习
- 主题: awesome-list, biomedical, clinical, datasets, healthcare
- 协议: Creative Commons Zero v1.0 Universal 所有者: geniusrise 托管方: github
- 链接: https://github.com/geniusrise/awesome-healthcare-datasets
86. Pathogen Detection | Salmonella Enterica
- 星标数: ⭐ 116
- 简介: 病原体检测在疾病诊断中具有重要意义。
- 主题: genetics, biology
- 协议: Other (specified in description) 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/pathogen-detection-salmonella-enterica
87. Real Breast Cancer Data
- 星标数: ⭐ 115
- 简介: 真实乳腺癌样本数据集,适用于医疗健康与癌症数据分析。
- 主题: diseases, categorical, health, tabular, cancer
- 协议: CC0: Public Domain 所有者: AM 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/amandam1/breastcancerdataset
88. COVID19 Daily Updates
- 星标数: ⭐ 115
- 简介: 新型冠状病毒(又称COVID-19)每日疫情更新
- 主题: healthcare, public health, news
- 协议: Data files © Original Authors 所有者: Gabriel Preda 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/gpreda/coronavirus-2019ncov
89. Cancer Risk Factors Data
- 星标数: ⭐ 114
- 简介: 关联生活方式、环境与遗传因素的癌症风险数据集。
- 主题: healthcare, diseases, deep learning, cancer, pytorch
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Tarek Masryo 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/tarekmasryo/cancer-risk-factors-dataset
90. Healthcare Diabetes Dataset
- 星标数: ⭐ 113
- 简介: 糖尿病风险评估综合数据集
- 主题: healthcare, exploratory data analysis, binary classification, regression, diabetes
- 协议: Apache 2.0 所有者: Nandita Pore 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/nanditapore/healthcare-diabetes
91. Global Health Statistics
- 星标数: ⭐ 112
- 简介: 全球健康统计:各国疾病流行率、治疗与结果分析
- 主题: health, artificial intelligence, computer science, cancer, covid19
- 协议: CC0: Public Domain 所有者: MalaiarasuGRaj 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/malaiarasugraj/global-health-statistics
92. Medical Insurance Cost Prediction
- 星标数: ⭐ 111
- 简介: 10万名个体的健康、生活方式、保险、理赔及医疗费用数据
- 主题: healthcare, health, classification, regression, insurance
- 协议: CC0: Public Domain 所有者: Mohan Krishna Thalla 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mohankrishnathalla/medical-insurance-cost-prediction
93. imcs21-cblue
- 星标数: ⭐ 110
- 简介: 这是天池CBLUE竞赛中医疗对话数据集’imcs21’的代码仓库。
- 主题: annotated-corpora, bioinformatics, healthcare-application, medical-dialogue, natural-language-understanding
- 协议: 未提供 所有者: lemuria-wchen 托管方: github
- 链接: https://github.com/lemuria-wchen/imcs21-cblue
94. Predict survival of patients with heart failure
- 星标数: ⭐ 110
- 简介: 心力衰竭临床记录
- 主题: health, classification, clustering, regression, health conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Rabie El Kharoua 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/rabieelkharoua/predict-survival-of-patients-with-heart-failure
95. Insurance Claim Analysis: Demographic and Health
- 星标数: ⭐ 110
- 简介: 对保险索赔风险与严重程度的影响
- 主题: healthcare, public health, health, insurance
- 协议: Other (specified in description) 所有者: The Devastator 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/thedevastator/insurance-claim-analysis-demographic-and-health
96. HeartHealthPrediction
- 星标数: ⭐ 107
- 简介: 在全球范围内,无论是发达国家还是欠发达国家,心脏病都是导致死亡的主要原因。数据科学家利用独特的机器学习技术,通过真实数据集高效且准确地对健康疾病进行建模。医疗分析师迫切需要能够预测患者发病前疾病风险的模型或系统。高胆固醇、不健康饮食、有害饮酒、高血糖、高血压以及吸烟是心脏病发病风险的主要征兆……
- 主题: data-science, decision-trees, healthcare, heart-health-prediction, meachinelearning
- 协议: 未提供 所有者: ammarmahmood1999 托管方: github
- 链接: https://github.com/ammarmahmood1999/HeartHealthPrediction
97. Global Health,Mortality & Disease Trend Since 2000
- 星标数: ⭐ 106
- 简介: 自2000年起各国健康、死亡率及人口指标
- 主题: healthcare, diseases, health, data analytics
- 协议: CC BY-SA 4.0 所有者: Shreyansh Dangi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/shreyanshdangi/global-health-mortality-and-population-since-2000
98. Health Care Analytics
- 星标数: ⭐ 105
- 简介: 预测患者预后
- 主题: healthcare, health, data cleaning, ensembling, regression
- 协议: Data files © Original Authors 所有者: Abishek Sudarshan 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/abisheksudarshan/health-care-analytics
99. Parkinson’s Disease (PD) classification
- 星标数: ⭐ 103
- 简介: 从帕金森病患者的语音记录中提取特征。
- 主题: diseases, computer science, classification, feature engineering
- 协议: Unknown 所有者: Dipayan Biswas 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/dipayanbiswas/parkinsons-disease-speech-signal-features
100. Diabetes_Dataset_With_18_Features
- 星标数: ⭐ 103
- 简介: 您可以使用此数据集构建糖尿病诊断模型。
- 主题: categorical, feature engineering, gradient boosting, binary classification, diabetes
- 协议: Other (specified in description) 所有者: Parisa Karimi Darabi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/pkdarabi/diabetes-dataset-with-18-features
101. Clinical Dataset
- 星标数: ⭐ 102
- 简介: 发现队列和验证队列的临床数据
- 主题: medicine, drugs and medications, hospitals and treatment centers
- 协议: Other (specified in description) 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/clinical-dataset
生物医学 (7个)
1. pubmedqa
- 星标数: ⭐ 414
- 简介: PubMedQA:生物医学研究问答数据集
- 主题: 未提供
- 协议: MIT License 所有者: pubmedqa 托管方: github
- 链接: https://github.com/pubmedqa/pubmedqa
2. MedMentions
- 星标数: ⭐ 344
- 简介: 一个标注了UMLS实体提及的生物医学论文语料库。
- 主题: 未提供
- 协议: 未提供 所有者: chanzuckerberg 托管方: github
- 链接: https://github.com/chanzuckerberg/MedMentions
3. awesome-drug-discovery-knowledge-graphs
- 星标数: ⭐ 249
- 简介: 本资源库汇集了与药物发现知识图谱相关的研究论文、数据集及软件工具。该资源库作为《药物发现相关生物医学数据集综述:知识图谱视角》(《生物信息学简报》,2022年)一文的配套资料,旨在为相关领域研究者提供系统化的参考资源。
- 主题: awesome-list, drug-discovery, drug-discovery-knowledge-graph, knowledge-graph
- 协议: Apache License 2.0 所有者: AstraZeneca 托管方: github
- 链接: https://github.com/AstraZeneca/awesome-drug-discovery-knowledge-graphs
4. BioNEV
- 星标数: ⭐ 230
- 简介: 图嵌入评估 / 《生物医学网络上的图嵌入:方法、应用与评估》(Bioinformatics 2020)相关代码与数据集
- 主题: biomedical-graphs, biomedical-networks, deepwalk, gae, graph-embedding
- 协议: MIT License 所有者: xiangyue9607 托管方: github
- 链接: https://github.com/xiangyue9607/BioNEV
5. End ALS Kaggle Challenge
- 星标数: ⭐ 197
- 简介: 共享数据并众包关键诊断查询
- 主题: universities and colleges, genetics, biology, health, medicine
- 协议: Other (specified in description) 所有者: ALS Group 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/alsgroup/end-als
6. Mice Protein Expression
- 星标数: ⭐ 130
- 简介: 在大脑皮层中测量了77种蛋白质的表达水平。
- 主题: biology, health, multiclass classification, health conditions
- 协议: CC0: Public Domain 所有者: Ruslan Klymentiev 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/ruslankl/mice-protein-expression
7. biomedical-qa-datasets
- 星标数: ⭐ 128
- 简介: 生物医学问答数据集。
- 主题: 未提供
- 协议: MIT License 所有者: Andy-jqa 托管方: github
- 链接: https://github.com/Andy-jqa/biomedical-qa-datasets
通用医学 (69个)
1. Skin Cancer MNIST: HAM10000
- 星标数: ⭐ 2,275
- 简介: 大量多源皮肤镜色素性病变图像集
- 主题: health, image, multiclass classification
- 协议: CC BY-NC-SA 4.0 所有者: K Scott Mader 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kmader/skin-cancer-mnist-ham10000
2. Awesome-Medical-Dataset
- 星标数: ⭐ 1,735
- 简介: 精选医疗数据集资源汇总。
- 主题: 未提供
- 协议: 未提供 所有者: openmedlab 托管方: github
- 链接: https://github.com/openmedlab/Awesome-Medical-Dataset
3. Life Expectancy (WHO)
- 星标数: ⭐ 1,363
- 简介: 影响预期寿命因素的统计分析
- 主题: global, health, social science, data cleaning
- 协议: Other (specified in description) 所有者: KumarRajarshi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kumarajarshi/life-expectancy-who
4. UNCOVER COVID-19 Challenge
- 星标数: ⭐ 1,354
- 简介: 联合国新冠肺炎数据探索与研究网络
- 主题: public health, business, computer science, covid19
- 协议: Data files © Original Authors 所有者: Roche Data Science Coalition 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/roche-data-science-coalition/uncover
5. Blood Cell Images
- 星标数: ⭐ 907
- 简介: 12,500张图像:涵盖4种不同的细胞类型
- 主题: biology, medicine, classification, image, health conditions
- 协议: Other (specified in description) 所有者: Paul Mooney 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/paultimothymooney/blood-cells
6. Retinal OCT Images (optical coherence tomography)
- 星标数: ⭐ 595
- 简介: 84,495张图像,4个类别
- 主题: biology, health, medicine, image, eyes and vision
- 协议: CC BY-NC-SA 4.0 所有者: Paul Mooney 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/paultimothymooney/kermany2018
7. Diabetic Retinopathy (resized)
- 星标数: ⭐ 576
- 简介: 糖尿病视网膜病变Kaggle竞赛数据集的调整后版本
- 主题: arts and entertainment, biology, health, medicine, software
- 协议: Unknown 所有者: ilovescience 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/tanlikesmath/diabetic-retinopathy-resized
8. Medical Insurance Cost Dataset
- 星标数: ⭐ 512
- 简介: 根据人口统计和生活方式因素预测健康保险费用
- 主题: health, artificial intelligence, regression, insurance, python
- 协议: CC0: Public Domain 所有者: Mosap Abdel-Ghany 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mosapabdelghany/medical-insurance-cost-dataset
9. Lung Cancer Prediction
- 星标数: ⭐ 423
- 简介: 空气污染、酒精、吸烟与肺癌风险
- 主题: earth and nature, pollution, physical science, health, cancer
- 协议: Other (specified in description) 所有者: The Devastator 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/thedevastator/cancer-patients-and-air-pollution-a-new-link
10. Mental Health
- 星标数: ⭐ 411
- 简介: 心理健康是人们生活和社会的重要组成部分。
- 主题: mental health
- 协议: Other (specified in description) 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/mental-health
11. Breast cancer dataset
- 星标数: ⭐ 401
- 简介: 该数据集基于乳腺癌数据集,最适合用于笔记本和探索性数据分析(EDA)。
- 主题: diseases, earth and nature, health, text, cancer
- 协议: Apache 2.0 所有者: Wasiq Ali 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/wasiqaliyasir/breast-cancer-dataset
12. PromptCBLUE
- 星标数: ⭐ 390
- 简介: PromptCBLUE:一个面向中文医疗领域多任务与少样本学习的大规模指令调优数据集
- 主题: 未提供
- 协议: 未提供 所有者: michael-wzhu 托管方: github
- 链接: https://github.com/michael-wzhu/PromptCBLUE
13. Zhongjing
- 星标数: ⭐ 387
- 简介: 基于LLaMa的中文医疗ChatGPT,通过大规模预训练语料和多轮对话数据集进行训练。
- 主题: 未提供
- 协议: Apache License 2.0 所有者: SupritYoung 托管方: github
- 链接: https://github.com/SupritYoung/Zhongjing
14. COVID-19 Corona Virus India Dataset
- 星标数: ⭐ 378
- 简介: 各邦/联邦属地/国家首都辖区新冠肺炎数据
- 主题: arts and entertainment, india, diseases, public health
- 协议: Other (specified in description) 所有者: Devakumar K. P. 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imdevskp/covid19-corona-virus-india-dataset
15. cMedQA2
- 星标数: ⭐ 375
- 简介: 这是针对中文社区医疗问答数据集的最新更新版本。
- 主题: 未提供
- 协议: GNU General Public License v3.0 所有者: zhangsheng93 托管方: github
- 链接: https://github.com/zhangsheng93/cMedQA2
16. vindr-lab
- 星标数: ⭐ 372
- 简介: 医疗人工智能数据平台,以精益流程与先进标注功能,助力构建高质量数据集与算法。
- 主题: 未提供
- 协议: MIT License 所有者: vinbigdata-medical 托管方: github
- 链接: https://github.com/vinbigdata-medical/vindr-lab
17. Disease Prediction Using Machine Learning
- 星标数: ⭐ 350
- 简介: 运用机器学习和深度学习模型对42种疾病进行分类!
- 主题: diseases, earth and nature, biology, education, medicine
- 协议: Database: Open Database, Contents: Database Contents 所有者: KAUSHIL268 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kaushil268/disease-prediction-using-machine-learning
18. Huatuo-26M
- 星标数: ⭐ 321
- 简介: 最大规模的中文医学问答数据集:包含26,000,000个问答对。
- 主题: 未提供
- 协议: 未提供 所有者: FreedomIntelligence 托管方: github
- 链接: https://github.com/FreedomIntelligence/Huatuo-26M
19. Skin Cancer ISIC
- 星标数: ⭐ 308
- 简介: 皮肤癌数据集。包含9种皮肤癌类型。
- 主题: categorical, medicine, image, cancer
- 协议: Other (specified in description) 所有者: Andrey Katanskiy 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/nodoubttome/skin-cancer9-classesisic
20. 🧠 Alzheimer’s Disease Dataset 🧠
- 星标数: ⭐ 300
- 简介: 阿尔茨海默病综合健康信息
- 主题: mental health, health, classification, tabular, health conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Rabie El Kharoua 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/rabieelkharoua/alzheimers-disease-dataset
21. Leukemia Classification
- 星标数: ⭐ 277
- 简介: 在最常见的儿童癌症类型中识别癌细胞。
- 主题: public health, biology, health, medicine, image
- 协议: Other (specified in description) 所有者: Larxel 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/andrewmvd/leukemia-classification
22. Data-Science-for-COVID-19
- 星标数: ⭐ 276
- 简介: 韩国COVID-19数据集与综合医疗数据集及可视化工具
- 主题: 未提供
- 协议: 未提供 所有者: ThisIsIsaac 托管方: github
- 链接: https://github.com/ThisIsIsaac/Data-Science-for-COVID-19
23. COVID-19 Symptoms Checker
- 星标数: ⭐ 269
- 简介: 预测某人是否感染了冠状病毒?
- 主题: categorical, biology, health, classification, health conditions
- 协议: GPL 2 所有者: Bilal Hungund 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/iamhungundji/covid19-symptoms-checker
24. COVID-19 chest xray
- 星标数: ⭐ 254
- 简介: COVID-19影像数据收集
- 主题: health, computer science
- 协议: CC0: Public Domain 所有者: bachir 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/bachrr/covid-chest-xray
25. chinese-medical-dataset
- 星标数: ⭐ 253
- 简介: [更新中] Chinese Medical Dataset 致力于全面梳理并汇总所有现存的中文医学数据集,涵盖详尽的数据概述、样本展示及下载链接等内容。
- 主题: ai-for-science, chinese-medical-dataset
- 协议: 未提供 所有者: Mengqi97 托管方: github
- 链接: https://github.com/Mengqi97/chinese-medical-dataset
26. Health Nutrition and Population Statistics
- 星标数: ⭐ 242
- 简介: 全球人类健康状况
- 主题: nutrition, health, demographics
- 协议: Unknown 所有者: World Bank 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/theworldbank/health-nutrition-and-population-statistics
27. Brain Stroke Dataset
- 星标数: ⭐ 234
- 简介: 脑卒中数据集分类预测
- 主题: health, intermediate, advanced, binary classification, health conditions
- 协议: Database: Open Database, Contents: Database Contents 所有者: Jillani SofTech 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/jillanisofttech/brain-stroke-dataset
28. CT KIDNEY DATASET: Normal-Cyst-Tumor and Stone
- 星标数: ⭐ 229
- 简介: 用于检测自动肾脏疾病分析的数据集
- 主题: health conditions
- 协议: Data files © Original Authors 所有者: MD NAZMUL ISLAM 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/nazmul0087/ct-kidney-dataset-normal-cyst-tumor-and-stone
29. PMC-VQA
- 星标数: ⭐ 227
- 简介: PMC-VQA是一个大规模医学视觉问答数据集,包含来自14.9万张医学影像的22.7万组问答对,涵盖多种影像模态与疾病类型。
- 主题: 未提供
- 协议: MIT License 所有者: xiaoman-zhang 托管方: github
- 链接: https://github.com/xiaoman-zhang/PMC-VQA
30. Awesome-Medical-VLMs-and-Datasets
- 星标数: ⭐ 219
- 简介: 一份专为医学报告生成和视觉问答定制的视觉语言模型列表;以及一份医学视觉语言数据集列表。
- 主题: 未提供
- 协议: 未提供 所有者: lab-rasool 托管方: github
- 链接: https://github.com/lab-rasool/Awesome-Medical-VLMs-and-Datasets
31. 🫀 Heart Disease Dataset
- 星标数: ⭐ 214
- 简介: 综合数据集,整合自五个流行的心脏病数据集。
- 主题: medicine, classification, binary classification, drugs and medications, heart conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: mexwell 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mexwell/heart-disease-dataset
32. BreakHis
- 星标数: ⭐ 177
- 简介: 乳腺癌组织病理学数据库(BreakHis)
- 主题: medicine, image, cancer
- 协议: Unknown 所有者: Bukun 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/ambarish/breakhis
33. Diabetes Dataset – Pima Indians
- 星标数: ⭐ 173
- 简介: 分析糖尿病数据库
- 主题: statistical analysis, data analytics, tabular, health conditions, diabetes
- 协议: CC0: Public Domain 所有者: Ms. Nancy Al Aswad 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/nancyalaswad90/review
34. Health Insurance Coverage
- 星标数: ⭐ 170
- 简介: 《平价医疗法案》实施前后的保险覆盖率
- 主题: health
- 协议: CC0: Public Domain 所有者: US Department of Health and Human Services 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/hhs/health-insurance
35. mcp-simple-pubmed
- 星标数: ⭐ 162
- 简介: 用于搜索和查询PubMed医学论文/研究数据库的MCP服务器
- 主题: 未提供
- 协议: MIT License 所有者: andybrandt 托管方: github
- 链接: https://github.com/andybrandt/mcp-simple-pubmed
36. Colorectal Histology MNIST
- 星标数: ⭐ 162
- 简介: 结直肠癌组织学纹理收集
- 主题: arts and entertainment, earth and nature, biology, education, health
- 协议: Unknown 所有者: K Scott Mader 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kmader/colorectal-histology-mnist
37. Heart Disease
- 星标数: ⭐ 162
- 简介: 健康研究之心血管疾病数据
- 主题: exploratory data analysis, data cleaning, data visualization, data analytics, heart conditions
- 协议: Other (specified in description) 所有者: Oktay Ördekçi 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/oktayrdeki/heart-disease
38. Memory Test on Drugged Islanders Data
- 星标数: ⭐ 150
- 简介: 《快乐与悲伤记忆启动下新岛民抗焦虑药物使用情况分组研究》
- 主题: mental health, drugs and medications
- 协议: CC BY-SA 4.0 所有者: Steve Ahn 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/steveahn/memory-test-on-drugged-islanders-data
39. Malaria Dataset
- 星标数: ⭐ 149
- 简介: 2010年各国病例数量
- 主题: diseases, health
- 协议: Other (specified in description) 所有者: Devakumar K. P. 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imdevskp/malaria-dataset
40. Smoking and Drinking Dataset with body signal
- 星标数: ⭐ 145
- 简介: 利用身体信号数据预测吸烟者和饮酒者。
- 主题: health, medicine, classification, binary classification
- 协议: CC BY-NC-SA 4.0 所有者: Soo.Y 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/sooyoungher/smoking-drinking-dataset
41. Parkinson’s Disease Data Set
- 星标数: ⭐ 144
- 简介: 检测帕金森病——Python机器学习项目
- 主题: diseases, earth and nature, health, health conditions
- 协议: Database: Open Database, Contents: Database Contents 所有者: Vikas Ukani 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/vikasukani/parkinsons-disease-data-set
42. Depression Dataset
- 星标数: ⭐ 140
- 简介: 用于分析健康、生活方式及社会经济因素的综合数据集
- 主题: mental health, health, psychology, drugs and medications, diabetes
- 协议: CC BY-SA 4.0 所有者: AnthonyTherrien 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/anthonytherrien/depression-dataset
43. medkit-pharmacy-app
- 星标数: ⭐ 136
- 简介: 本应用旨在指导用户在家中使用药物治疗多种疾病的症状。应用内采用了少量动画效果,并以Firebase作为数据库支持。
- 主题: dart, flutter, medical-application, pharmacy
- 协议: 未提供 所有者: mhmzdev 托管方: github
- 链接: https://github.com/mhmzdev/medkit-pharmacy-app
44. Medical Student Mental Health
- 星标数: ⭐ 136
- 简介: 职业倦怠、共情能力、焦虑与抑郁
- 主题: mental health, health, survey analysis
- 协议: CC0: Public Domain 所有者: The Devastator 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/thedevastator/medical-student-mental-health
45. Malaria Bounding Boxes
- 星标数: ⭐ 135
- 简介: 间日疟原虫(疟疾)感染的人血涂片
- 主题: video games, public health, medicine, classification, image
- 协议: Attribution-NonCommercial-ShareAlike 3.0 IGO (CC BY-NC-SA 3.0 IGO) 所有者: K Scott Mader 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kmader/malaria-bounding-boxes
46. World Bank WDI 2.12 – Health Systems
- 星标数: ⭐ 132
- 简介: 2016年世界发展指标
- 主题: health, covid19
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Dan Evans 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/danevans/world-bank-wdi-212-health-systems
47. Breast Cancer
- 星标数: ⭐ 126
- 简介: 威斯康星州乳腺癌(诊断)数据集
- 主题: medicine, cancer
- 协议: Other (specified in description) 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/breast-cancer
48. Food Ingredients and Allergens
- 星标数: ⭐ 126
- 简介: 此功能适用于过敏原检测模型及成分相似性分析。
- 主题: health, computer science, exploratory data analysis, classification, food
- 协议: CC0: Public Domain 所有者: Laksika Tharmalingam 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/uom190346a/food-ingredients-and-allergens
49. medical-question-answer-data
- 星标数: ⭐ 125
- 简介: 从网络上收集的医学问答数据集。
- 主题: medical, medical-questions, qa-dataset, question-answering
- 协议: MIT License 所有者: LasseRegin 托管方: github
- 链接: https://github.com/LasseRegin/medical-question-answer-data
50. MedTagger
- 星标数: ⭐ 124
- 简介: 基于众包的医学数据集标注协作框架。
- 主题: crowdsourcing, data-science, data-validation, deep-learning, labeling
- 协议: Apache License 2.0 所有者: medtagger 托管方: github
- 链接: https://github.com/medtagger/MedTagger
51. Data on COVID-19 (coronavirus)
- 星标数: ⭐ 124
- 简介: 《我们的数据世界》提供的COVID-19(冠状病毒)数据
- 主题: medicine, covid19
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Bojan Tunguz 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/tunguz/data-on-covid19-coronavirus
52. Drosophila Melanogaster Genome
- 星标数: ⭐ 124
- 简介: 探索常见果蝇的注释基因组
- 主题: biology, medicine
- 协议: CC0: Public Domain 所有者: Myles O’Neill 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mylesoneill/drosophila-melanogaster-genome
53. Kidney Stone Prediction based on Urine Analysis
- 星标数: ⭐ 118
- 简介: 开发机器学习/深度学习模型以预测肾结石的发生。
- 主题: health
- 协议: Unknown 所有者: Vuppala Adithya Sairam 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/vuppalaadithyasairam/kidney-stone-prediction-based-on-urine-analysis
54. Pakistan Corona Virus Dataset
- 星标数: ⭐ 116
- 简介: 城市时序动态更新
- 主题: health, computer science, covid19
- 协议: Data files © Original Authors 所有者: Zeeshan-ul-hassan Usmani 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/zusmani/pakistan-corona-virus-citywise-data
55. Medical Insurance Cost Prediction
- 星标数: ⭐ 114
- 简介: 使用机器学习预测医疗保险费用的数据集
- 主题: artificial intelligence, exploratory data analysis, data visualization, linear regression, matplotlib
- 协议: MIT 所有者: M Rahul Vyas 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/rahulvyasm/medical-insurance-cost-prediction
56. Lifestyle and Sleep Patterns
- 星标数: ⭐ 114
- 简介: 睡眠中的健康模式
- 主题: health and fitness, exercise, health, data cleaning, data visualization
- 协议: CC0: Public Domain 所有者: Minahil Fatima 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/minahilfatima12328/lifestyle-and-sleep-patterns
57. NIH DeepLesion Subset
- 星标数: ⭐ 114
- 简介: 从美国国立卫生研究院(NIH)的DeepLesion数据集中随机选取的32,000张图像。
- 主题: biology, medicine, image, online communities
- 协议: Unknown 所有者: K Scott Mader 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/kmader/nih-deeplesion-subset
58. cMedQA
- 星标数: ⭐ 113
- 简介: 这是中文社区医疗问答的数据集。
- 主题: 未提供
- 协议: 未提供 所有者: zhangsheng93 托管方: github
- 链接: https://github.com/zhangsheng93/cMedQA
59. Eye Tracking Autism
- 星标数: ⭐ 112
- 简介: 眼动追踪数据集以支持自闭症谱系障碍研究
- 主题: mental health, eyes and vision
- 协议: CC BY-SA 4.0 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/eye-tracking-autism
60. Digital Lifestyle Benchmark Dataset
- 星标数: ⭐ 108
- 简介: 探究屏幕使用时间与数字行为对心理健康的影响
- 主题: mental health, education, electronics, health conditions
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Tarek Masryo 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/tarekmasryo/digital-health-and-mental-wellness
61. Resized 2015 & 2019 Blindness Detection Images
- 星标数: ⭐ 107
- 简介: 来自盲症与糖尿病视网膜病变竞赛的调整尺寸与裁剪图像
- 主题: health, medicine, image, health conditions, eyes and vision
- 协议: Data files © Original Authors 所有者: Benjamin Warner 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/benjaminwarner/resized-2015-2019-blindness-detection-images
62. A-Z Medicine Dataset of India
- 星标数: ⭐ 106
- 简介: 该数据集包含超过25万条对抗疗法药物数据及其定价信息。
- 主题: india, health, real estate, medicine, intermediate
- 协议: CC BY-SA 4.0 所有者: Shudhanshu Singh 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/shudhanshusingh/az-medicine-dataset-of-india
63. COVID vaccination vs. mortality
- 星标数: ⭐ 106
- 简介: 在死亡人数统计旁,您还可以查看新冠疫苗接种比例及进展。
- 主题: global, public health, health, medicine, public safety
- 协议: CC0: Public Domain 所有者: Sina Karaji 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/sinakaraji/covid-vaccination-vs-death
64. Causes of Death in World
- 星标数: ⭐ 105
- 简介: 人们因何而逝?
- 主题: medicine, drugs and medications, cancer
- 协议: Other (specified in description) 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/causes-of-death-in-world
65. ADHD | Mental Health
- 星标数: ⭐ 105
- 简介: 注意力缺陷多动障碍与常见精神障碍:对南非大学新生学业成就的影响
- 主题: universities and colleges, mental health, diseases
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Mohamadreza Momeni 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/imtkaggleteam/adhd-mental-health
66. Vaccination against Covid-19
- 星标数: ⭐ 102
- 简介: 每周更新的COVID-19数据允许进行追溯性修正。
- 主题: europe, medicine, intermediate, advanced, estonian
- 协议: CC BY-SA 3.0 所有者: Olaf Yunus Laitinen Imanov 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/olaflundstrom/vaccination-against-covid-19
67. 1000 Fundus images with 39 categories
- 星标数: ⭐ 101
- 简介: 1000张眼底图像,涵盖39个类别
- 主题: medicine, deep learning, image, eyes and vision
- 协议: Database: Open Database, Contents: Database Contents 所有者: linchundan 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/linchundan/fundusimage1000
68. 🩺📊 Cancer Prediction Dataset 🌟🔬
- 星标数: ⭐ 100
- 简介: 基于医疗与生活方式数据预测癌症风险
- 主题: earth and nature, tabular, binary classification, health conditions, cancer
- 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Rabie El Kharoua 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/rabieelkharoua/cancer-prediction-dataset
69. Life expectancy & Socio-Economic (world bank)
- 星标数: ⭐ 100
- 简介: 2000-2019年全球预期寿命与社会经济变量关系研究
- 主题: global, health, social science, economics, time series analysis
- 协议: World Bank Dataset Terms of Use 所有者: Shritej Shrikant Chavan 托管方: kaggle
- 链接: URL: https://kaggle.com/datasets/mjshri23/life-expectancy-and-socio-economic-world-bank