医疗行业最受欢迎100+机器学习数据集

合集:行业AI数据集精选

本文精选医疗行业最受欢迎100+机器学习数据集,这些数据集来自具有重要影响力的学会、会议、数据库、期刊、国内外AI竞赛组织方、Github和Kaggle等数据集托管方。

一、医学组织

参考文章:医疗行业最受欢迎100+计算机视觉数据集 – 甲壳虫AI案例数据集和论文

获取医疗行业众多具有重要影响力的学会、会议、数据库和期刊。

二、数据集明细

汇总

总仓库数: 203 个

星标数分布:

  • ⭐ 1000+: 17 个 (8.4%)
  • ⭐ 500-999: 22 个 (10.8%)
  • ⭐ 100-499: 164 个 (80.8%)

MICCAI-医学图像计算与计算机辅助介入大会 (1个)

1. RSNA MICCAI PNG

临床医疗 (101个)

1. Pima Indians Diabetes Database
2. Breast Cancer Wisconsin (Diagnostic) Data Set
3. Stroke Prediction Dataset
4. Medical Cost Personal Datasets
  • 星标数: ⭐ 3,158
  • 简介: 使用线性回归进行保险预测
  • 主题: healthcare, education, finance, health, insurance
  • 协议: Database: Open Database, Contents: Database Contents 所有者: Miri Choi 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/mirichoi0218/insurance
5. Heart Failure Prediction Dataset
  • 星标数: ⭐ 3,138
  • 简介: 预测心脏病事件的11项临床特征。
  • 主题: healthcare, health, classification, health conditions, heart conditions
  • 协议: Database: Open Database, Contents: © Original Authors 所有者: fedesoriano 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/fedesoriano/heart-failure-prediction
6. Heart Failure Prediction
7. Diabetes Dataset
8. Sign Language MNIST
  • 星标数: ⭐ 1,687
  • 简介: 手部手势识别任务中MNIST的即插即用替代方案
  • 主题: languages, healthcare, linguistics, computer science
  • 协议: CC0: Public Domain 所有者: tecperson 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/datamunge/sign-language-mnist
9. Cardiovascular Disease dataset
10. Malaria Cell Images Dataset
11. Mental Health in Tech Survey
  • 星标数: ⭐ 1,225
  • 简介: 2014年科技行业职场心理健康状况调查
  • 主题: mental health, healthcare, genetics, earth and nature, employment
  • 协议: CC BY-SA 4.0 所有者: Open Sourcing Mental Illness, LTD 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/osmi/mental-health-in-tech-survey
12. Medical Appointment No Shows
13. Indicators of Heart Disease (2022 UPDATE)
14. mimic3-benchmarks
  • 星标数: ⭐ 877
  • 简介: 用于从MIMIC-III临床数据库构建基准机器学习数据集的Python套件。💊
  • 主题: benchmark, clinical-data, deep-learning, machine-learning
  • 协议: MIT License 所有者: YerevaNN 托管方: github
  • 链接: https://github.com/YerevaNN/mimic3-benchmarks
15. COVID-19 Dataset
16. Diabetes prediction dataset
17. Health Insurance Marketplace
  • 星标数: ⭐ 716
  • 简介: 探索美国医疗保险市场中健康与牙科计划的数据
  • 主题: healthcare, dentistry, earth and nature, business, economics
  • 协议: CC0: Public Domain 所有者: US Department of Health and Human Services 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/hhs/health-insurance-marketplace
18. Fetal Health Classification
  • 星标数: ⭐ 684
  • 简介: 利用CTG数据将胎儿健康状况分类为正常、可疑或病理状态。
  • 主题: healthcare, public health, health, mortality, tabular
  • 协议: Other (specified in description) 所有者: Larxel 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/andrewmvd/fetal-health-classification
19. Breast Cancer Dataset
20. Heartbeat Sounds
21. Cervical Cancer Risk Classification
22. CKG
  • 星标数: ⭐ 587
  • 简介: 临床知识图谱(CKG)是一个具有双重目标的平台:1)构建一个包含实验数据及从多种生物医学数据库导入数据的图数据库;2)利用图谱中所有信息实现知识发现的自动化。
  • 主题: 未提供
  • 协议: MIT License 所有者: MannLabs 托管方: github
  • 链接: https://github.com/MannLabs/CKG
23. Respiratory Sound Database
24. Logistic regression To predict heart disease
25. Ocular Disease Recognition
26. Disease Symptom Prediction
27. Diagnosis of COVID-19 and its clinical spectrum
  • 星标数: ⭐ 495
  • 简介: 人工智能与数据科学辅助临床决策(3月28日至4月3日)
  • 主题: healthcare, public health, earth and nature, health, classification
  • 协议: Unknown 所有者: Einstein Data4u 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/einsteindata4u/covid19
28. Student Stress Monitoring Datasets
29. Indian Liver Patient Records
30. Heart Attack Prediction
31. Polycystic ovary syndrome (PCOS)
32. National Health and Nutrition Examination Survey
33. Hospital Beds Management
34. Medicare Data
  • 星标数: ⭐ 399
  • 简介: 医疗保险数据(BigQuery数据集)
  • 主题: healthcare, health, bigquery, drugs and medications
  • 协议: CC0: Public Domain 所有者: Centers for Medicare & Medicaid Services 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/cms/cms-medicare
35. UCI Heart Disease Data
36. Pfizer Vaccine Tweets
37. Breast Cancer Proteomes
38. Disease Symptoms and Patient Profile Dataset
39. awesome-cancer-variant-resources
  • 星标数: ⭐ 325
  • 简介: 一个由社区维护的癌症临床知识库和数据库集合,专注于癌症变异研究。
  • 主题: awesome-list, bioinformatics, cancer, cancer-genomics, cancer-variants
  • 协议: MIT License 所有者: seandavi 托管方: github
  • 链接: https://github.com/seandavi/awesome-cancer-variant-resources
40. HEALTHCARE PROVIDER FRAUD DETECTION ANALYSIS
41. awesome-healthcare-ai
  • 星标数: ⭐ 313
  • 简介: 精选的优质开源医疗工具、算法、数据集及研究论文列表。
  • 主题: awesome-list, awesome-lists, healthcare, healthcare-application, healthcare-datasets
  • 协议: Creative Commons Zero v1.0 Universal 所有者: medtorch 托管方: github
  • 链接: https://github.com/medtorch/awesome-healthcare-ai
42. Genetic Variant Classifications
  • 星标数: ⭐ 301
  • 简介: 预测某个变异是否会导致临床分类上的冲突。
  • 主题: healthcare, genetics, earth and nature, biology, medicine
  • 协议: CC0: Public Domain 所有者: Kevin Arvai 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/kevinarvai/clinvar-conflicting
43. Heart Attack Risk Prediction Dataset
44. Dermnet
  • 星标数: ⭐ 285
  • 简介: 23类皮肤病的影像数据
  • 主题: deep learning, image, hospitals and treatment centers
  • 协议: Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) 所有者: Shubham Goel 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/shubhamgoel27/dermnet
45. Finding and Measuring Lungs in CT Data
  • 星标数: ⭐ 283
  • 简介: 一组CT图像,包含手动分割的肺部及2D/3D测量数据。
  • 主题: healthcare, earth and nature, biology, image, health conditions
  • 协议: Unknown 所有者: K Scott Mader 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/kmader/finding-lungs-in-ct-data
46. Lower Back Pain Symptoms Dataset
47. Diabetes 130 US hospitals for years 1999-2008
  • 星标数: ⭐ 256
  • 简介: 糖尿病 – 再入院
  • 主题: healthcare, health, diabetes
  • 协议: CC0: Public Domain 所有者: Humberto Brandão, Ph.D. 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/brandao/diabetes
48. MIAS Mammography
49. Chronic illness: symptoms, treatments and triggers
50. U.S. Healthcare Data
51. TSDB
  • 星标数: ⭐ 233
  • 简介: 一个Python工具箱仅需一行代码即可加载172个公开时间序列数据集,适用于机器学习和深度学习。这些数据集涵盖医疗健康、金融、电力、交通、天气等多个领域。
  • 主题: classification, data-mining, database, deep-learning, forecasting
  • 协议: BSD 3-Clause “New” or “Revised” License 所有者: WenjieDu 托管方: github
  • 链接: https://github.com/WenjieDu/TSDB
52. Predict Diabetes
53. Hepatitis C Prediction Dataset
  • 星标数: ⭐ 217
  • 简介: 献血者与丙型肝炎患者的实验室检测值
  • 主题: health and fitness, healthcare, cancer
  • 协议: Database: Open Database, Contents: © Original Authors 所有者: fedesoriano 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/fedesoriano/hepatitis-c-dataset
54. Body Fat Prediction Dataset
55. Skin Lesion Images for Melanoma Classification
  • 星标数: ⭐ 207
  • 简介: 共有9个类别,总计25,331张图像。
  • 主题: arts and entertainment, healthcare, health, health conditions, cancer
  • 协议: Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) 所有者: Larxel 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/andrewmvd/isic-2019
56. american-healthcare-conundrum
  • 星标数: ⭐ 206
  • 简介: 调查性数据新闻:逐项量化美国医疗体系中的可避免浪费。基于CMS、OECD及联邦数据集的开源分析。目前已识别出986亿美元的可节约资金。
  • 主题: cms-data, data-journalism, drug-pricing, health-policy, healthcare
  • 协议: MIT License 所有者: rexrodeo 托管方: github
  • 链接: https://github.com/rexrodeo/american-healthcare-conundrum
57. Covid-19 Case Surveillance Public Use Dataset
58. COVID-19 patient pre-condition dataset
59. DDSM Mammography
  • 星标数: ⭐ 193
  • 简介: 来自DDSM数据集的扫描图像的tfrecords文件。
  • 主题: arts and entertainment, healthcare, biology, health, medicine
  • 协议: CC0: Public Domain 所有者: Eric A. Scuccimarra 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/skooch/ddsm-mammography
60. Cirrhosis Prediction Dataset
61. U.S. Opiate Prescriptions/Overdoses
62. Heart Attack Dataset
63. COVID-19 – Clinical Data to assess diagnosis
  • 星标数: ⭐ 177
  • 简介: Data Intelligence Team提供的Sírio-Libanês人工智能与分析数据
  • 主题: business, health, social science, medicine, classification
  • 协议: Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) 所有者: Hospital Sírio-Libanês 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/Sírio-Libanes/covid19
64. Cannabis Strains
65. Healthcare Insurance
  • 星标数: ⭐ 168
  • 简介: 我的数据集涉及全球医疗保健领域的不安全感问题,目前正在开发中。
  • 主题: exploratory data analysis, data visualization, neural networks, health conditions, numpy
  • 协议: CC0: Public Domain 所有者: willian oliveira 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/willianoliveiragibin/healthcare-insurance
66. Diabetes Health Indicators Dataset
67. Breast Cancer Gene Expression Profiles (METABRIC)
68. Anxiety and Depression Psychological Therapies
69. Autism Screening
70. COVID-19 Clinical Trials dataset
71. Thyroid Disease Data
  • 星标数: ⭐ 151
  • 简介: 患者人口统计学资料及血液检测结果,以及甲状腺疾病诊断。
  • 主题: health, medicine, classification, tabular, cancer
  • 协议: Attribution 4.0 International (CC BY 4.0) 所有者: jaina 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/jainaru/thyroid-disease-data
72. Employee Attrition for Healthcare
73. Hospital ratings
74. Hospitals and beds in India (Statewise)
75. Cirrhosis Patient Survival Prediction
76. Medical Speech, Transcription, and Intent
77. Global Hospital Beds Capacity (for covid-19)
78. heart failure clinical records
79. Thyroid Disease Data
  • 星标数: ⭐ 130
  • 简介: 患者人口统计学特征及甲状腺疾病诊断相关的血液检测结果
  • 主题: medicine, exploratory data analysis, data cleaning, data visualization, classification
  • 协议: CC0: Public Domain 所有者: Emmanuel F. Werr 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/emmanuelfwerr/thyroid-disease-data
80. Lung Cancer Detection
81. Adverse Food Events
  • 星标数: ⭐ 128
  • 简介: 90,000起与产品相关的用户报告不良医疗事件
  • 主题: healthcare, government, medicine, software
  • 协议: CC0: Public Domain 所有者: Food and Drug Administration 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/fda/adverse-food-events
82. Obesity Classification Dataset
83. awesome-healthcare-datasets
84. Lung Cancer Dataset
  • 星标数: ⭐ 117
  • 简介: 肺癌风险评估与分析详细患者档案
  • 主题: healthcare, computer science, health conditions, cancer
  • 协议: Database: Open Database, Contents: © Original Authors 所有者: Akash Nath 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/akashnath29/lung-cancer-dataset
85. awesome-healthcare-datasets
  • 星标数: ⭐ 116
  • 简介: 医疗保健与生物医学数据集,适用于人工智能/机器学习
  • 主题: awesome-list, biomedical, clinical, datasets, healthcare
  • 协议: Creative Commons Zero v1.0 Universal 所有者: geniusrise 托管方: github
  • 链接: https://github.com/geniusrise/awesome-healthcare-datasets
86. Pathogen Detection | Salmonella Enterica
87. Real Breast Cancer Data
  • 星标数: ⭐ 115
  • 简介: 真实乳腺癌样本数据集,适用于医疗健康与癌症数据分析。
  • 主题: diseases, categorical, health, tabular, cancer
  • 协议: CC0: Public Domain 所有者: AM 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/amandam1/breastcancerdataset
88. COVID19 Daily Updates
  • 星标数: ⭐ 115
  • 简介: 新型冠状病毒(又称COVID-19)每日疫情更新
  • 主题: healthcare, public health, news
  • 协议: Data files © Original Authors 所有者: Gabriel Preda 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/gpreda/coronavirus-2019ncov
89. Cancer Risk Factors Data
90. Healthcare Diabetes Dataset
91. Global Health Statistics
92. Medical Insurance Cost Prediction
93. imcs21-cblue
  • 星标数: ⭐ 110
  • 简介: 这是天池CBLUE竞赛中医疗对话数据集’imcs21’的代码仓库。
  • 主题: annotated-corpora, bioinformatics, healthcare-application, medical-dialogue, natural-language-understanding
  • 协议: 未提供 所有者: lemuria-wchen 托管方: github
  • 链接: https://github.com/lemuria-wchen/imcs21-cblue
94. Predict survival of patients with heart failure
95. Insurance Claim Analysis: Demographic and Health
96. HeartHealthPrediction
  • 星标数: ⭐ 107
  • 简介: 在全球范围内,无论是发达国家还是欠发达国家,心脏病都是导致死亡的主要原因。数据科学家利用独特的机器学习技术,通过真实数据集高效且准确地对健康疾病进行建模。医疗分析师迫切需要能够预测患者发病前疾病风险的模型或系统。高胆固醇、不健康饮食、有害饮酒、高血糖、高血压以及吸烟是心脏病发病风险的主要征兆……
  • 主题: data-science, decision-trees, healthcare, heart-health-prediction, meachinelearning
  • 协议: 未提供 所有者: ammarmahmood1999 托管方: github
  • 链接: https://github.com/ammarmahmood1999/HeartHealthPrediction
97. Global Health,Mortality & Disease Trend Since 2000
98. Health Care Analytics
99. Parkinson’s Disease (PD) classification
100. Diabetes_Dataset_With_18_Features
  • 星标数: ⭐ 103
  • 简介: 您可以使用此数据集构建糖尿病诊断模型。
  • 主题: categorical, feature engineering, gradient boosting, binary classification, diabetes
  • 协议: Other (specified in description) 所有者: Parisa Karimi Darabi 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/pkdarabi/diabetes-dataset-with-18-features
101. Clinical Dataset
  • 星标数: ⭐ 102
  • 简介: 发现队列和验证队列的临床数据
  • 主题: medicine, drugs and medications, hospitals and treatment centers
  • 协议: Other (specified in description) 所有者: Mohamadreza Momeni 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/imtkaggleteam/clinical-dataset

生物医学 (7个)

1. pubmedqa
  • 星标数: ⭐ 414
  • 简介: PubMedQA:生物医学研究问答数据集
  • 主题: 未提供
  • 协议: MIT License 所有者: pubmedqa 托管方: github
  • 链接: https://github.com/pubmedqa/pubmedqa
2. MedMentions
  • 星标数: ⭐ 344
  • 简介: 一个标注了UMLS实体提及的生物医学论文语料库。
  • 主题: 未提供
  • 协议: 未提供 所有者: chanzuckerberg 托管方: github
  • 链接: https://github.com/chanzuckerberg/MedMentions
3. awesome-drug-discovery-knowledge-graphs
  • 星标数: ⭐ 249
  • 简介: 本资源库汇集了与药物发现知识图谱相关的研究论文、数据集及软件工具。该资源库作为《药物发现相关生物医学数据集综述:知识图谱视角》(《生物信息学简报》,2022年)一文的配套资料,旨在为相关领域研究者提供系统化的参考资源。
  • 主题: awesome-list, drug-discovery, drug-discovery-knowledge-graph, knowledge-graph
  • 协议: Apache License 2.0 所有者: AstraZeneca 托管方: github
  • 链接: https://github.com/AstraZeneca/awesome-drug-discovery-knowledge-graphs
4. BioNEV
  • 星标数: ⭐ 230
  • 简介: 图嵌入评估 / 《生物医学网络上的图嵌入:方法、应用与评估》(Bioinformatics 2020)相关代码与数据集
  • 主题: biomedical-graphs, biomedical-networks, deepwalk, gae, graph-embedding
  • 协议: MIT License 所有者: xiangyue9607 托管方: github
  • 链接: https://github.com/xiangyue9607/BioNEV
5. End ALS Kaggle Challenge
  • 星标数: ⭐ 197
  • 简介: 共享数据并众包关键诊断查询
  • 主题: universities and colleges, genetics, biology, health, medicine
  • 协议: Other (specified in description) 所有者: ALS Group 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/alsgroup/end-als
6. Mice Protein Expression
  • 星标数: ⭐ 130
  • 简介: 在大脑皮层中测量了77种蛋白质的表达水平。
  • 主题: biology, health, multiclass classification, health conditions
  • 协议: CC0: Public Domain 所有者: Ruslan Klymentiev 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/ruslankl/mice-protein-expression
7. biomedical-qa-datasets

通用医学 (69个)

1. Skin Cancer MNIST: HAM10000
2. Awesome-Medical-Dataset
3. Life Expectancy (WHO)
4. UNCOVER COVID-19 Challenge
5. Blood Cell Images
  • 星标数: ⭐ 907
  • 简介: 12,500张图像:涵盖4种不同的细胞类型
  • 主题: biology, medicine, classification, image, health conditions
  • 协议: Other (specified in description) 所有者: Paul Mooney 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/paultimothymooney/blood-cells
6. Retinal OCT Images (optical coherence tomography)
7. Diabetic Retinopathy (resized)
8. Medical Insurance Cost Dataset
9. Lung Cancer Prediction
10. Mental Health
11. Breast cancer dataset
  • 星标数: ⭐ 401
  • 简介: 该数据集基于乳腺癌数据集,最适合用于笔记本和探索性数据分析(EDA)。
  • 主题: diseases, earth and nature, health, text, cancer
  • 协议: Apache 2.0 所有者: Wasiq Ali 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/wasiqaliyasir/breast-cancer-dataset
12. PromptCBLUE
  • 星标数: ⭐ 390
  • 简介: PromptCBLUE:一个面向中文医疗领域多任务与少样本学习的大规模指令调优数据集
  • 主题: 未提供
  • 协议: 未提供 所有者: michael-wzhu 托管方: github
  • 链接: https://github.com/michael-wzhu/PromptCBLUE
13. Zhongjing
  • 星标数: ⭐ 387
  • 简介: 基于LLaMa的中文医疗ChatGPT,通过大规模预训练语料和多轮对话数据集进行训练。
  • 主题: 未提供
  • 协议: Apache License 2.0 所有者: SupritYoung 托管方: github
  • 链接: https://github.com/SupritYoung/Zhongjing
14. COVID-19 Corona Virus India Dataset
15. cMedQA2
  • 星标数: ⭐ 375
  • 简介: 这是针对中文社区医疗问答数据集的最新更新版本。
  • 主题: 未提供
  • 协议: GNU General Public License v3.0 所有者: zhangsheng93 托管方: github
  • 链接: https://github.com/zhangsheng93/cMedQA2
16. vindr-lab
  • 星标数: ⭐ 372
  • 简介: 医疗人工智能数据平台,以精益流程与先进标注功能,助力构建高质量数据集与算法。
  • 主题: 未提供
  • 协议: MIT License 所有者: vinbigdata-medical 托管方: github
  • 链接: https://github.com/vinbigdata-medical/vindr-lab
17. Disease Prediction Using Machine Learning
18. Huatuo-26M
  • 星标数: ⭐ 321
  • 简介: 最大规模的中文医学问答数据集:包含26,000,000个问答对。
  • 主题: 未提供
  • 协议: 未提供 所有者: FreedomIntelligence 托管方: github
  • 链接: https://github.com/FreedomIntelligence/Huatuo-26M
19. Skin Cancer ISIC
20. 🧠 Alzheimer’s Disease Dataset 🧠
21. Leukemia Classification
22. Data-Science-for-COVID-19
23. COVID-19 Symptoms Checker
24. COVID-19 chest xray
25. chinese-medical-dataset
  • 星标数: ⭐ 253
  • 简介: [更新中] Chinese Medical Dataset 致力于全面梳理并汇总所有现存的中文医学数据集,涵盖详尽的数据概述、样本展示及下载链接等内容。
  • 主题: ai-for-science, chinese-medical-dataset
  • 协议: 未提供 所有者: Mengqi97 托管方: github
  • 链接: https://github.com/Mengqi97/chinese-medical-dataset
26. Health Nutrition and Population Statistics
27. Brain Stroke Dataset
  • 星标数: ⭐ 234
  • 简介: 脑卒中数据集分类预测
  • 主题: health, intermediate, advanced, binary classification, health conditions
  • 协议: Database: Open Database, Contents: Database Contents 所有者: Jillani SofTech 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/jillanisofttech/brain-stroke-dataset
28. CT KIDNEY DATASET: Normal-Cyst-Tumor and Stone
29. PMC-VQA
  • 星标数: ⭐ 227
  • 简介: PMC-VQA是一个大规模医学视觉问答数据集,包含来自14.9万张医学影像的22.7万组问答对,涵盖多种影像模态与疾病类型。
  • 主题: 未提供
  • 协议: MIT License 所有者: xiaoman-zhang 托管方: github
  • 链接: https://github.com/xiaoman-zhang/PMC-VQA
30. Awesome-Medical-VLMs-and-Datasets
31. 🫀 Heart Disease Dataset
  • 星标数: ⭐ 214
  • 简介: 综合数据集,整合自五个流行的心脏病数据集。
  • 主题: medicine, classification, binary classification, drugs and medications, heart conditions
  • 协议: Attribution 4.0 International (CC BY 4.0) 所有者: mexwell 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/mexwell/heart-disease-dataset
32. BreakHis
33. Diabetes Dataset – Pima Indians
  • 星标数: ⭐ 173
  • 简介: 分析糖尿病数据库
  • 主题: statistical analysis, data analytics, tabular, health conditions, diabetes
  • 协议: CC0: Public Domain 所有者: Ms. Nancy Al Aswad 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/nancyalaswad90/review
34. Health Insurance Coverage
  • 星标数: ⭐ 170
  • 简介: 《平价医疗法案》实施前后的保险覆盖率
  • 主题: health
  • 协议: CC0: Public Domain 所有者: US Department of Health and Human Services 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/hhs/health-insurance
35. mcp-simple-pubmed
36. Colorectal Histology MNIST
37. Heart Disease
  • 星标数: ⭐ 162
  • 简介: 健康研究之心血管疾病数据
  • 主题: exploratory data analysis, data cleaning, data visualization, data analytics, heart conditions
  • 协议: Other (specified in description) 所有者: Oktay Ördekçi 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/oktayrdeki/heart-disease
38. Memory Test on Drugged Islanders Data
39. Malaria Dataset
40. Smoking and Drinking Dataset with body signal
41. Parkinson’s Disease Data Set
42. Depression Dataset
  • 星标数: ⭐ 140
  • 简介: 用于分析健康、生活方式及社会经济因素的综合数据集
  • 主题: mental health, health, psychology, drugs and medications, diabetes
  • 协议: CC BY-SA 4.0 所有者: AnthonyTherrien 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/anthonytherrien/depression-dataset
43. medkit-pharmacy-app
  • 星标数: ⭐ 136
  • 简介: 本应用旨在指导用户在家中使用药物治疗多种疾病的症状。应用内采用了少量动画效果,并以Firebase作为数据库支持。
  • 主题: dart, flutter, medical-application, pharmacy
  • 协议: 未提供 所有者: mhmzdev 托管方: github
  • 链接: https://github.com/mhmzdev/medkit-pharmacy-app
44. Medical Student Mental Health
45. Malaria Bounding Boxes
  • 星标数: ⭐ 135
  • 简介: 间日疟原虫(疟疾)感染的人血涂片
  • 主题: video games, public health, medicine, classification, image
  • 协议: Attribution-NonCommercial-ShareAlike 3.0 IGO (CC BY-NC-SA 3.0 IGO) 所有者: K Scott Mader 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/kmader/malaria-bounding-boxes
46. World Bank WDI 2.12 – Health Systems
47. Breast Cancer
48. Food Ingredients and Allergens
49. medical-question-answer-data
50. MedTagger
  • 星标数: ⭐ 124
  • 简介: 基于众包的医学数据集标注协作框架。
  • 主题: crowdsourcing, data-science, data-validation, deep-learning, labeling
  • 协议: Apache License 2.0 所有者: medtagger 托管方: github
  • 链接: https://github.com/medtagger/MedTagger
51. Data on COVID-19 (coronavirus)
52. Drosophila Melanogaster Genome
53. Kidney Stone Prediction based on Urine Analysis
54. Pakistan Corona Virus Dataset
55. Medical Insurance Cost Prediction
56. Lifestyle and Sleep Patterns
57. NIH DeepLesion Subset
  • 星标数: ⭐ 114
  • 简介: 从美国国立卫生研究院(NIH)的DeepLesion数据集中随机选取的32,000张图像。
  • 主题: biology, medicine, image, online communities
  • 协议: Unknown 所有者: K Scott Mader 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/kmader/nih-deeplesion-subset
58. cMedQA
  • 星标数: ⭐ 113
  • 简介: 这是中文社区医疗问答的数据集。
  • 主题: 未提供
  • 协议: 未提供 所有者: zhangsheng93 托管方: github
  • 链接: https://github.com/zhangsheng93/cMedQA
59. Eye Tracking Autism
60. Digital Lifestyle Benchmark Dataset
61. Resized 2015 & 2019 Blindness Detection Images
62. A-Z Medicine Dataset of India
63. COVID vaccination vs. mortality
64. Causes of Death in World
65. ADHD | Mental Health
  • 星标数: ⭐ 105
  • 简介: 注意力缺陷多动障碍与常见精神障碍:对南非大学新生学业成就的影响
  • 主题: universities and colleges, mental health, diseases
  • 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Mohamadreza Momeni 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/imtkaggleteam/adhd-mental-health
66. Vaccination against Covid-19
67. 1000 Fundus images with 39 categories
  • 星标数: ⭐ 101
  • 简介: 1000张眼底图像,涵盖39个类别
  • 主题: medicine, deep learning, image, eyes and vision
  • 协议: Database: Open Database, Contents: Database Contents 所有者: linchundan 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/linchundan/fundusimage1000
68. 🩺📊 Cancer Prediction Dataset 🌟🔬
  • 星标数: ⭐ 100
  • 简介: 基于医疗与生活方式数据预测癌症风险
  • 主题: earth and nature, tabular, binary classification, health conditions, cancer
  • 协议: Attribution 4.0 International (CC BY 4.0) 所有者: Rabie El Kharoua 托管方: kaggle
  • 链接: URL: https://kaggle.com/datasets/rabieelkharoua/cancer-prediction-dataset
69. Life expectancy & Socio-Economic (world bank)

发表评论