Technische Übersicht
Kohortierung mit MIMIC-IV, Feature-Engineering und ML-Modelle für 30-Tage-Wiedereinweisungsrisiko und Pflegeaufwand.
Daten & Kohortierung
- Identifikation von HF-Patienten via ICD-10; Definition Indexaufenthalt und 30-Tage-Wiedereinweisung.
- Features: Demografie, Komorbiditäten, Vitalwerte, Labore, Medikation, Prozeduren, Station.
- Processing: speichereffiziente Tabellen-Joins, Chunking; standardisierte Schemas.
Modelle
- Klassifikation: Logistische Regression, Random Forest, XGBoost.
- Ressourcen-Regression: Pflegestunden nach Pflegegrad und Verweildauer.
- Evaluation: AUROC, AUPRC, Kalibrierung; MAE/RMSE für Regression.
Pipeline & Reproduzierbarkeit
- Modulare Struktur unter
src/;tests/zur Validierung; konfigurationsgetriebene Läufe. - Skripte:
make_dataset.py,extract_features.py,preprocess.py,readmission_model.py,resource_model.py. - Automation:
run_pipeline.shfür End-to-End.
Repo: cyranothebard/heart_failure_readmission
Auf einen Blick
Klassifikator
LR / RF / XGB
Eval
AUROC / AUPRC
Pflege
MAE / RMSE