Technische Übersicht
Kohortierung mit MIMIC-IV, Feature-Engineering und ML-Modelle für 30-Tage-Wiedereinweisungsrisiko und Pflegeaufwand.
Daten & Kohortierung
- Identifikation von HF-Patienten via ICD-10; Definition Indexaufenthalt und 30-Tage-Wiedereinweisung.
- Features: Demografie, Komorbiditäten, Vitalwerte, Labore, Medikation, Prozeduren, Station.
- Processing: speichereffiziente Tabellen-Joins, Chunking; standardisierte Schemas.
Modelle
- Klassifikation: Logistische Regression, Random Forest, XGBoost.
- Ressourcen-Regression: Pflegestunden nach Pflegegrad und Verweildauer.
- Evaluation: AUROC, AUPRC, Kalibrierung; MAE/RMSE für Regression.
Pipeline & Reproduzierbarkeit
- Modulare Struktur unter
src/
;tests/
zur Validierung; konfigurationsgetriebene Läufe. - Skripte:
make_dataset.py
,extract_features.py
,preprocess.py
,readmission_model.py
,resource_model.py
. - Automation:
run_pipeline.sh
für End-to-End.
Repo: cyranothebard/heart_failure_readmission
Auf einen Blick
Klassifikator
LR / RF / XGB
Eval
AUROC / AUPRC
Pflege
MAE / RMSE