Residual Stock Return Prediction: Data Challenge von QRT
Dieses Projekt betraf eine binäre Klassifikationsaufgabe, bei der vorhergesagt werden sollte, ob eine Aktie am nächsten Tag den Median der gesamten marktneutralen Rendite übertreffen wird. Ich implementierte und optimierte ein gestapeltes Modell bestehend aus einem Random Forest sowie einem Gradient Boosted Tree Ensemble mit XGBoost und LightGBM.
Mein Modell erreichte eine Genauigkeit von 52,18 % auf dem Testdatensatz und belegte damit den 62. Platz (von 950) in der öffentlichen Rangliste (Stand: 5. Mai 2025).
Zur Erzielung dieser Leistung entwickelte ich Merkmale (Features) für verschiedene GICS-Gruppierungen sowie aktienspezifische Merkmale und prüfte sorgfältig Methoden zur Regularisierung der Ensemble-Modelle.
Mit dem Polars-Dataframe-Paket gestaltete ich den Projektcode so, dass er erweiterbar ist und schnelle Forschungsiterationen ermöglicht.