Mobirise

Von klassischen Modellen zu KI Eine Übersicht der Prognose-methoden

Dieser Leitfaden bietet einen kompakten Überblick über die wichtigsten heute verwendeten Prognosemethoden. Er umfasst klassische Statistik hybride Ansätze Machine Learning Deep Learning und moderne Foundation Modelle und zeigt worin die Stärken der einzelnen Gruppen liegen und in welchen Situationen sie besonders hilfreich sind.

1. Klassische und statistische Methoden

ARIMA (AutoRegressive Integrated Moving Average) modelliert eine Zeitreihe anhand ihrer eigenen Vergangenheitswerte (AR), Differenzen zur Herstellung von Stationarität (I) sowie vergangener Prognosefehler (MA). Das Verfahren eignet sich besonders gut für stationäre oder differenzstationäre Reihen mit klaren Autokorrelationsstrukturen.
SARIMA erweitert ARIMA um saisonale Komponenten und ist daher für Daten mit wöchentlichen, monatlichen oder jährlichen Mustern geeignet. Diese Modelle sind transparent, gut interpretierbar und gelten weiterhin als wichtiger Industriestandard und Referenzansatz. 

ETS-Modelle (Error, Trend, Seasonality) kombinieren exponentielle Glättung mit einer expliziten Modellierung von Trend und Saisonalität. Holt–Winters ist ein klassisches ETS-Verfahren, das Niveau, Trend und saisonale Effekte rekursiv und adaptiv aktualisiert.
Das Modell eignet sich besonders für kurz- bis mittelfristige operative Prognosen, bei denen aktuelle Daten stärker gewichtet werden als ältere Beobachtungen. Es ist leicht verständlich und liefert in der Praxis oft überraschend konkurrenzfähige Ergebnisse. 

GARCH (Generalized Autoregressive Conditional Heteroskedasticity) modelliert nicht primär das Niveau einer Zeitreihe, sondern deren zeitlich variierende Volatilität. Das Verfahren wird vor allem im Finanzbereich zur Prognose von Risiko und Schwankungsintensität eingesetzt.
Das Modell geht davon aus, dass starke Ausschläge zeitlich gehäuft auftreten und dass die Volatilität selbst einem autoregressiven Prozess folgt. Auch wenn GARCH die Mittelwerte einer Reihe nur begrenzt prognostiziert, ist es unverzichtbar, wenn Volatilität und Risiko im Mittelpunkt stehen. 

Die Theta-Methode zerlegt eine Zeitreihe in sogenannte „Theta-Linien“, die unterschiedliche Aspekte von Trend und Krümmung hervorheben, und kombiniert anschließend deren Prognosen. Bekannt wurde das Verfahren durch seine starke Leistung in den Forecasting-Wettbewerben M3 und M4.
Die Methode ist konzeptionell einfach, zugleich jedoch erstaunlich leistungsfähig und robust über viele Anwendungsbereiche hinweg. Sie wird häufig als starker klassischer Benchmark für univariate Zeitreihenprognosen verwendet. 

Die Vektorautoregression VAR erweitert univariate AR-Modelle auf mehrere Zeitreihen, indem jede Variable von den vergangenen Werten aller Variablen im System abhängt. VARMA ergänzt zusätzlich Moving-Average-Komponenten und bildet damit sowohl autoregressive Dynamiken als auch Schockeffekte in multivariaten Systemen ab.
VECM ist eine spezielle Variante für nichtstationäre, aber kointegrierte Zeitreihen. Das Modell beschreibt sowohl kurzfristige Dynamiken als auch langfristige Gleichgewichtsbeziehungen. Diese Verfahren werden häufig in der Makroökonomie und Finanzanalyse eingesetzt, insbesondere wenn Wechselwirkungen zwischen Variablen relevant sind und die Interpretierbarkeit der Zusammenhänge wichtig ist. 

Zustandsraummodelle beschreiben Zeitreihen über verborgene Zustände, die sich im Zeitverlauf entwickeln und über eine Beobachtungsgleichung die beobachteten Daten erzeugen. Der Kalman-Filter ist der rekursive Algorithmus zur Echtzeitschätzung dieser verborgenen Zustände in linearen gaußschen Modellen und liefert optimale Prognosen sowie Unsicherheitsabschätzungen.
Viele klassische Verfahren wie ARIMA oder exponentielle Glättung lassen sich in Zustandsraumform darstellen. Gleichzeitig ermöglicht der Ansatz die Integration individueller Komponenten für Trends, Saisonalität, Zyklen oder exogene Einflüsse. Zustandsraummodelle können fehlende Daten elegant verarbeiten und bieten hohe Flexibilität beim Aufbau strukturierter und interpretierbarer Prognosesysteme. 

Die Croston-Methode wurde speziell für intermittierende Nachfrage entwickelt, also Zeitreihen mit vielen Nullwerten, wie beispielsweise Ersatzteile oder Produkte mit geringer Absatzhäufigkeit. Dabei werden Nachfragehöhe und Zeitabstand zwischen Nachfrageereignissen getrennt geschätzt und deren Verhältnis als Prognose verwendet. Dadurch werden Verzerrungen vermieden, die klassische Verfahren bei sehr dünnen Daten häufig zeigen.
Die Syntetos-Boylan-Approximation (SBA) korrigiert einen bekannten Bias der ursprünglichen Methode, während die TSB-Variante zusätzlich die Wahrscheinlichkeit eines Nachfrageereignisses explizit glättet. Diese Verfahren gelten als Standardmethoden im Bestandsmanagement und in der Service-Level-Planung für Produkte mit sporadischer Nachfrage. 

Markov-Switching-Modelle erlauben es, dass sich die Parameter eines Zeitreihenmodells abhängig von einem nicht beobachtbaren diskreten Zustand verändern, der selbst einer Markov-Kette folgt. Typische Beispiele sind Modelle mit Wechsel zwischen Rezessions- und Wachstumsphasen oder zwischen niedriger und hoher Volatilität.
Jedes Regime besitzt eigene Dynamiken, etwa unterschiedliche Mittelwerte oder Varianzen. Das Modell schätzt sowohl die zustandsspezifischen Parameter als auch die Übergangswahrscheinlichkeiten zwischen den Zuständen. Dadurch lassen sich Strukturbrüche und nichtlineare Verhaltensmuster erfassen, die von Modellen mit nur einem Regime oft nicht erkannt werden. Entsprechend werden diese Verfahren häufig in der Makroökonomie und Finanzzeitreihenanalyse eingesetzt. 

2. Hybride Modelle (Statistik × Machine Learning)

Prophet ist ein additives Modell, das eine Zeitreihe in Trend, Saisonalität und besondere Ereignisse wie Feiertage zerlegt. Es wurde speziell für geschäftsbezogene Zeitreihen mit starken saisonalen Mustern, Wachstum sowie vielen Ausreißern oder fehlenden Werten entwickelt.
Das Modell erkennt automatisch Trendwechselpunkte und unterstützt mehrere saisonale Muster gleichzeitig, beispielsweise wöchentliche und jährliche Zyklen. Seine größte Stärke liegt in der einfachen Anwendung und hohen Interpretierbarkeit, weniger in der maximal möglichen Prognosegenauigkeit. 

Auto-ARIMA automatisiert die Auswahl der optimalen ARIMA-Konfiguration, also der Parameter p, d, q sowie saisonaler Komponenten. Die Auswahl erfolgt anhand von Informationskriterien wie AIC oder BIC.
Das Verfahren durchsucht systematisch viele Modellvarianten und wählt diejenige aus, die ein gutes Gleichgewicht zwischen Modellgüte und Komplexität bietet. Dadurch entfällt ein großer Teil der manuellen Modelloptimierung. Auto-ARIMA eignet sich besonders als robuster und skalierbarer Basisansatz in produktiven Forecasting-Pipelines. 

BATS und TBATS sind Erweiterungen der exponentiellen Glättung, die Box-Cox-Transformationen, ARMA-Fehlerstrukturen, Trendkomponenten sowie trigonometrische Fourier-Darstellungen saisonaler Muster kombinieren.
Sie wurden für Zeitreihen mit mehreren und teilweise nichtganzzahligen Saisonalitäten entwickelt, etwa stündliche Daten mit täglichen und wöchentlichen Mustern. TBATS ist besonders hilfreich, wenn klassische saisonale Modelle komplexe oder lange saisonale Zyklen nicht ausreichend erfassen können. Die Methode gilt als Standardansatz bei vielen überlagernden saisonalen Effekten. 

Bei STL + ARIMA/ETS wird die Zeitreihe zunächst mittels STL (Seasonal and Trend decomposition using Loess) in Trend-, Saison- und Restkomponenten zerlegt. Anschließend wird die Restkomponente mit ARIMA oder ETS modelliert, während Trend und Saisonalität separat prognostiziert und später wieder zusammengeführt werden.
Dieser Ansatz bietet hohe Flexibilität, da jede Komponente mit einer spezialisierten Methode behandelt werden kann. Er ist robust gegenüber Veränderungen saisonaler Muster und liefert häufig sehr stabile Prognoseergebnisse. 

ARIMAX erweitert das ARIMA-Modell um exogene Variablen wie Marketingausgaben, Wetterdaten oder Preisänderungen. Dadurch lässt sich der Einfluss externer Faktoren auf die Zielzeitreihe quantifizieren, während gleichzeitig Autokorrelationen und saisonale Effekte berücksichtigt werden.
Die dynamische Regression beschreibt allgemein die Kombination klassischer Regressionsmodelle mit Zeitreihenstrukturen in den Residuen. Diese Modelle sind besonders wichtig, wenn erklärbare Ursache-Wirkungs-Beziehungen im Vordergrund stehen und nicht ausschließlich musterbasierte Prognosen. 

Ensemble-Modelle kombinieren Prognosen mehrerer Einzelmodelle, etwa ARIMA-, ETS- oder Machine-Learning-Verfahren, zu einer gemeinsamen Vorhersage. Die Grundidee besteht darin, dass unterschiedliche Modelle verschiedene Aspekte der Daten erfassen und deren Kombination Varianz sowie modellspezifische Verzerrungen reduziert.
In der Praxis liefern Ensemble-Ansätze häufig bessere Ergebnisse als einzelne Modelle, insbesondere bei verrauschten realen Daten. Sie werden deshalb häufig in Wettbewerben und produktiven Systemen eingesetzt, um Stabilität und Robustheit zu erhöhen. 

GAMs sind Regressionsmodelle, bei denen der Einfluss jeder Eingangsvariable durch glatte, potenziell nichtlineare Funktionen beschrieben wird, während das Gesamtmodell additiv und interpretierbar bleibt.
Im Forecasting können damit Kalendereffekte, saisonale Muster und externe Einflussgrößen transparent modelliert werden. GAMs bilden einen Mittelweg zwischen klassischer Statistik und schwer interpretierbaren Machine-Learning-Modellen und sind daher besonders attraktiv in Bereichen, in denen sowohl Flexibilität als auch Nachvollziehbarkeit gefordert sind. 

Gradient-Boosted-Hybridmodelle kombinieren klassische Zeitreihenmerkmale wie Verzögerungen (Lags), gleitende Statistiken oder saisonale Indikatoren mit Boosting-Algorithmen wie XGBoost oder LightGBM.
Die Zeitreihenstruktur wird dabei über die Features abgebildet, während das Boosting-Modell komplexe nichtlineare Zusammenhänge lernt. Dieser Ansatz kann die Prognosegenauigkeit deutlich verbessern, insbesondere wenn viele externe Einflussgrößen verfügbar sind. Er verbindet statistisches Fachwissen mit der Leistungsfähigkeit moderner Machine-Learning-Methoden. 

ES RNN ist ein hybrides Modell, das exponentielle Glättung mit rekurrenten neuronalen Netzen kombiniert und ursprünglich für den M4-Forecasting-Wettbewerb entwickelt wurde.
Die exponentielle Glättung übernimmt die Aktualisierung von Niveau- und Saisonkomponenten, während das RNN komplexe Muster über viele Zeitreihen hinweg aus gemeinsamen Repräsentationen lernt. Dadurch werden die strukturellen Vorteile klassischer Zeitreihenmodelle mit der Flexibilität von Deep Learning verbunden. ES RNN zeigte eindrucksvoll, dass hybride Ansätze sowohl rein statistische als auch rein neuronale Modelle deutlich übertreffen können. 

NeuralProphet ist eine neuronale Weiterentwicklung von Facebook Prophet. Das Modell behält die additive Struktur aus Trend-, Saison- und Feiertagseffekten bei, erweitert diese jedoch um gelernte autoregressive und verzögerte Komponenten.
Basierend auf PyTorch können neuronale Netze Signalanteile modellieren, die mit einfachen linearen Komponenten schwer erfassbar sind, während gleichzeitig eine klare Zerlegung für Interpretierbarkeit erhalten bleibt. NeuralProphet unterstützt mehrere saisonale Muster, zukünftige Kovariaten und benutzerdefinierte Ereignisse und erzielt häufig bessere Ergebnisse als Prophet, wenn die Daten komplexe oder nichtlineare Dynamiken aufweisen. Ziel ist die Kombination aus einfacher Nutzung, Nachvollziehbarkeit und zusätzlicher Leistungsfähigkeit durch Deep Learning. 

3. Machine-Learning-Modelle

Random Forests sind Ensembles aus Entscheidungsbäumen, die auf zufällig gezogenen Stichproben der Daten sowie zufälligen Teilmengen von Merkmalen trainiert werden. Im Zeitreihenkontext arbeiten sie nicht direkt auf den Rohdaten, sondern auf Merkmalen wie Verzögerungen (Lags), gleitenden Durchschnitten oder Kalenderindikatoren.
Sie sind robust gegenüber Rauschen, können nichtlineare Zusammenhänge gut erfassen und liefern Informationen über die Wichtigkeit einzelner Variablen. Allerdings modellieren sie zeitliche Abhängigkeiten nicht direkt, weshalb sorgfältiges Feature Engineering entscheidend ist. 

XGBoost ist eine hochoptimierte Gradient-Boosting-Bibliothek, die Entscheidungsbäume sequenziell aufbaut, um Fehler vorheriger Modelle schrittweise zu korrigieren. Im Forecasting wird XGBoost typischerweise mit konstruierten Zeitreihenmerkmalen wie Lags, saisonalen Indikatoren und externen Variablen eingesetzt.
Das Verfahren erzielt häufig Spitzenleistungen in Wettbewerben und datenintensiven Analyseprojekten. Der wichtigste Nachteil gegenüber klassischen statistischen Modellen ist die geringere Interpretierbarkeit. Werkzeuge wie SHAP helfen jedoch dabei, Prognosen nachvollziehbar zu erklären. 

LightGBM ist ein weiteres Gradient-Boosting-Framework, das mithilfe histogrammbasierter Algorithmen und eines leaf-wise Baumwachstums speziell auf Geschwindigkeit und Skalierbarkeit optimiert wurde.
Das Modell kann große Mengen an Features sowie hochfrequente Zeitreihendaten effizient verarbeiten. Mit geeignetem Feature Engineering lassen sich komplexe nichtlineare Beziehungen und Wechselwirkungen zwischen Variablen modellieren. In produktiven Systemen wird LightGBM häufig aufgrund seiner Kombination aus Geschwindigkeit, Genauigkeit und moderatem Ressourcenverbrauch eingesetzt. 

Support Vector Regression (SVR) nutzt Kernel-Methoden, um nichtlineare Zusammenhänge zwischen Eingangsmerkmalen und Zielvariablen zu lernen. Für Zeitreihen werden dabei typischerweise Features wie Lags, Differenzen oder saisonale Indikatoren verwendet.
SVR kann auf mittelgroßen Datensätzen mit klaren Mustern sehr gute Ergebnisse erzielen, skaliert jedoch nur eingeschränkt auf sehr große Datenmengen. Zudem ist die Interpretation schwieriger als bei linearen oder additiven Modellen. 

kNN-Forecasting prognostiziert zukünftige Werte anhand ähnlicher Muster aus der Vergangenheit. Dazu werden historische Zeitfenster gesucht, die der aktuellen Situation ähneln, und deren spätere Entwicklungen als Prognose genutzt.
Der Ansatz ist einfach und intuitiv und funktioniert besonders gut, wenn sich bestimmte Muster regelmäßig wiederholen. Die Leistung nimmt jedoch ab, wenn sich das Verhalten der Zeitreihe grundlegend verändert oder die Anzahl der Merkmale sehr hoch wird. 

Quantilsregressionsvarianten von Random Forests oder Boosting-Modellen prognostizieren nicht nur einen einzelnen Mittelwert, sondern bestimmte Quantile der zukünftigen Verteilung. Dadurch lassen sich Prognoseintervalle und Risikomaße direkt ableiten.
Diese Verfahren sind besonders nützlich, wenn asymmetrische Risiken relevant sind, beispielsweise wenn eine Unterschätzung der Nachfrage deutlich teurer ist als eine Überschätzung. Sie können eigenständig oder in Kombination mit Conformal-Prediction-Techniken eingesetzt werden. 

Regelbasierte Modelle erzeugen aus Baumensembles verständliche Regeln und kombinieren diese anschließend mit linearen Modellen. Im Zeitreihenkontext können solche Regeln beispielsweise lauten: „Wenn die Verkäufe der letzten Woche hoch waren und gleichzeitig Dezember ist, wird die Nachfrage voraussichtlich sehr hoch sein.“
Dadurch entsteht eine Brücke zwischen flexiblen Machine-Learning-Modellen und nachvollziehbarer Geschäftslogik. Solche Modelle sind besonders hilfreich, wenn Fachbereiche die Entscheidungslogik in klarer Sprache verstehen müssen. 

Feature-basierte Ansätze berechnen automatisch Hunderte oder Tausende statistischer Merkmale aus Zeitreihen, beispielsweise Autokorrelationen, Trendstärke oder Entropie. Diese Merkmale werden anschließend mit allgemeinen ML-Modellen wie Random Forests oder Boosting-Verfahren kombiniert.
Dadurch lassen sich leistungsfähige tabellarische Machine-Learning-Algorithmen nutzen und gleichzeitig komplexe Eigenschaften von Zeitreihen erfassen. Der Ansatz eignet sich besonders gut für viele kurze Zeitreihen, die einheitlich klassifiziert oder prognostiziert werden sollen. 

CatBoost ist eine Gradient-Boosting-Bibliothek, die insbesondere bei kategorialen Variablen sehr leistungsfähig ist. Dies wird durch spezielle Kodierungsverfahren und Regularisierungstechniken erreicht.
Im Forecasting wird CatBoost typischerweise mit tabellarischen Merkmalen eingesetzt, die aus Zeitreihen abgeleitet werden, etwa Lags, gleitende Statistiken, Kalenderinformationen oder kategoriale Kennungen für Produkte oder Standorte. CatBoost erreicht häufig mindestens vergleichbare, oft sogar bessere Ergebnisse als andere Tree-Boosting-Verfahren und benötigt dabei weniger manuelle Vorverarbeitung kategorialer Daten. Daher eignet sich das Modell besonders gut für produktionsreife Forecasting-Systeme mit vielen Einflussgrößen und komplexen Wechselwirkungen. 

4. Deep-Learning- und KI-Modelle
4.1 Rekurrente und konvolutionale Modelle

LSTMs sind rekurrente neuronale Netze, die speziell dafür entwickelt wurden, langfristige Abhängigkeiten in Sequenzen zu erfassen. Dies geschieht über sogenannte Gates, welche den Informationsfluss gezielt steuern.
LSTMs können komplexe nichtlineare Zusammenhänge, mehrere Eingangsvariablen und lange Historien in Zeitreihendaten modellieren. Sie werden häufig eingesetzt, wenn klassische lineare Modelle komplexe Muster nicht ausreichend abbilden können. Allerdings sind LSTMs vergleichsweise rechenintensiv und erfordern oft sorgfältige Parametrierung sowie Regularisierung. 

GRUs sind eine vereinfachte Variante der LSTM-Architektur mit weniger Gates und Parametern. Sie erreichen häufig eine ähnliche Prognosequalität wie LSTMs, lassen sich jedoch schneller trainieren und einfacher optimieren.
Im Forecasting werden GRUs häufig für multivariate Zeitreihen und Sequenzen mittlerer Länge eingesetzt. Sie gelten oft als pragmatischer Einstieg in Deep-Learning-basierte Sequenzmodelle. 

TCNs verwenden dilatierte, kausale Faltungen, um langfristige zeitliche Abhängigkeiten ohne rekurrente Strukturen zu erfassen. Da Sequenzen parallel verarbeitet werden können, sind TCNs häufig schneller und stabiler trainierbar als viele klassische RNN-Modelle.
Im Forecasting können sie sowohl kurzfristige als auch langfristige Muster effektiv modellieren. Besonders attraktiv sind sie für großskalige Anwendungen, bei denen Trainingsgeschwindigkeit und Skalierbarkeit entscheidend sind. 

BiTCN erweitert klassische TCNs um bidirektionale Faltungen, wodurch sowohl vergangene als auch zukünftige Kontexte innerhalb eines Trainingsfensters genutzt werden können. Dadurch verbessert sich die Merkmalsextraktion und Mustererkennung während des Trainings deutlich.
Bei der eigentlichen Prognose wird in der Regel nur die Vergangenheit verwendet, allerdings auf Basis reichhaltiger gelernter Repräsentationen. Dies kann insbesondere bei komplexen und verrauschten Zeitreihen zu präziseren Vorhersagen führen. 

DeepAR ist ein probabilistisches rekurrentes neuronales Netz, das entwickelt wurde, um viele verwandte Zeitreihen gleichzeitig zu prognostizieren. Statt für jede Serie ein eigenes Modell zu trainieren, lernt DeepAR ein globales Modell über alle Reihen hinweg.
Das ist besonders hilfreich, wenn einzelne Zeitreihen kurz oder stark verrauscht sind. Das Modell liefert vollständige Wahrscheinlichkeitsverteilungen statt nur einzelner Punktprognosen und wird häufig im großskaligen Retail- und Supply-Chain-Forecasting eingesetzt. 

Encoder-Decoder-LSTM-Modelle, auch Sequence-to-Sequence- oder Seq2Seq-Modelle genannt, verwenden ein rekurrentes Netzwerk zur Kodierung eines historischen Zeitfensters in eine latente Repräsentation und ein zweites Netzwerk zur Dekodierung dieser Repräsentation in zukünftige Werte.
Diese Architektur eignet sich besonders für Multi-Step-Forecasting, da komplette Prognosepfade erzeugt werden können, anstatt jeden Zeithorizont separat vorherzusagen. Zusätzlich können Attention-Mechanismen integriert werden, damit sich der Decoder bei jeder Vorhersage auf die relevantesten vergangenen Zeitpunkte konzentriert.
Seq2Seq-Modelle sind sehr flexibel und leistungsfähig für multivariate und mehrstufige Prognosen, benötigen jedoch meist große Datenmengen sowie sorgfältige Regularisierung. 

xLSTMTime nutzt erweiterte LSTM-Architekturen für Zeitreihenprognosen und integriert moderne rekurrente Designs, die Skalierbarkeit sowie die Modellierung langer Sequenzen verbessern.
Das Modell kann als moderne rekurrente Alternative zu transformerbasierten Forecasting-Ansätzen betrachtet werden. Besonders sinnvoll ist xLSTMTime, wenn sequenzielle Strukturen und zeitliche Abhängigkeiten wichtig sind, klassische LSTMs jedoch an ihre Grenzen stoßen.
Damit bewegt sich xLSTMTime an der Schnittstelle zwischen klassischen rekurrenten Deep-Learning-Modellen und modernen Foundation-Model-Architekturen. 

4. Deep-Learning- und KI-Modelle
4.2 Transformer-basierte Modelle

Transformer-Modelle nutzen Self-Attention-Mechanismen, um unterschiedliche Zeitpunkte innerhalb einer Sequenz unterschiedlich zu gewichten und dadurch langfristige Abhängigkeiten ohne rekurrente Strukturen zu erfassen. Alle Zeitschritte werden parallel verarbeitet, was sehr gut mit moderner Hardware skaliert.
Im Zeitreihenkontext können Transformer lange Historien sowie heterogene Eingaben wie kategoriale und kontinuierliche Kovariaten verarbeiten. Die größten Herausforderungen liegen im hohen Datenbedarf sowie im steigenden Rechenaufwand bei sehr langen Sequenzen. 

Der Temporal Fusion Transformer ist eine speziell für Forecasting entwickelte Transformer-Architektur, die Attention-Mechanismen mit rekurrenten Schichten und Netzwerken zur Variablenselektion kombiniert.
Das Modell kann statische Merkmale, bekannte zukünftige Eingaben wie Feiertage sowie beobachtete historische Kovariaten in einer einheitlichen Architektur verarbeiten. Zusätzlich bietet TFT Interpretierbarkeit über Attention-Gewichte und Variablenselektionsscores, wodurch sichtbar wird, welche Eingaben für die Prognose besonders relevant waren. Das macht TFT besonders attraktiv für industrielle Anwendungen, in denen sowohl Genauigkeit als auch Nachvollziehbarkeit gefordert sind. 

iTransformer verfolgt einen „invertierten“ Ansatz zur Darstellung von Zeitreihen, bei dem häufig Variablen selbst als Tokens behandelt werden. Dadurch kann Attention flexibler genutzt werden, insbesondere in multivariaten Szenarien, in denen Beziehungen zwischen Variablen ebenso wichtig sind wie zeitliche Muster.
Die Architektur ist auf hohe Parametereffizienz ausgelegt und kann dennoch komplexe Abhängigkeiten erfassen. Auf Benchmark-Datensätzen übertrifft iTransformer häufig ältere Transformer-Varianten. 

PatchTST unterteilt Zeitreihen in überlappende „Patches“, ähnlich wie Vision Transformer Bildausschnitte verarbeiten. Diese Patches werden eingebettet und anschließend durch Transformer-Schichten verarbeitet, wodurch lokale und globale Muster effizient gelernt werden können.
Die patchbasierte Darstellung ermöglicht die Verarbeitung langer Kontextfenster, ohne dass die Rechenkosten übermäßig ansteigen. PatchTST zeigt besonders starke Leistungen bei langfristigen Forecasting-Aufgaben. 

TimesNet transformiert eindimensionale Zeitreihen in mehrere zweidimensionale, zeit-frequenzähnliche Darstellungen und verarbeitet diese mithilfe konvolutionsähnlicher Blöcke innerhalb eines transformerähnlichen Frameworks.
Dadurch kann das Modell periodische Muster auf unterschiedlichen Skalen strukturiert erfassen. TimesNet erzielt besonders gute Ergebnisse bei langfristigen Forecasting-Benchmarks und eignet sich vor allem für Daten mit ausgeprägten multiperiodischen Strukturen. 

Informer führt probabilistische Sparse-Self-Attention ein, um Transformer-Modelle auf sehr lange Eingabesequenzen skalierbar zu machen. Anstatt alle Zeitpunkte gleichermaßen zu berücksichtigen, fokussiert sich das Modell gezielt auf die informativsten Abschnitte der Sequenz.
Dadurch werden Speicherbedarf und Rechenaufwand deutlich reduziert, ohne die Prognosequalität wesentlich zu verschlechtern. Informer wird häufig für langfristige Prognosen in Bereichen wie Energieversorgung oder Verkehrsanalysen eingesetzt. 

Autoformer integriert einen sogenannten Auto-Correlation-Mechanismus, um periodische Muster und langfristige Abhängigkeiten explizit zu modellieren. Dabei wird die Eingangszeitreihe in Trend- und Saisonkomponenten zerlegt, die getrennt verarbeitet werden.
Diese Zerlegung hilft dem Modell, auch bei langen Sequenzen die wesentlichen periodischen Strukturen stabil zu erfassen. Autoformer wurde speziell für langfristige Forecasting-Aufgaben mit klaren saisonalen Mustern entwickelt. 

FEDformer (Frequency-Enhanced Decomposed Transformer) arbeitet teilweise im Frequenzraum. Die Zeitreihe wird dabei in Komponenten zerlegt, auf die Attention selektiv angewendet wird.
Durch die Verarbeitung im Frequenzbereich können periodische und saisonale Verhaltensmuster besonders effizient erkannt werden. FEDformer kombiniert Informationen aus Zeit- und Frequenzdomäne und verbessert dadurch Robustheit und Prognosequalität. Die Architektur eignet sich besonders für Daten mit komplexen und überlagernden saisonalen Zyklen. 

Crossformer ist eine speziell für multivariate Zeitreihen entwickelte Transformer-Variante, die den Fokus auf Abhängigkeiten zwischen verschiedenen Variablen legt. Die Daten werden als zweidimensionale Struktur aus Variablen und Zeitsegmenten organisiert, wobei Attention sowohl entlang der Zeitdimension als auch zwischen den Variablen angewendet wird.
Dadurch kann das Modell lernen, wie unterschiedliche Zeitreihen sich gegenseitig beeinflussen, beispielsweise Wetterdaten und Energieverbrauch oder mehrere Sensorsignale in industriellen Anlagen. Crossformer eignet sich besonders für hochdimensionale Zeitreihen mit komplexen Wechselwirkungen zwischen einzelnen Variablen. 

ETSformer ist eine Transformer-Architektur, die Konzepte aus exponentieller Glättung und klassischen ETS-Modellen direkt integriert. Das Modell zerlegt Zeitreihen explizit in Niveau-, Trend- und Saisonkomponenten und verwendet spezialisierte Attention- sowie glättungsähnliche Mechanismen für jede dieser Komponenten.
Durch diese eingebauten strukturellen Annahmen kann ETSformer Trends und saisonale Muster stabiler extrapolieren und gleichzeitig besser interpretierbare Prognosen liefern als generische Transformer-Modelle. Besonders bei langfristigen Forecasting-Aufgaben mit stabilen Trend- und Saisonmustern erzielt ETSformer häufig sehr gute Ergebnisse. 

4. Deep-Learning- und KI-Modelle
4.3 Foundation-Forecasting-Modelle

TimeGPT ist ein großes Foundation-Modell für Zeitreihen, das auf umfangreichen Sammlungen zeitlicher Daten vortrainiert wurde. Es kann mit minimalem Fine-Tuning an neue Aufgaben angepasst oder in vielen Fällen direkt „out of the box“ für Forecasting-Probleme eingesetzt werden.
Das Ziel des Modells besteht darin, starke Baseline-Ergebnisse ohne aufwendiges Model Engineering bereitzustellen. TimeGPT steht exemplarisch für den Trend hin zu „Time-Series-as-a-Service“ mit leistungsfähigen universellen Modellarchitekturen. 

Chronos ist eine tokenbasierte Familie vortrainierter Foundation-Modelle für Zeitreihen, entwickelt von Amazon. Numerische Werte werden dabei ähnlich wie in Sprachmodellen als diskretisierte Tokens dargestellt.
Das Modell lernt generische zeitliche Muster sowie probabilistische Verhaltensweisen über große Sammlungen von Zeitreihen hinweg und kann Zero-Shot- oder Few-Shot-Prognosen mit minimaler aufgabenspezifischer Anpassung erzeugen. Besonders relevant ist Chronos für probabilistische Forecasts, Unsicherheitsabschätzungen und skalierbare domänenübergreifende Anwendungen.

Chronos Bolt erweitert die ursprüngliche Chronos-Architektur um effizientere Inferenz, geringere Latenzzeiten und bessere Skalierbarkeit für industrielle Produktionsumgebungen, ohne die starken probabilistischen Forecasting-Fähigkeiten zu verlieren.

Chronos 2 entwickelt die Modellfamilie weiter in Richtung universeller Forecasting-Fähigkeiten. Neben univariaten Prognosen unterstützt das Modell auch multivariate Forecasts, Kovariaten und umfangreichere Kontextinformationen. Ziel ist eine flexiblere und praxisnähere Foundation-Architektur für heterogene reale Forecasting-Szenarien. 

TimesFM ist ein von Google Research entwickeltes Foundation-Modell für Zero-Shot- und Few-Shot-Forecasting. Die Architektur basiert auf einem Decoder-only-Ansatz und wurde auf sehr großen Mengen von Zeitreihendaten vortrainiert, wodurch eine Generalisierung auf neue Domänen ohne spezifisches Training möglich wird.

TimesFM 2.0 erweitert diesen Ansatz um stärkere Few-Shot-Fähigkeiten, bei denen verwandte Zeitreihen zur Verbesserung der Prognosen einer Zielreihe genutzt werden können. 

TimesFM 2.5 verbessert zusätzlich Skalierbarkeit, Kontextverarbeitung und Transferleistung über heterogene Forecasting-Datensätze hinweg, während gleichzeitig eine effiziente Inferenz für großskalige industrielle Anwendungen erhalten bleibt.
Die Modellfamilie eignet sich besonders für Organisationen, die ein universelles Forecasting-Backbone mit minimalem manuellem Feature Engineering einsetzen möchten. 

Moirai 1.0 und Moirai 1.1 sind universelle Foundation-Modelle für Zeitreihen von Salesforce AI Research. Sie wurden für probabilistisches Forecasting über unterschiedliche Domänen, Frequenzen und Prognosehorizonte hinweg entwickelt und basieren auf großskaligem Pretraining heterogener Zeitreihendaten.

Die ursprüngliche Moirai-Familie verwendet eine Architektur im Stil maskierter Encoder und unterstützt flexible Patch-Größen zur Verarbeitung unterschiedlicher zeitlicher Auflösungen. Diese Modelle zählen klar zur Kategorie der Foundation-Modelle, da ihre Hauptstärke in der Übertragbarkeit auf verschiedenste Forecasting-Aufgaben liegt. 

Moirai 2.0 stellt die nächste Generation der Moirai-Familie dar und nutzt eine vereinfachte Decoder-only-Architektur für universelles Zeitreihen-Forecasting.
Im Vergleich zu Moirai 1.0 ersetzt das Modell mehrere komplexe Architekturentscheidungen durch Quantilprognosen, rekursive Multi-Quantil-Dekodierung und eine effizientere Modellstruktur. Das Ergebnis ist ein kleineres und schnelleres Foundation-Modell, das dennoch starke probabilistische Forecasts über viele Domänen hinweg liefert.
Moirai 2.0 sollte daher als eigenständige Entwicklungsstufe betrachtet werden, da es innerhalb derselben Modellfamilie einen deutlichen architektonischen Wandel repräsentiert. 

Kairos ist ein modernes Foundation-Modell für Zeitreihen, das für skalierbares Forecasting und temporales Repräsentationslernen über heterogene Domänen hinweg entwickelt wurde.
Durch großskaliges Pretraining lernt das Modell wiederverwendbare zeitliche Strukturen, die sich mit minimaler Anpassung auf neue Datensätze und Forecasting-Aufgaben übertragen lassen. Der Fokus liegt auf robustem Cross-Domain-Transfer-Learning, effizienter Inferenz sowie flexibler Unterstützung unterschiedlicher Prognosehorizonte und Datenfrequenzen.
Kairos steht exemplarisch für den Trend zu universellen vortrainierten Forecasting-Backbones für Industrie und Forschung. 

TiRex ist ein vortrainiertes Foundation-Modell für Zeitreihen mit Schwerpunkt auf dem Lernen reichhaltiger temporaler Repräsentationen für Forecasting und verwandte Downstream-Aufgaben.
Das Modell kombiniert großskaliges Pretraining mit Architekturen, die speziell für langfristige Forecasts und komplexe zeitliche Abhängigkeiten optimiert wurden. Ziel ist eine starke Generalisierung über verschiedene Branchen, Datenfrequenzen und Forecasting-Szenarien hinweg, während gleichzeitig der Bedarf an datensatzspezifischem Model Engineering reduziert wird.
TiRex gehört damit zur neuen Generation übertragbarer Foundation-Modelle für Zeitreihenanalysen. 

4. Deep-Learning- und KI-Modelle
4.4 Universelle und Transfer-Learning-Modelle für Zeitreihen

MOMENT ist eine Familie offener Foundation-Modelle für Zeitreihen, die für allgemeine Zeitreihenanalysen entwickelt wurde. Die Modelle werden auf großen öffentlichen Sammlungen von Zeitreihendaten vortrainiert und können anschließend für Aufgaben wie Forecasting, Klassifikation, Anomalieerkennung oder Imputation angepasst werden.
Besonders relevant ist MOMENT, weil Zeitreihenmodellierung hier nicht nur als Forecasting-Problem verstanden wird, sondern als umfassende Aufgabe des Repräsentationslernens. Das Modell eignet sich insbesondere für Szenarien mit wenig Daten oder begrenzter Supervision, da vortrainierte zeitliche Repräsentationen den Bedarf an großen aufgabenspezifischen Datensätzen reduzieren können. 

UniTime ist ein vereinheitlichtes Zeitreihenmodell, das mehrere zeitbezogene Aufgaben und Domänen innerhalb einer gemeinsamen Architektur verarbeitet. Anstatt für jeden Datensatz oder Prognosehorizont eigene Modelle zu entwickeln, zielt UniTime darauf ab, übertragbare zeitliche Repräsentationen zu lernen.
Das Modell ist besonders interessant für Unternehmen, die Forecasting-, Klassifikations- oder Anomalieerkennungsprozesse über viele verwandte Datensätze hinweg standardisieren möchten. Aufgrund seines Fokus auf Generalisierung und Transfer Learning gehört UniTime klar zur modernen Kategorie der Foundation-Modelle. 

Toto ist ein modernes Foundation-Modell für Zeitreihen mit Schwerpunkt auf allgemeinem Forecasting auf Basis vortrainierter zeitlicher Repräsentationen.
Das Modell gehört zu jener Gruppe von Ansätzen, die den Bedarf an aufgabenspezifischem Modelldesign reduzieren möchten, indem sie allgemeine Muster aus vielen Datensätzen lernen. Solche Modelle sind besonders wertvoll, wenn Daten aus unterschiedlichen Domänen stammen und manuelle Modellauswahl aufwendig oder teuer wäre.
Toto zählt zu den neueren Foundation-Model-Ansätzen, wobei die praktische Relevanz stark von verfügbarer Infrastruktur, Benchmark-Ergebnissen und Tooling abhängt. 

Sundial ist ein aktuelles Foundation-Style-Modell für Zeitreihen, das auf flexibles Forecasting über heterogene zeitliche Daten hinweg ausgelegt ist. Wie andere vortrainierte Modelle versucht auch Sundial, allgemeine zeitliche Strukturen zu lernen, die sich auf bislang unbekannte Datensätze übertragen lassen.
Seine Bedeutung liegt vor allem im wachsenden Ökosystem universeller Forecasting-Backbones, die mit Modellen wie TimeGPT, Chronos, TimesFM oder Moirai konkurrieren. Sundial ist daher am besten in der Kategorie moderner Foundation-Modelle einzuordnen. 

4. Deep-Learning- und KI-Modelle
4.5 Effiziente und kompakte Foundation-Modelle

TinyTimeMixer, auch als TTM bekannt und Bestandteil der IBM Granite Time Series Modelle, ist eine kompakte Familie vortrainierter Foundation-Modelle für Zeitreihen.
Der Schwerpunkt liegt auf effizientem Forecasting mit sehr kleinen Modellgrößen, wodurch TTM im Vergleich zu großen transformerbasierten Foundation-Modellen deutlich geringere Infrastrukturanforderungen besitzt. Das Modell unterstützt sowohl Zero-Shot- als auch Fine-Tuned-Forecasting und eignet sich daher besonders für industrielle Anwendungen, bei denen Geschwindigkeit, Kosten und einfache Bereitstellung entscheidend sind.
TTM steht exemplarisch für den Trend hin zu kleinen, spezialisierten Foundation-Modellen für Zeitreihen anstelle ausschließlich sehr großer Modelle. 

Timer und Timer XL sind Foundation-Modelle für Zeitreihen, die durch großskaliges Pretraining wiederverwendbare temporale Repräsentationen lernen. Sie wurden entwickelt, um Forecasting über unterschiedliche Datensätze und Prognosehorizonte hinweg zu unterstützen.
Die größeren Varianten zielen insbesondere auf bessere Generalisierung sowie die Verarbeitung langer Kontextfenster ab. Die Modellfamilie verdeutlicht den Wandel von aufgabenspezifischen Forecasting-Modellen hin zu universellen vortrainierten Backbones, die flexibel an viele Zeitreihenprobleme angepasst werden können.
Timer XL ist besonders relevant für langfristige Forecasting-Aufgaben und domänenübergreifendes Transfer Learning. 

Lag-Llama ist ein modernes Zeitreihenmodell, das von Large-Language-Models inspiriert wurde, jedoch speziell für lagbasierte zeitliche Daten optimiert ist.
Das Modell verwendet Sequenzmodellierung auf Basis verzögerter Einbettungen, um komplexe Muster und Abhängigkeiten zu erfassen. Dadurch kann Lag-Llama häufig über verschiedene Datensätze und Aufgaben hinweg generalisieren und fungiert in vielen Fällen als semi-universelles Foundation-Modell.
Seine Stärke liegt insbesondere im flexiblen Repräsentationslernen für unterschiedlichste Zeitreihenprobleme. 

TabPFN TS ist ein Forecasting-Ansatz, der aus dem TabPFN-Framework für probabilistisches tabellarisches Lernen abgeleitet wurde. Das Modell überträgt vortrainierte transformerähnliche Inferenzmechanismen auf Zeitreihenprognosen, indem Forecasting-Probleme in strukturierte tabellarische Vorhersageaufgaben umgewandelt werden.
Der Schwerpunkt liegt auf starker Zero-Shot- und Few-Shot-Performance bei gleichzeitig minimalem Bedarf an Hyperparameteroptimierung oder manuellem Feature Engineering.
TabPFN TS ist besonders interessant für Anwender, die schnelle und weitgehend automatisierte Forecasting-Systeme benötigen, die auch bei relativ kleinen Datensätzen und begrenzter Trainingszeit konkurrenzfähige Ergebnisse liefern. 

4. Deep-Learning- und KI-Modelle
4.6 Mixture-of-Experts- und modulare Foundation-Modelle

Moirai MoE ist eine Mixture-of-Experts-Erweiterung der Moirai-Foundation-Modellfamilie. Statt für alle Zeitreihen denselben Modellpfad zu verwenden, steuert ein Gating-Mechanismus die Eingaben zu unterschiedlichen Expertenkomponenten, die jeweils auf bestimmte zeitliche Strukturen oder Domänen spezialisiert sind.
Dadurch eignet sich das Modell besonders für heterogene Forecasting-Probleme, bei denen sich Zeitreihen stark hinsichtlich Frequenz, Saisonalität, Volatilität oder geschäftlichem Kontext unterscheiden.
Moirai MoE gehört klar zur Kategorie der Foundation-Modelle mit Mixture-of-Experts-Architektur. 

TimeXer ist ein Zeitreihenmodell auf Basis eines Mixture-of-Experts-Transformer-Backbones. Unterschiedliche Experten spezialisieren sich dabei auf verschiedene zeitliche Muster oder Regime.
Ein Gating-Mechanismus entscheidet dynamisch, welche Experten für eine bestimmte Eingabe genutzt werden, wodurch Flexibilität und Prognosequalität verbessert werden. Diese Struktur eignet sich besonders für heterogene Datensätze, bei denen kein einzelnes Modell überall optimale Ergebnisse liefert.
TimeXer ist insbesondere relevant für Anwendungen mit vielen unterschiedlichen Domänen oder ausgeprägten Regimewechseln. 

Time-MoE (Time Mixture-of-Experts) bezeichnet eine breitere Modellfamilie, die mehrere Expertennetzwerke zusammen mit einer Gating-Funktion für Zeitreihenprognosen verwendet.
Einzelne Experten können sich beispielsweise auf kurzfristige Dynamiken, langfristige Trends oder spezifische saisonale Muster spezialisieren. Die Mixture-Struktur ermöglicht es dem Gesamtsystem, sich flexibel an unterschiedliche Muster anzupassen, ohne dass jedes Teilmodell unnötig komplex werden muss.
Time-MoE-Modelle können große Datensätze effizient skalieren, da typischerweise nur ein Teil der Experten pro Eingabe aktiviert wird. 

Synthefy Migas ist ein leichtgewichtiges Mixture-of-Experts-Forecasting-Modell, das mehrere vortrainierte Foundation-Modelle für Zeitreihen kombiniert.
Anstatt sich auf ein einzelnes universelles Backbone zu verlassen, lernt Migas die individuellen Stärken und Schwächen verschiedener Expertenmodelle und passt diese mit minimalem Fine-Tuning an neue Datensätze an. Dadurch werden starke Zero-Shot-Forecasting-Fähigkeiten sowie effiziente Anpassungen an domänenspezifische Anwendungen ermöglicht.
Mit ungefähr zehn Millionen Parametern erzielt Migas laut Benchmark-Tests wie GIFT Eval sehr gute Ergebnisse und bleibt dabei deutlich ressourcenschonender als viele große Foundation-Modelle.
Das Modell ist proprietär und wird über die Plattform von Synthefy bereitgestellt. 

KAN Experts sind Mixture-of-Experts-Architekturen, bei denen jeder Experte auf einem Kolmogorov-Arnold-Network (KAN) basiert. Ein Gating-Netzwerk entscheidet, welche KAN-Experten für ein bestimmtes Eingabemuster aktiviert werden.
Dadurch wird die Ausdrucksstärke von KANs mit der Flexibilität von Expertenmischungen kombiniert. Unterschiedliche Experten können sich auf verschiedene zeitliche Regime spezialisieren.
Das Ziel dieser Modelle besteht darin, hohe Prognosequalität mit strukturierten und vergleichsweise interpretierbaren funktionalen Komponenten zu verbinden. 

RMoK kombiniert rekurrente neuronale Architekturen mit funktionalen Zerlegungen nach dem Kolmogorov-Arnold-Prinzip. Ziel ist es, komplexe nichtlineare Zusammenhänge als Kombination einfacherer Funktionen darzustellen, organisiert in einer Mixture-of-Experts-Struktur.
Dadurch kann das Modell ein breites Spektrum unterschiedlicher Verhaltensmuster mit hoher Approximationsfähigkeit erfassen.
RMoK bildet damit eine Brücke zwischen funktionaler Approximationstheorie und praktischer Sequenzmodellierung für Zeitreihen. 

4. Deep-Learning- und KI-Modelle
4.7 LLM- und Prompt-basierte Forecasting-Modelle

PromptCast behandelt Zeitreihenprognosen als Prompting-Aufgabe für Large Language Models. Historische Beobachtungen und Aufgabenbeschreibungen werden dabei in textuelle Prompts umgewandelt, auf deren Basis das Sprachmodell zukünftige Werte oder Forecast-Beschreibungen generiert.
Der Ansatz ist derzeit noch experimenteller als klassische oder spezialisierte neuronale Forecasting-Modelle, jedoch besonders relevant, weil er zeigt, wie natürliche Sprachschnittstellen mit Forecasting kombiniert werden können.
PromptCast eignet sich vor allem für Szenarien, in denen Erklärbarkeit, Kontextinformationen und menschenlesbare Interaktion Teil des Forecasting-Prozesses sind. 

LLMTime nutzt Large Language Models für Zeitreihenprognosen, indem numerische Sequenzen in tokenbasierte Darstellungen umgewandelt werden, die von Sprachmodellarchitekturen verarbeitet werden können.
Die zentrale Idee besteht darin, dass vortrainierte Sprachmodelle auch außerhalb natürlicher Sprache sequenzielle Strukturen und Extrapolationsmuster erfassen können.
LLMTime ist besonders aus Forschungsperspektive interessant, da es eine Brücke zwischen numerischem Forecasting und generativer Sprachmodellierung schlägt. Das Modell gehört gemeinsam mit Time-LLM und PromptCast zur Familie LLM-basierter Zeitreihenmodelle. 

Time-LLM bezeichnet Architekturen, die Large Language Models mit Zeitreiheneingaben kombinieren, häufig über Prompt Engineering oder gelernte Adapterstrukturen.
Ziel ist es, die Fähigkeiten von LLMs in den Bereichen Mustererkennung, Kontextverständnis und Reasoning für Forecasting, Anomalieerkennung oder Szenarioanalysen zu nutzen.
Time-LLM-Systeme können Unsicherheiten und Kontextinformationen zusätzlich in natürlicher Sprache beschreiben, wodurch die Ergebnisse auch für nichttechnische Stakeholder leichter verständlich werden.
Das Forschungsfeld befindet sich noch in einer frühen Entwicklungsphase, und Best Practices entwickeln sich derzeit dynamisch weiter. 

TEMPO ist ein Zeitreihenmodell, das klassische Zerlegungsansätze mit vortrainierten Sprach- oder Sequenzmodellen kombiniert.
Dabei wird die zeitliche Struktur typischerweise in Komponenten wie Trend, Saisonalität und Restdynamik zerlegt, die anschließend mit leistungsfähigen neuronalen Backbones modelliert werden.
Dadurch entsteht ein hybrider Ansatz zwischen klassischer Zeitreihenzerlegung und modernen Foundation-Model-Konzepten. TEMPO eignet sich besonders für langfristige Forecasting-Aufgaben, bei denen explizite Strukturmodellierung und vortrainierte Repräsentationen sich sinnvoll ergänzen. 

4. Deep-Learning- und KI-Modelle
4.8 Vision- und multimodale Zeitreihenmodelle

VisionTS überträgt Konzepte aus Computer Vision und visuellem Repräsentationslernen auf Zeitreihenprognosen, indem zeitliche Daten in strukturierte Darstellungen transformiert werden, die von Architekturen verarbeitet werden können, die an Vision Transformer und patchbasierte Bildmodelle angelehnt sind.
Diese Ansätze nutzen moderne Verfahren aus Computer Vision und multimodaler KI, um komplexe zeitliche Muster, langfristige Abhängigkeiten und domänenübergreifende Strukturen in Zeitreihendaten zu erfassen.
VisionTS++ erweitert den ursprünglichen VisionTS-Ansatz um bessere Skalierbarkeit, leistungsfähigere Merkmalsextraktion und stärkere Generalisierung über heterogene Forecasting-Aufgaben hinweg.
Die VisionTS-Modellfamilie verdeutlicht die zunehmende Konvergenz zwischen Computer Vision, multimodalen Foundation-Modellen und modernen Zeitreihenprognoseverfahren. 

4. Deep-Learning- und KI-Modelle
4.9 Lineare und MLP-basierte Forecasting-Modelle

MLP-Forecasting-Modelle verwenden Multi-Layer-Perceptrons, um zeitliche Zusammenhänge direkt aus verzögerten Beobachtungen und optionalen Kovariaten zu lernen, ohne rekurrente oder Attention-basierte Architekturen einzusetzen.
Moderne MLP-basierte Forecasting-Ansätze zeigen, dass vergleichsweise einfache Feedforward-Netzwerke auf vielen Forecasting-Benchmarks sehr konkurrenzfähige Ergebnisse erzielen können und dabei recheneffizient sowie leicht skalierbar bleiben.
Varianten für multivariate Zeitreihen erweitern diesen Ansatz, indem Abhängigkeiten zwischen mehreren verwandten Zeitreihen gemeinsam modelliert werden.
MLP-Architekturen sind besonders attraktiv für praktische Anwendungen, in denen Effizienz, Einfachheit und stabiles Trainingsverhalten wichtig sind. 

N-BEATS ist eine speziell für univariate Zeitreihenprognosen entwickelte Deep-Learning-Architektur, die mit rückwärts- und vorwärtsgerichteten Residual-Blöcken arbeitet.
Das Modell lernt Trend- und Saisonkomponenten direkt aus den Daten, ohne auf manuell definierte statistische Annahmen angewiesen zu sein, und erzielte Spitzenleistungen in bedeutenden Forecasting-Wettbewerben.
N-BEATSx erweitert diese Architektur um exogene Variablen und Kovariaten wie Kalendereffekte, Wetterdaten oder Preisinformationen. Dadurch eignet sich das Modell besser für praxisnahe multivariate Business-Forecasting-Aufgaben.
Die N-BEATS-Familie gilt insgesamt als wichtige Klasse effizienter MLP-basierter Forecasting-Architekturen mit starker Prognosequalität und vergleichsweise einfacher, skalierbarer Modellstruktur. 

N-HiTS (Neural Hierarchical Interpolation for Time Series) erweitert N-BEATS um hierarchische Interpolation auf mehreren Auflösungsebenen.
Das Modell ist besonders leistungsfähig für langfristige Forecasts, bei denen unterschiedliche zeitliche Auflösungen relevant sind. Durch die getrennte Modellierung von nieder- und hochfrequenten Komponenten kann N-HiTS sowohl globale Trends als auch lokale Details erfassen.
Auf langfristigen Forecasting-Benchmarks übertrifft N-HiTS häufig frühere Deep-Learning-Modelle. 

DLinear ist ein einfaches, aber einflussreiches neuronales Forecasting-Modell, das auf linearen Schichten und Zeitreihenzerlegung basiert.
Die Zeitreihe wird in Trend- und Restkomponenten aufgeteilt, auf die anschließend lineare Transformationen angewendet werden, um zukünftige Werte vorherzusagen.
Trotz seiner Einfachheit erzielte DLinear überraschend starke Ergebnisse auf mehreren Long-Horizon-Benchmarks. Besonders wichtig wurde das Modell, weil es die Annahme infrage stellte, dass komplexe Transformer-Architekturen für leistungsfähiges Forecasting zwingend notwendig seien. 

NLinear ist ein normalisierungsbasiertes lineares Forecasting-Modell. Vor der linearen Prognoseschicht wird zunächst der zuletzt beobachtete Wert subtrahiert und anschließend wieder zur Vorhersage addiert.
Dieser einfache Mechanismus hilft dabei, Verteilungsverschiebungen und wechselnde Niveaus innerhalb der Zeitreihe besser zu behandeln.
NLinear ist leichtgewichtig, schnell und häufig konkurrenzfähig gegenüber deutlich größeren Deep-Learning-Architekturen. Das Modell gilt als starke Baseline für langfristige Forecasting-Aufgaben und wird oft gemeinsam mit DLinear und RLinear betrachtet. 

RLinear ist eine robuste lineare Forecasting-Architektur aus der Familie effizienter linearer Zeitreihenmodelle. Der Fokus liegt auf stabilen langfristigen Prognosen bei minimaler architektonischer Komplexität.
Das Modell zeigt, dass sorgfältige Normalisierung, Residualdesign und einfache lineare Transformationen in vielen Benchmark-Szenarien mit deutlich komplexeren neuronalen Architekturen konkurrieren können.
RLinear ist sowohl als praktische Baseline als auch als Beispiel für die Vorteile einfacher Modellstrukturen relevant. 

CARD ist eine moderne Forecasting-Architektur für Zeitreihen mit Schwerpunkt auf verbessertem Repräsentationslernen für langfristige Prognosen.
Das Modell zielt darauf ab, komplexe zeitliche Abhängigkeiten zu erfassen und gleichzeitig ausreichend effizient für praktische Anwendungen zu bleiben.
CARD gehört zur Gruppe neuer Deep-Forecasting-Modelle, die Genauigkeit, Skalierbarkeit und Robustheit in Einklang bringen möchten, und wird häufig gemeinsam mit anderen effizienten Nicht-Transformer-Architekturen eingeordnet. 

TSMixer ist eine leichtgewichtige Forecasting-Architektur, inspiriert vom MLP-Mixer-Konzept aus Computer Vision.
Anstelle von Attention-Mechanismen verwendet das Modell Multi-Layer-Perceptrons, um Informationen entlang der Zeit- und Feature-Dimensionen zu mischen. Dadurch entstehen effiziente und skalierbare Forecasting-Modelle mit vergleichsweise geringem Rechenaufwand.
TSMixerx erweitert diesen Ansatz um exogene Variablen und zusätzliche Kovariaten wie Kalenderinformationen, Wettersignale oder produktspezifische Metadaten. Dadurch eignet sich das Modell besser für industrielle Forecasting-Anwendungen.
Die TSMixer-Familie zeigt, dass sorgfältig entwickelte MLP-basierte Architekturen leistungsfähige Forecasts liefern können, während sie gleichzeitig deutlich einfacher und effizienter bleiben als viele transformerbasierte Modelle. 

TimeMixer ist eine verwandte Architektur, die zeitliche Segmente oder Patches mithilfe spezieller Mixing-Schichten kombiniert.
Ziel ist es, lokale und globale Muster effizient gemeinsam zu modellieren, indem Informationen über unterschiedliche Segmente hinweg gemischt werden. Dadurch können Trainingskosten reduziert werden, ohne die Forecasting-Qualität wesentlich zu verschlechtern.
TimeMixer gehört zur breiteren Familie von Modellen, die schwere Attention-Mechanismen durch effizientere Mixing-Operationen ersetzen möchten. 

TiDE ist eine neuronale Forecasting-Architektur mit dichter Encoder-Decoder-Struktur, die bewusst auf vergleichsweise einfache Bausteine statt komplexer Transformer-Komponenten setzt.
Der Fokus liegt auf Effizienz und gleichzeitig starker Leistung bei praxisnahen Forecasting-Aufgaben. TiDE kann mehrere Kovariaten und lange Eingabefenster verarbeiten und bleibt dabei relativ leichtgewichtig.
Dadurch eignet sich das Modell besonders für industrielle Deployments, bei denen Latenz und Ressourcenverbrauch wichtig sind. 

SOFTS (Series Core Fused Time Series Forecaster) ist ein effizientes MLP-basiertes Modell für multivariate Zeitreihenprognosen.
Es verwendet ein sogenanntes STAR-Modul, um Wechselwirkungen zwischen mehreren Zeitreihen zu erfassen und gleichzeitig die Architektur leichtgewichtig zu halten.
SOFTS wurde für skalierbares Long-Horizon-Forecasting entwickelt und eignet sich besonders für Szenarien, in denen viele verwandte Variablen effizient gemeinsam modelliert werden müssen.
Das Modell gehört zur modernen Familie effizienter MLP- und neuronaler Forecasting-Architekturen und nicht zu den klassischen Foundation-Modellen. 

4. Deep-Learning- und KI-Modelle
4.10 Konvolutionale, frequenzbasierte und effiziente neuronale Modelle

ModernTCN ist eine moderne Weiterentwicklung temporaler Convolutional-Network-Architekturen für leistungsfähiges Long-Horizon-Forecasting.
Das Modell greift konvolutionale Zeitreihenmodellierung erneut auf und kombiniert sie mit modernen Designentscheidungen wie größeren rezeptiven Feldern, verbesserter Normalisierung und effizientem Channel-Mixing.
Im Vergleich zu Transformer-Modellen bietet ModernTCN häufig bessere Recheneffizienz und kann dennoch langfristige zeitliche Abhängigkeiten zuverlässig erfassen.
Das Modell ist besonders relevant, weil es zeigt, dass konvolutionale Ansätze auch im modernen Forecasting weiterhin hoch konkurrenzfähig sind. 

SCINet ist ein neuronales Forecasting-Modell, das auf Sample-Convolution- und Interaktionsmechanismen basiert.
Die Zeitreihe wird rekursiv in Teilsequenzen zerlegt, zwischen denen das Modell Interaktionen lernt. Dadurch können sowohl lokale als auch globale zeitliche Strukturen erfasst werden.
SCINet eignet sich besonders für langfristige Forecasting-Aufgaben, bei denen hierarchische zeitliche Muster eine wichtige Rolle spielen.
Das Modell gehört zu einer Gruppe effizienter Deep-Learning-Architekturen, die weder klassische RNNs noch Standard-Transformer verwenden. 

MICN ist ein Multi-Scale-Convolutional-Network für Zeitreihenprognosen.
Das Modell wurde entwickelt, um sowohl lokale kurzfristige Muster als auch globale langfristige Abhängigkeiten über unterschiedliche konvolutionale Skalen hinweg zu erfassen.
Dadurch eignet sich MICN besonders für Zeitreihen mit gemischten Periodizitäten oder Mustern auf verschiedenen zeitlichen Auflösungen.
Das Modell repräsentiert die Familie multiskaliger konvolutionaler Forecasting-Architekturen. 

FiLM ist ein frequenzverbessertes Modell für langfristige Zeitreihenprognosen.
Der Schwerpunkt liegt auf der Erkennung wichtiger Frequenzkomponenten und deren Nutzung zur Verbesserung langfristiger Extrapolationen.
Das Modell ist besonders hilfreich bei Daten mit starken zyklischen oder periodischen Strukturen, die sich im Frequenzraum leichter darstellen lassen.
FiLM ergänzt Architekturen wie FEDformer oder andere frequenzbewusste Modelle, ist jedoch typischerweise leichtergewichtig und stärker spezialisiert. 

FreTS ist ein neuronales Forecasting-Modell, das im Frequenzbereich arbeitet und spektrale Darstellungen nutzt, um zeitliche Abhängigkeiten zu erfassen.
Anstatt sämtliche Muster direkt im Zeitbereich zu modellieren, lernt das Modell Beziehungen zwischen transformierten Frequenzkomponenten.
Dies kann insbesondere bei periodischen oder quasi-periodischen Zeitreihen effizient und leistungsfähig sein.
FreTS ergänzt transformer- und konvolutionsbasierte Ansätze sinnvoll und verdeutlicht die zunehmende Bedeutung frequenzbasierter Modellierung im modernen Forecasting. 

4. Deep-Learning- und KI-Modelle
4.11 Funktionale, dynamische und graphbasierte Modelle

KANs sind neuronale Netzwerke, die auf dem Kolmogorov-Arnold-Darstellungssatz basieren. Dieser besagt, dass multivariate stetige Funktionen als Kombinationen univariater Funktionen und deren Kompositionen dargestellt werden können.
Anstelle klassischer linearer Schichten verwenden KANs lernbare Basisfunktionen und splineähnliche Operationen.
Für Zeitreihenprognosen können KANs komplexe nichtlineare Zusammenhänge mit vergleichsweise wenigen Parametern modellieren und bieten potenziell bessere Interpretierbarkeit als klassische Multi-Layer-Perceptrons.
Sie gelten daher als vielversprechende Alternative zu traditionellen MLP-Architekturen. 

Koopa ist ein Forecasting-Modell, das von der Koopman-Operatortheorie inspiriert wurde. Ziel dieser Theorie ist es, nichtlineare Dynamiken in einen Raum zu überführen, in dem sich ihre Entwicklung linearer und damit leichter prognostizierbar verhält.
Dadurch besitzt Koopa eine starke theoretische Verbindung zur Dynamik komplexer Systeme.
Das Modell eignet sich besonders für Zeitreihen mit stark nichtlinearem Verhalten, bei denen klassische lineare Modelle zu einfach und vollständig Black-Box-basierte Ansätze schwer interpretierbar sind.
Koopa gehört zur modernen Familie effizienter neuronaler Forecasting-Modelle. 

StemGNN ist eine Graph-Neural-Network-Architektur für multivariate Zeitreihenprognosen, die zeitliche Modellierung mit gelernten Abhängigkeitsgraphen zwischen verschiedenen Zeitreihen kombiniert.
Das Modell erfasst gleichzeitig zeitliche Dynamiken und Beziehungen zwischen Variablen, indem spektrales Graphlernen mit Sequenz-Forecasting-Komponenten integriert wird.
Dadurch kann StemGNN komplexe Wechselwirkungen zwischen korrelierten Zeitreihen, beispielsweise Sensorsystemen, Finanzinstrumenten oder Energiesystemen, deutlich besser modellieren als voneinander unabhängige Forecasting-Modelle.
StemGNN eignet sich besonders für hochdimensionale multivariate Forecasting-Probleme, bei denen die Beziehungen zwischen Variablen eine zentrale Rolle spielen. 

5. Probabilistische und unsicherheitsorientierte Methoden

Conformal Prediction bietet einen allgemeinen Ansatz zur Konstruktion von Prognoseintervallen mit garantierter Abdeckungswahrscheinlichkeit, wobei lediglich die Austauschbarkeit der Daten vorausgesetzt wird.
Im Zeitreihenkontext wird das Verfahren häufig auf bestehende Punktprognosemodelle angewendet, indem aktuelle Residuen analysiert werden. Dadurch können sich Prognoseintervalle dynamisch an veränderte Volatilität oder Regimewechsel anpassen.
Der größte Vorteil liegt darin, dass Conformal Prediction modellagnostisch ist und gleichermaßen mit klassischen statistischen Verfahren, Machine-Learning-Modellen oder Deep-Learning-Architekturen kombiniert werden kann. 

DeepFactor kombiniert globale neuronale Netzwerke mit lokalen Zustandsraummodellen, um sowohl gemeinsame Muster über viele Zeitreihen hinweg als auch individuelle Besonderheiten einzelner Reihen zu erfassen.
Das globale Netzwerk lernt latente Faktoren, während die lokale Komponente spezifische Dynamiken einzelner Zeitreihen modelliert. Dadurch entstehen flexible probabilistische Forecasts für große Mengen verwandter Zeitreihen.
Das Modell eignet sich besonders für Bereiche wie Retail oder Supply Chain, in denen Tausende Produkte gemeinsame Verhaltensmuster aufweisen. 

Gaussian Process Regression modelliert keine festen Parameter, sondern Wahrscheinlichkeitsverteilungen über Funktionen. Diese werden durch eine Mittelwertfunktion und einen Kovarianzkernel definiert.
Für Zeitreihenprognosen können Kernelfunktionen Annahmen wie glatte Trends oder periodische Saisonalitäten abbilden. Das Modell erzeugt für jeden zukünftigen Zeitpunkt eine gaußsche Wahrscheinlichkeitsverteilung und liefert dadurch natürliche und konsistente Unsicherheitsabschätzungen.
Die Unsicherheit steigt automatisch in Bereichen mit wenigen oder verrauschten Daten. Gaussian Processes sind sehr flexibel und interpretierbar, skalieren jedoch schlecht bei langen Zeitreihen oder sehr großen Datenmengen. Daher eignen sie sich besonders für mittelgroße Probleme oder in Kombination mit Sparse-Approximationen. 

Bayesian-Deep-Learning-Ansätze erweitern neuronale Netze um Unsicherheitsabschätzungen anstelle reiner Punktprognosen.
Beim Monte-Carlo-Dropout bleibt Dropout auch während der Vorhersage aktiv. Mehrere Vorwärtsdurchläufe erzeugen unterschiedliche Prognosen, deren Streuung als Maß für Modellunsicherheit interpretiert wird.

Deep Ensembles trainieren mehrere unabhängige neuronale Netze, wobei die Varianz ihrer Prognosen als Unsicherheitsmaß dient.
Beide Verfahren lassen sich relativ einfach auf bestehende Architekturen anwenden und machen aus klassischen Deep-Forecasting-Modellen probabilistische Systeme. Häufig profitieren die resultierenden Unsicherheitsintervalle jedoch zusätzlich von einer nachgelagerten Kalibrierung, beispielsweise durch Conformal Prediction. 

Bayesian Structural Time Series Modelle kombinieren Trend-, Saison-, Regressions- und Interventionseffekte innerhalb eines bayesianischen Zustandsraumframeworks.
Sie erzeugen vollständige Posteriorverteilungen für Forecasts und eignen sich zusätzlich für Kausalanalysen, etwa zur Bewertung von Kampagnen oder Interventionen.
BSTS-Modelle sind gut interpretierbar, da jede Modellkomponente eine klare inhaltliche Bedeutung besitzt. Gleichzeitig liefert die bayesianische Inferenz glaubwürdige Unsicherheitsintervalle.
Die Modelle werden häufig in Marketing, Wirtschaft und Business Analytics eingesetzt, wo Erklärbarkeit ebenso wichtig ist wie Prognosegenauigkeit. 

Quantile Forecasting prognostiziert gezielt bestimmte Punkte der zukünftigen Wahrscheinlichkeitsverteilung, beispielsweise das 10., 50. Oder 90. Perzentil, anstatt nur einen einzelnen Mittelwert vorherzusagen.
Dadurch lassen sich Prognoseintervalle und asymmetrische Risikobewertungen direkt ableiten. Viele moderne Modelle, darunter Gradient-Boosting-Verfahren oder Foundation-Modelle wie Moirai 2.0, nutzen Quantilziele für probabilistische Forecasts.
Quantile Forecasting ist besonders relevant in geschäftlichen Anwendungen, in denen Über- und Unterprognosen unterschiedliche wirtschaftliche Konsequenzen haben. 

Distributional Forecasting sagt vollständige Wahrscheinlichkeitsverteilungen zukünftiger Werte voraus und nicht nur Punktprognosen oder einzelne Quantile.
Je nach Datentyp können Modelle gaußsche, Student-t-, negative binomiale, Misch- oder andere likelihoodbasierte Verteilungen erzeugen.
Dieser Ansatz ist typisch für probabilistische Deep-Learning-Modelle wie DeepAR oder Architekturen auf Basis von Amazon GluonTS.
Distributional Forecasting ist besonders wertvoll für Anwendungen mit Risikoanalysen, Service-Level-Planung oder Simulation zukünftiger Szenarien. 

Deep State Space Models kombinieren neuronale Netzwerke mit klassischen latenten Zustandsraummodellen.
Neuronale Komponenten lernen komplexe nichtlineare Übergänge oder Beobachtungsfunktionen, während die Zustandsraumstruktur zeitliche Konsistenz sowie probabilistische Unsicherheitsabschätzungen liefert.
Dadurch eignen sich diese Modelle besonders für multivariate, verrauschte oder teilweise beobachtete Zeitreihen.
Sie verbinden die Flexibilität moderner Deep-Learning-Ansätze mit der probabilistischen Struktur und Disziplin klassischer Zustandsraummodelle. 

6. Frameworks, Bibliotheken und Tools
6.1 Allgemeine Forecasting-Frameworks

Darts ist eine Python-Bibliothek, die eine einheitliche Schnittstelle für zahlreiche Forecasting-Modelle bereitstellt, darunter ARIMA, ETS, N-BEATS, TFT, PatchTST und viele weitere.
Die Bibliothek vereinfacht Experimente durch konsistente APIs für Training, Backtesting und Ensemblebildung. Dadurch können klassische statistische Verfahren, Machine-Learning-Modelle und Deep-Learning-Ansätze schnell auf denselben Daten verglichen werden.
Darts eignet sich besonders gut für den Aufbau vollständiger End-to-End-Forecasting-Workflows. 

sktime ist ein an scikit-learn angelehntes Framework für Zeitreihenanalyse in Python. Es unterstützt Forecasting, Klassifikation und Transformation von Zeitreihen über eine einheitliche API.
Mit sktime lassen sich klassische statistische Modelle und Machine-Learning-Verfahren benchmarken, Pipelines aufbauen und bestehende scikit-learn-Werkzeuge integrieren.
Das Framework eignet sich besonders für systematische Modellvergleiche und reproduzierbare Experimente. 

Kats ist ein universelles Toolkit für Zeitreihenanalyse, entwickelt von Meta.
Die Plattform bündelt Forecasting-Modelle, Verfahren zur Anomalie- und Change-Point-Erkennung, Feature-Extraktion sowie Simulationstools in einer gemeinsamen Schnittstelle.
Für Forecasting bietet Kats unter anderem Wrapper für Modelle wie Prophet, ARIMA und verschiedene Ensemble-Strategien sowie Integrationen mit NeuralProphet.
Besonders nützlich ist Kats für explorative Zeitreihenanalysen, bei denen Forecasting mit Diagnostikfunktionen wie Anomalieerkennung, Strukturbruchanalyse oder Feature-Extraktion kombiniert wird. 

Merlion ist eine Time-Series-Intelligence-Bibliothek, die ursprünglich von Salesforce entwickelt wurde.
Die Bibliothek unterstützt Forecasting, Anomalieerkennung und Modellevaluierung über eine konsistente Schnittstelle.
Merlion eignet sich besonders für praxisnahe Systeme, in denen Forecasting nur ein Bestandteil eines umfassenderen Monitoring- oder Entscheidungsprozesses ist.
Besonders relevant ist das Framework für operative Zeitreihen, Infrastrukturüberwachung und automatisierte Anomalieerkennung. 

aeon ist ein modernes Python-Toolkit für Machine Learning auf Zeitreihen. Es unterstützt Forecasting, Klassifikation, Regression, Clustering, Anomalieerkennung und Transformationen von Zeitreihen.
Das Framework führt Konzepte früherer sktime-ähnlicher Ökosysteme weiter und erweitert sie mit Fokus auf modulare und reproduzierbare Zeitreihen-Workflows.
aeon eignet sich besonders für Teams, die ein breites Toolkit für unterschiedlichste Zeitreihenaufgaben benötigen und nicht nur eine reine Forecasting-Bibliothek suchen. 

6. Frameworks, Bibliotheken und Tools
6.2 Statistische und Machine-Learning-Forecasting-Bibliotheken

StatsForecast ist eine Python-Bibliothek, die auf schnelle und skalierbare klassische Forecasting-Methoden wie ARIMA, ETS, Theta oder Croston-Varianten spezialisiert ist.
Durch optimierten kompilierten Code und Parallelisierung können Modelle effizient auf sehr großen Mengen von Zeitreihen trainiert werden, wodurch sich die Bibliothek besonders für industrielle Anwendungen mit Tausenden oder Millionen von Zeitreihen eignet.
StatsForecast bietet automatische Modellauswahl sowie Prognoseintervalle und wird häufig sowohl für starke statistische Baselines als auch für produktive Forecasting-Systeme eingesetzt.
Die Bibliothek lässt sich gut mit modernen Deep-Learning-Frameworks kombinieren und unterstützt dadurch hybride Pipelines aus klassischen und neuronalen Modellen. 

MLForecast ist eine Bibliothek für Machine-Learning-basiertes Zeitreihen-Forecasting mit tabellarischen Modellen wie LightGBM, XGBoost, CatBoost oder linearen Verfahren.
Die Bibliothek automatisiert die Erstellung von Lag-Features, Rolling-Statistiken und Kalendermerkmalen und hält den gesamten Modellierungsprozess gleichzeitig effizient und skalierbar.
MLForecast eignet sich besonders für große Gruppen verwandter Zeitreihen, bei denen baumbasierte Modelle zusätzliche Informationen wie Artikel-, Standort- oder Kalendermerkmale effektiv nutzen können.
Die Bibliothek ergänzt StatsForecast und NeuralForecast häufig in produktiven Forecasting-Pipelines. 

AutoGluon Time Series ist ein AutoML-Framework für Forecasting, das verschiedene Modellfamilien automatisch trainieren, optimieren und zu Ensembles kombinieren kann.
Das Framework unterstützt statistische Modelle, Machine-Learning-Methoden und Deep-Learning-Architekturen innerhalb eines einheitlichen Workflows.
Der größte Vorteil liegt in der schnellen Entwicklung leistungsfähiger Baselines ohne umfangreiche manuelle Modellauswahl oder aufwendiges Algorithm Engineering.
AutoGluon eignet sich besonders für Teams, die mit begrenztem Entwicklungsaufwand starke Forecasting-Ergebnisse erzielen möchten. 

Orbit ist ein Python-Paket von Uber für bayesianische Zeitreihenmodellierung und Forecasting.
Der Fokus liegt auf strukturellen Modellen mit lokalen und globalen Trends, Saisonalität sowie Regressionskomponenten, die mithilfe bayesianischer Inferenz-Engines wie Stan oder Pyro geschätzt werden.
Orbit bietet einfache Schnittstellen zur Erzeugung vollständiger posteriorer Prognoseverteilungen und ermöglicht dadurch glaubwürdige Unsicherheitsintervalle sowie Analysen im Stil von Causal Impact.
Die Bibliothek eignet sich besonders für Anwendungen, bei denen Interpretierbarkeit und eine realistische Quantifizierung von Unsicherheit ebenso wichtig sind wie reine Prognosegenauigkeit. 

pyts ist ein Python-Paket für Zeitreihenklassifikation, Transformation und Feature-Extraktion.
Die Bibliothek enthält Methoden zur Umwandlung von Zeitreihen in alternative Darstellungen wie Recurrence Plots, Gramian Angular Fields oder Symbolic Aggregate Approximations.
Auch wenn pyts stärker auf Klassifikation und Repräsentationslernen als auf Forecasting fokussiert ist, eignet sich das Paket hervorragend für Vorverarbeitung, Feature Engineering und allgemeine Zeitreihen-ML-Workflows.
pyts erweitert das Tooling-Ökosystem sinnvoll über reine Forecasting-Bibliotheken hinaus. 

6. Frameworks, Bibliotheken und Tools
6.3 Deep-Learning- und Foundation-Model-Frameworks

GluonTS ist ein Deep-Learning-Toolkit für probabilistische Zeitreihenmodellierung, das ursprünglich auf MXNet basierte und inzwischen auch PyTorch integriert.
Die Bibliothek enthält Referenzimplementierungen für Modelle wie DeepAR, DeepState, DeepFactor sowie transformerbasierte Varianten.
Ein besonderer Schwerpunkt liegt auf probabilistischem Forecasting inklusive Prognoseintervallen und Wahrscheinlichkeitsverteilungen.
GluonTS wird sowohl in der Forschung als auch in industriellen Projekten für großskalige Forecasting-Anwendungen eingesetzt. 

NeuralForecast ist eine Bibliothek mit Fokus auf moderne Deep-Learning-Modelle für Forecasting, darunter N-BEATS, N-HiTS, PatchTST, TimesNet, TFT und viele weitere Architekturen.
Die Implementierungen sind auf GPUs und große Datensätze optimiert und lassen sich gut in typische Python-Data-Science-Workflows integrieren.
Zusätzlich bietet die Bibliothek Werkzeuge für Evaluierung, Hyperparameteroptimierung und Modellvergleich.
NeuralForecast eignet sich besonders für Anwender, die moderne Deep-Forecasting-Modelle produktiv einsetzen möchten, ohne eigene Implementierungen entwickeln zu müssen. 

PyTorch Forecasting ist eine High-Level-Bibliothek auf Basis von PyTorch Lightning, die das Training fortgeschrittener Deep-Learning-Modelle für Zeitreihen deutlich vereinfacht.
Die Bibliothek unterstützt unter anderem Temporal Fusion Transformer, DeepAR sowie generische Seq2Seq-Architekturen.
Sie bietet komfortable Datenabstraktionen, automatische Verarbeitung von Kovariaten und Zeitindizes sowie integrierte Werkzeuge für Backtesting und Hyperparameteroptimierung.
Zusätzlich enthält PyTorch Forecasting Funktionen zur Interpretierbarkeit, beispielsweise zur Visualisierung von Attention-Gewichten oder Feature-Importances bei TFT-Modellen.
Dadurch reduziert die Bibliothek den Boilerplate-Code erheblich und ermöglicht einen schnellen Übergang von Rohdaten zu trainierten Forecasting-Modellen. 

Nixtla ist ein modernes Forecasting-Ökosystem, das Werkzeuge wie StatsForecast, MLForecast, NeuralForecast und TimeGPT umfasst.
Das Ökosystem bietet skalierbare Implementierungen für klassische statistische Verfahren, Machine-Learning-Modelle, Deep-Learning-Architekturen und Foundation-Model-basiertes Forecasting.
Besonders stark ist Nixtla im produktiven Einsatz, da Geschwindigkeit, Backtesting, Cross-Validation und saubere APIs im Mittelpunkt stehen.
Nixtla ist deshalb besonders relevant, weil mehrere der bereits genannten Bibliotheken direkt aus diesem Ökosystem stammen oder damit integriert werden können. 

tsai ist eine Deep-Learning-Bibliothek für Zeitreihenklassifikation, Regression und Forecasting, die auf PyTorch sowie den Konzepten von fastai basiert.
Die Bibliothek stellt zahlreiche moderne neuronale Architekturen und komfortable Trainingswerkzeuge für zeitliche Daten bereit.
tsai eignet sich besonders dann, wenn Forecasting Teil eines umfassenderen Machine-Learning-Workflows für Zeitreihen ist.
Besonders attraktiv ist die Bibliothek für Anwender, die bereits mit dem fastai-Ökosystem vertraut sind. 

Die Time Series Library, meist als TSLib bezeichnet, ist ein weit verbreitetes Open-Source-Benchmark- und Forschungsframework für Deep-Learning-basierte Zeitreihenanalyse und Forecasting.
Das Framework bietet standardisierte Implementierungen moderner Architekturen wie Informer, Autoformer, FEDformer, PatchTST, TimesNet oder iTransformer innerhalb einer einheitlichen Experimentierumgebung.
TSLib ist besonders wichtig für reproduzierbare Benchmarks, vergleichende Forschung und schnelle Experimente mit State-of-the-Art-Forecasting-Modellen.
In der akademischen Forschung hat sich TSLib zu einem zentralen Referenzökosystem für moderne Zeitreihenarchitekturen entwickelt. 

6. Frameworks, Bibliotheken und Tools
6.4 Foundation-Model-Ökosysteme und Plattformen

TSFM (IBM Granite Time Series Foundation Models Toolkit) ist ein Framework von IBM, das Code, Notebooks und Hilfswerkzeuge für die Arbeit mit Foundation-Modellen für Zeitreihen wie TinyTimeMixer bereitstellt.
Das Toolkit unterstützt Aufgaben wie Zero-Shot-Forecasting, Fine-Tuning und Deployment vortrainierter Zeitreihenmodelle.
Besonders relevant ist TSFM, weil es den Übergang von Forschungsmodellen zu praktischen Produktionsworkflows erleichtert.
Innerhalb moderner Foundation-Model-Ökosysteme gehört es in dieselbe Kategorie wie Darts, GluonTS oder NeuralForecast. 

Hugging Face Time Series Models bezeichnet das wachsende Ökosystem vortrainierter Forecasting- und Zeitreihenmodelle innerhalb der Plattform von Hugging Face.
Es umfasst Foundation-Modelle, Transformer-Architekturen und probabilistische Forecasting-Modelle, die über standardisierte APIs und Model-Hubs geteilt, feinjustiert und deployt werden können.
Das Ökosystem ermöglicht Forschern und Unternehmen den Zugriff auf moderne Zeitreihenmodelle mit ähnlichen Workflows wie in Natural Language Processing oder Computer Vision.
Besonders wichtig ist die Plattform für Open-Model-Sharing, Reproduzierbarkeit sowie die Integration von Zeitreihen-Foundation-Modellen in multimodale KI-Pipelines. 

BigQuery TimesFM ist die von Google Cloud bereitgestellte Integration des Foundation-Forecasting-Modells TimesFM innerhalb des BigQuery-Ökosystems.
Damit können großskalige Zero-Shot- und Few-Shot-Zeitreihenprognosen direkt in cloudbasierten Analyseworkflows durchgeführt werden, ohne Forecasting-Modelle manuell trainieren zu müssen.
Die Integration verbindet die Skalierbarkeit von BigQuery mit den Fähigkeiten vortrainierter Foundation-Modelle und macht moderne Forecasting-Technologien innerhalb SQL-basierter Datenpipelines und Enterprise-Analytics-Umgebungen zugänglich.
BigQuery TimesFM ist besonders relevant für industrielle Forecasting-Anwendungen mit hohen Anforderungen an Skalierbarkeit, Cloud-Integration und geringe operative Komplexität. 

Uni2TS ist ein universelles Framework für Zeitreihenmodellierung, das eng mit der Moirai-Modellfamilie verbunden ist.
Das Framework stellt Infrastruktur und Modellkomponenten für Aufbau, Training und Evaluierung vortrainierter Zeitreihenmodelle über unterschiedliche Datensätze und Forecasting-Szenarien hinweg bereit.
Uni2TS ist nicht nur als Modellökosystem relevant, sondern auch als praktisches Forschungsframework für Foundation-Model-basiertes Forecasting.
Es ergänzt die Moirai-Familie sinnvoll, da beide denselben Ansatz universeller und übertragbarer Zeitreihenmodellierung verfolgen. 

6. Frameworks, Bibliotheken und Tools
6.5 Benchmarks, Datensätze und Evaluierung

GIFT Eval ist ein Benchmark-System zur Evaluierung von Foundation-Modellen für Zeitreihen über unterschiedliche Datensätze, Datenfrequenzen und Forecasting-Szenarien hinweg.
Der Benchmark ist besonders wichtig, weil Foundation-Modelle nicht nur auf einzelnen Spezialdatensätzen bewertet werden sollten, sondern hinsichtlich ihrer tatsächlichen Generalisierungsfähigkeit über verschiedene Domänen hinweg.
Modelle wie Moirai, Chronos oder TimesFM werden häufig auf umfangreichen Benchmark-Suites dieser Art verglichen.
GIFT Eval ist daher primär als Evaluierungs- und Benchmark-Ressource einzuordnen und nicht als Forecasting-Bibliothek. 

Das Monash Time Series Forecasting Repository ist eine weit verbreitete Sammlung von Benchmark-Datensätzen für Forecasting-Forschung.
Die Plattform enthält Zeitreihen aus zahlreichen Domänen mit unterschiedlichen Frequenzen und Forecasting-Horizonten und eignet sich dadurch hervorragend zum Vergleich verschiedener Algorithmen unter realistischen und heterogenen Bedingungen.
Viele moderne Forecasting-Publikationen verwenden Datensätze aus diesem Repository zur Bewertung der Generalisierungsfähigkeit ihrer Modelle.
Das Repository gilt als zentrale Ressource für reproduzierbare Benchmarks und gehört zu den wichtigsten Datensatzsammlungen im Forecasting-Bereich. 

TFB, kurz für Time Series Forecasting Benchmark, ist ein Benchmarking- und Evaluierungsframework für den systematischen Vergleich von Forecasting-Modellen über unterschiedliche Datensätze, Prognosehorizonte und zeitliche Domänen hinweg.
Das Framework stellt standardisierte Datensätze, Evaluierungsprotokolle und reproduzierbare Experimentierumgebungen bereit, um statistische Modelle, Machine-Learning-Verfahren, Deep-Learning-Architekturen und moderne Foundation-Modelle vergleichbar zu machen.
Besonders wertvoll ist TFB für die Bewertung der Generalisierungsfähigkeit von Forecasting-Ansätzen unter heterogenen realen Bedingungen und nicht nur auf isolierten Benchmark-Datensätzen.
TFB gehört damit gemeinsam mit GIFT Eval und dem Monash Time Series Forecasting Repository zu den wichtigsten Ressourcen im Bereich Benchmarking und Evaluierung moderner Forecasting-Systeme. 

6. Frameworks, Bibliotheken und Tools
6.6 KI-gestützte Forecasting- und Copilot-Systeme

TimeCopilot ist ein KI-gestütztes Framework für automatisierte Zeitreihenanalyse, Forecasting und Entscheidungsunterstützung. Es kombiniert Large Language Models mit statistischen und Machine-Learning-basierten Forecasting-Pipelines.
Das System unterstützt Anwender bei Aufgaben wie Modellauswahl, Feature Engineering, Anomalieerkennung, Interpretation von Forecasts und Szenarioanalysen über natürliche Sprachinteraktion.
Durch die Verbindung klassischer Forecasting-Workflows mit konversationellen KI-Fähigkeiten steht TimeCopilot exemplarisch für den Wandel hin zu intelligenten Forecasting-Assistenten und KI-gestützten Analytics-Systemen.
Besonders relevant ist TimeCopilot für Unternehmen, die fortgeschrittene Forecasting-Prozesse auch für Anwender ohne tiefes Data-Science-Know-how zugänglich machen möchten. 

Mobirise Website Builder