Machine Learning in der aktuariellen Risikomodellierung
Künstliche Intelligenz im Risikomanagement 15. FaRis & DAV Symposium
Dr. Zoran Nikolić, B&W Deloitte; Prof. Dr. Christian Weiß, Hochschule Ruhr West, B&W Deloitte
Machine Learning in der Risikomodellierung
• Risikomodellierung• Stochastische Unternehmensmodelle bestehend aus:
• Kapitalmarktmodell (ökonomisches Umfeld)• Aktivmodell (Kapitalanlagenseite)• Passivmodell (Passivseite, Versicherungsverträge)• Managementmodell (Überschussverwendung,
Notstandsmaßnahmen, etc.)
• Machine Learning• allgemein: Maschinelle Generierung von Wissen aus
Erfahrung & Daten• konkret: Methoden der Programmierung von
Lernalgorithmen• häufig als Teilgebiet der künstlichen Intelligenz klassifiziert
ökonomischer Szenario-Generator (ESG):
Entwicklung von Zinsen, Aktien Returns, usw. Kapitalmarktszenarien
Passiv-Modell Aktiv-Modell
• LV-Produkte
• Explizite RfB
• Optionen u.Garantien
• Asset-Klassen
• Strategische
Asset Allokation
AktionärVN
Messung und Bewertung der Risiken
dynamische Anpassung der SAA
Deklaration derÜberschussbeteiligung
Management Regeln
Überschussbeteiligung
FaRis, 06.12.2019 2
Bestimmung des SCR-Bedarfs mittels Nested Stochastics (1/2)
1
2
3
4
Bestimmung und Modellierung der Risikotreiber
Bestimmung der Eigenmittel in t=1 (Millionen Szenarien)
Generierung der Real World Szenarien
Bestimmung des Risikokapitals
SCR
t=0
Erwartung Own Funds
Wah
rschein
lichkeitsv
erte
ilun
g
der O
wn
Fu
nd
s
W‘keit: 0,5%
1
3
2
4
W‘keit: 99,5%
t=1
1.000.000 PVFPs
MVA
OF
RM
BEL
Ausgangspunkt:
ökonom. Bilanz
zu t=0
FaRis, 06.12.2019
Bestimmung des SCR-Bedarfs mittels Nested Stochastics (2/2)
• Mehrdimensionaler Input (also nRisikofaktoren im Risikomodell):
Zins-Veränderungen, 𝑥1 Aktienentwicklung 𝑥2 Spread-Ausweitung 𝑥3 Sterblichkeit 𝑥4 Kosten 𝑥5 … 𝑥𝑛
• Output:
Veränderungen der Own Funds für jede Kombination von Risikofaktoren als Ausgabe des Projektionstools
Ein Szenario wird durch einen Vektor (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ ℝ𝑛 der Risikofaktoren
definiert
Für jedes Szenario werden die Own Funds OF(𝑥1, 𝑥, … , 𝑥𝑛) ∈ ℝ mithilfe von Monte-Carlo-Simulationen gerechnet
FaRis, 06.12.2019 4
Erzeugung von Regressionsszenarien(~25,000) von gleichmäßig verteilten Ein-Jahres-Entwicklungen der Risikotreiber
Durchführung weniger ALM-Projektionen und Berechnung von 25.000 Own-Funds-Schätzern
Regression eines multi-dimensionalen Polynoms, der “LSMC-Funktion” für die PVFPs
Jedes Szenario
beinhaltet
Veränderungen
aller Risikotreiber
……
~25,000 1-Jahres-Realisierungen Vereinfachte ALM-Berechnungen(jeweils 2 risikoneutrale Szenarien)
OF-Schätzer
~25,000 1-Jahres-Realisierungen
Validierung der LSMC-Funktion, z.B. durch out-of-sample-Tests
Polynom
Schätzwerte
Risikotreiber, z.B. Aktienkurs
PVFP
+10%
-20% -10% Best Estimate +10% +20%
0%
-10%
-20%
+20%
0,0
0,2
0,4
0,6
0,8
1,0
1,2
1,4
-1 -0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 1
Mil
lia
rde
n
Validierung
Schätzung
2 a
2
2
2
b
c d
Least Squares Monte Carlo Methode (1/2)
FaRis, 06.12.2019
PVFP-2
LS
MC
PVFP-1
PVFP-3PVFP-4PVFP-5PVFP-6PVFP-7PVFP-8
~1.000.000 1-Jahres-Realisierungen
Simulation der gemeinsamen Risikotreiberverteilung Auswertung der LSMC-Funktion
Bestimmung der Own-Funds-Verteilung und SCR-Bestimmung
3 4
4
a
b
Least Squares Monte Carlo Methode (2/2)
FaRis, 06.12.2019
Beschreibung des Regressionsproblems
Kalibrierung/Training:• Ungenaue Daten der abhängigen Variable (Own
Funds) für Berechnung der Regressionsfunktion
25.000 Realisierungen von Einjahres-Szenarien (Sobol-Methodik zur Auswahl)
Je 2 Simulationen
• Genauere Daten der abhängigen Variable (OwnFunds) für Validierung
256 Realisierungen von Einjahres-Szenarien (wieder Sobol)
Out of sample
Je 1.000 Simulationen
Zielgrößen:• 99,5% Value-at-Risk (VaR-Daten)
Real-World-Szenarien um das 99,5 % Quantil der Verlustverteilung
4,000 Simulationen, ziemlich genau
• Erwartung (Basis-Szenario)
Basisauslenkung aller Risikofaktoren
16.000 Simulationen, sehr genau
Die eigentliche Zielgröße ist: SCR = Own-Funds-Erwartung – 99.5% VaR
FaRis, 06.12.2019 7
Simpler Ansatz: Lineare Ausgleichsfunktion
Implementierung:Risikotreiber in Simulation i: 𝑋𝑖 = (𝑋1
𝑖 , … , 𝑋𝑛𝑖 )
Own Funds Werte in Simulation i: OFi
Algorithmus: Wähle 𝛽 = (𝛽0, 𝛽1, 𝛽2, … , 𝛽𝑛), sodass
min 𝑋𝛽 − 𝑂𝐹minimiert wird.
Ergebnis:Linearer Schätzer für die Own Funds
𝑂𝐹𝐿𝑖𝑛 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 +⋯+ 𝛽𝑛𝑥𝑛
FaRis, 06.12.2019 8
Ergebnisse (1/5)
Methodik Company 1 Company 2 Company 3
Lineare Regression (Validierung) -17.8% -0.4% -0.1%
Lineare Regression (Value at Risk) +12.0% +0.9% -3.7%
FaRis, 06.12.2019 9
Erweiterung: Allgemeine lineare Modelle
Erweiterung:
In der Realität beobachtete Zusammenhänge sind oft nicht linear
Beispiel: Komplexe Abhängigkeite der OwnFunds vom Zins (höhere Erträge der Assets vs. Diskontierung)
Mögliche Basisfunktionen:
Polynome: 𝑥𝑖𝑘 , 1 ≤ 𝑖 ≤ 𝑛, 𝑘 ∈ ℕ
Radiale Basisfunktionen, z.B. GaußscheBasisfunktionen
𝜑𝜀 𝑥𝑖 = 𝑒− 𝜀𝑥𝑖2, 𝜀 ∈ ℝ
Wavelets, z.B. Poisson wavelets
𝜓𝑛 𝑥𝑖 =1
2𝜋1 − 𝑖𝑥𝑖
−𝑛+1, 𝑛 ∈ ℕ
Beispiel:Zusätzlich zu den linearen Termen werden quadratische Terme verwendet
𝑂𝐹𝐴𝐿𝑀 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 +⋯+ 𝛽𝑛𝑥𝑛
+𝛾1𝑥12 + 𝛾2𝑥2
2 +⋯+ 𝛾𝑛𝑥𝑛2
(*) Ermittelt mit LSMC-PFFaRis, 06.12.2019 10
Ergebnisse (2/5)
Methodik Company 1 Company 2 Company 3
Lineare Regression (Validierung) -17.8% -0.4% -0.1%
Lineare Regression (Value at Risk) +12.0% +0.9% -3.7%
Auch quadratische Terme (Validierung) -6.8% -0.5% -0.1%
Auch quadratische Terme (Value at Risk) +27.4% +1.6% -2.3%
FaRis, 06.12.2019 11
Praxis: Expertenschätzung
Feststellungen zu linearer Regression:
Lineare Regressionsfunktion berücksichtigt keine Interaktion zwischen den Risikotreibern
Sehr schlechte Abbildung der Own Funds Werte in manchen Bereichen des Raums der Risikotreiber
Idee:Experte passt linearen Schätzer um notwendige Terme an. Die Koeffizienten werden weiterhin mittels Least Squares geschätzt
𝑂𝐹𝐸𝑥𝑝 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 +⋯+ 𝛽𝑛𝑥𝑛
+𝛾12𝑥1𝑥2 + 𝛾35𝑥3𝑥5 + 𝛾1𝑥12
Lineare Regression Expertenschätzung
FaRis, 06.12.2019 12
Ergebnisse (3/5)
Methodik Company 1 Company 2 Company 3
Lineare Regression (Validierung) -17.8% -0.4% -0.1%
Lineare Regression (Value at Risk) +12.0% +0.9% -3.7%
Auch quadratische Terme (Validierung) -6.8% -0.5% -0.1%
Auch quadratische Terme (Value at Risk) +27.4% +1.6% -2.3%
Expertenschätzung (Validierung) -6.6% -0.5% -0.1%
Expertenschätzung (Value at Risk) +20.8% +0.5% -1.7%
FaRis, 06.12.2019 13
Informationstheoretischer Ansatz: AIC
Feststellungen zu Expertenschätzung:
Expertenschätzung ist von Einzelmeinung(en) abhängig – Gefahr der Willkür
Experten können bestehende Zusammenhänge in Daten aufgrund hoher Komplexität übersehen (Underfitting)
Gleichzeitig werden eventuell Zusammenhänge, die gar nicht existieren, in Daten hineininterpretiert (Overfitting)
Idee:Ersetze Expertenmeinung durch Algorithmus zur Wahl der Polynomterme
Underfitting Overfitting
Realität
FaRis, 06.12.2019 14
Akaike Informationskriterium (AIC)
Klassische Statistik: Schätze den unbekannten Parameter einer bekannten Verteilung, z.B. die Varianz einer normalverteilten Zufallsvariable
Bei LSMC-Regression jedoch: Schätze die unbekannten Koeffizienten eines unbekannten Polynoms
Es sind also zwei simultane Aufgaben zu erledigen: Finde bestes Polynom und gleichzeitig dessen Koeffizienten
Das Akaike Informationskriterium AIC vergleicht die Güte des Fits unterschiedlicher Modelle
Satz (Akaike, 1973): Das AIC ist ein erwartungstreuer Schätzer für die Kullback-Leibler Divergenz, das heißt, es ist ein Maß dafür wie gut eine gegebene Funktion f mit k Parametern eine andere unbekannte Funktion g annähert. Sind die Fehler der Regression normalverteilt, so gilt
𝐴𝐼𝐶 = 𝑛 log𝑅𝑆𝑆
𝑛+ 2𝑘
FaRis, 06.12.2019 15
Ausgans-
Polynom
(Iteration i)
Identifizierung
möglicher
“Kandidaten
Terme”
STOP
Least Squares
Regression
REGRESSION
Versuche jedes “Kandidaten-Modell” d.h. jeder Term der möglichen Kandidaten wird getestet indem
der Term zum Polynom hinzugefügt wird. Multiple Regression - jedes mal wird nur ein einziger
weiterer Term hinzugefügt
Ist AIC
kleiner?
JA
Füge Term,
welcher kleinstes
AIC erzeugt, hinzu
Neues Polynom
(mit einem
weiteren Term)
i=i+1Polynom
aktualisieren
NEIN
Max
Anzahl
Terme
erreicht?
NEIN
JA
AIC berechnen
0 12
3
Algorithmus zum Auffinden optimaler Polynomstruktur (1/3)
FaRis, 06.12.2019 16
“Kandidaten-Terme” ist die Menge aller Terme die bei jeder Iteration zum Polynom hinzugefügt werden könnten
Regeln werden angewandt um diese “Kandidaten-Terme” auszuwählen
Die “forward stepwise” Routine, also ein mehrstufiges Verfahren, limitiert die Wahl der möglichen “Kandidaten-Terme” bei jedem Schritt der Regression indem das Prinzip der Marginalität oder “principle of marginality” eingehalten wird.
“Ein Kandidaten-Term kann ausschließlich zum Modell hinzugefügt werden, wenn das jeweilige Modell bereits alle Terme enthält, die marginal zum Kandidaten-Term sind”
Die marginalen Terme für eine jeweilig gegebene Menge von “Kandidaten-Termen” sind jeweils deren algebraische Faktoren.
Algorithmus zum Auffinden optimaler Polynomstruktur (2/3)
FaRis, 06.12.2019 17
Algorithmus zum Auffinden optimaler Polynomstruktur (3/3)
Ein Term kann zum Hinzufügen zumModell nur dann in Betracht gezogenwerden, wenn das Modell bereits alleFaktoren des Terms enthält
Beispiel: Modell mit drei Risikofaktoren𝑥1, 𝑥2, 𝑥3. An einem bestimmten Schrittim Modellauswahlprozess besteht dasModell aus:
𝑦 = 𝛽0,0,0 + 𝛽1,0,0𝑥1 + 𝛽0,1,0𝑥2 + 𝛽2,0,0𝑥12
Die marginalen Termine, die zum Modell hinzugefügt werden können, sind dann folgende:
𝑥3, 𝑥1𝑥2, 𝑥22, 𝑥1
3
Es könnte zum Beispiel nicht der Term 𝑥1𝑥3 hinzugefügt werden, es sei denn 𝑥3 wird vorher hinzugefügt
FaRis, 06.12.2019 18
Ergebnisse (4/5)
Methodik Company 1 Company 2 Company 3
Lineare Regression (Validierung) -17.8% -0.4% -0.1%
Lineare Regression (Value at Risk) +12.0% +0.9% -3.7%
Auch quadratische Terme (Validierung) -6.8% -0.5% -0.1%
Auch quadratische Terme (Value at Risk) +27.4% +1.6% -2.3%
Expertenschätzung (Validierung) -6.6% -0.5% -0.1%
Expertenschätzung (Value at Risk) +20.8% +0.5% -1.7%
Informationskriterium AIC (Validierung) -1.6% -0.5% +0.0%
Informationskriterium AIC (Value at Risk) +6.7% -0.9% -1.3%
FaRis, 06.12.2019 19
FaRis, 06.12.2019 20Quelle: Haykin: Neural Networks and Learning Machines, Pearson, 2009
• Ramón y Cajál (1911): Die Idee von Neuronen
• Gehirn als extrem effizienter Rechner
• Nachahmung der Intelligenz
Bildquelle: Wikipedia
Neuronale Netze: Motivation aus der Gehirnforschung
Warren McCulloch & Walter Pitts, 1943
• erste Idee für ein künstliches neuronales Netz, aus verknüpften elementaren Einheiten
• zur Berechnung logischer und arithmetischer Funktionen
Frank Rosenblatt, 1958
• Neurocomputer Marc I Perceptron: Multi-Layer Perceptron
• Idee: Sehr viele Berechnungseinheiten, die erst durch ihre Interaktion „intelligent“ werden
Seitdem ein stetes Auf und Ab: Hypes und Ernüchterungen
Boom seit ca. 10 Jahren durch den enormen Anstieg an Rechenkapazität
Bildquellen: https://ptihiup2018.blogspot.com/2019/07/artifical-neural-network.html & Wikipedia
FaRis, 06.12.2019 21
Neuronale Netze & Deep Learning
FaRis, 06.12.2019
Wikipedia
• Je eine Input- und Output-Schicht• Keine, eine oder mehrere Verarbeitungsschichten
(= versteckte Schichten)• Nicht immer existieren alle Verbindungen zwischen
zwei Schichten• In den Neuronen Verarbeitung mit
Aktivierungsfunktionen:• Tangens Hyperbolicus
• Logistische 𝒇 𝒙, 𝜽 =𝟏
𝟏+𝒆−(𝒙−𝜽)
• Rectified Linear Unit (ReLU) 𝒇 𝒙, 𝜽 = max(𝟎, 𝒙 − 𝜽)• Leaky ReLU 𝒇 𝒙, 𝜽 = max 𝜶 𝒙 − 𝜽 , 𝒙 − 𝜽 , 𝜶 > 𝟎 klein
22
Input – Versteckte Schichten - Output
• Schwierig, da viele verschachtelte Funktionen
• In der Regel grafisch, gelegentlich hilft die Matrixform
• Im Code meistens einfach
FaRis, 06.12.2019 23
Mathematische Darstelung
Die polynomialen Funktionen in und werden durch neuronale Netze ersetzt
Aus LSMC-PF wird LSMC-NN
Die grundsätzliche Methodik bleibt aktuariell und finanzmathematisch unverändert
2 c
2 d
FaRis, 06.12.2019 24
Neuronale Netze für die SCR-Berechnung
Ergebnisse (5/5)
Methodik Company 1 Company 2 Company 3
Lineare Regression (Validierung) -17.8% -0.4% -0.1%
Lineare Regression (Value at Risk) +12.0% +0.9% -3.7%
Auch quadratische Terme (Validierung) -6.8% -0.5% -0.1%
Auch quadratische Terme (Value at Risk) +27.4% +1.6% -2.3%
Expertenschätzung (Validierung) -6.6% -0.5% -0.1%
Expertenschätzung (Value at Risk) +20.8% +0.5% -1.7%
Informationskriterium AIC (Validierung) -1.6% -0.5% +0.0%
Informationskriterium AIC (Value at Risk) +6.7% -0.9% -1.3%
Neuronale Netze (Validierung) +0.2% +0.1% -0.0%
Neuronale Netze (Value at Risk) -1.1% +0.4% +1.0%
FaRis, 06.12.2019 25
26Deloitte 2019
Einfaches Beispiel: Schematische Darstellung der Standardformelberechnung
Vielfältige Erweiterungsmöglichkeiten (1/5)
27Deloitte 2019
Aktiva
Passiva
Own
Funds
SCR
Solvenz
Quote
Parametrisierung des
Asset-Bestandes zur
Darstellung möglicher
Portfolien zum neuen
Stichtag
Fortschreibung
der Passiva zum
neuen Stichtag
Veränderung der Modell-Inputs zur Kennzahlen-Schätzung in der Zukunft
Risikokennzahlen in
Abhängigkeit von
Portfolien und
Kapitalmarktsituation
zum neuen Stichtag
Parametrisierung
möglicher
Kapitalmarkt-
situationen
Vielfältige Erweiterungsmöglichkeiten (2/5)
28Deloitte 2019
Aktiva
Passiva
Own
Funds
SCR
Solvenz
Quote
Vielfältige Erweiterungsmöglichkeiten (3/5)
Solvenzkennzahlen unter dynamischen Bedingungen mit neuronalen Netzen
Verwendung von Machine
Learning Techniken zur
Beschreibung dieser
Abhängigkeiten
29Deloitte 2019
Für neue Stichtagsdaten kann ohne weiteren Rechenaufwand eine Solvenzquote ermittelt werden
Passiva
Aktiva
Fortschreibung
der Passiva
zum neuen
Stichtag
Entwicklung
des
Portfolios
Mögliche Zinskurven
Resultierende SII-Quote
Szenario SII-Quote
… …
Zinsanstieg 182%
… …
Best Estimate 178%
… …
Zinsrückgang 165%
… …
Ergebnis:
Solvenzkennzahlen zum
neuen Stichtag in Ab-
hängigkeit von der zu-
künftigen Entwicklung
der Kapitalmärkte
Vielfältige Erweiterungsmöglichkeiten (4/5)
FaRis, 06.12.2019
Zukünftige Risikosituationen werden für alle möglichen Entwicklungen analysiert um kritische Szenarien zu identifizieren
t=0
Management
Regeln
Passiva
Aktiva
Neuronale Netze
Own
FundsSCR
Solvenz
Quote
Kapital-
markt
Ergebnis:
Solvenzkennzahlen wer-
den für alle denkbaren zu-
künftigen Situationen
berechnet
Neugeschäft
Asset
Portfolio
t=3
Vielfältige Erweiterungsmöglichkeiten (5/5)