Machine Learning in der aktuariellen Risikomodellierung

Machine Learning in der aktuariellen Risikomodellierung

Künstliche Intelligenz im Risikomanagement 15. FaRis & DAV Symposium

Dr. Zoran Nikolić, B&W Deloitte; Prof. Dr. Christian Weiß, Hochschule Ruhr West, B&W Deloitte

Machine Learning in der Risikomodellierung

• Risikomodellierung• Stochastische Unternehmensmodelle bestehend aus:

• Kapitalmarktmodell (ökonomisches Umfeld)• Aktivmodell (Kapitalanlagenseite)• Passivmodell (Passivseite, Versicherungsverträge)• Managementmodell (Überschussverwendung,

Notstandsmaßnahmen, etc.)

• Machine Learning• allgemein: Maschinelle Generierung von Wissen aus

Erfahrung & Daten• konkret: Methoden der Programmierung von

Lernalgorithmen• häufig als Teilgebiet der künstlichen Intelligenz klassifiziert

ökonomischer Szenario-Generator (ESG):

Entwicklung von Zinsen, Aktien Returns, usw. Kapitalmarktszenarien

Passiv-Modell Aktiv-Modell

• LV-Produkte

• Explizite RfB

• Optionen u.Garantien

• Asset-Klassen

• Strategische

Asset Allokation

AktionärVN

Messung und Bewertung der Risiken

dynamische Anpassung der SAA

Deklaration derÜberschussbeteiligung

Management Regeln

Überschussbeteiligung

FaRis, 06.12.2019 2

Bestimmung des SCR-Bedarfs mittels Nested Stochastics (1/2)

1

2

3

4

Bestimmung und Modellierung der Risikotreiber

Bestimmung der Eigenmittel in t=1 (Millionen Szenarien)

Generierung der Real World Szenarien

Bestimmung des Risikokapitals

SCR

t=0

Erwartung Own Funds

Wah

rschein

lichkeitsv

erte

ilun

g

der O

wn

Fu

nd

s

W‘keit: 0,5%

1

3

2

4

W‘keit: 99,5%

t=1

1.000.000 PVFPs

MVA

OF

RM

BEL

Ausgangspunkt:

ökonom. Bilanz

zu t=0

FaRis, 06.12.2019

Bestimmung des SCR-Bedarfs mittels Nested Stochastics (2/2)

• Mehrdimensionaler Input (also nRisikofaktoren im Risikomodell):

Zins-Veränderungen, 𝑥1 Aktienentwicklung 𝑥2 Spread-Ausweitung 𝑥3 Sterblichkeit 𝑥4 Kosten 𝑥5 … 𝑥𝑛

• Output:

Veränderungen der Own Funds für jede Kombination von Risikofaktoren als Ausgabe des Projektionstools

Ein Szenario wird durch einen Vektor (𝑥1, 𝑥2, … , 𝑥𝑛) ∈ ℝ𝑛 der Risikofaktoren

definiert

Für jedes Szenario werden die Own Funds OF(𝑥1, 𝑥, … , 𝑥𝑛) ∈ ℝ mithilfe von Monte-Carlo-Simulationen gerechnet

FaRis, 06.12.2019 4

Erzeugung von Regressionsszenarien(~25,000) von gleichmäßig verteilten Ein-Jahres-Entwicklungen der Risikotreiber

Durchführung weniger ALM-Projektionen und Berechnung von 25.000 Own-Funds-Schätzern

Regression eines multi-dimensionalen Polynoms, der “LSMC-Funktion” für die PVFPs

Jedes Szenario

beinhaltet

Veränderungen

aller Risikotreiber

……

~25,000 1-Jahres-Realisierungen Vereinfachte ALM-Berechnungen(jeweils 2 risikoneutrale Szenarien)

OF-Schätzer

~25,000 1-Jahres-Realisierungen

Validierung der LSMC-Funktion, z.B. durch out-of-sample-Tests

Polynom

Schätzwerte

Risikotreiber, z.B. Aktienkurs

PVFP

+10%

-20% -10% Best Estimate +10% +20%

0%

-10%

-20%

+20%

0,0

0,2

0,4

0,6

0,8

1,0

1,2

1,4

-1 -0,8 -0,6 -0,4 -0,2 0 0,2 0,4 0,6 0,8 1

Mil

lia

rde

n

Validierung

Schätzung

2 a

2

2

2

b

c d

Least Squares Monte Carlo Methode (1/2)

FaRis, 06.12.2019

PVFP-2

LS

MC

PVFP-1

PVFP-3PVFP-4PVFP-5PVFP-6PVFP-7PVFP-8

~1.000.000 1-Jahres-Realisierungen

Simulation der gemeinsamen Risikotreiberverteilung Auswertung der LSMC-Funktion

Bestimmung der Own-Funds-Verteilung und SCR-Bestimmung

3 4

4

a

b

Least Squares Monte Carlo Methode (2/2)

FaRis, 06.12.2019

Beschreibung des Regressionsproblems

Kalibrierung/Training:• Ungenaue Daten der abhängigen Variable (Own

Funds) für Berechnung der Regressionsfunktion

25.000 Realisierungen von Einjahres-Szenarien (Sobol-Methodik zur Auswahl)

Je 2 Simulationen

• Genauere Daten der abhängigen Variable (OwnFunds) für Validierung

256 Realisierungen von Einjahres-Szenarien (wieder Sobol)

Out of sample

Je 1.000 Simulationen

Zielgrößen:• 99,5% Value-at-Risk (VaR-Daten)

Real-World-Szenarien um das 99,5 % Quantil der Verlustverteilung

4,000 Simulationen, ziemlich genau

• Erwartung (Basis-Szenario)

Basisauslenkung aller Risikofaktoren

16.000 Simulationen, sehr genau

Die eigentliche Zielgröße ist: SCR = Own-Funds-Erwartung – 99.5% VaR

FaRis, 06.12.2019 7

Simpler Ansatz: Lineare Ausgleichsfunktion

Implementierung:Risikotreiber in Simulation i: 𝑋𝑖 = (𝑋1

𝑖 , … , 𝑋𝑛𝑖 )

Own Funds Werte in Simulation i: OFi

Algorithmus: Wähle 𝛽 = (𝛽0, 𝛽1, 𝛽2, … , 𝛽𝑛), sodass

min 𝑋𝛽 − 𝑂𝐹minimiert wird.

Ergebnis:Linearer Schätzer für die Own Funds

𝑂𝐹𝐿𝑖𝑛 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 +⋯+ 𝛽𝑛𝑥𝑛

FaRis, 06.12.2019 8

Ergebnisse (1/5)

Methodik Company 1 Company 2 Company 3

Lineare Regression (Validierung) -17.8% -0.4% -0.1%

Lineare Regression (Value at Risk) +12.0% +0.9% -3.7%

FaRis, 06.12.2019 9

Erweiterung: Allgemeine lineare Modelle

Erweiterung:

In der Realität beobachtete Zusammenhänge sind oft nicht linear

Beispiel: Komplexe Abhängigkeite der OwnFunds vom Zins (höhere Erträge der Assets vs. Diskontierung)

Mögliche Basisfunktionen:

Polynome: 𝑥𝑖𝑘 , 1 ≤ 𝑖 ≤ 𝑛, 𝑘 ∈ ℕ

Radiale Basisfunktionen, z.B. GaußscheBasisfunktionen

𝜑𝜀 𝑥𝑖 = 𝑒− 𝜀𝑥𝑖2, 𝜀 ∈ ℝ

Wavelets, z.B. Poisson wavelets

𝜓𝑛 𝑥𝑖 =1

2𝜋1 − 𝑖𝑥𝑖

−𝑛+1, 𝑛 ∈ ℕ

Beispiel:Zusätzlich zu den linearen Termen werden quadratische Terme verwendet

𝑂𝐹𝐴𝐿𝑀 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 +⋯+ 𝛽𝑛𝑥𝑛

+𝛾1𝑥12 + 𝛾2𝑥2

2 +⋯+ 𝛾𝑛𝑥𝑛2

(*) Ermittelt mit LSMC-PFFaRis, 06.12.2019 10

Ergebnisse (2/5)




Auch quadratische Terme (Validierung) -6.8% -0.5% -0.1%

Auch quadratische Terme (Value at Risk) +27.4% +1.6% -2.3%

FaRis, 06.12.2019 11

Praxis: Expertenschätzung

Feststellungen zu linearer Regression:

Lineare Regressionsfunktion berücksichtigt keine Interaktion zwischen den Risikotreibern

Sehr schlechte Abbildung der Own Funds Werte in manchen Bereichen des Raums der Risikotreiber

Idee:Experte passt linearen Schätzer um notwendige Terme an. Die Koeffizienten werden weiterhin mittels Least Squares geschätzt

𝑂𝐹𝐸𝑥𝑝 = 𝛽0 + 𝛽1𝑥1 + 𝛽2𝑥2 +⋯+ 𝛽𝑛𝑥𝑛

+𝛾12𝑥1𝑥2 + 𝛾35𝑥3𝑥5 + 𝛾1𝑥12

Lineare Regression Expertenschätzung

FaRis, 06.12.2019 12

Ergebnisse (3/5)






Expertenschätzung (Validierung) -6.6% -0.5% -0.1%

Expertenschätzung (Value at Risk) +20.8% +0.5% -1.7%

FaRis, 06.12.2019 13

Informationstheoretischer Ansatz: AIC

Feststellungen zu Expertenschätzung:

Expertenschätzung ist von Einzelmeinung(en) abhängig – Gefahr der Willkür

Experten können bestehende Zusammenhänge in Daten aufgrund hoher Komplexität übersehen (Underfitting)

Gleichzeitig werden eventuell Zusammenhänge, die gar nicht existieren, in Daten hineininterpretiert (Overfitting)

Idee:Ersetze Expertenmeinung durch Algorithmus zur Wahl der Polynomterme

Underfitting Overfitting

Realität

FaRis, 06.12.2019 14

Akaike Informationskriterium (AIC)

Klassische Statistik: Schätze den unbekannten Parameter einer bekannten Verteilung, z.B. die Varianz einer normalverteilten Zufallsvariable

Bei LSMC-Regression jedoch: Schätze die unbekannten Koeffizienten eines unbekannten Polynoms

Es sind also zwei simultane Aufgaben zu erledigen: Finde bestes Polynom und gleichzeitig dessen Koeffizienten

Das Akaike Informationskriterium AIC vergleicht die Güte des Fits unterschiedlicher Modelle

Satz (Akaike, 1973): Das AIC ist ein erwartungstreuer Schätzer für die Kullback-Leibler Divergenz, das heißt, es ist ein Maß dafür wie gut eine gegebene Funktion f mit k Parametern eine andere unbekannte Funktion g annähert. Sind die Fehler der Regression normalverteilt, so gilt

𝐴𝐼𝐶 = 𝑛 log𝑅𝑆𝑆

𝑛+ 2𝑘

FaRis, 06.12.2019 15

Ausgans-

Polynom

(Iteration i)

Identifizierung

möglicher

“Kandidaten

Terme”

STOP

Least Squares

Regression

REGRESSION

Versuche jedes “Kandidaten-Modell” d.h. jeder Term der möglichen Kandidaten wird getestet indem

der Term zum Polynom hinzugefügt wird. Multiple Regression - jedes mal wird nur ein einziger

weiterer Term hinzugefügt

Ist AIC

kleiner?

JA

Füge Term,

welcher kleinstes

AIC erzeugt, hinzu

Neues Polynom

(mit einem

weiteren Term)

i=i+1Polynom

aktualisieren

NEIN

Max

Anzahl

Terme

erreicht?

NEIN

JA

AIC berechnen

0 12

3

Algorithmus zum Auffinden optimaler Polynomstruktur (1/3)

FaRis, 06.12.2019 16

“Kandidaten-Terme” ist die Menge aller Terme die bei jeder Iteration zum Polynom hinzugefügt werden könnten

Regeln werden angewandt um diese “Kandidaten-Terme” auszuwählen

Die “forward stepwise” Routine, also ein mehrstufiges Verfahren, limitiert die Wahl der möglichen “Kandidaten-Terme” bei jedem Schritt der Regression indem das Prinzip der Marginalität oder “principle of marginality” eingehalten wird.

“Ein Kandidaten-Term kann ausschließlich zum Modell hinzugefügt werden, wenn das jeweilige Modell bereits alle Terme enthält, die marginal zum Kandidaten-Term sind”

Die marginalen Terme für eine jeweilig gegebene Menge von “Kandidaten-Termen” sind jeweils deren algebraische Faktoren.


FaRis, 06.12.2019 17


Ein Term kann zum Hinzufügen zumModell nur dann in Betracht gezogenwerden, wenn das Modell bereits alleFaktoren des Terms enthält

Beispiel: Modell mit drei Risikofaktoren𝑥1, 𝑥2, 𝑥3. An einem bestimmten Schrittim Modellauswahlprozess besteht dasModell aus:

𝑦 = 𝛽0,0,0 + 𝛽1,0,0𝑥1 + 𝛽0,1,0𝑥2 + 𝛽2,0,0𝑥12

Die marginalen Termine, die zum Modell hinzugefügt werden können, sind dann folgende:

𝑥3, 𝑥1𝑥2, 𝑥22, 𝑥1

3

Es könnte zum Beispiel nicht der Term 𝑥1𝑥3 hinzugefügt werden, es sei denn 𝑥3 wird vorher hinzugefügt

FaRis, 06.12.2019 18

Ergebnisse (4/5)








Informationskriterium AIC (Validierung) -1.6% -0.5% +0.0%

Informationskriterium AIC (Value at Risk) +6.7% -0.9% -1.3%

FaRis, 06.12.2019 19

FaRis, 06.12.2019 20Quelle: Haykin: Neural Networks and Learning Machines, Pearson, 2009

• Ramón y Cajál (1911): Die Idee von Neuronen

• Gehirn als extrem effizienter Rechner

• Nachahmung der Intelligenz

Bildquelle: Wikipedia

Neuronale Netze: Motivation aus der Gehirnforschung

Warren McCulloch & Walter Pitts, 1943

• erste Idee für ein künstliches neuronales Netz, aus verknüpften elementaren Einheiten

• zur Berechnung logischer und arithmetischer Funktionen

Frank Rosenblatt, 1958

• Neurocomputer Marc I Perceptron: Multi-Layer Perceptron

• Idee: Sehr viele Berechnungseinheiten, die erst durch ihre Interaktion „intelligent“ werden

Seitdem ein stetes Auf und Ab: Hypes und Ernüchterungen

Boom seit ca. 10 Jahren durch den enormen Anstieg an Rechenkapazität

Bildquellen: https://ptihiup2018.blogspot.com/2019/07/artifical-neural-network.html & Wikipedia

FaRis, 06.12.2019 21

Neuronale Netze & Deep Learning

FaRis, 06.12.2019

Wikipedia

• Je eine Input- und Output-Schicht• Keine, eine oder mehrere Verarbeitungsschichten

(= versteckte Schichten)• Nicht immer existieren alle Verbindungen zwischen

zwei Schichten• In den Neuronen Verarbeitung mit

Aktivierungsfunktionen:• Tangens Hyperbolicus

• Logistische 𝒇 𝒙, 𝜽 =𝟏

𝟏+𝒆−(𝒙−𝜽)

• Rectified Linear Unit (ReLU) 𝒇 𝒙, 𝜽 = max(𝟎, 𝒙 − 𝜽)• Leaky ReLU 𝒇 𝒙, 𝜽 = max 𝜶 𝒙 − 𝜽 , 𝒙 − 𝜽 , 𝜶 > 𝟎 klein

22

Input – Versteckte Schichten - Output

• Schwierig, da viele verschachtelte Funktionen

• In der Regel grafisch, gelegentlich hilft die Matrixform

• Im Code meistens einfach

FaRis, 06.12.2019 23

Mathematische Darstelung

Die polynomialen Funktionen in und werden durch neuronale Netze ersetzt

Aus LSMC-PF wird LSMC-NN

Die grundsätzliche Methodik bleibt aktuariell und finanzmathematisch unverändert

2 c

2 d

FaRis, 06.12.2019 24

Neuronale Netze für die SCR-Berechnung

Ergebnisse (5/5)








Informationskriterium AIC (Validierung) -1.6% -0.5% +0.0%

Informationskriterium AIC (Value at Risk) +6.7% -0.9% -1.3%

Neuronale Netze (Validierung) +0.2% +0.1% -0.0%

Neuronale Netze (Value at Risk) -1.1% +0.4% +1.0%

FaRis, 06.12.2019 25

26Deloitte 2019

Einfaches Beispiel: Schematische Darstellung der Standardformelberechnung

Vielfältige Erweiterungsmöglichkeiten (1/5)

27Deloitte 2019

Aktiva

Passiva

Own

Funds

SCR

Solvenz

Quote

Parametrisierung des

Asset-Bestandes zur

Darstellung möglicher

Portfolien zum neuen

Stichtag

Fortschreibung

der Passiva zum

neuen Stichtag

Veränderung der Modell-Inputs zur Kennzahlen-Schätzung in der Zukunft

Risikokennzahlen in

Abhängigkeit von

Portfolien und

Kapitalmarktsituation

zum neuen Stichtag

Parametrisierung

möglicher

Kapitalmarkt-

situationen


28Deloitte 2019

Aktiva

Passiva

Own

Funds

SCR

Solvenz

Quote


Solvenzkennzahlen unter dynamischen Bedingungen mit neuronalen Netzen

Verwendung von Machine

Learning Techniken zur

Beschreibung dieser

Abhängigkeiten

29Deloitte 2019

Für neue Stichtagsdaten kann ohne weiteren Rechenaufwand eine Solvenzquote ermittelt werden

Passiva

Aktiva

Fortschreibung

der Passiva

zum neuen

Stichtag

Entwicklung

des

Portfolios

Mögliche Zinskurven

Resultierende SII-Quote

Szenario SII-Quote

… …

Zinsanstieg 182%

… …

Best Estimate 178%

… …

Zinsrückgang 165%

… …

Ergebnis:

Solvenzkennzahlen zum

neuen Stichtag in Ab-

hängigkeit von der zu-

künftigen Entwicklung

der Kapitalmärkte


FaRis, 06.12.2019

Zukünftige Risikosituationen werden für alle möglichen Entwicklungen analysiert um kritische Szenarien zu identifizieren

t=0

Management

Regeln

Passiva

Aktiva

Neuronale Netze

Own

FundsSCR

Solvenz

Quote

Kapital-

markt

Ergebnis:

Solvenzkennzahlen wer-

den für alle denkbaren zu-

künftigen Situationen

berechnet

Neugeschäft

Asset

Portfolio

t=3


Date post:	27-Nov-2021
Category:	Documents
Upload:	others
View:	2 times
Download:	0 times

Machine Learning in der aktuariellen Risikomodellierung

Documents