+ All Categories
Home > Documents > Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter...

Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter...

Date post: 06-Apr-2015
Category:
Upload: uwe-kantner
View: 105 times
Download: 2 times
Share this document with a friend
31
Knowledge Discovery Erzeugung künstlicher Telekommunikationsda ten (Teil II) Markus Höchstötter Michael Wenzelburger
Transcript
Page 1: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Knowledge DiscoveryErzeugung künstlicher Telekommunikationsdaten

(Teil II)

Markus Höchstötter

Michael Wenzelburger

Page 2: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Agenda

Problemstellung Lösungsansatz Implementierung Performance Feedback

Page 3: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Problemstellung

Generierung von TelKo Daten Input:

Verteilung, Parameter Wahrscheinlichkeitsmodell

Output: TelKo Mikrodaten (Gespräche) Beginn, Dauer, Tarifzone

Page 4: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Problemstellung

TelKo Datenstruktur Gesprächsdauer/ Belegungsdauer Einfallsabstand

ln-Normalverteilung durch Transformation

2exp

2

1)(

2uxfy

) ln(

) ln( ) ln(

x

m

Q

x xu

Page 5: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

ProblemstellungGesprächsdauerdichte

0 1 2 3 4 5 6 7 8

Gesprächsdauer in Minuten

Rel

ativ

e H

äufig

keit

Page 6: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Agenda

Problemstellung Lösungsansatz Implementierung Performance Feedback

Page 7: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Lösungsansatz

Erzeugung von einzelnen Kunden

Erzeugung von einzelnen Gesprächsdaten für jeden Kunden mit Zeitstrahlmodell

Page 8: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Erzeugung von Kunden

Kundengruppen unterteilt nach Telfonierverhalten

Ziehung der kundenspezifi-schen Parameter mit ZV aus Kundengruppen

Page 9: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Erzeugung von Gesprächsdaten Generierung für einzelnen

Kunden Beginn bei Null Fortlaufende Ziehung von

Gesprächsdauer und Zwischengesprächsabstand

Ermittlung der Tarifstruktur vor jeder Ziehung

Page 10: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Zeitenstrahl

t=0

}Zwischenzeit 1

t1

Gespräch 1

t2

Ziehung:•Tarifzone (Ort, Nah, Fern)•Gesprächsdauer

} Abhängig vom

Startzeitpunkt

t3

}Zwischenzeit 2

...

Page 11: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Agenda

Problemstellung Lösungsansatz Implementierung Performance Feedback

Page 12: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Implementierung

Eingabe Ziehung Generierung Ausgabe

Page 13: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Eingabe

Festlegung der Rahmen-bedingungen Klassen Tarifzonen Anschlussarten Zeitfenster WoEnde / Werktag Dirac

Page 14: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Eingabe

Einlesen der Verteilungs-parameter SHV: diskrete Verteilung Mittelwert/Streuung für Gesprächs-

dauer und Einfallabstand Prozentsatz der gleichverteilten

Gesprächsdauern

Page 15: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Ziehung

Diskretes Ziehen: Kundenklasse Anschlussart Tarifzone

Gleichverteilte Z-Zahl zwischen 0 und 1

Page 16: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Ziehung

Beispiel:

Zufallszahlen:

Tarifzone Ort Nah FernP(x) absolut 22 15 18P(x) relativ 0,4 0,27 0,33P(x) kumuliert 0,4 0,67 1

0,44 => Nah

0,76 => Fern

0,54 => Nah

0,01 => Ort

Page 17: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Ziehung

Stetiges Ziehen: Gesprächdauer Zwischenankunftszeit

Normalverteilte Z-Zahl Transformation

)*exp( )1,0( NLN xx

Page 18: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Ziehung

Beispiel: µ = 2, = 1.5 Z-Zahl xN(0,1) = -0.7

Transformation

xLN = exp(1.5*(-0.7) +2) = 2.59

Page 19: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Generierung

Bestimmung des Kunden Klasse Anschlussart

Alternierende Ziehung von ZAK und Gesprächsdauer

Page 20: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Generierung

ZAK durch Ziehung einer ZZ und deren Transformation

Dirac Tarifzone in abh der akt Zeit

und Klasse Gesprächslänge unter

Berücksichtigung von Zeitfensterüberlauf

Page 21: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Augabe

Kunde Kunden ID Klasse Anschluss

Gespräch Kunden ID Tarifzone Beginn Dauer

Page 22: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Agenda

Problemstellung Lösungsansatz Implementierung Performance Feedback

Page 23: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Performance

Abbildungsgenauigkeit Bandbreite Datenvolumen

Page 24: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Abbildungsgenauigkeit

Gesprächsdauer 100 Kunden 8 * 86400 sec = 8 Tage kein Dirac

soll ist AbweichungMue 1 1,09 9%Sigma 1 0,82 18%Mue 2 1,97 2%Sigma 1 1,12 12%Mue 5 4,99 0%Sigma 1 0,99 1%Mue 3 2,95 2%Sigma 1 1,08 8%Mue 7 7,07 1%Sigma 1 1,25 25%

5. Versuch

1. Versuch

2. Versuch

3. Versuch

4. Versuch

Page 25: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Abbildungsgenauigkeit

Tarifzonen 100 Kunden 8 * 86400 sec = 8 Tage

soll ist AbweichungOrt 60% 59,8% 0,4%Nah 15% 15,2% 1,3%R50 10% 10,4% 3,7%R200 10% 9,7% 2,7%DE 5% 4,9% 1,5%Summe 100% 100,0% 0,0%

Page 26: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Abbildungsgenauigkeit

Klassen 10000 Kunden 3 Anschlussarten 2 Klassen

soll ist AbweichungAnzahl 3000 2970 1%AS 1 2400 2341 2%AS 2 450 469 4%AS 3 150 160 7%Anzahl 7000 7030 0%AS 1 4200 4071 3%AS 2 2100 2229 6%AS 3 700 730 4%

Klasse 2

Klasse 1

Page 27: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Abbildungsgenauigkeit

Sehr exakte Abbildung der Tarifzonen bzw. Klassen

Ausreichend genaue Abbildung der Gesprächsdauer bzw. ZAK große Werte genauer abgebildet

als kleine

Page 28: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Bandbreite / Datenvolumen 1000 Kunden mit

realitätsnahen Parametern 5 Kundenklassen 5 Tarifzonen

650 sec Laufzeit 26.000 kB Gesprächsdaten 10 kB Kundendaten

Page 29: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Agenda

Problemstellung Lösungsansatz Implementierung Performance Feedback

Page 30: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Feedback

Wahrscheinlich zu detaillierte Parameterstruktur

Hindernis Datenschutz Datenbankanbindung Zeitfenster alle gleichlang

Page 31: Knowledge Discovery Erzeugung künstlicher Telekommunikationsdaten (Teil II) Markus Höchstötter Michael Wenzelburger.

Fragen


Recommended