IT-Symposium 2007 19.04.2007
www.hp-user-society.de 1
3G06Grundlagen bei der Einführung von ILM
Dr. Christoph BalbachPresales Manager Nord-Ost
Hewlett-Packard GmbH
Storage Presales
ILM besteht aus Lösungen und Services, um Daten zu erfassen, managen, erhalten, und Informationen gemäß der Geschäftsanforderungen zur Verfügung zu stellen
Kostenreduktion durch Management ständig wachsender Daten, wobei diese gleichzeitig in verwendbare, relevante
Geschäftsinformationen gewandelt werden.
HP Information Lifecycle ManagementMehrwerte aus Geschäftsinformationen als klaren Wettbewerbsvorteil ziehen
− ständig verändernden Geschäfts-Anforderungen nachkommen
− Nutzen von Informationen für verbesserte Geschäftsprozesse
− Automatisiertes Management Ihrer Geschäftsinformation
− Wandlung unstrukturierter Daten in “right-time Business Intelligence”
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 2
Begriffs-Definitionen
Begriffsdefinition: Datensicherung
Unter einer Datensicherung versteht man sowohl den Vorgang des Kopierens der in einem Computersystem vorhandenen Daten auf ein Speichermedium (das im allgemeinen transportabel ist) mit dem Ziel, diese dauerhaft (aber nicht unbegrenzt) aufzubewahren, als auch das Ergebnis - die auf dem Speichermedium gesicherten Daten. Die Datensicherung wird auch als Backup [�bækʌp] oder Sicherungskopie bezeichnet. Deren Wiederherstellung wird auch als Datenrücksicherung oder Restorebezeichnet.
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 3
Begriffsdefinition: Archiv
Unter einem Archiv (lateinisch archivum aus griechischαρχείο(ν), archeío(n), „Regierungs-“, „Amtsgebäude“) versteht man eine Institution oder Organisationseinheit, in der Unterlagen aus Verwaltungshandeln, die als archivwürdig bewertet und somit zu Archivgut umgewidmet wurden, erfasst, erschlossen, erhalten, ausgewertet und zugänglich gemacht werden. Im übertragenen Sinne bezeichnet es auch das Gebäude. Archivgut sind Schriftstücke, Akten, Karten, Pläne, Siegel, Bild-, Film- und Tonmaterialien sowie sonstige, auch elektronisch gespeicherte Informationen, die einen bleibenden Wert besitzen.
„Das Gedächtnis der Informationsgesellschaft ist ungeordnet, überfrachtet und zeigt erste Ausfallerscheinungen. Einerseits werden wir von der „Informationsflut“ überrollt, andererseits tut sich aber ein immer größer werdendes „Information Gap“ nicht mehr verfügbarer oder auswertbarer elektronischer Information auf …
… ILM Information Lifecycle Management hat daher auch zum Ziel, Information entsprechend ihrem Wert handhabbar zu machen ...
… ILM ist die Strategie, die diesen Wert heute erschließt und auch für die Zukunft bewahrt.“
Ulrich Kampffmeyer, Jahr 2003
Der „Wert“ von Informationen wird weiterhin unterschätzt
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 4
Informationen schützen und nutzen…
Trends in der Informations- & Dokumenten-Verwaltung
• heute− Die meisten Dokumente werden
elektronisch erstellt (z.B. ERP, e-mail)
− Viele Daten mit “überschaubarer Bedeutung” werden gespeichert
− 60% und mehr der Kunden akzeptieren Email als rechtlich verbindlich & relevant
− “Neue Fragestellungen:
• Ist das Dokument original ?
• Wer hat das Dokument erstellt ?
• Wann und wie kann das Dokument verändert werden?
• Kann ich das Dokument lesen?
•1998-Die meisten Dokumente wurden auf Papier erstellt
-Nur offizielle Dokumentewurden gespeichert und Archiviert
-Nur gedruckte Dokumente hatten rechtlichen Status
−“Lagerhallen” an Papier Archiven
−Relevante Dokumentewurden gescannt und archiviert
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 5
Die Geschwindigkeit der Wirtschafts-abläufe verschärft sich dramatisch
Trading analytics
Document transfer
Call center inquiries
Airline operations
Track financial position
Supply chain updates
Phone activation
Trade settlement
Build-to-order PC
Refresh data warehouse
107 106 105 104 1,000 100 10 1 Sekunden
3 Tage 45 Sekunden
30 Minuten 5 Sekunden
20 Minuten 30 Sekunden
8 Stunden 10 Sekunden
1 Tag 5 Minuten
1 Tag 15 Minuten
3 Tage 1 Stunde
1 Monat 1 Stunde
24 Stunden
5 Tage 1 Tag
Mail / express / fax / e-mail30 Sekunden3 Tage
6 Wochen
Datenzugriff über die Zeit...
Applikationen
Storage Medien
ändern sichProgramm A �Programm B; API
ändern sichPlatte � Band
Zeit
meist konstantDaten
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 6
Die Daten sind da!Können sie auch interpretiert werden?
älter als400 Jahre nC
Stehle von Rosettagefunden: 1802 nCentstanden: 196 vC
über 1400 Jahre lang nicht mehr lesbar!
Hieroglyphen
Griechisch
Entschlüsselung durch Jean-Francois Champollion (1790-1832)
Aber auch heute haben sich die Probleme nicht verändert…
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 7
Langzeitarchivierung mit Industrie-Standards
• Archivlösungen müssen je nach Branche unterschiedliche Zeiträume „überstehen“
• Proprietäre Lösungen / Schnittstellen / Formate können dies nicht sicherstellen
• Industrie-Standards helfen, das Risiko zu minimieren:− Standard Schnittstellen (CIFS, NFS, …) � XAM (Extended Access Method)
− Standard Hardware (austauschbare Bausteine)
− Standard Formate
Service-Sicht auf das Storage-Management = ILM
Remove
Protect &
recover
Archive & recall
Create & modify
Information Lifecycle ManagementVom Datensatz/Datei ���� Information mit Geschäftswert
Filesystem/DBOnline
Migration, ReplikationOnline, Nearline
ArchivNearline, Offline
DatensicherungNearline, Offline
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 8
Information LifecycleManagement
IT-Budget
7-10% der gesamten Ausgaben
26% Storage in 2004
48% Storage in 2007
20% HW/SW 80% Betriebskosten
. . . moving from maintenance to innovation !!!
Es sind nicht die Anschaffungskosten…
Steigendes Daten-volumen und Datenwert
ManagementGAP
Steigende Managementkosten
Fallenden Storage Technologiekosten
(primär Platten)
€1.00 Speichertechnologie-kosten stehen €3.50 Management-kosten entgegen
es sind die ManagementkostenSteigendes Informations-
volumen undInformationswert
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 9
• Ungenutzte Datenmengen verursachen Betriebskosten.
• Manuelle Suchvorgänge.
• lnhaltsbezogene Suche notwendig.
ILM addressiert aktuelle Themen
• Kfm. Sorgfaltspflichten erfordern Aufbewahrungszeiten.
• Pflichtverletzungen können schwerwiegend sein (Geldbuße, Bilanzkorrekturen, Tiefenprüfung, Strafverfolgung).
• Explosives Datenwachstum.
• Kostenreduzierung unter Beibehaltung der Service Level.
Retention Management
Daten Management
Referenz Information
-
25
50
75
100
125
150
175
200
225
250
275
2003 2004 2005 2006
Healthcare (HIPAA)
BASEL-II (EU)Static data
search retrieve
Winter Report (EU)
Corp. Governance Kodex(D)
GDPdU (D)
GoBS (D)
SOA (US)
• Rechtliche Vorschriften zur Datenhaltung
• Gespeicherte Daten• Performance-Optimierung
• Backup-Optimierung
• Mehrstufige Konzepte
• Kostenreduktion• Preis pro GB
• Dauer der Datenhaltung – Archivierung
• Schnelligkeit im Zugriff auf die richtigen Daten
• Managementkosten
• Informationen aus Daten• Suchen/Finden und Management
Welche Themen werden beim Kunden adressiert?
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 10
Electronic Ledger Storage Law (Japan)
11MEDIS-DC (Japan)
CanadianElectronicEvidence
ActSEC 17a-4
(USA)
HIPAA (USA)
FDA 21 CRF Part 11
ISO 18501/18509
Sarbanes-Oxley Act (USA)
AIPA (Italy)
BSI PD0008 (UK)PublicRecords
Office (UK)
NF Z 42-013 (France)
FinancialServices
Authority (UK)
Basel IICapitalAccord
GDPdU & GoBSGermany
Rechtliche RahmenbedingungenAuszug
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 11
Datennutzung ändert sich über die Zeit...aber der Informationswert steigt!
Time after creation
im sofortigen Zugriff
monatliche Nutzung
Geschäftsbegleitendirgendwannwiederverwertbar
Source: Jan Möller, Ministery of Transport, NL
Zu
griffs
häu
figkeit
Gesch
äfts
rele
van
z
Referenzdaten
... Speicherverteilung nach Klassen
Zeit nach Erstellen..
Bed
eutu
ng online-
business
BezugsdatenProzessbegleitend
evtl.wieder-verwendbar
historisch
Referenzdaten
*ESG, apr/2002
On
line
Date
n
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 12
Verschiebung der Anforderungen
Zeit
Ges
peic
hert
e D
aten
Referenzinformationen
Operative Daten
Der grösste Anteil sind Referenzinformationen
10%
90%
DatenWachstum
ILM: Vorgehensweise
Aktive
Daten
Inaktive
DatenHistorie
Encapsulated Archive
.XSD
.XML
Daten Aufbewahrungsvorschriften 6 Monate-2 Jahre 2-7 Jahre 7 – 25+ Jahre
ERP, CRM, Enterprise Applikationen
transparenter Zugriff der Applikation
3rd Party Reporting Tools
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 13
Business needs Customer benefitsHP solution
• Unmanageable prod. db (approaching 1BN records), annual growth rate of 50%
• Unacceptable DR time of 12-48 hours
• 3-week downtime to upgrade to Oracle 11i
• Decreasing app. perf.
• High db maint. costs
Der “Wert” von ILM Manageability and performance
Timeline GB in OLTP
May-03 280
Oct-03 190
May-04 160
Aug-04 110
Jul-05 90
Without Archiving 500
Availability and Recovery
• 61% reduction in production database size (From 1BN to 390M rows)
• More than 90% reduction in disaster recovery window (12-48h to 2h)
Manageability
• Increased upgradeability to Oracle 11i (3 w. to 2 d.)
Performance
• 30% overall application performance improvement
• HP ILM RIM for Database
• Solving root causes not symptoms
Das ILM Model rechnet sich...Beispiel 1
# Events # Std Total cost # Events # Std Total cost
8.941 17.780 363.682 3.997 3.947 80.734
100% 100% 100% 45% 22% 22%
Online Speicher Referenzspeicher
Vergleich der Kosten-Struktur typischer SAN-Lösungen mit nachgegliedertem Backup
gegenüber
einer Referenzspeicher-Lösung
Kostenreduktion durch beispielsweise:• geringere Anschaffungskosten durch Near-Online Speichertechnologie
• geringeren Management- / Wartungsaufwand durch
• weniger Änderungen an statisch konstanten Informationen
• geringeren Backup-Aufwand / schnellere Restore!
• geringerer Sicherheitsaufwand durch gekapseltes Archivsystem
• ….
Microsoft
Excel-Arbeitsblatt
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 14
Faktorenrechnung Operative Daten Referenzdaten
Anschaffungskosten 1 1
Betriebskosten 4 0,9
Gesamtkosten 5 1,9
ILM Kostenrechnung:(10% * 5) + (90% * 1,9) = 2,21 = 44% der heutigen Betriebskosten
Ergebnis:Die Einführung von ILM ermöglicht eine Reduktion des IT Budgets für Speichersysteme um 56%.
Vergleich der unterschiedlichen Kostenstrukturen:
90%10%GB-Verteilung
Verteilung der operativen Daten & Referenzdaten:
Das ILM Model rechnet sich...Beispiel 1
• Wieviel Zeit verwenden Ihre Mitarbeiter pro Tag mit dem Suchen von Informationen (Emails / Dokumente) ?
• Was kosten das pro Jahr ?
Wenn man es schafft, die Suchzeit um nur 10 Minuten zu reduzieren, dann liegt das Produktivitätspotential bei 375.100 ,- €.
500 Mitarbeiter / 220 Arbeitstage / 3000€ Durchschnittsgehalt
Gesamt-Gehaltskosten: 18 Mio €mittlerer Suchaufwand/Tag: 10%mittlere Suchzeit/MA/Tag: 48 Minuten
Suchzeit / Gesamt / Tag: 24.000 MinutenSuchzeit / Gesamt / Jahr: 5,28 Mio. MinutenKosten / Minute: 0,341 €Gesamtkosten: 1,8 Mio €
Das ILM Model rechnet sich...Beispiel 2
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 15
153 Deutsche Unternehmen mit ILM Lösungen/Projekten
Enterprise Storage und Information Lifecycle Management (ILM) –Status und Trends in Deutschland (2006) Experton Group
Wie wichtig sind aus Ihrer Sicht folgende Anwendungen?
Müssen E-Mails für den Datenzugriff vorgehalten werden?
• Nein, die Speicherung von E-Mails, die keine steuerlich relevanten Daten enthalten, ist nicht erforderlich.
• E-Mails mit steuerlich relevantem Inhalt sind dagegen zusammen mit etwaigen steuerrelevanten Anhängen als originär digitale Dokumente elektronisch abzulegen und zur Ansicht bereit zu halten.
• Es wird empfohlen in E-Mails möglichst keine steuerlich relevanten Daten vorzuhalten ….
Mail-Server
Vollständige E-mail Archivierung
1:1 E-mailArchiv
Duplikat
Duplikat
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 16
Mail-Server
Selektive E-mail Archivierung
E-mailArchiv
Duplikat
Duplikat
Selektion
•Empfänger
•Betreff
•Inhalt
•Regeln
•Manuell
Regelungen• Was bleibt wie lange und wo gespeichert?• Was muss und was darf wann gelöscht werden?• Auslagerungen beim Reorganisieren beachten• Selektionsregeln�Archivbereich�Aufbewahrungszeit�Zugriffsregeln
10 Jahre
A
B
C
D
6 Monate
6 Monate
5 Jahre
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 17
10 Jahre
6 Monate
6 Monate
5 Jahre
Problem Speicherplatz• Doppelte Speicherung im Mail-Server und Archiv• Steigerungsraten E-mail Verkehr• (Multimedia-)Anhänge werden immer größer• Backup Mail Server• Lösung: Was im Archiv liegt wird bis auf Rumpfinfos gelöscht
10 Jahre
6 Monate
6 Monate
5 Jahre
Online Archiv
Geschäfts-Applikationen
Files(unstrukturiert)
E-mail/Messaging(semi-strukturiert)
Datenbanken(strukturiert)
Information Management PlattformIndustrie-Innovationen
SAPSAP OracleOracle DominoDominoSMTPMail
SMTPMail
SiebelSiebel PeopleSoftPeopleSoft ProprietaryApps&DataProprietaryApps&Data
xxx GB xxx GBxxx GBxxx GBxxx GB xxx GBxxx GBxxx GB xxx GBxxx GBxxx GBxxx GB xxx GBxxx GBxxx GBxxx GBxxx GBxxx GBxxx GB
Storage & CPU
Content IndexAttribute Index
xxx GBxxx GBxxx GBxxx GB
xxx GBxxx GB
Tiered Storage
ExchangeExchange MicrosoftMicrosoft LINUXLINUX UNIXUNIX
DominoDomino ExchangeExchange DatabaseDatabase SAPSAPD2DCDPD2DCDP
DICOMDICOM CIFSCIFS NFSNFSAuto StoreAuto Store
OutputServerOutputServer
CRMCRM3rd Party
Middleware3rd Party
MiddlewareConnectors& API’s
0-72 hrs 72 hrs – 2 wks Months Years Decades
Continuously Protect Optimize Archive
Transitional Information Repository
Indiziert, SigniertSingle-Insstance‘Such-/Nutzbar’
Operational
Disk Tape Integrierte Archivierungslösung
XAMXAM
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 18
Umsetzung von ILM Projekten
Umsetzung eines ILM Projektes in 5 Schritten
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 19
ILM Services Lifecyclenur 20% eines ILM Projektes werden durch das „Produkt“ abgebildet.
Business Criticaland Support Services
Managed Archiving Services
Implementationand IntegrationServices
Mgmt. Solution Pilots
ILM DiscoveryWorkshop
ILM BusinessRequirementsAnalysis
ILM Policy Definition
Retention Discovery
Legacy Data Load
Discovery
Architect
Strategise
Design
Manage
Implement
SupportStrategise
Mgmt. Solution Architecture Blueprint
ILM Business Value Analysis
IT-Symposium 2007 19.04.2007
www.hp-user-society.de 20
ILM...
�… ist kein reines Archivierungssystem
�… bedingt die Betrachtung der Geschäftsprozesse
�… benötigte eine detaillierte Projektphase
�… ist über mehrere Unternehmensbereiche zu betrachten
�… stellt Informationen aufgabengerecht zur Verfügung
�… schafft Compliance gegenüber rechtlichen Vorschriften & internen Revisionen und unterstützt unternehmensweite Prozesse
�… geht nicht ohne IT!