SeminarGroßrechneraspekte
(Mainframe)
Thema:
Netzwerk & System Management
von
Soeren Apelt
Inhalt
• Architektur für Komponenten beim Systemmanagement
• Enterprise Management Konsole
• Event Management
• Problem Management & Help Desk
• System Repository & Datenhaltung
Wozu System Management?
• zentrale Überwachung und Steuerung aller Komponenten (möglichst selbstständig)
• hohe Verfügbarkeit• Fehlererkennung und –meldung• kostengünstige Wartung• geringe Administrationskosten• allg. Kosten- und Arbeitsersparnisse
• Aufgaben– neue Platten installieren– Hardware rekonfigurieren– Server mit neuem Speicherplatz ausstatten– Daten zwischen den Laufwerken bewegen– Softwaremanagament
Aufgabenverteilung
• Remote Operation– Administrator beobachtet und steuert Systemkomponenten
– von einem geographisch entfernten Ort
• Unattended Operation– Electronic monitoring
– System / Automation handelt im Problemfall selbständig
– Zuständige Person wird bei Bedarf benachrichtigt
Erläuterung der Grundkonfiguration
• Agenten – Teil von Endgeräten (z.B.
Arbeitsplatzrechner, Netzgeräte)
• Manager – empfängt Traps von den Agenten– Kommandos und Daten an Agenten
senden– Daten abspeichern– Anwendungen aufrufen
• Repository (Datenspeicher)
• Administrator / Konsole– Daten von Agenten oder aus Repository
auslesen– Anwendungen aufrufen und interaktiv
damit arbeiten
System Management Architektur
System Management Framework
• Kooperation der Komponenten
• gemeinsamen Schnittstellen und Datenhaltung
• managed Interaktionen der System Management Anwendungen
• implementiert verteilbare Client/Server Architektur
Funktionen eines NSM Frameworks
• Policy Regimes• Profile Manager• Tasks• Scheduling Funktion• Security Einrichtungen• Rollback/Recovery• Administration• plus deren Verflechtungen
und Attribute (z.B. welcher Administrator darf auf welche Managed Nodes mit welchen Rechten zugreifen)
Gliederung von NSM Funktionen
• Verfügbarkeit (Availability)– Enterprise Management Konsole– Fault, Event Management– Agenten– Autodiscovery– Netzwerk Management
• Operations (Tools)– Problem Management, Help Desk– Remote Control– Job Scheduling, Workload Management– Performance Management– Application Management– Storage Management– Security Administration– Business Process Management– Accounting, Berichtswesen
Gliederung von NSM Funktionen
• Deployment– Configuration Management
– Software Management, Distribution und Installation
– Asset Management
• Erweiterbarkeit– Anwendungsprogrammierschnittstellen (API, SDK)
– Main Frame und SNA Integration
– Integration mit den Komponenten anderer Hersteller
– Unterstützung durch ISV´s
Ereignis Management Konsole
• Framework arbeitet mit graphischen Oberfläche (GUI)
• die Ereignismanagement Konsole ist ein spezielles Fenster in der GUI– auftretende Systemevents werden überwacht
– hierfür wird ein separater (Hardware) Rechner eingesetzt
Event Management(1)
• Event Logging– Einfangen von Events/Alerts (z.B. von individuellen Agenten, die in
Hubs, Routern, Arbeitsplatzrechnern oder Software operieren)• Event Consolidation
– Prioritisierung und Filterung von Events • Event Korrelation
– Gruppierung von Events/Alerts in einen einzigen Event/Alert– Aufgabe: Erleichterung der Erkennung zugrundeliegender Probleme
• Event Notification– ermöglicht Darstellung von Events – einzelne Administratoren bekommen nur für sie relevante Events zu
sehen (z.B. Colour Coding hebt Bedeutung der Events hervor– Benachrichtigung z.B. perFax, Telephone, E-Mail oder Beeper)
• Event Response– besteht aus den beiden Komponenten Event Diagnose und (der
idealerweise automatischen) Event Resolution
Event Management(2)• Beispiele:
– Fehler Diagnose– Fehlerbehandlung an dezentrale Server weiterleiten– Fehler auf der (Ereignismanagement)-Konsole gesondert hervorheben– Präventive Maßnahmen im Fall von Überlastungssituationen– Fehlervermeidung über automatisierte Prozesse– Once-only reporting beim gleichzeitigen Versagen mehrerer Systeme– Unterstützung von Eskalationsmechanismen– Abspeichern und Komprimierung von Status-, Meß- und Performance-Daten– Anstoßen der automatischen Problemeröffnung über Machine generated
Problem tracking und Eintragen des Trouble Tickets im Help Desk
Event Management(3)
• Event Korrelationsfähigkeiten:– Rule Templates für
häufig auftretende Verhaltensweisen
– Erzeugen, Modifizieren und Vernichten von Rule Sets
– Scripting Tool für die Erzeugung von Rules
– Möglichkeit des Austesten von Rules, ehe sie in den Produktionsbetrieb übernommen werden
Enterprise Management Konsole
• zentralen Manager ( Enterprise Management Konsole)– Komponenten:
• zentraler Ereignis Manager
• verteilte Ereignis Management Konsolen
• zentrale Datenhaltung
• verteilte Adaptoren
Hierarchische Gliederung von Enterprise Management Konsolen
• Verteilung der NSM Funktionen auf viele logische und physikalische Server
• „Manager of Managers“ (MOM) = Enterprise Management Konsole
• (Midlevel Manager, MLM) = Domänen
– es gibt geographische und administrative Domänen
– reduzieren die Netzlast
– kaskadierbar
– größere Flexibilität
– führt polling, Discovery und Management lokal aus
– Events korrelieren und automatische Reaktion
• Agenten– ist eine Software Instanz– überwachen Hard- und
Software Ressourcen– ergreifen automatisch
Maßnahmen – von Enterprise Management
Konsole aus zentral administrierbar, programmierbar und verteilbar
– kommunizieren mit Enterprise Management Konsole
– oder MLM über Protokolle• CMOT,SNMP1, SNMP2,
CMOL, CMIP, MIB2, RMON1, RMON2
– auch proprietäre Protokolle, die auf CORBA (z.B. Tivoli) oder RPC (z.B. CA) aufbauen
Problem Management, Help Desk(1)
• Verwaltung täglicher Probleme und Fragen• genaue Bestimmung des Ursprunges eines Problems und
Rückführung auf bestimmte Hardware-, Software- und/oder Prozedurfehler
• Bereiche:– Komponentendefinitionen (z.B. Hardware, Software,
Telekommunikationsanlagen und Sicherheitssysteme– Hierarchiebeziehungen, Garantie- und Wartungsinformationen werden
festgehalten – Machine-generated Problem Tracking (MGPT) ermöglicht die
automatische Erstellung von Problemeinträgen (Datensätzen) auf Basis der vom Eventmanagement überwachten Aktivitäten
– MGPT-Regeln dienen zur Erkennung von Problemen auf einzelnen Hosts
Problem Management, Help Desk(2)
• Problembehandlung – Problem analysieren und verfolgen, und entsprechende
Behebungsstrategie festgelegen– Help Desk Funktion:
• Call Tracking, Escalation, Management, Reporting, Business Analysis, Problem Solving und Document Retrieval
– Policy Based Automation regelt Autorisation
• Beispiel:– Problem/Alert in Konsole eintrifft, wird automatisch eine Anfrage in der
Help Desk Anwendung geöffnet– Configuration Datenbank stellt die Configuration vor Ort zur Verfügung– Change Management Datenbank können die letzten Änderungen
ausgelesen werden– Problem Management Datenbank kann die letzten 5 Probleme ausgelesen– Bearbeitung erfolgeich, werden automatisch Event/Alert Records
deaktiviert
System Management Repository
• Eigenschaften – redundanzfreie Datenhaltung– Replikationsmöglichkeit– veröffentlichtes Daten- und Funktionsmodell– veröffentlichtes Objektmodell– Data Base Scaleability– Data Sharing durch unabhängige Management Anwendungen– Data Base Batch Import für ursprüngliches Laden von´Management
Information– Unterstützung für ODBC compliant Datenbanken vorhanden– Unterstütztung für Oracle, Sybase, Informix, Ingres, DB2 oder SQL
Server
• Die von den einzelnen Managern verwalteten Daten sind z.B.:– Performance Meßdaten beim Performance Management– Event History Daten beim Event Management– TCP/IP Topologien beim Netzwerk Management– Software Configuration Daten bei der Software Distribution
• objektorientierte Datenbank über die RIM (RDBMS Interface Manager) Schnittstelle vorgetäuscht
• Repository selbst ist eine CORBA Objekt Datenbank
Datenhaltung
Zusammenfassung
• Backup/Recovery• System Managed Storage• Hardware Management Console (HMC)• Storage Manager
• Architektur für Komponenten für Systemmanagement• Enterprise Management Konsole• Event Management• Problem Management & Help Desk• System Repository & Datenhaltung