Fault-Konzepteuheuert/pdf/Anwendung... · 2006-11-15 · Christian Stroh FCAPS • ISO-Modell für...

Post on 17-Sep-2018

213 views 0 download

transcript

Christian Stroh

FaultFault--KonzepteKonzepte

Fehlermanagement in Fehlermanagement in RechnernetzenRechnernetzen

Christian Stroh

ÜbersichtÜbersicht1. Rückblick auf

FCAPS (Netzwerkmanagement) undSNMP (Netzwerkprotokoll)

2. Fehlermanagement (Definition, Struktur)3. Fehlerbehandlung

-Fehlererkennung-Fehlerdiagnose-Fehlerbehebung

4. Klassifizierung von Netzwerkmanagementwerkzeugen

5. Fehlerprävention

Christian Stroh

FCAPSFCAPS

• ISO-Modell für Netzwerkmanagement• FCAPS

(Fehler,Konfiguration,Abrechnung,Leistung,Sicherheit)• grosser Teil dieser Aufgaben wird von

Netzwerkmanagementprogrammen unterstützt• IP-Netze werden häufig mittels Netzwerkprotokollen wie

SNMP oder WMI verwaltet und überwacht

Christian Stroh

SNMP SNMP (Simple Network Management Protocol)(Simple Network Management Protocol)(1/2)(1/2)

• Netzwerkprotokoll um Komponenten (Router,Server,Switches,Drucker,Computer usw.) zentral zu überwachen und zu steuern

• Protokoll regelt die Kommunikation zwischen Komponenten und Überwachungsstation

• jede netzwerkfähige Komponente überwachbar• von den meisten Netzwerkmanagementprogrammen

unterstützter Standard

Christian Stroh

SNMP SNMP (Simple Network Management Protocol)(Simple Network Management Protocol)(2/2)(2/2)

mögliche Aufgaben des Netzwerkmanagements mit SNMP:• Überwachung von Komponenten (Monitoring)• Fernsteuerung und Fernkonfiguration von Komponenten• Fehlererkennung und Fehlerbenachrichtigung

Christian Stroh

DefinitionDefinitionFehlerFehler (fault) in einem Netz(fault) in einem Netz

Ereignisse und Zustände, die eine Komponente daran hindern,ihre Aufgabe anforderungsgerecht durchzuführen.

auftretende Fehler:• während der Implementierung der Komponenten• externe Störungen• Verschleiss von Komponenten• Überlastung von Komponenten

Christian Stroh

2. Fehlermanagement2. Fehlermanagement

Das Fehlermanagement hat die Verfügbarkeit einesKommunikationsnetzes möglichst hoch zu halten.Aus dieser Zielvorgabe ergeben sich folgende Teilaufgaben: • Überwachen des Netz- und Systemzustandes• Problemerkennung• Durchführen von Netzwerk- und Komponententests• Entgegennehmen und Verarbeiten von Alarmen• Diagnostizieren von Fehlerursachen• Einleiten und Überprüfung von Fehlerbehebungsmaßnahmen• Fehlerdokumentation• Leisten von Hilfestellung für den Benutzer

Christian Stroh

FehlermanagementFehlermanagement

Ziel: Erhöhung der Verfügbarkeit des Netzwerkes

Mittel: frühzeitiges Erkennen von Fehlersituationenund Bestimmung der Fehlerursachen

Dienste des Fehlermanagements:Sie umfassen Tests zur Überprüfung von Netz-Komponenten, bzw. zur Fehlerlokalisierung. Desweiteren können Fehlermeldungenausgetauscht und Fehlerstatistiken abgerufen werden.

Christian Stroh

Struktur des FehlermanagementStruktur des Fehlermanagement

Christian Stroh

3. Fehlerbehandlung3. Fehlerbehandlung

• Fehlererkennung-Liegt ein Fehler vor oder ist ein Fehler zu erwarten?

• Fehlerdiagnose-Ein Fehler ist aufgetreten. Wodurch wurde er verursacht?

• Fehlerbehebung-Gibt es eine kurzfristige (provisorische) Lösung?-Wie und wann kann der Fehler behoben werden?-Kann man die Nutzer beruhigen?-Ist die Ursache des Fehlers wirklich beseitigt oder tritt er regelmäßig wieder auf?

Christian Stroh

FehlerbehandlungFehlerbehandlungFehlererkennungFehlererkennung

• 3 Arten der Fehlererkennung:-Diagnosetests der Komponenten in zeitlichen Abständen (Polling)-Komponente sendet Fehlermeldung an Manager (Trapping/Alarm)-Anwender meldet Fehler beim Administrator

Christian Stroh

FehlerbehandlungFehlerbehandlungFehlerdiagnoseFehlerdiagnose

• Zur Fehlerdiagnose wird auf die Daten des Konfigurationsmanagements zurückgegriffen.

Christian Stroh

FehlerbehandlungFehlerbehandlungFehlerbehebungFehlerbehebung

• Programme zur Fehlerbehebung werdengestartet oder aber es werden aktive Eingriffeseitens der Administratoren gefordert.

Christian Stroh

FehlerbehandlungFehlerbehandlungFehlerbehebung Fehlerbehebung im Detail (1/2)im Detail (1/2)

Wird ein Fehler entdeckt,so sind die folgenden Schritte rasch auszuführen:1) Fehlerursache feststellen2) Isolation des restlichen Netzwerks von der

Störungsstelle3) Modifikation oder Rekonfiguration des Netzwerks.4) Reparatur oder Austausch der fehlerhaften

Komponenten. Das Netzwerk ist nun wieder in seinem ursprünglichen Zustand.

Christian Stroh

FehlerbehandlungFehlerbehandlungFehlerbehebungFehlerbehebung im Detail (2/2)im Detail (2/2)

Wichtig sind schnelle und zuverlässige Problemlösungen:• zuverlässige Fehlerverwaltungstechniken verwenden• Netzwerk durch redundante Komponenten und

Kommunikationsrouten gegenüber Fehler toleranter machen

Christian Stroh

Fehlerbehandlung im EinsatzFehlerbehandlung im Einsatz

BeispielSchritte um Dienst wiederherzustellen:-Erkennung kein mail-Dienst verfügbar-Identifizierung Link-Ausfall-Isolation zwischen Switch A und Router B-Wiederherstellung Reserve-Link einrichten-Lösung Interface/Kabel prüfen/reparieren-Fall abschliessen Bericht, neu konfigurieren

Christian Stroh

Fehlerhäufigkeit in den OSIFehlerhäufigkeit in den OSI--SchichtenSchichten

Christian Stroh

4. Klassifizierung von 4. Klassifizierung von ManagementwerkzeugenManagementwerkzeugen

Christian Stroh

NetzwerkNetzwerk--MonitoringMonitoring

• Überwachung und Kontrolle von Netzwerken, deren Hardware und Diensten

• externes Monitoring mit zusätzlichem Rechner• aktives Monitoring sendet zusätzliche Pakete ins Netz• Monitoringprogramme nutzen meist das

SNMP-Netzwerkprotokoll• Beispiel: Monitoring-Software RoboMon...

Christian Stroh

ProtokollanalysatorProtokollanalysator

Christian Stroh

RoboMonRoboMon ((MonitoringMonitoring--Software)Software)

• Ausfallzeiten minimieren• plattformunabhängig• netzwerkweite Verwaltung• Berichte und Diagramme

HP HP OpenViewOpenViewNetwork Network NodeNode ManagerManager

(integriertes Netzwerkmanagementprogramm)(integriertes Netzwerkmanagementprogramm)

• bietet die Möglichkeitder Konfiguration,der Fehlersuche undder Überwachungeines oder mehrererTCP/IP-basierender Netze

Christian Stroh

5. Fehlerprävention5. Fehlerprävention(Bekämpfung der Fehlerursachen)(Bekämpfung der Fehlerursachen)

• Monitoring ermöglicht Langzeitmessungen des Lastzustandes,um potenzielle Fehlerquellen (z.B. Leistungsengpässe) im Netz frühzeitig zu erkennen und dem Fehlerereignis präventiv zu begegnen.

• Ausfallsicherheit durch Redundanz der Netzwerk-Infrastruktur.Redundanz bedeutet, dass immer mindestens zwei oder mehr Komponenten (z.B. Server) sich die kritische Last gleichmässig aufteilen. Bei Ausfall einer Komponente übernimmt die andere unterbrechungsfrei die gesamte angeschlossene Last.

• Benutzer-Berechtigungen einschränken.

Christian Stroh

QuellenQuellen• http://einstein.informatik.uni-oldenburg.de/lehre/semester/rechnernetze/05ss/daten/RN2-NetzwerkManagement.pdf• http://einstein.informatik.uni-oldenburg.de/rechnernetze/seite121.htm• http://www.net.informatik.tu-muenchen.de/teaching/former/notes/Jessen_Rechnernetze_WS99.ps• http://www.bs.informatik.uni-siegen.de/web/wismueller/vl/ws06/rn2/v10_4.pdf• http://www.bs.informatik.uni-siegen.de/web/wismueller/vl/ws06/rn2/v10.pdf• http://de.wikipedia.org/wiki/Fehlermanagement• http://www-rnks.informatik.tu-cottbus.de/de/materials/ws2002vlrnksI/Folien_2_7_Studenten.pdf• http://www.internet-sicherheit.de/fileadmin/npo/vorlesungen/nwm/Einfuehrung_NWM_06_10_05.pdf• http://ls4-www.cs.uni-dortmund.de/home/maeter/Toplehre/PG380/PG380.Antrag.pdf• http://www.sws.bfh.ch/~lanz/SKRIPTE/DataKomm.pdf• http://www.rn.inf.tu-dresden.de/scripts_lsrn/Lehre/prosem_rn/print/print_ss05/Netzwerkmanagement.pdf• http://www2.fht-esslingen.de/~thkiit02/Semester5/Netzwerkmanagement/Vorlesungen/NM_03_ASN1_060323_55914.pdf• http://home.datacomm.ch/felix_fischer/data/Seminararbeit_Nw.pdf• http://net.informatik.uni-tuebingen.de/fileadmin/RI/teaching/seminar_iit/ws0304/slides/slides-baumeister.pdf• http://www.martinnet.de/studium/rechnernetze/RN8.pdf• http://209.85.135.104/search?q=cache:s-r_PgnF0SQJ:www.cs.fhm.edu/~ifw00245/dako/Dako.doc+rechnernetze+fehlermanagement&hl=de&gl=de&ct=clnk&cd=60• http://geb.uni-giessen.de/geb/volltexte/2004/1690/pdf/Apap_WI_1997_03.pdf• http://www.info-fhb.de/haupt/datentonne/scriptz.htm• http://home.in.tum.de/~velev/projects/rnp/rnp_nm1.pdf• http://209.85.129.104/search?q=cache:7l54AgGtYe4J:www.computerwoche.de/heftarchiv/1985/30/1170163/+rechnernetze+fehlermanagement&hl=de&gl=de&ct=clnk&cd=98• http://de.wikipedia.org/wiki/OSI-Modell• http://www.infotech.tu-chemnitz.de/~knoll/studienarbeit.pdf• http://de.wikipedia.org/wiki/Error-correcting_code• http://209.85.129.104/search?q=cache:OAk5jlaksuIJ:pi.informatik.uni-siegen.de/akkred/m_ti2005/m_ti2005_mhb_a4.ps+rechnernetze+fehlermanagement&hl=de&gl=de&ct=clnk&cd=110• http://en.wikipedia.org/wiki/Fault_management• http://www.pse.siemens.at/apps/pseauftritt/ge/pseinternet.nsf/CD_Index?OpenFrameset&Bookmark&/0/PK216BBA0E18A07FA8C12569EE003A472F• Zeitschrift LANline 4/2001• http://www.itwissen.info/definition/lexikon//_fmfm_fmfault%20management%20fm_fmfehlermanagement.html• http://www.tm.uka.de/lehre/WS0102/vorlesungen/Telematik/tm10-ka.pdf• http://lexikon.freenet.de/• http://de.wikipedia.org/wiki/Simple_Network_Management_Protocol• http://www.ifi.unizh.ch/ikm/Vorlesungen/KommSeminar00/KommSeminar00/Documents/NetzwerkmgmtSlides.pdf• http://www.nagios-wiki.de/lib/exe/fetch.php/workshop/2006/vortraege/2006-03-nagios-einfuehrung.pdf?id=workshops%3A2006%3Astart&cache=cache• http://www.nagios-wiki.de/lib/exe/fetch.php/workshop/2006/vortraege/2006-03-nagios-workshop.pdf?id=workshops%3A2006%3Astart&cache=cache• http://www.its.bth.se/courses/etb017/material/NM2h.pdf• http://www.rrzn.uni-hannover.de/fileadmin/ful/vorlesungen/rechnernetze_2/ss_06/Rechnernetze_II_1_SS06.pdf• http://www.msexchangefaq.de/konzepte/snmpbasics.htm• http://www.ztt.fh-worms.de/en/others/sem/ss96/hellwig_snmp/snmp.html• http://www.elektronik-kompendium.de/sites/net/0902011.htm• http://de.wikipedia.org/wiki/HP_OpenView• http://www.infotech.tu-chemnitz.de/~knoll/HP/hp_index.html• http://www.computerwoche.de/index.cfm?pid=432&pk=1135362• http://www.lampertz.de/html/default.asp?site=1_8_16

Literatur:Token Ring Netzwerke, Frank Kresse, Hüthig Buch Verlag HeidelbergEthernet, Mathias Hein, Thomson PublishingLAN/WAN Troubleshooting, Othmar Kyas, mitpIntegriertes Management vernetzter Systeme, Heinz-Gerd Hegering, Sebastian Abeck, Bernhard Neumair, dpunkt.verlag

Christian Stroh

Vielen Dank für Eure Aufmerksamkeit!