Post on 11-Aug-2019
transcript
Einführung in dieBioinformatik
Kay NieseltIntegrative Transkriptomik
Zentrum für Bioinformatik TübingenKay.Nieselt@uni-tuebingen.de
SS 20125. Biologische Netzwerke -Gut vernetzt hält besser
2
Überblick
• Einleitung• Hierarchie biologischer Netzwerke• Netzwerkmaße• Skalenfreie Netzwerke• Kleine-Welt-Netzwerke
3
Von der Biologie zur Systembiologie
Im vergangenen Jahrhundert studierte dieBiologie
• Struktur von Proteinen• Struktur von DNA/RNA• Replikation• Transkription• Translation• Interaktion von Molekülen• ...
4
Von der Biologie zur Systembiologie
Aufgrund neuer Technologien, die dieEntschlüsselung von Genomen, Transkriptomen,Proteomen, usw. erlaubt, studiert die Biologiein diesem Jahrhundert systematisch
• Zellen• Organe• Organismen• Zelluläre Prozesse: Kommunikation, ...
⇒ Systeme - Systembiologie
5
Biologische Systeme sind lebendigeNetzwerke
• Netzwerk-Ansätze zur Beschreibung undAnalyse komplexer vernetzter Systeme
• Netzwerke spielen eine entscheidendeRolle in der Systembiologie
• Daten von Genen, Proteinen undMetaboliten können direkt als Netzwerkinterpretiert oder in Netzwerkeeingebettet werden
6
Netzwerk-Biologie
Barabasi, Oltvai, Nature Rev. Genetics, 5:101 (2004)
7
Vielfalt biologischer Netzwerke
• Metabolische Netzwerke• Regulatorische Netzwerke• Interaktionsnetzwerke• Phylogenetische Netzwerke• Neuronale Netzwerke• Soziale Netzwerke
8
Netzwerke sind Graphen
• Visualisierung / Modellierung vonNetzwerken mittels Graphen
• Knoten sind Metabolite, Gene, Proteine,Neuronen, ...
• Kanten zwischen je zwei Knotenbeschreiben Reaktionen, Interaktionen,neuronale Verbindungen, ...
9
Netzwerke sind Graphen
• Knoten: Gene/Proteine/Taxa ...• Kanten: Interaktionen
• Kanten repräsentieren:– Protein-Protein-Interaktionen– Protein-DNA-Interaktionen (TF-Bindung)– Genetische Interaktionen– Regulatorische Interaktionen (positiv/negativ)
• Kanten können Richtungen haben
Protein-Protein-Interaktion
Gen A reguliert Gen B
10
• Metabolische Netzwerke
• Interaktionsnetzwerke
• Regulatorische Netzwerke
• Signalnetzwerke
• Evolutionäre Netzwerke
Eine Hierarchie biologischer Netzwerke
11
Metabolische Netzwerke
• Für viele Zellprozesse wird Energie benötigt• Energie wird durch Metabolismus erlangt:
– (1) katabolische Reaktion: große Moleküle werdenzu kleinen reduziert (Beispiel Glykolyse)
– (2) anabolische Reaktion: komplexe Molekülewerden aus kleinen synthetisiert (Beispiel:Aminosäuresynthese)
• Metabolismus ist ein strukturierterNetzwerkprozess
Metabolismus = Stoffwechsel
12
Metabolische Netzwerke
• KEGG (Kyoto Encyclopedia of Genes andGenomes)
• Große Datenbank mit Informationen überGene, Biomoleküle, Stoffwechselwege,Reaktionsgleichungen etc.
• Sammlung von Netzwerkdiagrammen(manuelles Layout!)
http://www.genome.jp/kegg/
13
Netzwerk von KEGG
http://www.genome.jp/kegg/
14
Eine Hierarchie biologischer Netzwerke
• Metabolische Netzwerke
• Interaktionsnetzwerke
• Regulatorische Netzwerke
• Signalnetzwerke
• Evolutionäre Netzwerke
Barabasi & Oltvai, Nat. Rev. Genetics (2004), 5:101
15
• Metabolische Netzwerke
• Interaktionsnetzwerke
• Regulatorische Netzwerke
• Signalnetzwerke
• Evolutionäre Netzwerke
Eine Hierarchie biologischer Netzwerke
16
Wyrick and Young, Deciphering gene regulatory Netzwerke, Curr Op genet & Devl.
Eine Hierarchie biologischer Netzwerke
• Metabolische Netzwerke
• Interaktionsnetzwerke
• Regulatorische Netzwerke
• Signalnetzwerke
• Evolutionäre Netzwerke
17
Eine Hierarchie biologischer Netzwerke
Graph generiert mit SplitsTree4, Huson et al.
• Metabolische Netzwerke
• Interaktionsnetzwerke
• Regulatorische Netzwerke
• Signalnetzwerke
• Evolutionäre Netzwerke
18
Knoten/Kanten in biol. Netzwerken
• Metabolische Netzwerke:
• Interaktionsnetzwerke:
• Regulatorische Netzwerke:
• Evolutionäre Netzwerke:
Metabolite/Reaktionen
Proteine/Interaktionen
Proteine/Aktivierung, ...
Spezies/Evolution
Analyse biologischer Netzwerke
• Untersuchung struktureller Eigenschaftenvon Netzwerken: besseres Verständnis fürAufbau, Robustheit gegenüber Störungen,Bedeutung zentraler Elemente
• Analyse und Visualisierung von Daten imKontext zugrunde liegender biologischerProzesse und Netzwerke
• Untersuchung des dynamischen Verhaltensder Prozesse mittels Simulation, um dieAntwort eines biologischen Systems aufÄnderungen vorherzusagen
20
Netzwerktopologien
Barabasi & Oltvai, Nat. Rev. Genetics (2004), 5:101
Zufällige Netzwerke
Skalenfreie Netzwerke
Hierarchische Netzwerke
21
Netzwerkmaße
• Knotengrad, -verteilung• Pfadlängen• Durchmesser• Zentralität• Clusterkoeffizient
22
Gut vernetzt hält besser• Eines der einfachsten Maße ist der Knotengrad k für
jeden Knoten in einem Graphen
k=5
23
Gut vernetzt hält besser• Die Gradverteilung P(k)
entspricht der Wahrscheinlichkeit, dassein Knoten den Grad k hat.
• Für ein geg. Netzwerk berechnet manP(k), in dem man alle Knoten miteinem gegebenen Grad zählt.
24
Skalen-freie Netzwerke• In vielen biologischen Netzwerken
folgt die Gradverteilung demPotenzgesetz
P(k) ~ k-γ
γ ist der Gradexponent; γ liegtmeistens zwischen 2 und 3
• Die meisten Knoten habenniedrigen Grad, aber es gibtHubs, d.h. Knoten mit sehrvielen Verbindungen
• Wenn log(P(k)) eines Netzwerkesals Funktion von k eine Geradedarstellt, ist das Hinweis aufPotenzgesetz ⇒ skalenfreies Netzwerk
Zhu & Qin. Structural comparison of metabolic networks, BMC Bioinformatics 2005, 6:8
25
Hubs - Drehkreuze
www.hemispheresmagazine.com
26
Hubs• Hubs finden sich oft in
biologischen Netzwerken
Beispiel:• PPI-Netzwerk in Hefe
Barabasi & Oltvai, Nat. Rev. Genetics (2004), 5:101
27
Pfadlängen und Zentralität• Die durchschnittliche kürzeste Pfadlänge zwischen je
zwei Knoten ist ein Maß, wie schnell man von einembeliebigen Knoten zu einem anderen kommt.
• Weiterer wichtiger Parameter ist derGraphendurchmesser: die Länge des längstenkürzesten Pfades im Graphen
• Zentralität eines Knoten:relative Anzahl der kürzestenPfade, die den Knoten enthalten.
http://en.wikipedia.org/wiki/Centrality
Farbton (Rot=0 nach Blau=max) repräsentiert Knoten-Zentralität.
28
Beispiel
• ∅ Pfadlänge: 1,75
• Durchmesser: 3• Zentralität für Knoten mit Grad 5: 1,3
29
Clusterkoeffizient• Maß für Transitivität in einem Netzwerk
(Ist Knoten A mit Knoten B verbunden und B mitKnoten C, ist dann auch A mit C verbunden?)
• Globaler Clusterkoeffizient:
• Lokaler Clusterkoeffizient:
n = Anzahl der Kanten, die zwischen den ki Nachbarnvon Knoten i verlaufen
ki(ki-1) = Anzahl möglicher Kantenverbindungen zwischen allen Nachbarn von Knoten i.
30
Beispiel
• Lokaler Clusterkoeffizient für Knotenmit Grad 5: (2*1)/20 = 0,1
31
Small-World Netzwerke
• Nachbarn eines Knotens stärker vernetzt alsin zufällig organisierten Netzwerken
• Durchschnittliche Pfadlänge zwischen zweiKnoten des Netzwerks sehr kurz
• Skalenfreie Netzwerke haben dieseEigenschaft, da ‘Hubs’ das schnelleDurchlaufen ermöglichen
• Beispiel: Metabolische Netzwerke sind Kleine-Welt-Netzwerke, die meisten Paare vonMetaboliten sind mittels 3-4 Reaktionenverbunden.
32
Stabilität• Biologische Netzwerke sind meist robust gegenüber
Störungen (Perturbationen)• Skalenfreie Netzwerke sind sehr robust gegenüber
zufälligen Deletionen: die Mehrheit der Knoten habengeringen Grad
• Hubs, auf der anderen Seite, sind sehr gefährdet: ihreDeletion könnte zum Zerfall des Netzwerkes inTeilnetzwerke führen
33
Stabilität
Beispiel des Protein-Protein-Interaktionsnetzwerkes in Hefe:
• Knoten sind farbkodierthinsichtlich Effekts einerKnock-out-Mutante– Rot: letal– Grün: nicht letal– Orange: langsames Wachstum– Gelb: unbekannt
• Hubs sind oft rot!
Aufgaben der Bioinformatik
• Repräsentation der Netzwerke undzugehöriger Daten– Datenstrukturen– Datenbanken– Datenintegration
• Analyse und Simulation der Netzwerke undder durch sie repräsentierten Prozesse– Algorithmen– Simulation– Statistik– Maschinelles Lernen
• Darstellung und Exploration– Visualisierung
Analyse biologischer Netzwerke
• Biologische Netzwerke sind oft modular undorganisiert
• Untersuchung von kleinen, vielfachvorkommenden Teilgraphen -> Netzwerk-Motive!
• Netzwerk-Motive haben besondere Bedeutungfür Signaltransduktions- und GenregulatorischeNetzwerke
Pavlopoulos GA, BioData Mining 2011
36
Cytoscape
http://www.cytoscape.org/what_is_cytoscape.html
• open source Software-Plattform• Visualisierung komplexer Netzwerke• Integration beliebiger Attributdaten• > 100 Plugins• Anwendungsdomänen: Bioinformatik, soziale Netzwerke,
semantisches Web
37
Zusammenfassung
• Netzwerke finden sich in allenBereichen der Biologie
• Viele dieser sind skalenfreie-Netzwerkeund weisen Eigenschaften der “KleinenWelt” auf.
• Die Bioinformatik und dieSystembiologie tragen in vielenBereichen wie Analyse, Visualisierung,Interpretation ... bei
38
Links
• http://www.genome.jp/kegg• http://string.embl.de/• http://www.cytoscape.org/