+ All Categories
Home > Documents > 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen...

5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen...

Date post: 05-Apr-2015
Category:
Upload: dietmar-heimgartner
View: 104 times
Download: 0 times
Share this document with a friend
26
5. Vorlesung WS 2006/07 Softwarewerkzeuge 1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk - Hierarchischer Aufbau der Proteinstruktur - Klassifikation von Proteinstrukturen
Transcript
Page 1: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 1

V5: Bioinformatische Analyse von Proteinstrukturen

Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk

- Hierarchischer Aufbau der Proteinstruktur

- Klassifikation von Proteinstrukturen

Page 2: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 2

Funktion von Proteinen

Strukturproteine (Hüllenproteine von Viren, Cytoskelett)

Enzyme, die chemische Reaktionen katalysieren

Transport- und Speicherproteine (Hämoglobin)

Regulatoren wie Hormone und Rezeptoren/Signalübertragungsproteine

Proteine, die die Transkription kontrollieren

oder an Erkennungsvorgängen beteiligt sind:

Zelladhäsionsproteine, Antikörper

Page 3: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 3

Warum sind Proteine so groß?

Proteine sind große Moleküle.

Ihre Funktion ist oft in einem kleinen Teil der Struktur, dem aktiven Zentrum,

lokalisiert.

Der Rest?

- Korrekte Orientierung der Aminosäuren des aktiven Zentrums

- Bindungsstellen für Interaktionspartner

- Konformationelle Dynamik

Evolution der Proteine: Veränderungen der Struktur, die durch Mutationen in ihrer

Aminosäuresequenz hervorgerufen werden.

Page 4: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 4

Hierarchischer Aufbau

Primärstruktur – Sekundärstruktur – Tertiärstruktur – Quartärnere Struktur –

Komplexe

Welche „Kräfte“ sind für die Ausbildung der verschiedenen „Strukturen“

wichtig?

Lösliche Proteine: wichtigstes Prinzip ist der hydrophobe Effekt.

Membranproteine: sind im Transmembranbereich außen hydrophober als innen.

Page 5: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 5

Hydrophober EffektBeobachtung, dass die Überführung einer unpolaren

Substanz/Oberflächenbereichs aus einem organischen bzw. Unpolaren

Lösungsmittel nach Wasser

(a) energetisch stark ungünstig ist

(b) bei Raumtemperatur zu einer Abnahme der Entropie führt

(c) zu einer Zunahme der Wärmekapazität führt.

Eisberg-Modell

Kauzman 1959

Page 6: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 6

Hydrophober Effekt

Der Beitrag hydrophober WW zur Freien Enthalpie bei der Proteinfaltung und der

Protein-Liganden-Wechselwirkung kann als proportional zur Grösse der während

dieser Prozesse vergrabenen hydrophoben Oberfläche angesehen werden.

Löslichkeit von Kohlenwasserstoffen in Wasser: -0.10 bis -0.14 kJ mol -1 Å-2 .

Typische Oberflächen : Methan CH4

Benzol CH6

Die Vergrabung einer zusätzlichen Methylgruppe (ca. 25 Å2 ) liefert

-2.75 bis -6 kJ mol-1 , was eine Erhöhung der Assoziationskonstanten um einen

Faktor 3-11 bewirkt.

Hydrophobe Aminosäuren: aliphatisch : Ile – Val – Leu

aromatisch : Phe – Tyr – Trp

sonstige : Ala – Pro – Cys

Page 7: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 7

Lesk-Buch

Anwendungen der Hydrophobizität

Page 8: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 8

In Peptiden und Proteinen sind die Aminosäuren miteinander als lange

Ketten verknüpft.

Ein Paar ist jeweils über eine „Peptidbindung“ verknüpft.

Die Aminosäuresequenz eines

Proteins bestimmt seinen

„genetischen code“.

Die Kenntnis der Sequenz eines

Proteins allein verrät noch nicht

viel über seine Funktion.

Entscheidend ist seine

drei-dimensionale Struktur.

O

OR

H

H N

O

OR

H

H N

O

O

O

R

H

H N N

H

H

R

O

O

O

R

H

H N N

H

H

R

+

-3

+

-3+

+3

-+ H O2

2

2

1

1

+3

21

peptide bond

G>0

Einleitung: Peptidbindung

Page 9: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 9

E.J. Corey und Linus Pauling studierten die Petidbindung in den

1940‘ern und 1950‘ern.

Sie fanden: die C-N Länge ist 1.33 Å.

Sie liegt damit zwischen 1.52 Å und 1.25 Å,

was die Werte für eine Einfach- bzw.

Doppelbindung sind.

Die benachbarte C=O Bindung hat eine Länge

Von 1.24 Å, was etwas länger als eine typische

Carbonyl- C=O Doppelbindung ist (1.215 Å).

die Peptidbindung hat einen teilweise

konjugierten Charakter und ist nicht frei drehbar.

Es bleiben damit pro Residue 2 frei drehbare

Diederwinkel des Proteinrückgrats übrig.

O

OR

H

H N

O

OR

H

H N

O

O

O

R

H

H N N

H

H

R

O

O

O

R

H

H N N

H

H

R

+

-3

+

-3+

+3

-+ H O2

2

2

1

1

+3

21

peptide bond

G>0

Eigenschaften der Peptidbindung

Linus PaulingNobelpreise fürChemie 1954 undFrieden 1963

Page 10: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 10

Wie seit den 1950‘er Jahren bekannt,

können Aminosäure-Stränge

Sekundärstrukturelemente

bilden:(aus Stryer, Biochemistry)

-Helices

und -Stränge.

In diesen Konformationen

bilden sich jeweils

Wasserstoffbrückenbindungen

zwischen den C=O und N-H

Atomen des Rückgrats. Daher

sind diese Einheiten strukturell

stabil.

Sekundärstrukturelemente

Page 11: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 11

Diederwinkel des Proteinrückgrats

Lesk-Buch

Die dreidimensionale

Faltung des Proteins wird

vor allem durch die

Diederwinkel des

Proteinrückgrats bestimmt.

Pro Residue gibt es 2 frei

drehbare Diederwinkel, die

als und bezeichnet

werden.

Page 12: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 12

Stabilität und Faltung von Proteinen

Die gefaltete Struktur eines Proteins ist

die Konformation, die die günstigste freie

Enthalpie G für diese

Aminosäuresequenz besitzt.

Der Ramachandran-Plot charakterisiert

die energetisch günstigen Bereiche des

Aminosäurerückgrats.

Die einzige Residue, die außerhalb der

erlaubten Bereich liegt, also alle

möglichen Torsionswinkel annehmen

kann, ist Glycin.

Grund: es hat keine Seitenkette.

r-Helix-Region

-Faltblatt-Region

(rechtsgängige Helix)

Page 13: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 13

Kompakter Bereich im

Faltungsmuster einer

Molekülkette,

der den Anschein hat, “er

könnte auch unabhängig von

den anderen stabil sein”.

Domänen

cAMP-abhängige Proteinkinase

SERCA Calcium-Pumpe

Lesk-Buch

Page 14: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 14

Modular aufgebaute Proteine bestehen aus mehreren Domänen.

Anwendung von SMART (www.smart.embl-heidelberg.de) für die Src-Kinase HcK

ergibtSequenz: MGGRSSCEDP GCPRDEERAP RMGCMKSKFL QVGGNTFSKT ETSASPHCPVYVPDPTSTIK PGPNSHNSNT PGIREAGSED IIVVALYDYE AIHHEDLSFQKGDQMVVLEE SGEWWKARSL ATRKEGYIPS NYVARVDSLE TEEWFFKGISRKDAERQLLA PGNMLGSFMI RDSETTKGSY SLSVRDYDPR QGDTVKHYKIRTLDNGGFYI SPRSTFSTLQ ELVDHYKKGN DGLCQKLSVP CMSSKPQKPWEKDAWEIPRE SLKLEKKLGA GQFGEVWMAT YNKHTKVAVK TMKPGSMSVEAFLAEANVMK TLQHDKLVKL HAVVTKEPIY IITEFMAKGS LLDFLKSDEGSKQPLPKLID FSAQIAEGMA FIEQRNYIHR DLRAANILVS ASLVCKIADFGLARVIEDNE YTAREGAKFP IKWTAPEAIN FGSFTIKSDV WSFGILLMEIVTYGRIPYPG MSNPEVIRAL ERGYRMPRPE NCPEELYNIM MRCWKNRPEERPTFEYIQSV LDDFYTATES QYQQQP

Modular aufgebaute Proteine

Page 15: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 15

http://jkweb.berkeley.edu/

Beispiel: Src-Kinase HcK

Page 16: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 16

Die Klassifikation von Proteinstrukturen

nimmt in der Bioinformatik eine

Schlüsselposition ein, weil sie das

Bindeglied zwischen Sequenz und

Funktion darstellt.

Lesk-Buch

Klassifikation von Proteinen

Page 17: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 17

Im Inneren der Lipidschicht kann das Proteinrückgrat keine Wasserstoffbrücken-

Bindungen mit den Lipiden ausbilden

die Atome des Rückgrats müssen miteinander Wasserstoffbrückenbindungen

ausbilden,

sie müssen entweder helikale oder -Faltblattkonformation annehmen.

Topologie von Membranproteinen

Page 18: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 18

Topologie von Membranproteinen

http://www.biologie.uni-konstanz.de/folding/Structure%20gallery%201.html

Die hydrophobe Umgebung erzwingt, dass (zumindest die bisher bekannten)

Strukturen von Transmembranproteinen entweder reine -Barrels (links)

oder reine -helikale Bündel (rechts) sind.

Page 19: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 19

Vergleich von zwei Proteinstrukturen:

Angabe des RMS-Werts, die Wurzel

der mittleren quadratischen

Abweichung,

oder root-mean-square deviation

Interessanterweise ist bei zwei

verschiedenen Proteinen oft nicht klar,

welche Atome überlagert werden

sollen!

Superposition von Strukturen und Struktur-Alignment

n

dRMS i

2

di : Abstand zwischen den Koordinaten des

i-ten Atompaares

n : Anzahl an Atompaaren

Page 20: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 20

L. Holm & C. Sander

Während der Evolution eines Proteins verändert sich seine Struktur.

Was häufig erhalten bleibt, ist die Verteilung der Kontakte zwischen den Aminosäuren.

Konstruiere Kontaktmatrix (distance matrix) für beide Proteine (leicht)

finde maximal übereinstimmende Untermatrizen der Kontaktmatrizen (schwierig)

http://www.ebi.ac.uk/dali

DALI (Distance-matrix Alignment)

Page 21: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 21

Wie kann man 2 Proteinstrukturen vergleichen?

Paarweise Sequenzvergleiche

Paarweise Strukturvergleiche?

Erkläre Kontaktmatrix an der Tafel

Page 22: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 22

Partitioning protein space into homologous families

The tramtrack protein [2drp] is a small

protein (525 heavy atoms, 63 residues,

and 6 elements of secondary structure).

Yet it exhibits typical modular protein

architecture with two compact structural

domains, the so-called zinc fingers.

(A) The most detailed description of

atomic positions is required to understand

the function of the tramtrack protein (gray

and black, running left to right), which

involves binding to a specific base

sequence of DNA (white).

Holm, Sander Science 273, 5275 (1996)

Page 23: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 23

Partitioning protein space into homologous families

(B) When side chains are stripped off, the

polypeptide backbone (thick) can be seen

meandering from the bottom left to the

upper right.

Thin lines: hydrogen bonds between

amide and carbonyl groups of the

polypeptide backbone give rise to

secondary structure.

(C)

shows secondary structure elements

schematically as arrows for  strands and

cylinders for  helices (with zinc atoms as

spheres). Holm, Sander Science 273, 5275 (1996)

Page 24: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 24

Meaning of structural equivalence

Shape comparison aims at the 1:1

enumeration of equivalent polymer units

in 2 protein molecules.

The problem and solution can be

represented

- in 3D, as a rigid-body superimposition;

- in 2D, as similar patterns in distance

matrices;

- in 1D, as an alignment of amino acid

sequences.

-

Here, the comparison of the tramtrack

protein with another zinc finger protein,

the human enhancer-binding protein

MBP-1 [1bbo], is used as an example.

Holm, Sander Science 273, 5275 (1996)

(A) In the 3D comparison, the problem is to find a translation and rotation of one molecule (red: 1bbo) onto the other (blue: 2drpA). The 3D superimposition (residue centers only, green lines join equivalenced residue centers, zinc atoms as spheres) is not exact because of an internal rotation of the two zinc finger domains relative to one another.

Page 25: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 25

Partitioning protein space into homologous families(B) The 2D distance matrices reveal

the conserved structure of the zinc

fingers (left: distance matrices of the

whole structures; black dots are

intramolecular distances less than

12 Å, 1bbo at bottom and 2drpA on

top; right: distance matrices brought

into register by keeping only rows or

columns corresponding to

structurally equivalent residues).

(C) One-dimensional alignment of

amino acid strings. Evolutionary

comparison aligns the histidine (H)

residues involved in zinc binding

(bold; helices and strands of

secondary structure are underlined).

Holm, Sander Science 273, 5275 (1996)

Page 26: 5. Vorlesung WS 2006/07Softwarewerkzeuge1 V5: Bioinformatische Analyse von Proteinstrukturen Angelehnt an Kapitel 1 und 5 aus dem Buch von Arthur Lesk.

5. Vorlesung WS 2006/07

Softwarewerkzeuge 26

Die Sekundärstrukturelemente -Helix und -Faltblatt werden durch energetisch

günstige Wasserstoffbrücken zwischen Atomen des Peptidrückgrats gebildet.

Sie sind sequenzunabhängig.

Protein ”folds” ergeben sich durch die Assemblierung von

Sekundärstrukturelementen.

Der Ramachandran-Plot ist ein wichtiges Werkzeug um die Güte von Protein-

strukturen (bzw. –modellen) zu beurteilen.

Proteine sind oft modular aus mehreren Domänen aufgebaut.

Der Vergleich mehrerer Proteinstrukturen ist nicht-trivial.

Eine weitverbreitete Methode (DALI) vergleicht die Kontaktmatrizen der beiden

Proteine.

Zusammenfassung


Recommended