Ein Verfahren für BAC DNA-Aufreinigung im Hochdurchsatz
zur Genomkartierung von Dicentrarchus labrax
vorgelegt von
Diplom-Ingenieur
Heiner Kuhl
Von der Fakultät III – Prozesswissenschaften
der Technischen Universität Berlin
zur Erlangung des akademischen Grades
Doktor der Ingenieurswissenschaften
-Dr. Ing.-
genehmigte Dissertation
Promotionsausschuss:
Vorsitzender: Prof. Dr. Helmut Görisch
Berichter: Prof. Dr. Roland Lauster
Berichter: PD Dr. Lorenz Adrian
Tag der wissenschaftlichen Aussprache: 07.03.2008
Berlin 2008
D83
Diese Arbeit
wurde durchgeführt am
Max-Planck-Institut für
Molekulare Genetik Berlin
In der Arbeitsgruppe von
Dr. Richard Reinhardt
Hiermit erkläre ich an Eides Statt, dass ich die vorliegende Arbeit selbst angefertigt habe. Die
aus fremden Quellen direkt oder indirekt übernommenen Gedanken sind als solche kenntlich
gemacht.
Heiner Kuhl Berlin, den
DANKSAGUNG
Diese Arbeit entstand in der Zeit vom 1. Mai 2004 bis zum 30. November 2007 in der
Arbeitsgruppe von Dr. Richard Reinhardt am Max-Planck-Institut für Molekulare Genetik,
Berlin. Ihm danke ich für die vielfältigen technischen Möglichkeiten, welche mir in seiner
Arbeitsgruppe geboten wurden und für die verantwortungsvollen Aufgaben, die er mir
anvertraute.
Für technische Unterstützung bedanke ich mich aufs Herzlichste bei allen Mitarbeitern der
Arbeitsgruppe von Dr. Reinhardt. Besonderer Dank gilt dabei Gregor Wozniak für die
Programmierung der verschiedenen Roboter. Dr. Bernd Timmermann, Anna Kosiura und
Isabelle Kuehndahl möchte ich für die Unterstützung bei der DNA-Sequenzierung auf dem
Roche GS20-System danken. Dr. Alfred Beck, Dr. Michael Kube und Sven Klages danke ich
für bioinformatische Tipps und Tricks. Ebenso tausend Dank an Beatrice Baumann, Birol
Köysüren, Steffen Wiechert und Janina Thiel, die mit ihrer Arbeit zum reibungslosen Ablauf
der Sequenzierung von Dicentrarchus labrax beitrugen!
Herrn PD Dr. Lorenz Adrian und Herrn Professor Dr. Roland Lauster sei für die Betreuung
dieser Arbeit seitens der Technischen Universität Berlin herzlich gedankt.
Meiner Freundin Margot Kasper danke ich für die Jahre in Berlin und für Ihre immer wieder
erfolgreichen Aufmunterungsversuche in schwierigen Phasen der Doktorarbeit.
I
INHALTSVERZEICHNIS
1. EINLEITUNG ................................................................................................................ 1
1.1. Bedeutung des Probendurchsatzes für die Genomsequenzierung....................... 1
1.2. Sequenzierungstechnologien der zweiten Generation ........................................... 2
1.3. DNA-Templates als limitierender Faktor der Sanger-Sequenzierung.................... 2
1.3.1. PCR ....................................................................................................................... 3
1.3.2. Rolling Circle Amplifikation .................................................................................... 3
1.3.3. Plasmid-Isolation ................................................................................................... 4
1.4. Aufreinigung von Plasmid-DNA im Hochdurchsatz ................................................ 5
1.4.1. Magnetische Partikel ............................................................................................. 6
1.4.2. Adsorption an Silica-Membranen........................................................................... 7
1.4.3. Präzipitation mit Alkoholen und direkte Sequenzierung aus Zelllysat ................... 8
1.5. Größenselektive DNA-Präzipitation in PEG / Salz Gemischen ............................... 9
1.5.1. Plasmid-Aufreinigung durch größenselektive Präzipitation ................................. 11
1.5.2. PCR-Produktaufreinigung durch größenselektive Präzipitation........................... 12
1.5.3. Automatisierung der PEG-Methode und ihre Grenzen ........................................ 12
1.6. Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen ........................... 13
1.6.1. BAC-Filterhybridisierung...................................................................................... 13
1.6.2. BAC-Klon Fingerprinting ...................................................................................... 14
1.6.3. Komparative Kartierung mit BAC-Endsequenzen................................................ 15
1.7. Der Wolfsbarsch - Dicentrarchus labrax ................................................................ 16
1.7.1. Fortgeschrittene Fischgenomprojekte für komparative Studien mit D. labrax ..... 17
1.8. Ziel der Arbeit............................................................................................................ 18
II
2. MATERIAL UND METHODEN ................................................................................... 19
2.1. Verwendete Materialien und Geräte ........................................................................ 19
2.1.1. Chemikalien ......................................................................................................... 19
2.1.2. Enzyme und Reaktionspuffer............................................................................... 20
2.1.3. Besondere Verbrauchsmaterialien ...................................................................... 20
2.1.4. Primer für die Sequenzierung .............................................................................. 20
2.1.5. Längenmarker für die Agarose-Gelelektrophorese.............................................. 21
2.1.6. Geräte.................................................................................................................. 21
2.1.7. Puffer und Lösungen ........................................................................................... 22
2.1.8. BAC-Bibliothek von D. labrax .............................................................................. 24
2.1.9. Genomsequenzen von T. nigroviridis, O. latipes und G. aculeatus ..................... 24
2.2. Untersuchungen von PEG-Präzipitationsmethoden ............................................. 25
2.2.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen .......................... 25
2.2.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen......................... 26
2.2.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und
Substitution von PEG durch 2-Propanol .............................................................. 27
2.2.4. Aufreinigung von Plasmid-DNA durch größenselektive Fällung in PEG / KAcetat /
2-Propanol-Gemischen. ....................................................................................... 28
2.2.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol ....................... 30
2.2.6. Größenselektive Präzipitation von DNA für die Shotgun-Klonierung................... 30
2.2.7. Steigerung der Fosmid-DNA Ausbeute d. induzierbare high-copy Replikation ... 32
2.3. DNA-Sequenzierung ................................................................................................. 32
2.3.1. Sequenzierung von Plasmid-DNA ....................................................................... 32
2.3.2. Sequenzierung von Fosmid-DNA und BAC-DNA ................................................ 33
2.3.3. Ethanol / NaAcetat-Fällung von Sequenzierungsprodukten ................................ 34
2.3.4. Parameter für Sequenzanalyse auf dem ABI3730xl-System............................... 34
2.3.5. Sequenzierung eines Pools von 109 BACs auf dem Roche GS20-System ........ 35
2.3.6. CsCl-Gradientenzentrifugation von BAC-DNA .................................................... 35
2.4. Bioinformatische Datenanalyse .............................................................................. 36
2.4.1. Anordnung von D. labrax BAC-Endsequenzen auf den Genomen von Tetraodon
nigroviridis, Oryzias latipes und Gasterosteus aculeatus .................................... 36
2.4.2. Komparative Genomkartierung von D. labrax auf G. aculeatus .......................... 36
2.4.3. Abgleich von genetischer Kopplungskarte und komparativer Karte .................... 37
2.4.4. Abgleich der Radiation Hybrid-Kartierung von S. aurata und G. aculeatus ......... 38
2.4.5. Prozessierung der Sanger-Sequenzdaten........................................................... 38
III
2.4.6. Assemblierung von BAC-Shotgun-Sequenzierungen.......................................... 38
2.4.7. Hybridassemblierung von GS20 und Sanger-Sequenzdaten .............................. 38
3. ERGEBNISSE ............................................................................................................ 40
3.1. Analyse der PEG-Präzipitation ................................................................................ 40
3.1.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen .......................... 40
3.1.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen......................... 42
3.1.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und
partielle Substitution von PEG durch 2-Propanol................................................. 42
3.1.4. Plasmid-DNA Aufreinigung in PEG / Kaliumacetat / 2-Propanol-Gemischen...... 44
3.1.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol ....................... 48
3.1.6. Weitere Anwendungen der größenselektiven Präzipitation ................................. 49
3.2. Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung......................... 50
3.2.1. Das 96-Well Format............................................................................................. 50
3.2.2. Das 384-Well Format........................................................................................... 51
3.3. Endsequenzierung von Fosmiden und BACs ........................................................ 54
3.3.1. Steigerung der Fosmid Ausbeute durch induzierbare high-copy Replikation ...... 54
3.3.2. Vergleich von Fosmid-Endsequenzierung mit und ohne Induktion...................... 55
3.3.3. BAC-Endsequenzierung ...................................................................................... 56
3.4. Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen ..... 57
3.4.1. Anordnung der D. labrax BAC-Endsequenzen auf Referenzgenomen ............... 57
3.4.2. Komparative Kartierung von D. labrax BAC-Klonen auf G. aculeatus ................. 58
3.4.3. Verifikation von angeordneten BAC Klonen ........................................................ 61
3.4.4. Abgleich von genetischer und komparativer Karte von D. labrax ........................ 62
3.4.5. Vergleich der Radiation Hybrid Kartierung von S. aurata mit G. aculeatus ......... 64
3.4.6. Sequenzierung von 109 BACs durch das GS20-System .................................... 65
3.4.7. Hybridassemblierung von Sanger- und GS20-Sequenzdaten eines D. labrax
Chromosoms........................................................................................................ 66
3.5. Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen ....... 66
3.5.1. EST-Sequenzierung ............................................................................................ 66
3.5.2. Fosmid-Endsequenzierung für die Genomanalyse von G. forsetii ...................... 67
3.5.3. Genomsequenzierung eines Archaebakteriums des rice-cluster-I durch
Metagenomanalyse mit Hilfe von Fosmid-Endsequenzen................................... 67
IV
4. DISKUSSION.............................................................................................................. 69
4.1. Phasendiagramme der PEG-Präzipitation .............................................................. 69
4.1.1. Das PEG / NaCl-System...................................................................................... 70
4.1.2. Das PEG / MgCl2-System.................................................................................... 71
4.1.3. Das PEG / KAcetat-System................................................................................. 72
4.1.4. Fällungsparameter für die Plasmid-Präparation .................................................. 73
4.1.5. Fällungsparameter für die PCR-Produkt Aufreinigung ........................................ 74
4.1.6. Weitere Anwendungsmöglichkeiten der größenselektiven Präzipitation ............. 74
4.2. Automatisierung durch Robotik .............................................................................. 75
4.2.1. Das 96er MTP-Format ......................................................................................... 75
4.2.2. Das 384er MTP-Format ....................................................................................... 76
4.3. Sequenzierung unter Verwendung von unterschiedlichen Vektortypen............. 77
4.3.1. Plasmid-Sequenzierung....................................................................................... 78
4.3.2. Fosmid-Endsequenzierung.................................................................................. 79
4.3.3. BAC-Endsequenzierung ...................................................................................... 80
4.4. Komparative Genomkartierung von Dicentrarchus labrax ................................... 82
4.4.1. Referenzgenome ................................................................................................. 82
4.4.2. Alignment der Endsequenzen auf T. nigroviridis und G. aculeatus ..................... 82
4.4.3. Die komparative Genomkarte von D. labrax........................................................ 84
4.4.4. Abgleich von genetischer Kopplungskartierung und komparativer Kartierung .... 86
4.4.5. Verifikation von angeordneten BAC Klonen ........................................................ 88
4.4.6. Rückschlüsse auf die Genomgröße von D. labrax .............................................. 89
4.4.7. Nutzung von ultra-hochdurchsatz Sequenzierungstechniken.............................. 91
4.5. Ausblick ..................................................................................................................... 92
5. ZUSAMMENFASSUNG.............................................................................................. 95
6. QUELLEN................................................................................................................... 96
V
ABBILDUNGSVERZEICHNIS
Abb. 1: Prinzip der DNA-Aufreinigung mit magnetischen Partikeln. .................................. 6 Abb. 2: Eines der automatisierten Systeme für die SPRI-Aufreinigung am JGI................. 7 Abb. 3: Glasfilterplatte für die Plasmid-DNA-Aufreinigung................................................. 7 Abb. 4: Sequentielle und parallele Fällung sonifizierter DNA nach Lis et al. ................... 10 Abb. 5.: Zusammenhang zwischen DNA-Konzentration und Ausbeute bei der
größenselektiven Präzipitation von DNA in PEG / NaCl. ..................................... 11 Abb. 6: Der Wolfsbarsch – Dicentrarchus labrax. ............................................................ 16 Abb. 7: Stammbaum der Knochenfische.......................................................................... 17 Abb. 8: Parameter der Plasmid, Fosmid und BAC Sequenzanalyse auf ABI3730xl-
Geräten................................................................................................................ 34 Abb. 9: Größenselektive Präzipitation von DNA in 1 M und 0,3 M NaCl bei
unterschiedlichen PEG-Konzentrationen............................................................. 40 Abb. 10: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / NaCl........... 41 Abb. 11: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / MgCl2. ........ 42 Abb. 12: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / KAcetat. ..... 43 Abb. 13: Größenselektive Fällung von DNA in Lösungen mit konstanter PEG- und KAcetat-
Konzentration, durch Zusatz von variierenden Mengen 2-Propanol.................... 43 Abb. 14: Messung der Absorption bei 260 nm von unterschiedlich gefällten Plasmid-
Präparationen. ..................................................................................................... 44 Abb. 15: Vergleich von Plasmid-Präparation mit und ohne RNAse.................................... 45 Abb. 16: Korrigierte Messwerte von Präparationen plasmid-haltiger Zellen. ..................... 46 Abb. 17: Leseweiten der Sequenzierung von PEG / 2-Propanol aufgereinigter Plasmide. 47 Abb. 18: Größenselektive Fällung von PCR-Produkten..................................................... 48 Abb. 19: Selektion von sonifizierten DNA-Fragmenten im Bereich von 1-4 kb durch
größenselektive Fällung. ...................................................................................... 49 Abb. 20: Anhand der Sequenzdaten ermittelte Insertgrößenverteilung von 4 BAC-Shotgun-
Banken................................................................................................................. 50 Abb. 21: Roboteranlage für Plasmid-, Fosmid- und BAC-DNA Aufreinigung im 96er MTP-
Format.................................................................................................................. 50 Abb. 22: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 96er
Format.................................................................................................................. 51 Abb. 23: Aufbau der „BigRobby“-Anlage zur automatisierten Plasmid-Aufreinigung im
384er-Format. ...................................................................................................... 52 Abb. 24: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 384er
MTP-Format. ........................................................................................................ 52
VI
Abb. 25: Schema des durch die PEG / 2-Propanol-Aufreinigungsmethode vereinfachten
Ablaufs. ................................................................................................................ 53 Abb. 26: Zelldichte von L-Arabinose induzierten copy control Fosmid-Klonen in Abhängig-
keit von Inkubationszeit und Medienzusammensetzung...................................... 54 Abb. 27: Vergleich von Fosmid-Endsequenzierungen im 96er MTP- und im 384er MTP-
Format.................................................................................................................. 55 Abb. 28: Leseweitenverteilung von 102.282 Endsequenzen einer BAC-Bank des D. labrax
Genoms. .............................................................................................................. 56 Abb. 29: Elektropherogramm einer BAC-Endsequenzierung............................................. 56 Abb. 30: Menge der auf verschiedenen Fischgenomen angeordneten BAC-Endsequenzen
in Prozent............................................................................................................. 58 Abb. 31: Genomweite Darstellung der komparativen Karte von D. labrax auf den
Chromosomen von G. aculeatus. ........................................................................ 60 Abb. 32: Vergleich von durch komparative Kartierung auf G. aculeatus vorhergesagten
Koordinaten von BAC-Endsequenzen und realen Koordinaten auf D. labrax. .... 61 Abb. 33: Abgleich der genetischen Kopplungskarte von D. labrax und dem Genom von
G. aculeatus......................................................................................................... 63 Abb. 34: Unterschiede des Sequencing Coverage der 1000 größten Contigs eines Pools
von 109 auf dem GS20-System sequenzierten BAC-Inserts............................... 65 Abb. 35: PEG / NaCl-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher
Fragmentgrößen. ................................................................................................. 71 Abb. 36: PEG / MgCl2-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher
Fragmentgrößen. ................................................................................................. 71 Abb. 37: PEG / Kaliumacetat-Phasendiagramm für die Löslichkeit von DNA
unterschiedlicher Fragmentgrößen...................................................................... 72 Abb. 38: Durchmischung von hochkonzentrierter PEG / NaCl-Lösung mit Plasmid-DNA
durch Einwirkung der Schwerkraft. ...................................................................... 76 Abb. 39: Anzahl einseitig und beidseitig sequenzierter BAC-Klone................................... 81 Abb. 40: Vergleich der Anordnung von BAC-Endsequenzen auf dem Genom von
T. nigroviridis und G. aculeatus............................................................................ 83 Abb. 41: Grafische Darstellung des Bereichs aus Tab. 22. ............................................... 85 Abb. 42: Vergleich homologer Chromosomen von T. nigroviridis, S. aurata und
G. aculeatus, sowie komparativer BAC-Karte von D. labrax. .............................. 87 Abb. 43: Genstruktur der cyp19-Aromatase Isoformen, welche auf bassbac-27g15 und
bassbac-22g15 identifiziert wurden. .................................................................... 88 Abb. 44: Alignment eines 1,3 Mb Scaffold von D. labrax auf G. aculeatus und T. nigroviridis
durch VISTA. ....................................................................................................... 90
VII
Abb. 45: Darstellung der Verteilung „virtueller“ Insertgrößen beidseitig angeordneter BACs
auf Genomen von T. nigroviridis, G. aculeatus und O. latipes. ........................... 90 Abb. 46: Vergleich von Sequenzierungsergebnissen des GS20-Systems. ....................... 91 Abb. 47: Vista Alignment der Sequenzdaten von 109 BACs, welche mit dem GS20 System
gepoolt sequenziert wurden................................................................................. 92 Abb. 48: Entwicklung des Sequenzierungsdurchsatzes am MPI f. Molekulare Genetik. ... 93
VIII
TABELLENVERZEICHNIS
Tab. 1: Vor- und Nachteile von alternativen Methoden zur Produktion von Template-DNA
für die Sanger-Sequenzierung............................................................................... 5 Tab. 2: Einflussparameter auf die größenabhängige DNA-Fällung in PEG / NaCl
Gemischen nach Lis et al. ................................................................................... 10 Tab. 3: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / NaCl-Fällung. .. 25 Tab. 4: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen NaCl-
Versuchsreihen. ................................................................................................... 25 Tab. 5: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / MgCl2-Fällung.. 26 Tab. 6: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen MgCl2-
Versuchsreihen. ................................................................................................... 26 Tab. 7: Versuchsreihen zur Bestimmung von Eigenschaften der PEG/KAcetat-Fällung. 27 Tab. 8: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen KAcetat-
Versuchsreihen. ................................................................................................... 27 Tab. 9: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / Kaliumacetat-
Fällung in Gegenwart von 2-Propanol.................................................................. 28 Tab. 10: Schrittweise Erhöhung der 2-Propanol-Konzentration in den einzelnen
Versuchsreihen mit Kaliumacetat / PEG. ............................................................. 28 Tab. 11: Versuchsreihen zur Bestimmung von Fällungsparametern zur Plasmid-DNA
Aufreinigung in PEG / Kaliumacetat / 2-Propanol. ............................................... 29 Tab. 12: Plasmidsafe-Reaktionsansätze zum Verdau von linearer genomischer DNA. .... 30 Tab. 13: Reaktionsbedingungen für die Reparatur der Enden von gescherter DNA. ........ 31 Tab. 14: Ligationsansatz für die Erstellung von Shotgun-DNA-Banken. ........................... 31 Tab. 15: Zusätze für die verzögerte Induktion der high-copy Replikation von pCC1Fos-
Vektoren............................................................................................................... 32 Tab. 16: Sequenzierungsreaktion für Plasmid-DNA. ......................................................... 32 Tab. 17: Temperaturprogramm für die Sequenzierung von Plasmid-DNA. ....................... 33 Tab. 18: Modifizierter Sequenzierungsansatz für BACs und Fosmide. ............................. 33 Tab. 19: Ergebnisse des D. labrax BAC-Endsequenzierungsprojekts............................... 57 Tab. 20: Oxford-Plot von 460 Markern der S. aurata Radiation Hybrid-Kartierung auf den
Chromosomen von G. aculeatus.......................................................................... 64 Tab. 21: Typische Ausbeuten und Leseweiten bei unterschiedlichen Vektorkonstrukten. 78 Tab. 22: Tabellarische Darstellung von angeordneten BAC-Endsequenzen auf dem
Genom von G. aculeatus. .................................................................................... 84
IX
ABKÜRZUNGSVERZEICHNIS
2-prop 2-Propanol
Ab Absorption
AFLP amplified fragment-length polymorphism
AG Arbeitsgruppe
Abb. Abbildung
b Basen
BAC bacterial artificial chromosome
Baylor HGSC Baylor Human Genome Sequencing Center; USA
bp Basenpaare
cDNA komplementäre DNA
CGE capillary gelelectrophoresis, Kapillargelelektrophorese
Chr Chromosom
Contig lückenlose Sequenzdaten, welche aus überlappenden kürzeren
Sequenzen zusammengesetzt sind
d day, Tag
ddNTP Didesoxynukleotid
DNA Desoxyribonukleinsäure
dNTP Desoxynukleotid
EDTA Ethylendiamintetraessigsäure
ES Endsequenz
EST expressed sequence tag
et al. et alteri
FLI Fritz-Lipmann-Institut, Jena
G Erdbeschleunigung (9,81 m/sek2)
GBF Gesellschaft für Biotechnologische Forschung, Braunschweig
h hours, Stunden
HZI Helmholtz Zentrum für Infektionsforschung, Braunschweig
IMB Institut für Molekulare Biotechnologie, Jena
JGI Joint Genome Institute, USA
kb Kilobasen
Mb Megabasen
Mbp Megabasenpaare
MPI Max-Planck-Institut
MTP Mikrotiterplatte
OD Optische Dichte
X
ORF open reading frame
Ori origin of replication, Replikationsursprung
PCR polymerase chain reaction, Polymerase-Kettenreaktion
PA Polyacrylamid
PEG Polyethylenglycol
PVDF Polyvinylidenfluorid
RCA rolling circle Amplifikation
RC-I Rice Cluster I
RH radiation hybrid
RIKEN Institute of Physical and Chemical Research, Japan
RNA Ribonukleinsäure
rpm rotations per minute, Umdrehungen pro Minute
RT Raumtemperatur
RZPD Deutsches Ressourcenzentrum für Genomforschung
SDS Sodium-dodecyl-sulfate, Natriumdodecylsulfat
s Sekunden
SNP single nucleotide polymorphism
SPRI solid phase reversible immobilization
Tab. Tabelle
TBE TRIS-Borat-EDTA
TE TRIS-EDTA
TIGR The Institute for Genome Research, USA
TRIS HCl Tris (hydroxymethyl) aminomethan Hydrochlorid
UV Ultraviolettstrahlung
VBA Visual Basic for Applications
v/v Volumen pro Volumen
w/v Gewicht pro Volumen
wga whole genome amplification
WGS whole genome shotgun
YAC Yeast artificial chromosome
YT Yeast Tryptone
λ-DNA Erbgut des Phagen Lambda
Einleitung: Bedeutung des Probendurchsatzes für die Genomsequenzierung 1
1. Einleitung
1.1. Bedeutung des Probendurchsatzes für die Genomsequenzierung
Nach der Aufklärung der DNA-Struktur 1953 (1) und der Entschlüsselung des genetischen
Codes 1961 - 1966 (2) wurden schnelle Methoden benötigt, die die Basenabfolge in DNA-
Molekülen bestimmen konnten. Die Arbeiten von Frederick Sanger (3) sowie Maxam und
Gilbert (4) ermöglichten die Bestimmung der Sequenz von DNA-Fragmenten gegen Ende
des Jahres 1977.
Mit Entwicklung der Polymerase-Kettenreaktion (PCR) ab 1983 (5, 6) konnte die Sanger-
Methode weiter verbessert werden, in dem man die Sequenzierungsreaktion als Cycle-
Sequencing in Thermocyclern durchführte. Durch Nutzung von Fluoreszenzfarbstoffen für die
Markierung der ddNTPs setzte sich die Sanger-Methode endgültig gegenüber der Maxam-
Gilbert-Methode durch, da die Arbeitsschritte ohne Radioaktivität durchgeführt wurden und
die Methode besser automatisiert werden konnte.
Die Leseweite von DNA-Fragmenten ist mit der Sanger-Methode auf ca. 1.000 b limitiert,
woraus resultierte, dass für die Sequenzierung größerer DNA-Moleküle Klonierungs-
strategien entwickelt werden mussten.
Die Shotgun-Klonierung (7) ist ihr bekanntester Vertreter. Die geringe Leseweite bei der
Sequenzierung kann mit der Shotgun-Methode durch eine Vielzahl von Sequenzierungen
zufällig überlappender Fragmente des ursprünglichen DNA-Strangs kompensiert werden. Im
Durchschnitt musste jede Base großer DNA-Moleküle statistisch betrachtet mindestens
10fach sequenziert werden, um die Basenabfolge des Moleküls aus kurzen überlappenden
Sequenzen lückenlos zu rekonstruieren. Methoden, die höhere Leseweiten erzielten als die
Sequenzierung nach Sanger, waren und sind bisher nicht bekannt. Die weitere Entwicklung
der Sequenzierungstechnologien musste also durch massive Parallelisierung vorangetrieben
werden.
Vor 1990 war nur die Sequenzierung kleiner viraler Genome und Plasmide möglich. Erst in
den 90er Jahren konnten polyacrylamidgel-basierte Sequenzierroboter bis zu 96 Proben in
ca. 8 - 10 h parallel bearbeiten und ermöglichten es, bakterielle Genome mit vertretbaren
Zeitaufwand zu sequenzieren (50.000 – 70.000 Sequenzierungen) (8). Ab 1999 nutzten
Sequenzierroboter die Kapillargelelektrophorese (9), um den Probendurchsatz bei
geringerem Personalbedarf weiter zu steigern. Durch internationale Kooperation wurde es
möglich, das menschliche Genom innerhalb weniger Jahre zu entschlüsseln (>30 Mio.
Sequenzierungen) (10, 11).
In den letzten Jahren wurden neue Sequenzierungstechnologien entwickelt, welche auf hohe
Durchsatzsteigerung bei kürzeren Leseweiten ausgelegt sind.
Einleitung: Sequenzierungstechnologien der zweiten Generation 2
1.2. Sequenzierungstechnologien der zweiten Generation
Mittlerweile sind verschiedene DNA-Sequenzierer der zweiten Generation erhältlich, welche
DNA-Sequenzierung im ultra-Hochdurchsatz ermöglichen (20 - 1000 Mb pro Gerätelauf). Im
Vergleich zur Sanger-Sequenzierung liefern diese Geräte relativ kurze Sequenzdaten von
25 – 250 b. Durch die parallele Analyse von 105 – 107 unterschiedlichen DNA-Molekülen
können die Nachteile der kurzen Sequenzen aber zum Teil ausgeglichen werden.
Das Einsatzgebiet der neuen Technologien ist abhängig von der Art des Genomprojekts. So
eignen sich Sequencing by Synthesis (Illumina / Solexa) und die SOLiD-Technologie (ABI)
wegen ihrer kurzen Leseweiten (25 – 50 b) weniger für die de novo Sequenzierung
unbekannter Genome (12, 13). Für die Resequenzierung von bereits bekannten Genomen,
z. B. zur Analyse von SNPs, stellen die kurzen Leseweiten weniger ein Problem dar. Die
Technologie eignet sich besonders für die Analyse von Expressionsprofilen, z.B. durch
SAGE (Serial Analysis of Gene Expression) oder direkte cDNA-Quantifizierung (14).
Die von Roche / 454 verwendete Pyrosequencing-Technologie erzielt immerhin Leseweiten
von 100 b (250 b in der FLX Version) und ist damit für die de novo Sequenzierung wenig
repetitiver Bakteriengenome prinzipiell geeignet (15).
Goldberg et al. zeigten allerdings anhand der Sequenzierung von mehreren marinen
Bakteriengenomen, dass für qualitativ hochwertige Genomassemblierung weiterhin eine
niedrige Genomabdeckung mit Sanger-Sequenzdaten benötigt wird (85).
1.3. DNA-Templates als limitierender Faktor der Sanger-Sequenzierung
Wie in 1.1 dargestellt erfordert die Sanger-Sequenzierung von Genom-, Metagenom- oder
EST-Projekten aufgrund der hohen Anzahl von Proben automatisierte Systeme, welche die
zur Sequenzbestimmung notwendigen Schritte im Hochdurchsatz durchführen.
Mit der Entwicklung des Cycle-Sequencing nach Sanger und der Kapillargelelektrophorese
besteht die Möglichkeit, Sequenzierungsreaktion und Sequenzanalyse in 384er
Mikrotiterplatten (MTP) durchzuführen, so dass ein hoher Probendurchsatz erzielt wird.
Limitierender Faktor des Probendurchsatzes ist dagegen die zuverlässige Herstellung
qualitativ hochwertiger DNA als Template für die Sequenzierung nach Sanger. Verschiedene
Möglichkeiten zur Produktion sequenzierungstauglicher DNA mit hohem Probendurchsatz
werden im Folgenden vorgestellt.
Einleitung: DNA-Templates als limitierender Faktor der Sanger-Sequenzierung 3
1.3.1. PCR
Die enzymatische Amplifikation mittels PCR kann direkt aus der Übernachtkultur einzelner
Klone einer Klonbibliothek stattfinden (16). Prinzipiell werden die Inserts der Klone dabei so
stark vervielfältigt, dass Verunreinigungen (Zellbestandteile, Reste d. Kulturmediums)
gegenüber der DNA-Konzentration vernachlässigbar werden. Die PCR-Reaktionen können
in kleinen Reaktionsvolumina (10 – 20 µl) durchgeführt und DNA-Bibliotheken somit im 384er
MTP-Format bearbeitet werden, welches im Allgemeinen Volumina bis 40 µl pro Kavität
zulässt.
PCR-Produkte sind grundsätzlich gut geeignet für die Sequenzierung, wenn die Substrate
der Reaktion (Primer, dNTPs) während der Produktbildung verbraucht wurden. Ist dies nicht
der Fall, müssen insbesondere überschüssige Primer durch Aufreinigungsmethoden entfernt
werden, da sie sonst in der Sequenzierungsreaktion Fehlsignale verursachen, die die
Sequenzierungsqualität herabsetzen. Am MPI f. Molekulare Genetik wurden von Holger
Rauth und Richard Reinhardt seit 1996 verschiedene PCR-basierte Verfahren für die
automatisierte Template-Präparation entwickelt (17).
Im Hochdurchsatz ist die Anwendung der PCR auf DNA-Bibliotheken mit geringen
Insertgrößen von 0,1 - 4 kb beschränkt, wobei mit zunehmender Insertgröße die Anzahl an
Reaktionen steigt, welche keine ausreichende Amplifikation liefern. Eine nachträgliche
Qualitätskontrolle und eine Neuanordnung der Produkte (Rearraying) auf neuen MTPs ist
somit notwendig und verzögert den Sequenzierungsprozess maßgeblich.
Ein weiteres Problem der PCR-Methode ist der so genannte Amplification-Bias. Bestimmte
DNA-Sequenzen können nur schlecht oder gar nicht mittels PCR amplifiziert werden und
sind somit in den Ergebnissen der Sequenzierung unterrepräsentiert.
1.3.2. Rolling Circle Amplifikation
Ebenso wie bei der PCR wird DNA bei der Rolling Circle Amplifikation (RCA) durch eine
enzymatische Reaktion vervielfältigt. Die verwendete DNA-Polymerase aus dem
Bacteriophagen Φ29 besitzt eine Strand-Displacement Aktivität und kann ausgehend von
Brüchen (nicks) den DNA-Doppelstrang auftrennen und neu synthetisieren. An dem
verbleibenden Einzelstrang binden Hexamer-Primer zufälliger Sequenz und werden von der
Φ29-DNA-Polymerase zum Doppelstrang ergänzt (18).
Zwar ist die RC-Amplifikation unspezifisch und amplifiziert auch genomische DNA aus der
Übernachtkultur, die hohe Prozessivität der Polymerase (mittlere Produktgröße > 20 kb)
bewirkt jedoch, dass ringförmige Plasmide mit hoher Kopienzahl gegenüber linearen
Einleitung: DNA-Templates als limitierender Faktor der Sanger-Sequenzierung 4
Fragmenten bevorzugt amplifiziert werden. Im Gegensatz zur PCR können also auch
Vektoren, welche Inserts größer 4 kb tragen mit RCA noch zuverlässig amplifiziert werden.
Bei Fosmid- oder BAC-Klonen mit Insertgrößen jenseits von 40 kb und niedriger Kopienzahl
pro Zelle ist jedoch ein vorausgehender Aufreinigungsschritt unerlässlich (19).
Die Reaktion läuft isothermal bei 30ºC ab, dies ist ein Vorteil gegenüber der PCR, welche in
Thermocyclern durchgeführt werden muss. Kommerziell erhältliche Reagenzien für RCA
liefern hohe Produktausbeuten von 150 - 300 ng/µl. Die Reaktion kann in sehr kleinen
Volumina (> 5 µl) durchgeführt werden, was die Nutzung von MTP bis hin zum 1536 Format
ermöglicht.
Die Qualitätskontrolle der RCA-Produkte gestaltet sich schwierig, da sie im Gegensatz zu
PCR-Produkten keine definierten Produkte liefert, sondern ein Gemisch verzweigter DNA
verschiedener Größe, welches auch in Negativ-Kontrollen ohne DNA aus den vorhanden
Hexamer-Primern gebildet wird.
Probleme durch Amplification-Bias sollen wesentlich geringer sein als bei der PCR, weshalb
die RCA bevorzugt auch für die Amplifikation ganzer Genome eingesetzt wird (20).
1.3.3. Plasmid-Isolation
Im Gegensatz zu den in 1.3.1 und 1.3.2 dargestellten enzymatischen Methoden, kann
Template-DNA für die Sequenzierung auch direkt aus den Zellen einer Klon-Bibliothek
gewonnen werden (Amplifikation in vivo). Die Amplifikation der Plasmid-DNA erfolgt dabei
durch Kultivierung der Zellen in größeren Volumen (meist 1,5 ml). Die Größe der Konstrukte
ist dabei nur durch den verwendeten Vektortyp und die Effizienz bakterieller Replikation
beschränkt. Ebenso werden Amplification-Bias Effekte vermieden. Da isolierte Plasmide
keine unverbrauchten Oligonukleotide oder unspezifische Produkte enthalten, ist die Qualität
der Sequenzdaten meist höher als bei unaufgereinigten PCR-Produkten.
Die Vorteile der Plasmid-Isolation gegenüber den enzymatischen Methoden werden durch
höheren methodischen Aufwand teuer erkauft. Laufende Kosten entstehen vor allem durch
verwendete Einwegmaterialien wie Filter und magnetische Partikel. Zusätzlich leidet der
Probendurchsatz unter den großen verwendeten Kulturvolumina, welche die Prozesse meist
an das 96er MTP-Format binden. In Tab. 1 sind die Vor- und Nachteile der dargestellten
Methoden zusammengefasst.
Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 5
Tab. 1: Vor- und Nachteile von alternativen Methoden zur Produktion von Template-DNA für die Sanger-Sequenzierung.
Prinzip Amplifikation in vivo
Amplifikation in vitro
Methode
alkalische Lyse + Aufreinigung mit
magnetischen Partikeln oder Filterplatten
PCR Rolling Circle Amplifikation
Vorteile: geringe Konta-minationsproblematik, Stabilität verwendeter Reagenzien
Vorteile: in kleinen Volumen durchführbar (384er MTP-Format), wenige Arbeits-schritte
Vorteile: in kleinsten Volumen durchführbar (1536er MTP), wenige Arbeitsschritte Hochdurchsatz-
fähigkeit / Automatisier-
barkeit
Nachteile: zeitaufwendig, große Volumina werden benötigt (bisher meist nur 96 Mikrotiterplatten-format)
Nachteile: Instabilität des Enzymansatzes, Kontaminationsproblematik, aufgrund von Ausfällen Rearraying der positiven Produkte notwendig
Nachteile: extreme Kontaminations-problematik, hohe Instabilität des verwendeten Enzyms
Kosten
hoch, da kommerzielle Systeme viele Einweg- materialien verbrauchen (Spitzen, Filter, Beads), 0,4 – 1 Euro pro Klon
niedrig, insofern Enzyme und PCR-Reaktionspuffer selbst hergestellt werden, < 0,1 Euro pro Klon, zusätzliche Kosten für Rearraying der Produkte
hoch, da bisher nur kommerzielle Kits von Amersham-Pharmacia erhältlich 0,25 - 1 Euro pro Klon
Größenbereich amplifizierter
DNA
sämtliche Vektortypen können aufgereinigt werden, 3 kb (pUC) bis 300 kb (BAC), unabhängig von der Insertgrößenverteilung in der DNA-Bank
Im Hochdurchsatz sinkt die Ausbeute ab ca. 4 kb drastisch, gut im Bereich 0,1 kb - 2 kb, enger Größenbereich der Inserts in DNA-Bank ist von Vorteil
im Bereich 3kb - 10kb gute Ausbeuten, größere low-copy Konstrukte können nur nach Aufreinigung der Proben DNA amplifiziert werden
Qualität der Sequenzdaten
sehr gut, auch Bereiche die sich mit PCR nicht amplifizieren lassen
gut, es gibt jedoch Sekundärstrukturen, welche sich nicht amplifizieren lassen
Qualität der Sequenzen liegt über der von PCR-Produkten, reicht jedoch nicht an die von Plasmid Präparationen heran, vor allem bei Vektoren > 10 kb
Qualitäts-kontrolle
Qualitätskontrolle der DNA über Agarosegele gut, photometrische Methoden sind je nach verwendetem System eingeschränkt möglich
Qualitätskontrolle über Agarosegele sehr gut
Qualitätskontrolle nur sehr unzuverlässig, auch Negativkontrol-len ohne DNA bilden Produkte -> Restrikt-ionsverdau notwendig!!!
1.4. Aufreinigung von Plasmid-DNA im Hochdurchsatz
Wie in 1.2 dargestellt, ist die Plasmid-Präparation die flexibelste, aber auch technisch
aufwändigste Methode zur Herstellung von qualitativ hochwertigen DNA-Templates. In den
großen Sequenzierungszentren sind deshalb automatisierte Anlagen konzipiert worden, um
den nötigen Probendurchsatz von bis zu 50.000 Plasmiden pro Tag zu gewährleisten und die
Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 6
Kosten zu reduzieren. Die Verfahren unterscheiden sich maßgeblich in den verwendeten
Strategien zur Plasmid-Aufreinigung.
1.4.1. Magnetische Partikel
Elkin et al. veröffentlichten 2001 ein Verfahren, das am Joint Genome Institute (JGI) für die
Plasmid-Aufreinigung im Zuge des Humangenomprojekts entwickelt und angewendet
wurde (21). Die Plasmid-Isolation erfolgte im 96er MTP-Format durch Zelllyse in Lyso-
zym / Detergenz-Puffer und anschließender Plasmid-DNA-Aufreinigung durch Solid Phase
Reversible Immobilization (SPRI) mit Hilfe von carboxylierten magnetischen Partikeln (22).
Das Prinzip des Aufreinigunsschrittes ist in Abb. 1 dargestellt.
Abb. 1: Prinzip der DNA-Aufreinigung mit magnetischen Partikeln. Plasmid-DNA (rot) bindet in Gegenwart eines Bindungspuffers an magnetische Partikel (schwarz). Verun-reinigungen (grün) werden entfernt. Plasmid-DNA wird in konzentrierter Form in Elutionspuffer gelöst und von den Partikeln getrennt.
Durch vergleichende Sequenzierung von Plasmiden, welche mit Ethanol-Fällung oder SPRI
aufgereinigt worden waren, konnte gezeigt werden, dass die Qualität der Aufreinigung durch
SPRI wesentlich höhere Leseweiten (582 ± 51,6 b gegenüber 446 ± 81,2 b) und mehr
erfolgreiche Sequenzierungen (91 ± 5,6% gegenüber 69,1 ± 15,4%) auf Megabace 1000
Kapillarsequenzierern erzielte (21).
Der Aufreinigungsschritt wurde auf einem Robotersystem automatisiert und erzielte einen
Probendurchsatz von ca. 600.000 Plasmiden pro Monat (20.000 / d) (siehe Abb. 2). Da die
Plasmid-DNA durch Magnetseparatoren von Verunreinigungen getrennt wurde, konnten
Zentrifugationsschritte vermieden werden, so dass die Automatisierung vereinfacht wurde.
Mittlerweile sind Reagenzien auf Basis der SPRI-Technik kommerziell erhältlich, welche die
Aufreinigung auch im 384er MTP-Format ermöglichen (23). Die Kosten pro Probe reduzieren
sich dabei auf ca. 15 Cents für die verwendeten Reagenzien.
Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 7
Abb. 2: Eines der automatisierten Systeme für die SPRI-Aufreinigung am JGI. Das System bewältigt 11 x 96er MTPs pro Stunde (21).
1.4.2. Adsorption an Silica-Membranen
Itho et al. präsentierten 1999 ein System für die Plasmid-Aufreinigung im Hochdurchsatz am
japanischen Forschungsinstitut RIKEN (24). Für die Aufreinigung wurden Glasfilterplatten im
96 MTP-Format konstruiert. Der Ablauf erlaubt es, die Zelllyse durch Lysozym / SDS-Puffer,
selektive Bindung der Plasmid-DNA an die Silicamatrix in Anwesenheit von Guanidin / HCl,
Waschschritte und Elution in einer einzigen Filterplatte durchzuführen. Der Durchfluss der
Reagenzien durch die Filterplatten wird durch ein angelegtes Vakuum möglich, wodurch
aufwändig zu automatisierende und durchsatzlimitierende Zentrifugationsschritte vermieden
werden (siehe Abb. 3).
Abb. 3: Glasfilterplatte für die Plasmid-DNA-Aufreinigung. Das Vo-lumen der Wells beträgt 600 µl. Am Boden jeder Platte befindet sich ein Glasfilter und eine hydrophile PVDF Membran mit einer Porengröße von 0,45 µm. Die Glasfilter sind so ausgelegt, dass E. coli Zellen ge-erntet werden können und Plasmid-DNA in Gegenwart von Guanidin-HCl nach der Lyse adsorbiert wird. Die PVDF Membran hält die Lö-sungen an ihrem Platz (24).
Einleitung: Aufreinigung von Plasmid-DNA im Hochdurchsatz 8
Ein vollautomatisiertes System zur Plasmid-DNA-Aufreinigung wurde als Fließband
konzipiert, auf dem etwa 15.000 Proben in 8 h (45.000 / d) aufbereitet werden können. Ein
Test zeigte, dass 295 von 384 Proben gute Ausbeuten an Plasmid-DNA aufwiesen (76,8%),
von denen wiederum 276 (93,5%) gute Sequenzdaten lieferten. Die relativ hohen Verluste
bei der Präparation wurden auf Wachstumsprobleme der zugrunde liegenden Bakterien-
kulturen zurückgeführt. Die mittlere Leseweite auf einem ABI 377 Sequenzer betrug 450 b
(Ergebnisse sind nicht vergleichbar mit denen von 1.4.1, da verschiedene Geräte für die
Sequenzanalyse verwendet wurden).
Eppendorf bietet kommerzielle Aufreinigungssysteme für Plasmid-DNA auf Basis von 384-
Well Filterplatten mit DNA-Bindungskapazität an (25).
Dederichs et al. beschreiben eine äußerst preisgünstige Alternative zur Aufreinigung von
Plasmiden, welche am Baylor College of Medicine verwendet wird (26). Hierbei handelt es
sich um die Adsorption von Plasmid-DNA an Glasperlen (Ø 212 - 150 µm) in Gegenwart von
2-Propanol. Die Methode wurde nicht automatisiert, konnte aber trotzdem einen Durchsatz
von etwa 10.000 Proben pro Tag gewährleisten, wobei der Anteil erfolgreicher
Sequenzierungen bei ca. 82% lag und Leseweiten von durchschnittlich 500 b auf ABI 3700
Sequenzierern erreicht wurden. Die Kosten der Methode schätzte man auf 10 US-Cents pro
Plasmid. Sie lagen zum damaligen Zeitpunkt (2002) bei 10% des Marktpreises.
1.4.3. Präzipitation mit Alkoholen und direkte Sequenzierung aus Zelllysat
Das Labor von Bruce Roe am Advanced Center for Genome Technology der Universität
Oklahoma hat Protokolle zur Isolation von Plasmiden aus 384er MTPs im Internet öffentlich
zugänglich gemacht (27). Das Protokoll nutzt die alkalischen Lyse und anschließende
2-Propanol Fällung (28). Es kann hier kaum von einer wirklichen Aufreinigung gesprochen
werden, da 2-Propanol auch verdaute RNA und Proteine präzipitiert. Deshalb ist es
fragwürdig, ob die Qualität und Ausbeute der DNA auch für schwieriger zu sequenzierende
Templates, wie BACs oder Fosmide ausreicht. Über Ausfallrate und Leseweite gibt es keine
Angaben.
Ein ähnliches Verfahren zur Isolation von Plasmid-DNA bedient sich Filterplatten von
Corning (29). Hierbei wird das Zelllysat der alkalischen Lyse in einem einzigen
Zentrifugationsschritt durch einen 0,45 µm PVDF-Filter geklärt und in 2-Propanol gefällt. Die
Kosten werden mit 7 US-Cents pro Plasmid angegeben. Die erzielte Leseweite liegt bei
durchschnittlich 599 b auf ABI 3700 CGE-Sequenzern. Über Ausfallraten ist nichts bekannt.
Eine weitere sehr preisgünstige Methode wurde von Marra et al. am Washington Genome
Sequencing Center implementiert (30). Wie im Protokoll von Bruce Roe wird hier ebenfalls
auf eine wirkliche Aufreinigung der DNA verzichtet, die Zellen werden durch eine
Kombination von enzymatischer Lyse durch Lysozym und anschließender Hitzeeinwirkung
Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 9
durch Mikrowellenbestrahlung in 96 MTPs aufgeschlossen. Das Zelllysat wird zentrifugiert
und der Überstand direkt für die DNA-Sequenzierung verwendet. Auf polyacrylamidgel-
basierten ABI377-Sequenzierern konnten durchschnittlich 425 b gelesen werden, wobei 70%
aller Sequenzen Leseweiten über 400 b aufwiesen. Der Preis pro Plasmid-Präparation lag
bei 3 US-Cents und ist derzeit der niedrigste veröffentlichte Wert.
Eine der von Marra et al. ähnliche Methode wurde von Applied Biosystems auf neuerer
Sequenzierungstechnologie und im 384er MTP-Format angewendet. Ein wissenschaftliches
Poster hierzu findet sich im Internet (31). Die Verwendung des ABI3730 Sequenzierroboters
und der BigDye3.1 Sequenzierungsreagenzien erzielten typische Leseweiten von 700 -
800 b mit sehr geringen Ausfallraten.
Alle der in 1.4.3 dargestellten Methoden sind zwar für die Sequenzierung von high-copy
Vektoren geeignet, erweisen sich jedoch problematisch, wenn es um große Vektor-
Konstrukte mit geringer Kopienzahl (BACs, Fosmide) geht.
Außerdem werden wegen des hohen Preisdrucks, der auf öffentlichen Instituten wie auch
kommerziellen Sequenzierungsfirmen lastet, Reagenzien für den Sequenzierungsansatz
meist verdünnt eingesetzt. Hochverdünnte Sequenzierungsreagenzien werden allerdings mit
unzureichend aufgereinigten Plasmid-Templates zunehmend instabil.
Zusätzlich besteht das Problem, dass die Kapillaren moderner CGE-Sequenzierer anfällig für
Verunreinigungen sind und bei unzureichender Template Qualität häufiger gewechselt
werden müssen. Die preisgünstigen Methoden ziehen also Folgekosten nach sich, welche
den Vorteil der Methoden relativieren.
Eine bisher wenig beachtete alternative Aufreinigungsmethode für Plasmide wird im
Folgenden dargestellt. Die Präzipitation von DNA in Polyethylenglycol (PEG) erzielt eine gute
Reinheit der DNA und kommt ohne teure Einwegprodukte wie Filterplatten oder magnetische
Partikel aus.
1.5. Größenselektive DNA-Präzipitation in PEG / Salz Gemischen
Lis et al. beschrieben 1975 erstmals, dass die Löslichkeit von DNA-Molekülen in PEG / Salz
Gemischen von ihrer Größe abhängig ist (32). In dem sie sonifizierte λ-DNA in NaCl-Lösung
mit unterschiedlichen Mengen PEG-6000 versetzten, zeigten sie, dass eine Trennung von
Fragmentgrößen bei relativ niedriger Zentrifugalbeschleunigung durch Präzipitation möglich
ist.
Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 10
Abb. 4: Sequentielle und parallele Fällung sonifizierter DNA nach Lis et al.. Die Fällung großer DNA-Fragmente beginnt bei niedrigen PEG-Konzentrationen. Mit steigender PEG-Konzentration werden auch kleinere Fragmentgrößen ausgefällt (32).
Lis et al. überprüften unterschiedlichste Einflussparameter auf die fraktionierte Fällung,
welche in Tab. 2 zusammenfassend dargestellt sind.
Tab. 2: Einflussparameter auf die größenabhängige DNA-Fällung in PEG / NaCl Gemischen nach Lis et al.
Parameter Effekt
PEG-Konzentration Mit zunehmender Konzentration verschiebt sich die Löslich-
keitsgrenze zu kleineren DNA-Fragmentgrößen
NaCl-Konzentration
Unter 0,2 M keine fraktionierte Fällung / ab 0,35 M steigend
verschiebt sich die Löslichkeitsgrenze zu kleineren DNA-
Fragmentgrößen
DNA-Konzentration
Unter 10 ng/µl DNA kommt es zu massiven Ausbeuteverlusten
von 50% und mehr, mit steigender DNA-Konz. nähert sich die
Ausbeute 100%
Zentrifugalbeschleunigung im Bereich von 1.900 x G bis 27.000 x G kein Einfluss auf die
Fällung
zweiwertige Kationen Verschieben die Löslichkeitsgrenze zu kleineren DNA-
Fragmentgrößen
Equilibrierungszeit längere Zeiten erhöhen Ausbeute und verschieben die
Löslichkeitsgrenze zu größeren DNA-Fragmenten
pH-Wert im Bereich 5 – 8,3 kein Einfluss auf die Löslichkeit
Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 11
1.5.1. Plasmid-Aufreinigung durch größenselektive Präzipitation
Die größenselektive Fällung in PEG-Systemen kann auch zur Trennung von Protein-
gemischen angewendet werden. Eine Vorhersage der Löslichkeitsgrenze für bestimmte
Proteine ist wegen der Heterogenität dieser Molekülklasse allerdings nicht möglich. Ein
Vergleich der Fällungsparameter von Proteinen und DNA zeigt jedoch, dass Proteine erst bei
wesentlich höheren PEG-Konzentrationen präzipitieren als DNA-Fragmente mit Größen von
über 1.000 bp (33).
Die PEG-Fällung kann also eine Trennung großer DNA-Moleküle (z.B. Plasmide) von
Proteinen sowie kleinen Nukleinsäuren, wie z.B. RNAse behandelte RNAs, in einem einzigen
Schritt erzielen. Aus diesem Grund erfüllt diese Methode alle Anforderungen zur
Aufreinigung und Konzentrierung von Plasmiden aus geklärten Zelllysaten, in denen Proteine
und RNA den größten Anteil an Verunreinigungen darstellen.
Mehrere Methoden zur Aufreinigung von Plasmiden durch PEG-Präzipitation mit geringem
Probendurchsatz sind veröffentlicht worden. Pulleyblank et al. (34) nutzten eine PEG / LiCl-
Methode zur Aufreinigung von Plasmiden nach Pronase / SDS-Lyse der Zellen. Die Methode
ist relativ umständlich, da ein Ultrazentrifugationsschritt sowie eine Chloroformextraktion
benötigt wurden. Nicoletti et al. (35) verwendeten dagegen eine Kombination aus
PEG / MgCl2 mit dem Vorteil, dass die Fällung schon bei wesentlich geringeren Ionenstärken
durchgeführt werden konnte (ab 10 mM gegenüber >0,5 M bei NaCl).
Erst Schmitz et al. veröffentlichten 2006 eine Methode, welche durch Nutzung des
PEG / NaCl Systems die Aufreinigung von Plasmid-DNA direkt aus dem geklärten Zelllysat
erlaubte und somit den methodischen Aufwand erheblich verringerte (36). Auf Grund der in
Tab. 2 dargestellten Mindestkonzentration an DNA im Fällungsansatz, musste das Volumen
der zur alkalischen Lyse eingesetzten Puffer minimiert und auch die Fällungsreagenzien
PEG / NaCl mussten möglichst hochkonzentriert zugegeben werden. Erst wenn diese
Bedingungen erfüllt waren, konnte eine direkte Fällung aus dem Überstand der alkalischen
Lyse mit guter Ausbeute gelingen. Den Zusammenhang zwischen Ausbeute und DNA-
Konzentration im Fällungsansatz zeigt Abb. 5:
Abb. 5.: Zusammenhang zwischen DNA-Konzentration und Ausbeute bei der größenselektiven Präzipitation von DNA in PEG / NaCl (36).
Einleitung: Größenselektive DNA-Präzipitation in PEG / Salz Gemischen 12
1.5.2. PCR-Produktaufreinigung durch größenselektive Präzipitation
Anders als bei der Aufreinigung von Plasmiden sind PCR-Produkte mit unverbrauchten
Primern und dNTPs verunreinigt, welche sich negativ auf die Sequenzierungsreaktion
auswirken. Die Größe von PCR-Produkten liegt meist im Bereich 150 b bis 4.000 b. Es
müssen also wesentlich höhere PEG- oder Salz-Konzentrationen gewählt werden, um eine
Fällung kleiner PCR-Produkte zu erzielen (36). Die Trennung von Primern und dNTPs ist
dennoch unproblematisch, da die Trennschärfe der PEG-Methode zu kleineren
Nukleinsäuren hin zunimmt (siehe Abb. 4). Auch die Konzentration von PCR-Produkten ist
im Gegensatz zur Plasmid-Aufreinigung weniger kritisch, da sie meist über 20 ng/µl liegt.
1.5.3. Automatisierung der PEG-Methode und ihre Grenzen
Bisher gibt es in der Literatur keine Veröffentlichungen zu Anlagen, welche die Aufreinigung
von Plasmiden oder PCR-Produkten durch PEG-Präzipitation im Hochdurchsatz
ermöglichen. Dies liegt wahrscheinlich darin begründet, dass die Automatisierung der PEG-
Präzipitation durch mehrere Faktoren erschwert wird. Dazu zählen notwendige
Zentrifugationsschritte, die Viskosität hochkonzentrierter PEG-Lösungen und der hohe
Salzgehalt der Fällungsansätze.
Die Automatisierung von Zentrifugationsschritten ist aufwendig und erfordert speziell dafür
konzipierte Zentrifugen (z.B. Hettich Rotanta). Zudem ist die Zentrifugation im 96er MTP-
Format eine Limitierung für den Probendurchsatz. Dies ist einer der Gründe, weshalb viele
der in 1.4 dargestellten Methoden die Immobilisierung der DNA an Festphasen gegenüber
der Zentrifugation bevorzugen. Die Nutzung von 384er MTPs, welche auch stapelweise
zentrifugiert werden können, relativiert diesen Nachteil.
Die Durchmischung von Lysat und PEG / Salz zur Fällung kann sich gerade in den kleinen
Kavitäten von 384er MTPs als sehr schwierig erweisen, da die verwendeten PEG / Salz
Lösungen eine hohe Viskosität und Dichte aufweisen. Die PEG-Methode ist zudem relativ
empfindlich, was Pipettierungenauigkeiten betrifft und gerade diese werden durch hohe
Viskosität und niedriges Volumen gefördert.
Der hohe Salzgehalt, der für die größenselektive Präzipitation notwendig ist (Tab. 2),
erfordert mehrfaches Waschen der pelletierten DNA, um eine Inhibierung der
Sequenzierungsreaktion auszuschließen. Die Waschschritte erhöhen die Anzahl der nötigen
Zentrifugationsschritte und limitieren so wiederum den Probendurchsatz.
Trotz der zuvor genannten Probleme, würde sich ein automatisiertes, auf PEG-Präzipitation
basierendes DNA-Aufreinigungsverfahren, wegen des zugrunde liegenden Mechanismus der
Einleitung: Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen 13
selektiven Fällung von unterschiedlichen DNA-Molekülgrößen, nicht nur für die
kostengünstige Plasmid-Isolation, sondern auch besonders für die Aufreinigung großer
Vektorkonstrukte eignen, wie sie u.a. zur physikalischen Kartierung von eukaryotischen
Genomen verwendet werden.
1.6. Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen
Shizuya et al. beschrieben 1992 ein neuartiges Vektorsystem auf Basis des F-Plasmids von
E. coli, welches die Klonierung von großen DNA-Fragmenten eukaryotischer Genome
erlaubt und bacterial artificial chromosome (BAC) genannt wurde (37). Die parA- und parB-
Gene des F-Plasmids sorgen für eine niedrige Kopienzahl von 1 - 2 pro Zelle, so dass die
genetische Stabilität der bis zu 300 kb großen Inserts im Vergleich zu den aus Hefe
bekannten yeast artificial chromosomes (YAC) oder Cosmid-Vektoren wesentlich höher ist.
Die BAC-Vektoren wurden im Laufe der Zeit verbessert, z.B. wurde der Vektor pCC1BAC
durch einen zusätzlichen high-copy Replikationsursprung ergänzt (38). Durch Zusatz von
L-Arabinose ins Medium kann dieser indirekt induziert werden und die Ausbeute an BAC-
DNA um ein Vielfaches steigern.
Mittlerweile haben sich BACs als Klonierungssystem für große DNA-Fragmente etabliert und
für viele Organismen sind BAC-Bibliotheken erhältlich (http://bacpac.chori.org/). BAC-
Bibliotheken leisten insbesondere einen Beitrag zur physikalischen Kartierung großer
Genome. Verschiedene Strategien für die Genomkartierung mit Hilfe von BAC-Bibliotheken
sind im Folgenden dargestellt.
1.6.1. BAC-Filterhybridisierung
Mit BACs transformierte Klone können auf Nylon-Membranen gezüchtet werden. Nach Lyse
der Zellen und Denaturierung der DNA bleiben die einzelsträngige genomische und die BAC-
DNA auf der positiv geladenen Membran immobilisiert. Auf diesen BAC-Filtern können
mehrere 10.000 Klone durch Hybridisierung mit radioaktiv markierten Sonden parallel
untersucht werden.
Diese Technik wurde u. a. für die Genomkartierung von Medaka (Oryzias latipes) verwendet
(39). Dafür wurden 2.363 35mer-Oligonukleotide anhand von bekannten Medaka cDNA-
Sequenzen synthetisiert. Diese wurden radioaktiv markiert und auf BAC-Filtern mit 36.864
Klonen hybridisiert. Unterschiedliche Klone, welche nach Hybridisierung eines
Oligonukleotids ein Signal geben, können einander zugeordnet werden. Theoretisch muss
für jedes Oligonukleotid eine Hybridisierung durchgeführt werden, was einen immensen
Einleitung: Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen 14
Arbeitsaufwand bedeutet. Durch eine 2D-Poolingstrategie konnte der Aufwand immerhin um
den Faktor 3,4 auf 695 nötige Hybridisierungen reduziert werden. Trotzdem ist die Methode
aufwändig und wegen des Arbeitens mit Radioaktivität schlecht automatisierbar.
Die Kartierung des Medaka Genoms (~800 Mb) lieferte 902 Bereiche, welche von
überlappenden BAC-Inserts abgedeckt wurden (BAC-Contigs). Von diesen konnten 462 den
24 Chromosomen von Medaka zugeordnet werden.
1.6.2. BAC-Klon Fingerprinting
Das Fingerprinting von BAC-Klonen erfolgt durch den Verdau der BAC-DNA mittels
Restriktionsenzymen. Dabei entsteht ein klonspezifisches Muster verschiedener
Fragmentgrößen, welches durch Elektrophoresetechniken sichtbar gemacht werden kann.
Klone, die teilweise überlappen, werden einige gemeinsame Banden in ihren Restriktions-
mustern aufweisen und können einander so zugeordnet werden. Dabei gilt grob: Je mehr
gemeinsame Banden, desto größer die Überlappung und desto höher ihre Signifikanz.
Die Größe von BAC-Inserts macht die Analyse durch Agarose-Gelelektrophorese äußerst
schwierig. Setzt man selten schneidende Restriktionsenzyme ein, so erhält man zwar mit
Standardfärbemethoden gut nachweisbare Fragmente, welche aber wegen ihrer Größe
schlecht auftrennbar sind. Zusätzlich müssen BAC-Klone stärker überlappen, um größere
gemeinsame Banden aufweisen zu können. Werden die BAC Klone mit häufiger
schneidenden Enzymen fragmentiert, so lassen sich die kleinen Fragmente zwar besser
auftrennen, durch die große Anzahl der Fragmente relativiert sich dieser Effekt allerdings.
Zusätzlich werden kleinere Fragmente mit Standardfärbemethoden schwerer nachweisbar.
Durch Nutzung von Fluoreszenzmarkierung der Restriktionsfragmente in Kombination mit
hochauflösender Kapillargelelektrophorese, können diese Probleme bewältigt werden und es
steht ein besser automatisierbares Analyseverfahren zur Verfügung. Die Methode wurde
bisher zur Kartierung zahlreicher Genome verwendet (40, 41) und ist weiter verbessert
worden. Die Enden von DNA-Fragmenten, welche von verschiedenen Restriktionsenzymen
geschnitten wurden, können mit unterschiedlichen Farbstoffen markiert werden. Diese SnaP-
Shot genannte Methode erhöht die Anzahl unterscheidbarer Fragmente und ermöglicht somit
auch weniger stark überlappende BACs einander signifikant zuzuordnen (42). Die erwähnten
Referenzen erzielten die Anordnung von mehreren 10.000 BAC-Klonen in 750 – 2.000 BAC-
Contigs.
Einleitung: Kartierung eukaryotischer Genome mit Hilfe von BAC-Klonen 15
1.6.3. Komparative Kartierung mit BAC-Endsequenzen
Während beim BAC-Fingerprinting das gesamte Insert eines BACs charakterisiert wird, kann
durch BAC-Endsequenzierung nur etwa 1/100 des BAC-Inserts analysiert werden, nämlich
jeweils etwa 600 – 800 b vom Anfang und Ende des Inserts. Allerdings erfolgt dies mit
wesentlich höherer Genauigkeit auf der Sequenzebene, so dass es möglich wird Vergleiche
mit bereits kartierten und sequenzierten Genomen über Alignment-Algorithmen wie BLAST
(43, 44) durchzuführen. Der Erfolg dieses komparativen Ansatzes hängt von der evolu-
tionären Divergenz der zu vergleichenden Organismen und der Anzahl endsequenzierter
BAC-Inserts ab.
Können beide Endsequenzen eines BAC-Inserts auf der Referenzsequenz mit Signifikanz
angeordnet werden, wobei sie aufeinander gerichtet orientiert sind und ihr Abstand mit der
Insertgröße der Klone ungefähr übereinstimmt, so kann man den Klon als sicher angeordnet
betrachten. Werden nun weitere Klone gefunden, die versetzt im selben Bereich liegen, so
kann man diese, wie bei den in 1.6.1 & 1.6.2 dargestellten Methoden in Contigs
zusammenfassen und eine physikalische Karte des Genoms erstellen. Der Vorteil gegenüber
den zuvor genannten Methoden ist einerseits die Verwendung etablierter
hochdurchsatzfähiger Sequenzierungstechnologien und Auswertungssoftware und anderer-
seits, dass benachbarte Contigs auf Grund der Daten des Referenzgenoms mit hoher
Wahrscheinlichkeit vorausgesagt werden können. Außerdem gewähren die gewonnenen
Sequenzdaten bereits einen frühen Einblick in den Aufbau sequenzierter Gene,
Repeatstrukturen usw. und sind für Genomprojekte in fortgeschrittener Phase notwendige
Hilfsmittel.
Die komparative Strategie wurde u.a. zur Kartierung des Schimpansen-Genoms
angewendet, wobei das sehr ähnliche Human-Genom als Referenz diente (45). Auch bei
weniger verwandten Species wie Rind und Mensch waren komparative Ansätze erfolg-
reich (46). Es ist eine Einschränkung, dass die komparative Genomkartierung mit BAC-
Endsequenzen auf verwandte, bereits sequenzierte Genome angewiesen ist. Mit
zunehmender Anzahl von vollendeten Genomprojekten wird diese Methode in Zukunft
allerdings immer häufiger Anwendung finden.
Die Kombination von komparativer Genomkartierung durch BAC-Endsequenzierung mit den
zuvor dargestellten Sequenzierungstechnologien der ersten und zweiten Generation kann
die Analyse der kompletten Sequenz von eukaryotischen Genomen, wie z. B. dem Genom
von Dicentrarchus labrax (Wolfsbarsch, siehe 1.7), stark beschleunigen. Gerade in der
Gruppe der Teleosten (Knochenfische) stehen bereits fünf Referenzgenome für komparative
Studien zur Verfügung (siehe 1.7.1).
Einleitung: Der Wolfsbarsch - Dicentrarchus labrax 16
1.7. Der Wolfsbarsch - Dicentrarchus labrax
D. labrax (Teleostei, Perciformes, Moronidae) ist an den europäischen und nordafrikanischen
Atlantik und Mittelmeerküsten verbreitet. Er erreicht eine Größe von bis zu 100 cm und
ernährt sich von Garnelen, Mollusken und kleineren Fischen. Äußere Merkmale sind ein
länglicher grauer Körper, der sich zum Bauch hin aufhellt, sowie zwei Rückenflossen mit
8 - 10 Rückenflossenstacheln und 12 – 13 Rückenflossenweichstrahlen (47).
Abb. 6: Der Wolfsbarsch – Dicentrarchus labrax (47).
Als gefragter Speisefisch hat D. labrax in den vergangenen 10 Jahren zusammen mit der
Goldbrasse (Sparus aurata) einen hohen Stellenwert in der europäischen Fischindustrie
erlangt. Seine Anpassungsfähigkeit an verschiedene Habitate (Süß-, Brack und Meerwasser)
und Wassertemperaturen ermöglichen die Zucht in Aquakultur (48, 49). Aufgrund seiner
Bedeutung als Nahrungsquelle und wegen weiterer besonderer Merkmale, wie z.B. einer
temperaturabhängigen Geschlechtsdifferenzierung (50), gehört D. labrax zu einer der am
intensivsten erforschten Fischspecies der vergangenen Jahre. Die Bereitstellung
genomischer Sequenzdaten wird teilweise vom EU-Netzwerk „Marine Genomics Europe
(MGE)“ gefördert und wird nicht nur neue Ansatzpunkte für die Forschung an D. labrax
ermöglichen, sondern sich auch auf die Forschung an nahe verwandten Species wie Sparus
aurata (Goldbrasse) und Oreochromis niloticus (Buntbarsch) positiv auswirken.
Einleitung: Der Wolfsbarsch - Dicentrarchus labrax 17
1.7.1. Fortgeschrittene Fischgenomprojekte für komparative Studien mit D. labrax
Die verwandtschaftlichen Beziehungen verschiedener Ordnungen der Knochenfische
(Teleosten) sind in Abb. 7 dargestellt. Teleosten bilden mit etwa 23.600 lebenden Species
die größte Gruppe der Vertebraten. Die
Genome einiger Teleosten wurden in den
letzten Jahren nahezu vollständig se-
quenziert, dazu gehören:
Danio rerio (Zebrafish)
(siehe Ostariophysi) (51)
Oryzias latipes (Medaka)
(siehe Atherinomorpha) (52)
Gasterosteus aculeatus (Stichling)
(siehe Gasterosteiformes) (53)
Tetraodon nigroviridis (grüner Kugelfisch)
(siehe Tetraodontiformes) (54)
Takifugu rubripes (japanischer Kugelfisch)
(siehe Tetraodontiformes) (55)
Abb. 7: Stammbaum der Knochenfische (56).
D. labrax ist den Perciformes zugeordnet. Der Vergleich mit Abb. 7 zeigt, dass vier der oben
genannten Fische aus derselben Superordnung (Acanthopterygii) stammen. Die
Sequenzdaten dieser Genome eignen sich aufgrund ihrer näheren Verwandtschaft für
Sequenzvergleiche mit D. labrax.
Einleitung: Ziel der Arbeit 18
1.8. Ziel der Arbeit
Der zeit- und kostenlimitierende Faktor vieler molekulargenetischer Analyseverfahren ist die
Produktion von aufgereinigten DNA-Molekülen. Besonders im Bereich der DNA-
Sequenzierung werden Systeme benötigt, die dem hohen Probendurchsatz moderner CGE-
Sequenzierroboter gerecht werden.
Zahlreiche zum Teil auch vollautomatisierte Systeme sind erhältlich, welche meist mit dem
96er MTP-Format arbeiten. Um höheren Probendurchsatz zu gewährleisten und gleichzeitig
die Kosten pro Probe zu verringern, müssen Aufreinigungsmethoden für das 384er MTP-
Format entwickelt und automatisiert werden. Dabei können viele der im 96er Format
gängigen Methoden aufgrund von Durchmischungsproblemen und / oder aufwendig zu
produzierenden Verbrauchsmaterialien nicht kostengünstig und stabil umgesetzt werden.
In der Dissertation soll dargestellt werden, wie sich mit der Anwendung von größenselektiver
DNA-Präzipitation in PEG / Salz-Gemischen ein kostengünstiges, automatisiertes und hoch-
durchsatzfähiges Verfahren zur Aufreinigung von Plasmiden, Fosmiden und BACs sowie
PCR-Produkten realisieren lässt. Das Verfahren soll bei der Durchführung zahlreicher
Genom, Metagenom-, EST- und Resequenzierungsprojekte eingesetzt werden. Ein
besonderes Augenmerk soll dabei auf der Endsequenzierung von Large-Insert-Klonen wie
z.B. BACs gelegt werden, da diese aufgrund von niedrigen Template-Ausbeuten mit
herkömmlichen Methoden im 384er MTP-Format nicht bearbeitet werden können.
Eine hochdurchsatzfähige Methode zur Endsequenzierung von BAC-Klonen kann vor allem
bei der Kartierung großer eukaryotischer Genome neue Möglichkeiten erschließen. Die
Endsequenzierung einer BAC-Bibliothek des Genoms von Dicentrarchus labrax
(Wolfsbarsch) soll anhand der zuvor erarbeiteten Methodik durchgeführt werden und eine
komparative Kartierung des Genoms ermöglichen.
Material und Methoden: Verwendete Materialien und Geräte 19
2. Material und Methoden
2.1. Verwendete Materialien und Geräte
2.1.1. Chemikalien
Chemikalien Hersteller Bestellnummer
2-Propanol Merck 1.09634.2500
Agarose electrophoresis grade Invitrogen 15510-019
Ampicillin Natriumsalz Roth K029.2
Chloramphenicol Roth K3886.1
D-Glucose Monohydrat Merck 1.08342.2500
EDTA / Titriplex Merck 1.08418.1000
Ethanol absolut Merck 108543
Ethidiumbromid Sigma E-1510
HCl Merck 1.0317.2500
Hypochlorit-Lösung 2% (Bleach) Fluka 71696
Kaliumacetat Merck 1.04820.1000
Kanamycin-Lösung Sigma K0254
L-Arabinose Fluka 10845
MgCl2*6H2O Merck 5833
NaCl Merck 1.06404.1000
NaOH Merck 1.06498.1000
PEG-6000 Merck 8.07491.1000
SDS / Natriumlaurylsulfat Roth 4360.1
TBE-Puffer Merck 106177
TRIS HCl Merck 1.08382.0500
Tryptone Fluka 93655
Yeast Extract Merck 103753
Material und Methoden: Verwendete Materialien und Geräte 20
2.1.2. Enzyme und Reaktionspuffer
Enzyme und Reaktionspuffer Hersteller Bestellnummer
Big Dye Terminator V3.1 Applied Biosystems 4314849
Big Dye sequencing buffer Applied Biosystems 4305603
DNA-Polymerase I (Klenow) New England Biolabs #M0210 l
EcoRI+ Reaktionspuffer New England Biolabs #R0101S, B0210S
ElectroMAX DH10B komp. Zellen Invitrogen 18290-015
Plasmidsafe™ Exonuklease Epicentre E3101K
Ribonuclease A Sigma R-5503
T4-DNA-Ligase + Puffer Roche 799009
T4-DNA-Polymerase + Puffer Fermentas #EP0062
2.1.3. Besondere Verbrauchsmaterialien
besondere Verbrauchsmaterialien Hersteller Bestellnummer
384 MTP PCR 4titude 4ti-0384/G
384 MTP Kultur deep well Abgene AB 1178
384 well UV plate Corning 3675
384 MTP Kultur small Genetix XGE05006
384 Pin Replikatoren Genetix X5050
2.1.4. Primer für die Sequenzierung
Primer Hersteller Sequenz
T7 Invitrogen 5´-TAA TAC GAC TCA CTA TAG GG-3´
M13-40 Invitrogen 5´-GTT TTC CCA GTC ACG ACG-3´
M13-28 Invitrogen 5´-AGG AAA CAG CTA TGA CCA T-3´
SP6 Invitrogen 5´-ATT TAG GTG ACA CTA TAG-3´
Material und Methoden: Verwendete Materialien und Geräte 21
2.1.5. Längenmarker für die Agarose-Gelelektrophorese
Marker Hersteller Fragmentgrößen in bp
17 kb Marker MPI f. Mol Genetik 17000, 8000, 4500, 2500, 2000, 1600,
1300, 900, 700, 600, 400, 250, 100
(Restriktionsverdau eines Fosmid-Klons)
4 kb Marker MPI f. Mol. Genetik 4000, 2000, 1000, 500
(PCR-Produkte)
2.1.6. Geräte
Geräte Hersteller Typ
Autom. Zentrifuge Hettich Rotanta
Brutschrank Memmert nicht bekannt
Brutschüttler mit aktiver Kühlung New Brunswick Scientific Innova 4230
Brutschüttler mit passiver Kühlung New Brunswick Scientific Innova 4080
CGE-Sequenzierer Applied Biosystems ABI 3730xl
Elektroporator Bio-Rad E.coli-Pulser
Gelkammer MPI f. mol. Genetik Minigel
Laborschüttler mit Heizelement Eppendorf Thermomixer 5436
Microplate Dispenser Bio-Tek µ-Fill
Photometer Molecular Devices Spectramax+ 384
Pipettierroboter für 384er Beckmann Biomek NX
Pipettierroboter für 384er Beckmann Multimek 384
Pyrosequencer Roche Diagnostics GS 20
Roboterarm CRS-Robotics F3
Roboterarm CRS-Robotics A465
Schüttler für 384er Kulturen Heidolph Inkubator 1000
Thermocycler Applied Biosystems GeneAmp 9700
Transilluminator Ultraviolett Product inc. Ultra Cam
Ultraschall Gerät Branson Sonic Power Co Cell Disruptor B-30
Ultrazentrifuge Beckman Coulter L8-M Ultracentrifuge
Vakuumtrockner für 384er MTP Savant Speedvac+ SC210A
Zentrifuge f. 4x384MTP mit Kühlung Eppendorf 5810R
Zentrifuge f. 2x 384 MTP mit Kühlung Eppendorf 5804R
Zentrifuge f. Eppendorfgefäße Eppendorf 5403R
Material und Methoden: Verwendete Materialien und Geräte 22
2.1.7. Puffer und Lösungen
2YT-Nährmedium
Für 1 Liter Medium werden 10 g yeast extract, 16 g Tryptone und 5 g NaCl in doppelt
destilliertem Wasser gelöst. Das Nährmedium wird im Autoklav sterilisiert. Ungeöffnete
Medien können bei RT aufbewahrt werden.
SOC-Nährmedium
Für 1 Liter Medium werden 20 g Trypton, 5 g Yeast extract, 0,5 g NaCl und 2,5 ml KCl 1 M in
900 ml doppelt destilliertem Wasser gelöst. Der pH-Wert wird mit 10 M NaOH auf 7
eingestellt. Sterilisation erfolgt durch autoklavieren. Vor Gebrauch werden dem Medium
20 ml 1 M D-Glucose, 10 ml 1 M MgCl2 und 10 ml 1 M MgSO4 (alle Zusätze durch 0,45 µm
Filter sterilisieren) zugesetzt.
20% (w/v) D-Glucose als Zusatz zum Medium
10 g D-Glucose einwiegen und mit doppelt destilliertem Wasser lösen (Endvolumen 50 ml).
Die Lösung steril filtrieren und bei 4ºC aufbewahren.
20% (w/v) L-Arabinose als Zusatz zum Medium
10 g L-Arabinose einwiegen und mit doppelt destilliertem Wasser lösen (Endvolumen 50 ml).
Die Lösung steril filtrieren und bei 4ºC aufbewahren.
TRIS 1 M pH 8
Für einen Liter Puffer-Lösung 121,14 g TRIS*HCl abwiegen und in 300 ml doppelt
destilliertem Wasser lösen. Mit rauchender HCl einen pH-Wert von 8 einstellen.
Anschließend auf 1 Liter mit doppelt destilliertem Wasser auffüllen. Achtung der pH-Wert von
TRIS-Puffern ist stark temperaturabhängig. Die Angaben sollten sich immer auf RT (25ºC)
beziehen. Bei 4ºC aufbewahren.
EDTA 0,5 M pH 8
Für 500 ml Lösung 93,06 g EDTA abwiegen und in 400 ml doppelt destilliertem Wasser
lösen. Mit NaOH-Plätzchen das EDTA in Lösung bringen und den pH-Wert auf 8 einstellen
(es werden ungefähr 10 g NaOH benötigt). Auf 500 ml Endvolumen mit doppelt destilliertem
Wasser auffüllen. Bei 4ºC aufbewahren.
Material und Methoden: Verwendete Materialien und Geräte 23
S1-Puffer +/- Rnase (50 mM TRIS HCl, 10 mM EDTA, pH 8)
Für 1 Liter Lösung 50 ml TRIS 1 M pH 8 mit 20 ml in 930 ml doppelt destilliertem Wasser
verdünnen. Je nach Verwendung 100 mg RNAse zugeben und gut durchmischen. Bei 4ºC
aufbewahren.
S2-Puffer (0,2 M NaOH, 1% SDS)
Für 1 Liter Lösung zunächst 8 g NaOH in 200 ml doppelt destilliertem Wasser lösen
(Achtung Lösung erhitzt sich stark). 10 g SDS unter dem Abzug einwiegen und zu der
NaOH-Lösung geben. Die Lösung auf 1 Liter mit doppelt destilliertem Wasser auffüllen.
Bei RT aufbewahren!
S3 (2,8 M KAcetat, ~ pH 5)
Für einen Liter Lösung 274,82 g Kaliumacetat einwiegen und in 350 ml doppelt destilliertem
Wasser lösen. Den pH-Wert durch Zugabe von exakt 360 ml Eisessig einstellen. Die Lösung
auf ein Endvolumen von 1 Liter mit doppelt destilliertem Wasser auffüllen. Bei 4ºC
aufbewahren.
Achtung: niemals den pH-Wert mit zusätzlichem Eisessig auf z.B. 4,8 einstellen wie in
anderen Protokollen beschrieben.
Achtung: Für das in dieser Arbeit entwickelte Protokoll muss der S3 Puffer 3fach verdünnt
werden (z.B. 667 ml H2O+ 333 ml S3)!
PEG 40% (w/v)
Für einen Liter Lösung 400 g PEG-6000 in einen großen Messzylinder einwiegen. Den
Messzylinder bis etwa 900 ml mit doppelt destilliertem Wasser füllen und mit Parafilm dicht
verschließen. Das PEG durch kräftiges Schütteln in Lösung bringen, auf einem Magnetrührer
ca. 1 h bei RT rühren und zwischendurch auf exakt 1 Liter mit doppelt destilliertem Wasser
auffüllen. Die klare Lösung in eine Schottflasche überführen und bei RT aufbewahren.
10% (w/v) PEG-6000 / 75% 2-Propanol (v/v)
Für einen Liter Lösung zu 250 ml PEG 40% (w/v) 750 ml 2-Propanol zugeben und durch
kräftiges Schütteln mischen. Bei RT aufbewahren.
TRIS 1 mM (Elutionspuffer)
Für 1 Liter Lösung 999 ml doppelt destilliertes Wasser mit 1 ml TRIS 1 M pH8 versetzen und
gut durchmischen. Bei 4ºC aufbewahren.
Material und Methoden: Verwendete Materialien und Geräte 24
Ampicillin-Lösung (110 mg/ml)
1,5 g Ampicillin werden mit doppelt destilliertem Wasser in einem Endvolumen von 14 ml
gelöst und steril filtriert. Die Lösung sollte innerhalb einer Woche verbraucht werden und
kann so lange bei 4ºC aufbewahrt werden.
Chloramphenicol-Lösung (20 mg/ml)
1 g Chloramphenicol in 100%-Ethanol lösen (Endvolumen 50 ml). Steril filtrieren! Bei -20ºC
aufbewahren.
2.1.8. BAC-Bibliothek von D. labrax
Die von Whitaker et al. (74) konstruierte BAC-Bibliothek umfasst 69.120 Klone, welche in
180 x 384er MTPs archiviert sind. Die mittlere Insertgröße der Klone wird mit 150 – 160 kb
angegeben. Die Abdeckung des D. labrax Genoms durch die BAC-Bibliothek wird auf 13fach
geschätzt.
Die BAC-Bibliothek wurde vom ehemaligen Deutschen Ressourcenzentrum für Genom-
forschung (RZPD) zur Verfügung gestellt.
2.1.9. Genomsequenzen von T. nigroviridis, O. latipes und G. aculeatus
Die Sequenzdaten, der in dieser Arbeit verwendeten Referenzgenome, sind auf
www.ensembl.org oder dem zugehörigen FTP-Server per Download im Fasta-
Sequenzformat verfügbar. Es wurden folgende Datensätze verwendet:
Oryzias latipes
Assembly: HdrR, Oct 2005
Tetraodon nigroviridis
Assembly: TETRAODON 7, Apr 2003
Gasterosteus aculeatus
Assembly: BROAD S1, Feb 2006
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 25
2.2. Untersuchungen von PEG-Präzipitationsmethoden
2.2.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen
DNA-Fragmente im Größenbereich von 100 – 17000 bp wurden mit den in Tab. 3
dargestellten Mengen PEG-6000 (w/v) und NaCl versetzt. Die Endkonzentrationen von
PEG-6000 und NaCl in den Gemischen wurden so gewählt, dass die größten DNA-
Fragmente kurz vor der Präzipitation standen. Die Ansätze wurden nach intensivem Mischen
für 15 min bei RT equilibriert.
Tab. 3: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / NaCl-Fällung.
1 2 3 4 5 6 7 NaCl 5,38M 55,8 µl 44,6 µl 33,5 µl 27,8 µl 22,3 µl 16,7 µl 11,2 µlPEG 14, 18 o. 22% 85,7 µl 91,1 µl 105 µl 115,7 µl 128,6 µl 116,7 µl 136,4 µlH2O 8,5 µl 14,3 µl 11,5 µl 6,5 µl 0 µl 16,6 µl 2,4 µlDNA 0,1-17kb 135 µl 135 µl 135 µl 135 µl 134,1 µl 135 µl 135 µlEndkonz. NaCl 1,05 M 0,842 0,632 M 0,525 M 0,421 M 0,315 M 0,211 MEndkonz. PEG(w/v) 4,21% 4,48% 5,16% 5,68% 6,32% 7,37% 10,53%Endvolumen 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl
Von den Ansätzen 1 - 7 wurden 19 µl Aliquots in 12 Positionen auf einer 384 MTP pipettiert
und darauf folgend je 1 µl einer PEG-Verdünnungsreihe zu den Ansätzen hinzugegeben, so
dass die PEG-Konzentration bei konstanter NaCl-Konzentration in den zwölf Aliquots
ansteigt (siehe Tab. 4).
Tab. 4: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen NaCl-Versuchsreihen. Je 1 µl der PEG-Verdünnung (erste Spalte) wurde zu 19 µl Aliquots der Ansätze aus Tab. 3 gegeben, so wurden die in Reihe 1 – 7 dargestellten PEG-Endkonzentrationen (w/v) erzielt.
Reihe: 1 2 3 4 5 6 7 NaCl Konz. Reihe: 1 M 0,8 M 0,6 M 0,5 M 0,4 M 0,3 M 0,2 M PEG 1% 4,05% 4,30% 4,95% 5,45% 6,05% 7,05% 10,05%PEG 2% 4,10% 4,35% 5,00% 5,50% 6,10% 7,10% 10,10%PEG 4% 4,20% 4,45% 5,10% 5,60% 6,20% 7,20% 10,20%PEG 6% 4,30% 4,55% 5,20% 5,70% 6,30% 7,30% 10,30%PEG 8% 4,40% 4,65% 5,30% 5,80% 6,40% 7,40% 10,40%PEG 10% 4,50% 4,75% 5,40% 5,90% 6,50% 7,50% 10,50%PEG 14% 4,70% 4,95% 5,60% 6,10% 6,70% 7,70% 10,70%PEG 18% 4,90% 5,15% 5,80% 6,30% 6,90% 7,90% 10,90%PEG 22% 5,10% 5,35% 6,00% 6,50% 7,10% 8,10% 11,10%PEG 28% 5,40% 5,65% 6,30% 6,80% 7,40% 8,40% 11,40%PEG 34% 5,70% 5,95% 6,60% 7,10% 7,70% 8,70% 11,70%PEG 40% 6,00% 6,25% 6,90% 7,40% 8,00% 9,00% 12,00%
Nach intensiven Mischen der 84 Ansätze und weiterer Equilibrierung für 15 min bei RT
wurde die präzipitierte DNA durch Zentrifugation bei 2750 x G und 25ºC für 20 min
sedimentiert. Danach wurde die gelöste DNA-Fraktion im Überstand durch Zentrifugation der
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 26
umgedrehten Platte bei 172 x G für 1 min verworfen. Die sedimentierte DNA wurde in 9 µl 1x
TE-Puffer durch 30 min schütteln bei 37ºC gelöst.
Die Analyse der unter den verschiedenen Bedingungen präzipitierten DNA-Fraktionen
erfolgte durch Elektrophorese in 1,3% Agarosegelen in Anwesenheit von 0,001%
Ethidiumbromid.
2.2.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen
Die zum Test der Präzipitation in PEG / MgCl2 vollzogenen Arbeitsschritte entsprachen dem
in 2.2.1 dargestellten Ablauf, wobei jedoch die in Tab. 5 dargestellten Versuchsreihen
angesetzt wurden.
Tab. 5: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / MgCl2-Fällung.
1 2 3 4 5 6 7 MgCl2 0.5 / 0.25 M 60 µl 45 µl 60 µl 42 µl 30 µl 18 µl 12 µlPEG 8 / 10 / 14% 52,5 µl 56,5 µl 67,5 µl 78,75 µl 97,5 µl 120 µl 128,6 µlH2O 37,5 µl 48,75 µl 22,5 µl 29,25 µl 22,5 µl 12 µl 9,4 µlDNA 0,1-17kb 135 µl 135 µl 135 µl 135 µl 135 µl 135 µl 135 µl
Endkonz. MgCl2 0,105 M 0,079 M 0,053 M 0,037 M 0,026 M 0,016 M 0,211 MEndkonz. PEG(w/v) 1,474% 1,579% 1,895% 2,211% 2,737% 4,211% 10,53%Endvolumen 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl
Die Ansätze wurden zu je 19 µl aliquotiert und mit je 1 µl PEG-Lösungen unterschiedlicher
Konzentration versetzt, so dass die 84, in Tab. 6 dargestellten, Fällungsansätze resultierten.
Tab. 6: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen MgCl2-Versuchsreihen. Je 1 µl der PEG-Verdünnung (erste Spalte) wurde zu 19 µl Aliquots der Ansätze aus Tab. 5 gegeben, so wurden die in Reihe 1 – 7 dargestellten PEG-Endkonzentrationen (w/v) erzielt.
Reihe: 1 2 3 4 5 6 7 MgCl2 Konz. Reihe: 0,1 M 0,075 M 0,05 M 0,035 M 0,025 M 0,015 M 0,01 M PEG 1% 1,45% 1,55% 1,85% 2,15% 2,65% 4,05% 6,05% PEG 2% 1,50% 1,60% 1,90% 2,20% 2,70% 4,10% 6,10% PEG 4% 1,60% 1,70% 2,00% 2,30% 2,80% 4,20% 6,20% PEG 6% 1,70% 1,80% 2,10% 2,40% 2,90% 4,30% 6,30% PEG 8% 1,80% 1,90% 2,20% 2,50% 3,00% 4,40% 6,40% PEG 10% 1,90% 2,00% 2,30% 2,60% 3,10% 4,50% 6,50% PEG 14% 2,10% 2,20% 2,50% 2,80% 3,30% 4,70% 6,70% PEG 18% 2,30% 2,40% 2,70% 3,00% 3,50% 4,90% 6,90% PEG 22% 2,50% 2,60% 2,90% 3,20% 3,70% 5,10% 7,10% PEG 28% 2,80% 2,90% 3,20% 3,50% 4,00% 5,40% 7,40% PEG 34% 3,10% 3,20% 3,50% 3,80% 4,30% 5,70% 7,70% PEG 40% 3,40% 3,50% 3,80% 4,10% 4,60% 6,00% 8,00%
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 27
2.2.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und
Substitution von PEG durch 2-Propanol
Die Experimente zur DNA-Präzipitation in PEG / KAcetat mit und ohne 2-Propanol
entsprachen dem in 2.2.1 dargestellten Ablauf, wobei jedoch die in Tab. 7 dargestellten
Versuchsreihen angesetzt wurden.
Tab. 7: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / Kaliumacetat-Fällung.
1 2 3 4 5 6 7 8 KAc 2.8M pH4,8 107,1 µl 85,7 µl 75 µl 64,3 µl 53,6 µl 42,9 µl 32,1 µl 21,4 µlPEG34/22/28/40% 39,7 µl 64,8 µl 69,55 µl 75 µl 85,2 µl 75 µl 75 µl 97,5 µlH2O 3,2 µl 0 µl 5,45 µl 10,7 µl 11,2 µl 32,1 µl 42,9 µl 31,1 µlDNA 0,1-17kb 135 µl 134,5 µl 135 µl 135 µl 135 µl 135 µl 135 µl 135 µlEndkonz. KAc 1,05 M 0,842 M 0,737 M 0,632 M 0,527 M 0,422 M 0,315 M 0,210 MEndkonz. PEG(w/v) 4,74% 5,00% 5,37% 5,79% 6,58% 7,37% 10,53% 13,68%Endvolumen 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl 285 µl
Die Ansätze wurden zu je 19 µl aliquotiert und mit je 1 µl PEG-Lösungen unterschiedlicher
Konzentration versetzt, so dass 96 verschiedene, in Tab. 8 dargestellte, Fällungsansätze
resultierten.
Tab. 8: Schrittweise Erhöhung der PEG-Konzentration in den einzelnen KAcetat-Versuchsreihen. Je 1 µl der PEG-Verdünnung (erste Spalte) wurde zu 19 µl Aliquots der Ansätze aus Tab. 5 gegeben, so wurden die in Reihe 1 – 8 dargestellten PEG-Endkonzentrationen (w/v) erzielt.
Reihe: 1 2 3 4 5 6 7 8 KAc Konz. : 1 M 0,8 M 0,7 M 0,6 M 0,5 M 0,4 M 0,3 M 0,2 M PEG 1% 4,55% 4,80% 5,15% 5,55% 6,30% 7,05% 10,05% 13,05%PEG 2% 4,60% 4,85% 5,20% 5,60% 6,35% 7,10% 10,10% 13,10%PEG 4% 4,70% 4,95% 5,30% 5,70% 6,45% 7,20% 10,20% 13,20%PEG 6% 4,80% 5,05% 5,40% 5,80% 6,55% 7,30% 10,30% 13,30%PEG 8% 4,90% 5,15% 5,50% 5,90% 6,65% 7,40% 10,40% 13,40%PEG 10% 5,00% 5,25% 5,60% 6,00% 6,75% 7,50% 10,50% 13,50%PEG 14% 5,20% 5,45% 5,80% 6,20% 6,95% 7,70% 10,70% 13,70%PEG 18% 5,40% 5,65% 6,00% 6,40% 7,15% 7,90% 10,90% 13,90%PEG 22% 5,60% 5,85% 6,20% 6,60% 7,35% 8,10% 11,10% 14,10%PEG 28% 5,90% 6,15% 6,50% 6,90% 7,65% 8,40% 11,40% 14,40%PEG 34% 6,20% 6,45% 6,80% 7,20% 7,95% 8,70% 11,70% 14,70%PEG 40% 6,50% 6,75% 7,10% 7,50% 8,25% 9,00% 12,00% 15,00%
Um den Einfluss von 2-Propanol auf die Fällung in einem PEG / KAcetat-System
abzuschätzen, wurden die Versuchsreihen in Tab. 9 angesetzt.
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 28
Tab. 9: Versuchsreihen zur Bestimmung von Eigenschaften der PEG / Kaliumacetat-Fällung in Gegenwart von 2-Propanol.
1 2 3 4 5 6
KAc 2.8M pH4,8 21,4 µl 32,1 µl 42,9 µl 53,6 µl 64,3 µl 85,7 µlPEG 40% (w/v) 107,3 µl 73,5 µl 52,5 µl 45,8 µl 41,3 µl 36,0 µlH2O 0,0 µl 0,0 µl 9,6 µl 5,7 µl 0,0 µl 0,0 µlDNA 0,1-17kb 111,4 µl 134,4 µl 135,0 µl 135,0 µl 134,5 µl 118,3 µl
Endkonz. KAc 0,25 M 0,375 M 0,5 M 0,625 M 0,75 M 1 MEndkonz. PEG (w/v) 17,88% 12,25% 8,75% 7,63% 6,88% 6,00%Endvolumen 240 µl 240 µl 240 µl 240 µl 240 µl 240 µl
Die Ansätze 1 - 6 wurden zu je 16 µl aliquotiert und mit je 4 µl der in Tab. 10 dargestellten
2-Propanol-Verdünnungsreihe versetzt, so dass 72 verschiedene Fällungsansätze mit den
folgenden Endkonzentrationen an PEG / KAcetat / 2-Propanol resultierten.
Tab. 10: Schrittweise Erhöhung der 2-Propanol-Konzentration in den einzelnen Versuchsreihen mit Kaliumacetat / PEG. Je 4 µl der 2-Propanol-Ver-dünnung (erste Spalte) wurde zu 16 µl Aliquots der Ansätze aus Tab. 5 ge-geben, so wurden die in Reihe 1 – 6 dargestellten Endkonzentrationen (v/v für 2-Propanol bzw. w/v für PEG) erzielt.
Reihe: 1 2 3 4 5 6 PEG / KAc Konz. :
4,8% / 0,8 M
5,5% / 0,6 M
6,1% / 0,5 M
7,0% / 0,4 M
9,8% / 0,3 M
14,3% / 0,2 M
2-Propanol 0% 0% 0% 0% 0% 0% 0% 2-Propanol 5% 1% 1% 1% 1% 1% 1% 2-Propanol 10% 2% 2% 2% 2% 2% 2% 2-Propanol 20% 4% 4% 4% 4% 4% 4% 2-Propanol 30% 6% 6% 6% 6% 6% 6% 2-Propanol 40% 8% 8% 8% 8% 8% 8% 2-Propanol 50% 10% 10% 10% 10% 10% 10% 2-Propanol 60% 12% 12% 12% 12% 12% 12% 2-Propanol 70% 14% 14% 14% 14% 14% 14% 2-Propanol 80% 16% 16% 16% 16% 16% 16% 2-Propanol 90% 18% 18% 18% 18% 18% 18% 2-Propanol 100% 20% 20% 20% 20% 20% 20%
2.2.4. Aufreinigung von Plasmid-DNA durch größenselektive Fällung in PEG /
KAcetat / 2-Propanol-Gemischen.
Zwei Bakterienstämme wurden ausgehend von Glycerol-Stocks in 2YT-Medium für 16 h bei
37ºC kultiviert. Bei beiden Stämmen handelte es sich um E. coli DH10B, wobei einer der
beiden unverändert vorlag, der andere jedoch ein pUC19-Plasmid mit ca. 2 kb Insert
beherbergte und deshalb unter Selektion mit 110 µg/ml Ampicillin angezogen wurde. Die
optische Dichte der Kulturen wurde bei 600 nm bestimmt und beide Kulturen wurden durch
Zugabe von 2YT-Medium auf eine OD von 3 eingestellt. Von beiden Kulturen wurden 60 –
200 µl in eine 384er MTP mit 250 µl Kavitäten (Abgene, AB 1178) überführt (siehe
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 29
Pipettierschema). Die Zellen wurden durch 5 min Zentrifugation bei 2750 x G pelletiert und
der Überstand verworfen. Je 192 der Pellets wurden in 20 µl S1-Puffer mit RNAse
(100 µg/ml) resuspendiert, die weiteren 192 in 20 µl S1-Puffer ohne RNAse resuspendiert
(siehe Tab. 11). Die Zellen wurden darauf folgend mit je 20 µl S2-Puffer (0,2 M NaOH, 10%
SDS) 1 min geschüttelt und weitere 4 min bei RT inkubiert. Die Neutralisation erfolgte mit
20 µl 0,333fach S3 Puffer (KAcetat 0,933 M pH 4,8) und kurzem Mischen für 20 s, sowie
etwa 10 min Inkubation bei RT. Mit SDS präzipitierte Proteine und Zellbruchstücke wurden
für 30 min bei 2750 x G und RT pelletiert. Von dem geklärten Zelllysat wurden 40 µl in eine
neue 384er MTP (Abgene, AB 1178) überführt und mit verschiedenen Mengen (18 µl, 19 µl
und 28 µl) eines 10% PEG-6000 (w/v) / 75% 2-Propanolgemisches versetzt, so dass von
jeder Fällungsbedingung 3 Ansätze vorlagen (siehe Pipettierschema). Zum Vergleich wurde
ein Teil der Proben mit 35 µl reinem 2-Propanol gefällt. Nach Durchmischung und 15 min
Equilibrierung bei RT wurde das Präzipitat durch Zentrifugation für 30 min bei 2750 x G und
4ºC sedimentiert. 20 µl des Überstands wurden abpipettiert und in eine 384er MTP überführt.
Der restliche Überstand wurde durch Zentrifugation der umgedrehten Platte bei 172 x G für 1
min verworfen. Das Pellet wurde 5 min bei 60ºC getrocknet und in 20 µl 1 mM TRIS pH 8 für
30 min bei 60ºC gelöst.
Zum Vergleich der verschiedenen Fällungsbedingungen wurde die Absorption im UV-Bereich
bei 260 nm und 280 nm vom Überstand und gelösten Pellets bestimmt. Ausgewählte Proben
wurden zusätzlich durch Elektrophorese in 1% Agarose in Gegenwart von 0,001%
Ethidiumbromid analysiert.
Tab. 11: Versuchsreihen zur Bestimmung von Fällungsparametern zur Plasmid-DNA Aufreinigung in PEG / Kaliumacetat / 2-Propanol (jeweils 3 Replikate). Zahlen in den Feldern: Volumen der Zellkultur (OD = 3) in µl. Oberste Zeile: Zellen mit/ohne (+/-) Plasmid. Rechte Spalte: Lyse mit/ohne (+/-) RNAse. Unterste Zeile: Eingesetzte Mengen von Präzipitationsreagenzien.
Plasmid + - + - + - + - + - + - + - + - + - + - + - + -
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 RNAse
A 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 +
B 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 200 -
C 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 +
D 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 180 -
E 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 +
F 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 160 -
G 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 +
H 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 140 -
I 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 +
J 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 120 -
K 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 +
L 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 100 -
M 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 +
N 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 80 -
O 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 +
P 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 60 -
18 µl 10% Peg / 75% 2-Prop. 19 µl 10% Peg / 75% 2-Prop. 28 µl 10% Peg / 75% 2-Prop. 35 µl 2-Propanol
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 30
Die Sequenzierung der Plasmide erfolgte nach den in 2.3.1 beschriebenen Protokollen,
wobei von jeder Probe jeweils 1 µl eingesetzt wurde, ohne einen Konzentrationsangleich
durchzuführen.
2.2.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol
Gefällte PCR-Produkte mit Fragmentgrößen von 100, 256, 500, 756 und 1000 bp wurden in
100 µl PCR-Reaktionspuffer (75 mM Tris pH9, 20 mM (NH4)2SO4, 2,5 mM MgCl2, 500 mM
Betain, 0,01% Tween, 0,3 mM dNTPs und 0,3 µM Primer) gelöst. Die gelöste DNA wurde in
acht 10 µl Aliquots aufgeteilt. Als Fällungsreagenz wurden 200 ml 40% PEG-6000 mit 600 ml
2-Propanol und 120 ml 2,8 M Kaliumacetat-Puffer gemischt (Endkonzentration:
8,7% PEG (w/v) / 65,2% 2-Propanol (v/v) / 0,365 M KAcetat). Zu den aliquotierten Marker
DNAs wurde jeweils 7, 8, 9, 10, 11, 12, 13 und 14 µl des Fällungsreagenz pipettiert. Die
Proben wurden durchmischt und für 15 min bei RT equilibriert. Die Sedimentation der
gefällten DNA erfolgte anschließend bei 2750 x G und RT für 20 min. Der Fällungsüberstand
wurde bei 172 x G für 1 min aus der umgedrehten Platte zentrifugiert. Nach kurzem
Trocknen wurde die gefällte Marker DNA in 10 µl 1x TE Puffer durch Mischen mit einer
Pipette resuspendiert. Die Analyse der unter den verschiedenen Bedingungen präzipitierten
DNA-Fraktionen erfolgte durch Elektrophorese in 2,1% Agarosegelen in Anwesenheit von
0,001% Ethidiumbromid.
2.2.6. Größenselektive Präzipitation von DNA für die Shotgun-Klonierung
Aus 20 ml Kulturen (OD600 3 - 5) von ausgewählten BAC-Klonen der D. labrax BAC-Bank
wurde BAC-DNA durch alkalische Lyse (Einsatzmenge der Puffer: S1+RNAse, S2 und S3
jeweils 0,1faches Kulturvolumen) und anschließende Aufreinigung mit PEG / 2-Propanol
(0,475faches Volumen des Überstands) hergestellt, wobei Inkubations- und
Zentrifugationsschritte wie in 2.2.4 durchgeführt wurden. Die gefällte DNA wurde direkt in
170 µl PlasmidSafe-Exonuklease Puffer gelöst (siehe Tab. 12), um Reste von genomischer
DNA abzubauen. Inkubation erfolgte bei 37ºC für mindestens 90 min. Die Inaktivierung der
Exonuclease erfolgte bei 72ºC für 30 min.
Tab. 12: Plasmidsafe-Reaktionsansätze zum Verdau von linearer genomischer DNA.
PlasmidSafe Kit Volumen Endkonzentration PlasmidSafe 10x Puffer 17,0 µl 1x ATP 25 mM 22,8 µl 3,4 mM ATP-dependent Exonuclease 10 U/µl 5,4 µl 0,3 U/µl PCR H2O 124,8 µl - gesamt Volumen 170,0 µl -
Material und Methoden: Untersuchungen von PEG-Präzipitationsmethoden 31
Von der BAC-DNA wurden 30 µl in einem Eppendorfgefäß durch Einwirkung von Ultraschall
für 9 - 10 s geschert (Einstellungen: 40% Duty Cycle, 5 output control, continuous). Die
Enden der fragmentierten DNA wurden mittels T4-DNA-Polymerase und Klenow-Fragment
repariert (siehe Tab. 13).
Tab. 13: Reaktionsbedingungen für die Reparatur der Enden von gescherter DNA.
Nach 30 min Inkubation bei RT wurden 20 µl des Ansatzes mit dem gleichen Volumen PEG /
NaCl / 2-Propanol Gemisch versetzt, so dass eine größenselektive Fällung in Gegenwart von
4% PEG (w/v), 0,673 M NaCl und 12,5% 2-Propanol (v/v) stattfand. Dieser Ansatz wurde für
15 min bei RT equilibriert und anschließend bei 2750 x G für 30 min bei RT zentrifugiert. Der
Überstand wurde durch Abzentrifugieren bei 172 x G für 1 min entfernt und die gefällte DNA
bei 60ºC in 12 µl TRIS 1 mM pH8 für 30 min gelöst. Je 2 µl der größenselektierten DNA-
Fragmente wurden auf einem 1% Agarosegel mit 4 µl der nicht selektierten Fragmente
verglichen. Die größenselektierte DNA wurde mit T4-Ligase in pUC19-Vektoren kloniert,
dazu wurde folgender Ansatz pipettiert und 16 h bei 16ºC im Wasserbad inkubiert.
Tab. 14: Ligationsansatz für die Erstellung von Shotgun-DNA-Banken.
Ligationsansatz Volumen Endkonzentration Ligationspuffer 10x 0,6 µl 1 x ATP 5mM 0,6 µl 0,5 mM T4-DNA-Ligase 1,25 U/µl 0,6 µl 0,075 U/µl pUC19/SmaI 25ng/µl 0,6 µl 2,5 ng/µl DNA 10 - 20 ng/µl 3,6 µl 3,6 – 7,2 ng/µl
Nach der Inkubation wurden 3 µl Chloroform und 6 µl H2O zum Ligationsansatz pipettiert,
gemischt und 5 min bei 18000 x G zentrifugiert. Danach wurde die obere Phase (ca. 13 µl) in
ein neues Eppendorfgefäß überführt. 25 µl elektrokompetente Zellen (Invitrogen Electromax
DH10B) wurden mit 1 µl der rekombinanten Plasmide durch Elektroporation (1,8 KV)
transformiert und direkt in 1 ml SOC-Lösung aufgenommen. Danach wurden die Zellen 1 h
bei 37ºC in SOC-Medium inkubiert und auf großen Agarplatten (Nunc, 245 x 245 x 25 mm)
ausgestrichen. Selektion der Klone erfolgte durch 110 µg/ml Ampicillin im Agar. Inkubation
erfolgte für 16 h bei 37ºC im Brutschrank. Ca. 2000 Transformanden wurden durch
End-Repair Ansatz Volumen Endkonzentration DNA fragmentiert 28,0 µl ca. 20 - 40 ng/µl T4-DNA-Polymerase Puffer 5x 8,0 µl 1fach dNTPs 2 mM 2,0 µl 0,2 mM T4-DNA-Polymerase 1,0 µl 0,83 U/µl Klenow-Fragment 1,0 µl 0,83 U/µl
Material und Methoden: DNA-Sequenzierung 32
blau / weiß Selektion identifiziert und von einem automatischen Picking-System in 384er
Kulturplatten überführt. Plasmid-Präparation erfolgte durch automatisierte Aufreinigung mit
PEG / KAcetat / 2-Propanol (Sequenzierung siehe 2.3.1).
2.2.7. Steigerung der Fosmid-DNA Ausbeute durch induzierbare high-copy
Replikation
Ein Fosmid-Klon aus einer am MPI f. Molekulare Genetik mit dem pCC1Fos-Vektor erstellten
genomischen DNA-Bank des Bakteriums Azoarcus Stamm mXyN1 (57) wurde in 2YT-
Medium unter Selektion mit Chloramphenicol (20 µg/ml) bis zu einer OD von 0,8 bei 37ºC
kultiviert. Mit 3 ml dieser Kultur wurden 8 weitere 100 ml Kulturen in Erlenmeyerkolben
angeimpft, welche unterschiedliche Mengen an D-Glucose und L-Arabinose enthielten (siehe
Tab. 15).
Tab. 15: Zusätze für die verzögerte Induktion der high-copy Replikation von pCC1Fos-Vektoren.
Kultur 1 2 3 4 5 6 7 8L-Arabinose (w/v) 0% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2% 0,2%D-Glucose (w/v) 0,2% 0,2% 0,18% 0,16% 0,14% 0,1% 0,05% 0%
Das Wachstum jeder Kultur wurde durch photometrische Bestimmung der optischen Dichte
bei 600 nm halbstündlich verfolgt.
2.3. DNA-Sequenzierung
2.3.1. Sequenzierung von Plasmid-DNA
Für die Sanger-Sequenzierung von Plasmid-DNA wurden pro Reaktion die in Tab. 16
genannten Reagenzien verwendet. Die Wahl der Sequenzierungsprimer ist abhängig vom
sequenzierten Plasmidtyp, für pUC19-Plasmide wurden M13-40 und M13-28 Standard-
Primer verwendet. Die BigDyeV3.1 Reagenzien wurden 9fach verdünnt eingesetzt. Aufgrund
der hohen Verdünnung des BigDyeV3.1 musste der Reaktionsansatz mit PCR-Puffer (ohne
Primer) ergänzt werden. Angaben zum verwendeten PCR-Mix siehe 2.2.5.
Tab. 16: Sequenzierungsreaktion für Plasmid-DNA.
Primer [5µM] BigDyeV3.1 PCR-Puffer H2O gesamt Vol. Sequenzierungsansatz für Plasmide 1 µl 1,5 µl 0,15 µl 1,35 µl 4 µl
Material und Methoden: DNA-Sequenzierung 33
Als Vorbereitung der Sequenzierung im 384er MTP-Format wurden die Reagenzien in
großvolumigen Ansätzen pipettiert, zu je 4 µl in die MTPs aliquotiert und dann bei -80ºC
gelagert. Die Sequenzierung erfolgte durch Zugabe von ca. 20 ng (0,5 µl - 1 µl)
aufgereinigter Plasmid-DNA in diese Platten, Durchmischung und das in Tab. 17 dargestellte
Temperaturprogramm.
Tab. 17: Temperaturprogramm für die Sequenzierung von Plasmid-DNA.
Temperatur Dauer Anzahl Wdh.
Denaturierung 96°C 2:30 min 1
Denaturierung 96°C 20 s
M13-40: 55°C Primer
Hybridisierung M13-28: 50°C
10 s
Elongation 60°C 4 min
35 Zyklen
Ende 10°C ∞ 1
2.3.2. Sequenzierung von Fosmid-DNA und BAC-DNA
Die Sequenzierung von Fosmid- oder BAC-DNA in 384er MTPs erfolgte durch die in 2.3.1
beschriebene Vorgehensweise mit den in Tab. 18 dargestellten angepassten Reaktions-
bedingungen. Für die Fosmid-Endsequenzierung wurden ca. 30 - 40 ng (1 µl - 2 µl)
Template-DNA eingesetzt. Bei BACs wurden mit 3 µl (ca. 50 – 100 ng) etwa 1/3 der
vorhandenen DNA eingesetzt, welche aus 2 x 200 µl Kulturvolumen aufgereinigt wurde (UV-
Messwerte zwischen 40 ng/µl und 100 ng/µl waren nicht zuverlässig)
Tab. 18: Modifizierter Sequenzierungsansatz für BACs und Fosmide.
Primer [14,3 µM] BigDyeV3.1 ABI Seq.-Buffer gesamt Vol. Sequenzierungsansatz für Fosmide und BACs 0,35 µl 2,5 µl 0,15 µl 3 µl
Das verwendete Temperaturprogramm wurde wie in Tab. 17 beschrieben ausgeführt, wobei
die Anzahl der Zyklen für Fosmide auf 60 und für BACs auf 70 erhöht wurde. Für die
Fosmid / BAC-Endsequenzierung in dieser Arbeit wurden T7 (Annealingtemperatur 50ºC)
und M13-28 als Sequenzierungsprimer verwendet.
Material und Methoden: DNA-Sequenzierung 34
2.3.3. Ethanol / NaAcetat-Fällung von Sequenzierungsprodukten
Die Sequenzierungsprodukte wurden durch Fällung mit Ethanol / NaAcetat gefällt, um
fluoreszenzmarkierte ddNTPs und Salze zu entfernen. Dazu wurde Ethanol 100% mit
3 M NaAcetat-Puffer (pH 4,8 - 5,2) 25:1 gemischt. Von dieser immer frisch angesetzten
Lösung (NaAcetat kann mit der Zeit ausfallen) wurden 13 µl je Sequenzierungsreaktion
pipettiert, so dass die Fällung nach Durchmischung in Gegenwart von 83,3 mM NaAcetat
und 69,4% Ethanol stattfand. Die Platten wurden für 60 min bei RT und 2750 x G
zentrifugiert. Der Überstand wurde verworfen und Reste bei 27,5 x G aus der umgekehrten
Platte zentrifugiert. Die gefällten Produkte wurden nachfolgend mit 20 µl 70% Ethanol
gewaschen und erneut für 30 min bei 2750 x G und RT zentrifugiert. Der Überstand wurde
erneut verworfen und Reste wie oben beschrieben abzentrifugiert. Die gefällten Produkte
wurden 10 min bei RT getrocknet. Anschließend wurde jedes Well mit 15 µl 1 M Betain
befüllt und die mit einem Heatsealer verschlossene Platte für 30 min bei RT geschüttelt.
2.3.4. Parameter für Sequenzanalyse auf dem ABI3730xl-System
Die in 1 M Betain gelösten DNA-Sequenzierprodukte wurden auf ABI3730xl Sequenzern
analysiert, indem die Proben mit den in Abb. 8 dargestellten Parametern aufgetrennt wurden.
Dabei wurden in den Geräten 50 cm oder 36 cm Kapillaren verwendet. Die Protokolle für
Plasmid, Fosmid und BAC-DNA unterscheiden sich in der Injektionszeit (10, 20 und 30 s), da
so schwache Signale aufgrund von geringen Template-Mengen bei Fosmiden und BACs
verstärkt werden konnten. Plasmide Fosmide BACs
50 cm
Kap
illare
n36
cm K
apilla
ren
Abb. 8: Parameter der Plasmid, Fosmid und BAC Sequenzanalyse auf ABI3730xl-Geräten.
Material und Methoden: DNA-Sequenzierung 35
2.3.5. Sequenzierung eines Pools von 109 BACs auf dem Roche GS20-System
Anhand der komparativen Genomkartierung von D. labrax wurden 109 minimal
überlappende BACs ausgewählt. Die Klone wurden in dreifacher Ausführung in 96er MTPs
mit einem Kulturvolumen von 1,5 ml (2YT Medium + 20 µg/ml Chloramphenicol) angezogen.
Die Inkubation erfolgte für 18 h bei 37ºC und 260 rpm im Schüttler.
Nach der Inkubation wurden die Zellen bei 2750 x G für 5 min pelletiert, die Mediumreste
verworfen und die Zellpellets in 150 µl S1-Puffer+RNase resuspendiert. Die alkalische Lyse
der Zellen erfolgte durch Zugabe von 150 µl S2-Puffer und vorsichtiges Schütteln sowie
anschließende Inkubation für 5 min bei RT. Der Ansatz wurde mit 150 µl 0,33 x S3-Puffer
neutralisiert und vorsichtig durchmischt und etwa 15 min bei RT inkubiert.
Durch 30 min Zentrifugation bei 2750 x G und RT wurde das Zelllysat geklärt. Je 350 µl des
Überstands von drei Lyseansätzen eines Klons wurden in eine neue 96er MTP überführt und
erneut zentrifugiert, um eventuell verschleppte Präzipitate aus der alkalischen Lyse zu
pelletieren. Von dem zweifach zentrifugierten Überstand wurden 1000 µl in eine neue
96 MTP überführt und mit 700 µl 2-Propanol bei 2750 x G und 4ºC für 30 min gefällt. Nach
der Fällung wurde der Überstand durch Zentrifugation der umgekehrten Platte bei 172 x G
für 1 min verworfen. Die Pellets wurden für 5 min bei 70ºC im Trockenschrank getrocknet
und dann in 25 µl TRIS 1 mM pH8 bei sanftem Schütteln und 60ºC für 60 min gelöst. Danach
wurden die Proben langsam abgekühlt.
Die Proben wurden nun vereinigt und durch CsCl-Gradientenzentrifugation wurde
supercoiled BAC-DNA von genomischer E. coli-DNA und linearisierter BAC-DNA getrennt
(siehe 2.3.6).
Etwa 5 - 6 µg der gewonnenen BAC-DNA wurde für die Herstellung einer einzelsträngigen
DNA-Bank und die anschließende Sequenzierung mit dem Roche GS20-System verwendet.
Die dazu nötigen Arbeitschritte erfolgten gemäß den Protokollen des Herstellers. Zusätzlich
wurde ein Teil der DNA, wie in 2.2.6 (ab Ultraschallbehandlung) beschrieben, für die
Konstruktion einer Plasmid-Shotgun-Klonbank verwendet, welche zur Generierung
zusätzlicher Sanger-Sequenzdaten verwendet wurde.
2.3.6. CsCl-Gradientenzentrifugation von BAC-DNA
BAC-DNA wurde aus 400 - 500 ml Kulturvolumen isoliert und mit 4,5 g CsCl versetzt. Die
Lösung wurde mit 1x TE-Puffer auf ein Gewicht von 8,5 g aufgefüllt und mit 400 µl
Ethidiumbromid (10 mg/ml) angefärbt. Dieser Ansatz wurde in Beckmann-Röhrchen für die
Ultrazentrifugation überführt. Ein zweites Röhrchen mit CsCl in 1x TE diente als
Material und Methoden: Bioinformatische Datenanalyse 36
Gegengewicht (max. 0,02 g Gewichtsunterschied!). Beide Röhrchen wurden zugeschweißt
und bei 45000 rpm (100.000 x G) und 20ºC für 17 h zentrifugiert.
Nach der Zentrifugation wurden unter UV-Licht zwei Banden sichtbar. Die untere Bande
(supercoiled BAC-DNA) wurde mit einer Kanüle abgezogen. Mit Hilfe von 1 ml gesättigter
2-Propanol / CsCl-Lösung wurde Ethidiumbromid in die obere 2-Propanol-Phase extrahiert
und verworfen. Dieser Vorgang wurde insgesamt dreimal wiederholt. Die DNA-haltige Phase
wurde mit 4 ml H2O verdünnt und die BAC-DNA durch Zugabe von 8 ml 100% Ethanol
gefällt. Der Fällungsansatz wurde zur Steigerung der Ausbeute für 30 min bei -20ºC inkubiert
und dann für 20 min bei 4ºC und 2750 x G zentrifugiert. Die sedimentierte DNA wurde mit
4 ml 70% Ethanol gewaschen und erneut 15 min bei 4ºC und 2750 x G zentrifugiert. Der
Waschschritt wurde insgesamt zweimal wiederholt. Nach dem Trocknen des DNA-Pellets
wurde dieses in 100 µl 1x TE-Puffer resuspendiert.
2.4. Bioinformatische Datenanalyse
2.4.1. Anordnung von D. labrax BAC-Endsequenzen auf den Genomen von
Tetraodon nigroviridis, Oryzias latipes und Gasterosteus aculeatus
Zu Testzwecken wurden 10.000 BAC-Endsequenzen aus der BAC-Bibliothek von D. labrax
wurden mit BLASTN (43, 44) auf den Genomen von T. nigroviridis, O. latipes und G.
aculeatus angeordnet. Die entsprechende Software und Datenbanken wurden lokal
verfügbar gemacht. Dabei wurden folgende Parameter verwendet:
blastall -p blastn -i <BAC-Endsequenzen.fasta> -d <ReferenzgenomDB> -o <Output> -W 15 -e 1e-5
Die Output-Datei wurde gefiltert, so dass die Anzahl angeordneter Endsequenzen
ausgegeben wurde:
grep Value <Output> | wc
2.4.2. Komparative Genomkartierung von D. labrax auf G. aculeatus
Die Anordnung aller BAC-Endsequenzen (102.282) auf dem Genom von G. aculeatus
erfolgte durch folgende BLAST-Parameter:
blastall -p blastn -i <BAC-Endsequenzen.fasta> -d <G.aculeatusDB> -o <Output> -W 7 –q -1 -e 1e-5
Material und Methoden: Bioinformatische Datenanalyse 37
Die gegenüber 2.4.1 veränderten Parameter W und q steigerten die Sensitivität des BLAST-
Algorithmus, beanspruchten allerdings auch mehr Rechenzeit. Der BLAST-Output wurde
durch den BLAST-Filter MSPcrunch in eine Tabelle umgewandelt, welche in die
Tabellenkalkulation MS Excel weiter verarbeitet werden konnte.
MSPcrunch –d „Output“ > output.msp
Mit der Tabellenkalkulation konnte der Datensatz durch implementierte Befehle als auch
selbst programmierte VBA-Makros weiter gefiltert werden (siehe 3.4.2 & 4.4.2).
Ausgewählte beidseitig sequenzierte Klone konnten anhand der Chromosomen von
G. aculeatus und den Koordinaten der Alignments sortiert werden und so relativ zueinander
angeordnet werden. Aus diesen überlappenden Klonen wurde ein minimum tiling path
berechnet. Listen von zuvor ausgeschlossenen Klonen wurden erstellt und erneut mit
stringenteren BLAST-Parametern (W = 15) angeordnet. Nach Filterung repetitiver
Sequenzen (>5 Alignments) wurden diese der Kartierung hinzugefügt.
Die graphische Darstellung erfolgte durch ein VBA-Makro in CorelDraw11, welches die
Koordinaten der berechneten BAC-Contigs aus den Excel Tabellen einlas und mit einer
Genauigkeit von 10 bp zeichnete.
2.4.3. Abgleich von genetischer Kopplungskarte und komparativer Karte
Sequenzdaten, welche bei der genetischen Kopplungskartierung von D. labrax Verwendung
fanden und die resultierende Kopplungskarte, wurden von Filip Volckaert (KU Leuven,
Belgien) zur Verfügung gestellt. Dabei handelte es sich um 151 Sequenzen von
Mikrosatelliten und 31 EST-Sequenzen.
Die Sequenzdaten wurden mittels des BLAST-Servers der Ensembl-Webseite
(www.ensembl.org) auf dem Genom von G. aculeatus angeordnet, wobei als BLAST-
Parameter „Distant homologies“ ausgewählt wurde. Die manuelle Auswertung erfolgte,
indem zunächst Sequenzen, welche mit einem E-Value von <1*10-4 angeordnet waren oder
nur einen einzigen Treffer im Genom anzeigten, in der genetischen Kopplungskarte rot
markiert wurden. Sequenzen mit weniger signifikanter Anordnung wurden nur berücksichtigt,
wenn sie in Nachbarschaft von besser angeordneten Markern lagen, welche von derselben
Kopplungsgruppe stammten. Die zugeordneten Chromosomen von G. aculeatus wurden
neben den Kopplungsgruppen von D. labrax mit den entsprechenden Verbindungslinien zu
den angeordneten Markern eingezeichnet.
Material und Methoden: Bioinformatische Datenanalyse 38
2.4.4. Abgleich der Radiation Hybrid-Kartierung von S. aurata und G. aculeatus
Die Sequenzdaten von 725 Markern der Radiation Hybrid Genomkartierung von Sparus
aurata wurden von Elena Sarropoulou (HCMR, Griechenland) zur Verfügung gestellt. Die
Sequenzen wurden mit BLASTN auf der Genomsequenz von G. acuelatus angeordnet,
wobei eine Wordsize von 7, Output in tabellarischer Form (-m 8) und ansonsten
Standardeinstellungen verwendet wurden. Die besten Alignments wurden nach G. aculeatus
Chromosomen sortiert und ihre Anzahl je Radiation Hybrid-Gruppe bestimmt. Die
Häufigkeiten der Treffer pro Gruppe und Chromosom wurden in einem Oxford-Plot
dargestellt.
2.4.5. Prozessierung der Sanger-Sequenzdaten
Die Sequenz-Rohdaten von ABI3730xl-Geräten wurden durch den PHRED-Basecaller
prozessiert (58). Anschließend wurden die Sequenzen mit LUCY (59) auf Teile des
Sequenzierungsvektor untersucht und diese maskiert (Vectorclipping). Durch Megablast (60)
wurden Sequenzen, welche von E. coli stammten oder Klonierungsvektoren (z.B. pCC1BAC)
zuzuordnen waren, aussortiert. Diese Schritte wurden durch das Perl-Skript sp3.pl von
Steffen Scheer S. und Klages S. in unserer Arbeitsgruppe automatisiert.
2.4.6. Assemblierung von BAC-Shotgun-Sequenzierungen
Für die Assemblierung von Shotgun-Sequenzierungen wurde die PHRAP-Software (61)
verwendet. Die assemblierten Daten wurden mit Gap4 (Staden Softwarepaket) oder mit
CONSED (62) bearbeitet.
2.4.7. Hybridassemblierung von GS20 und Sanger-Sequenzdaten
Sequenzdaten des GS20-Systems wurden in Form von SFF-Files an den Genomassembler
Newbler V1.0.53.17 (Roche, Penzberg) übergeben. Nach der Assemblierung wurden die im
FASTA-Format vorliegenden Contigs der 454 Daten in phd-Files umgewandelt und
zusammen mit den Sanger-Sequenzierungen durch PHRAP assembliert. Die resultierende
ACE-Datenbank wurde mit CONSED bearbeitet.
Material und Methoden: Bioinformatische Datenanalyse 39
Contigs dieses Hybridassemblys wurden mit BLASTN auf dem G. aculeatus Genom
angeordnet. Die Anordnung wurde manuell in einer Tabellenkalkulation überprüft und
unsichere Anordnungen entfernt. Die resultierende Reihenfolge der Contigs und ihre
Orientierung wurde in einer Tabelle abgelegt. Anhand dieser Tabelle erstellte das Perl-Skript
„HK.pl“ von Beck A. aus unserer Arbeitsgruppe eine zusammenhängende Sequenz im
FASTA-Format aus den einzelnen Contigs, wobei zwischen den Contigs jeweils 10 n´s
eingefügt wurden.
Ergebnisse: Analyse der PEG-Präzipitation 40
3. Ergebnisse
3.1. Analyse der PEG-Präzipitation
3.1.1. Größenselektive DNA-Präzipitation in PEG / NaCl-Gemischen
DNA-Fragmente im Größenbereich von 100 - 17000 bp wurden mit 84 verschiedenen
PEG / NaCl-Konzentrationen gefällt. Die Auswertung von zwei Versuchsreihen sind als
Beispiel in Abb. 9 dargestellt .
Fällung in 1M NaCl
PEG 6000:
4,1% 4,2% 4,3% 4,4% 4,5% 4,7% 4,9% 5,1% 5,4% 5,7% 6% Marker
1700080004500
2500200016001300
900
700600
400
250
100
Fällung in 0,3M NaCl
PEG 6000:
Marker 7,05% 7,1% 7,2% 7,3% 7,4% 7,5% 7,7% 7,9% 8,1% 8,4% 8,7% 9,0%
Abb. 9: Größenselektive Präzipitation von DNA in 1 M und 0,3 M NaCl bei unterschiedlichen PEG-Konzentrationen. Mit steigender PEG-Konzentration werden zunehmend auch kleinere DNA-Fragmente gefällt. Die schwarze Linie zeigt die Fällungsgrenze.
Für jede PEG / NaCl-Kombination wurde mittels der Gelbilder eine Fällungsgrenze anhand
der sichtbaren Bandengröße geschätzt. Die ermittelten Fällungsgrenzen von Proben mit
konstantem Salzgehalt wurden als Versuchsreihen in Abhängigkeit von der PEG-
Konzentration graphisch aufgetragen. Durch Koordinatentransformationen wurde versucht
eine Modellgleichung für die Datenreihen zu finden. Potenzfunktionen lieferten dabei die
besten Regressionskoeffizienten (0,9684 – 0,9869), wenn die Messwerte zuvor doppelt
logarithmisch aufgetragen wurden. Daraus ließ sich folgender Zusammenhang für PEG-
Konzentration und Fällungsgrenze herleiten:
Formel 1: [Fällungsgrenze in bp] = 10(a*log([peg])^-k
Ergebnisse: Analyse der PEG-Präzipitation 41
Dabei sind a sowie k abhängig von der eingesetzten Salzkonzentration. Die graphische
Darstellung in Abb. 10 zeigt die gute Übereinstimmung von experimentellen und berechneten
Werten.
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
3,5 4,5 5,5 6,5 7,5 8,5 9,5 10,5 11,5 12,5
PEG % (w/v)
Fällu
ngsg
renz
e [b
p]
1M calc0,8M calc0,6M calc0,5M calc0,4M calc0,3M calc0,2M calc1M0,8M0,6M0,5M0,4M0,3M0,2M
Abb. 10: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / NaCl. Die anhand von Gelbildern ermittelten Fällungsgrenzen für Versuche mit unterschiedlichen NaCl-Konzen-trationen wurden über der zugehörigen PEG-Konzentration aufgetragen.
Die ermittelten Daten können auch als Phasendiagramm dargestellt werden, in dem
Salzkonzentration über der PEG-Konzentration aufgetragen wird und alle Messpunkte mit
gleicher Fällungsgrenze verbunden werden. Auch hier kann eine Modelgleichung gefunden
werden, welche das Phasendiagramm eines PEG / Salz-Systems in guter Näherung
beschreibt:
Formel 2: [Salz] = C * tan(A*[peg]+B)+D
Bei A, C und D handelt es sich um Konstanten, während B abhängig von der Fällungsgrenze
ist. Diese Darstellungsform wird im Diskussionsteil 4.1 verwendet und verdeutlicht die
Eigenschaften der DNA-Präzipitation in PEG / Salz-Systemen.
NaCl-Konz.:
Ergebnisse: Analyse der PEG-Präzipitation 42
3.1.2. Größenselektive DNA-Präzipitation in PEG / MgCl2-Gemischen
Die DNA-Fällung in Gegenwart von PEG / MgCl2 unterscheidet sich von der Fällung in PEG /
NaCl hauptsächlich dadurch, dass 10 - 20fach niedrigere Salzkonzentrationen und etwa die
halbe PEG-Konzentration für die Fällung benötigt werden. Trotz dieser Unterschiede ist die
Darstellung der Fällungsgrenzen in Abhängigkeit von der PEG-Konzentration in Abb. 11 mit
den Ergebnissen aus 3.1.1 vergleichbar.
Die Datenreihen können außerdem durch die zuvor verwendeten Gleichungen (Formel 1 &
Formel 2) mit guter Näherung beschrieben werden. Das PEG / MgCl2-Phasendiagramm wird
unter 4.1.2 diskutiert.
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0
PEG % (w/v)
Fällu
ngsg
renz
e [b
p]
100mM calc75mM calc50mM calc35 mM calc25mM calc15mM calc10mM calc10mM15mM25mM35mM50mM75mM100mM
Abb. 11: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / MgCl2. Die anhand von Gelbildern ermittelten Fällungsgrenzen für Versuche mit unterschiedlichen MgCl2-Konzen-trationen wurden über der zugehörigen PEG-Konzentration aufgetragen.
3.1.3. Größenselektive DNA-Präzipitation in PEG / Kaliumacetat-Gemischen und
partielle Substitution von PEG durch 2-Propanol
Viele molekularbiologische Methoden verwenden Kaliumacetat-Puffer, z.B. wird dieser Puffer
zur Neutralisierung nach der alkalischen Lyse von Bakterien benötigt. Im Hinblick auf die
Automatisierung einer PEG-basierten Plasmid-Aufreinigungsmethode lag es deshalb nahe,
die DNA-Präzipitation mit PEG in diesem Puffersystem zu prüfen. Die Darstellung der
Fällungsdaten in Abb. 12 weist auf ein ähnliches Verhalten wie das PEG / NaCl-System hin.
Beim Einsatz gleicher Molarität der Salze benötigt das KAcetat-System jedoch 1 - 4% höhere
PEG-Konzentrationen als das NaCl-System, um dieselben Fällungsergebnisse zu erzielen.
Dies hängt wahrscheinlich mit der besseren Löslichkeit von KAcetat gegenüber NaCl
zusammen.
MgCl2-Konz.:
Ergebnisse: Analyse der PEG-Präzipitation 43
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
4,0 6,0 8,0 10,0 12,0 14,0 16,0
PEG % (w/v)
Fällu
ngsg
renz
e [b
p]1M calc0,8M calc0,7M calc0,6M calc0,5M calc0,4M calc0,3M calc0,2M calc1M0.8M0.7M0.6M0.5M0.4M0.3M0.2M
Abb. 12: Fällungsgrenzen der größenselektiven DNA-Präzipitation in PEG / Kaliumacetat. Die anhand von Gelbildern ermittelten Fällungsgrenzen für Versuche mit unterschiedlichen Kaliumacetat-Konzentrationen wurden über der zugehörigen PEG-Konzentration aufgetragen.
Um höhere PEG-Konzentrationen und damit zusammenhängende Probleme, wie erhöhte
Viskosität, zu vermeiden, wurde das PEG / KAcetat-System mit Zusatz von 2-Propanol
getestet. Die Messpunkte in Abb. 13 zeigten, dass die Zunahme der 2-Propanol-
Konzentration im Fällungsansatz bei konstantem PEG / KAcetat Gehalt einen ähnlichen
Effekt wie die Erhöhung der PEG-Konzentration erzielten. Die Daten wurden an die Model-
gleichungen des reinen PEG / KAcetat-Systems in erster Näherung angepasst, indem abge-
schätzt wurde, dass der Einfluss von 2-Propanol auf die größenselektive Präzipitation ca.
7fach geringer ist als die von PEG-6000.
0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
4,0 6,0 8,0 10,0 12,0 14,0 16,0
PEG % (w/v)+ 1/7*2-Propanol % (v/v)
Fällu
ngsg
renz
e [b
p]
0,8M KAc berechnet0,6M KAc berechnet0,5M KAc berechnet0,4M KAc berechnet0,3M KAc berechnet0,2M KAc berechnet0,2M KAc 14,3 % PEG + x 2-prop0,3M KAc 9,8 % PEG + x 2-prop0,4M KAc 7,0 % PEG + x 2-prop0,5M KAc 6,1% PEG + x 2-prop0,6M KAc 5,5 % PEG + x 2-prop0,8M KAc 4,8 % PEG + x 2-prop
Abb. 13: Größenselektive Fällung von DNA in Lösungen mit konstanter PEG- und KAcetat-Konzentration durch Zusatz von variierenden Mengen 2-Propanol (Messpunkte von links nach rechts x = 0, 1, 2, 4, 6 … 20% [v/v] 2-Propanol). Die durchgezogenen Linien stellen die aus Abb. 12 ermittelten Fällungsgrenzen im PEG / KAcetat-System dar. Durch Anpassung der x-Achse (PEG[w/v] = 1/7*2-Propanol[v/v]) konnten Messungen der unterschiedlichen Prä-zipitationsbedingungen überlagert und verglichen werden.
KAc-Konz.:
Ergebnisse: Analyse der PEG-Präzipitation 44
3.1.4. Plasmid-DNA Aufreinigung in PEG / Kaliumacetat / 2-Propanol-Gemischen
Zunächst wurden die verschiedenen Fällungen von Plasmid-DNA betrachtet, welche zuvor
einer alkalischen Lyse mit Zusatz von RNAse unterzogen worden waren. Dabei wurde
deutlich, dass die UV-Messwerte bei einer reinen 2-Propanol Fällung sehr hoch lagen.
Gelbilder zeigten (n. dargestellt), dass dies nicht durch besonders hohe DNA-Ausbeuten zu
begründen war, sondern dadurch, dass die Präzipitation mit 2-Propanol keine effektive
Trennung von RNA-Abbauprodukten erzielte. Die Fällung mit 28 µl PEG / 2-Propanol
reduzierte die Absorptionswerte merklich, allerdings lagen die Messwerte immer noch
erheblich über realistischerweise zu erwartenden Plasmid-DNA Ausbeuten. Mit Reduktion
der Menge des PEG / 2-Propanol-Gemisches ging der zuvor exponentielle Anstieg der
Absorptionswerte auf ein lineares Verhältnis zurück. Die Unterschiede zwischen 18 µl und
19 µl eingesetzter Fällungslösung waren nur noch minimal (siehe Abb. 14).
0
50
100
150
200
250
300
350
0 50 100 150 200 250
Kulturvolumen (OD = 3) [µl]
A26
0*50
ng/
µl
Aufreinigung mit35 µl 2-propAufreinigung mit28 µl PEG/2-propAufreinigung mit18 µl PEG/2-propAufreinigung mit19 µl PEG/2-prop
Abb. 14: Messung der Absorption bei 260 nm von unterschiedlich gefällten Plasmid-Präparationen. Fällung mit 2-Propanol führt zu unrealistisch hohen Messwerten, da degradierte RNA ausgefällt wird. Durch größenselektive Präzipitation mit kleinen Mengen eines Gemischs von 10% (w/v) PEG / 75% (v/v) 2-Propanol (2-prop) kann Plasmid-DNA besser aufgereinigt werden und zeigt realistischere Messwerte.
Es war anzunehmen, dass bei Einsatz von 18 µl bzw. 19 µl Fällungsreagenz Bedingungen
erzielt wurden, welche die Trennung des überwiegenden Teils degradierter RNA von
Plasmid-DNA durch größenselektive Präzipitation erzielten. Diese Annahme bestätigte sich
beim Vergleich mit den Plasmid-Präparationen, welche ohne RNAse durchgeführt wurden.
Ergebnisse: Analyse der PEG-Präzipitation 45
0
100
200
300
400
500
600
700
800
0 50 100 150 200 250
Kulturvolumen (OD = 3) [µl]
A26
0*50
ng/
µlAufreinigung mit 18 µlPEG/2-prop mit RNAse
Aufreinigung mit 19 µlPEG/2-prop mit RNAse
Aufreinigung mit 19 µlPEG/2-prop ohne RNAse
Aufreinigung mit 18 µlPEG/2-prop ohne RNAse
Abb. 15: Vergleich von Plasmid-Präparation mit und ohne RNAse. Unter größenselektiven Fällungsbedingungen kann bei geringeren Zellmengen (60 - 120 µl) eine Aufreinigung der DNA auch ohne Einsatz von RNAse erzielt werden. Größere Zellmengen verändern den Salzgehalt des Fällungsansatzes und führen zur Präzipitation von nicht degradierter RNA.
Abb. 15 zeigt, dass die gemessenen Absorptionswerte bei Aufreinigung aus 60 – 100 µl
Zellen (OD600nm = 3) für RNAse behandelte und RNAse unbehandelte Ansätze nahezu
identisch sind. In diesem Bereich war es möglich auch schwach degradierte RNA von
Plasmid-DNA zu trennen, was für die Selektivität der Fällungsbedingungen sprach.
Bei Einsatz der geringsten Menge PEG / 2-Propanol waren auch die Werte für 120 µl Zellen
identisch. Wurden dagegen höhere Zellvolumina eingesetzt so verschlechterte sich die
Selektivität. Dies war dadurch erklärbar, dass sich die Ionenstärke im Fällungsansatz mit
zunehmender Zellmenge steigerte. So wurde die Fällungsgrenze nach unten verschoben,
was zum Ausfall von weniger degradierter RNA führte. Diese Probleme können allerdings,
wie bereits oben gezeigt wurde, durch Zusatz von RNAse bei der alkalischen Lyse
vermieden werden. Bei Einsatz von PEG / 2-Propanol-Mengen unter 18 µl verringerte sich
die Ausbeute an Plasmid-DNA (Ergebnisse nicht dargestellt), weshalb es keinen Sinn
machte geringere Volumina des PEG / 2-Propanol-Gemisches für die Plasmid-Aufreinigung
zu verwenden.
Durch den Vergleich der Absorptionswerte von Überstand und gelöstem Pellet konnte
gezeigt werden, dass unter selektiven Fällungsbedingungen etwa 97% der bei 260 nm
absorbierenden Substanzen (größtenteils RNA) mit dem Überstand von der gefällten
Plasmid-DNA abgetrennt werden konnten. Der Vergleich mit Fällungen von Präparationen
des Stammes DH10B, dem ein Plasmid fehlte, zeigte, dass etwa 55,3% des
Absorptionswertes der gelösten Pellets von der Plasmid-DNA herrührte (beide Werte
konnten linear korreliert werden) (siehe Abb. 16).
Ergebnisse: Analyse der PEG-Präzipitation 46
So konnte abgeschätzt werden, dass unter selektiven Fällungsbedingungen nur noch etwa
1,5% der zuvor vorhandenen RNA-Menge in der aufgereinigten Plasmid-DNA vorhanden
war. 2-Propanol lieferte bei vergleichbaren Fällungsansätzen (RNAse+ / Plasmid+) mit einem
durchschnittlichen Anteil von 12% RNA-Kontamination in der gefällten DNA etwa 8fach
schlechtere Werte.
y = 0,5529xR2 = 0,9848
0
5
10
15
20
25
30
35
40
0 10 20 30 40 50 60 70
A260 plasmid(+) *50 ng/µl
[A26
0 pla
smid
(+) m
inus
A26
0 Pla
smid
(-)] *
50 n
g/µl
Abb. 16: Messwerte von Präparationen plasmid-haltiger Zellen wurden mit Messwerten von Präparationen von Zellen, welche keine Plasmide beherbergten, korrigiert (Abb. links). Durch Vergleich der Messwerte von Überstand und Pellet konnte gezeigt werden, dass die Fällung in PEG / 2-Propanol bis zu 8 mal selektiver ist als eine reine 2-Propanolfällung (Abb. rechts).
Die Bestimmung des Gesamtproteingehalts der Plasmid-Präparationen mit Methoden, wie
z.B. Bradford, war problematisch, da diese durch vorhandene Plasmid-DNA und RNA
verfälscht wurden. Der Vergleich von Präparationen aus Zellen mit und ohne Plasmid zeigte
2 - 3fach erhöhte Werte des Proteingehalts, wenn Plasmid-DNA vorlag. Es gab eigentlich nur
zwei mögliche Gründe für den Anstieg des Proteingehalts in diesem Maße, entweder
plasmid-assoziierte Proteine wurden mitgefällt, oder aber die DNA reagierte mit dem
Farbstoff des Nachweis-Systems. Die gemessenen Werte ließen allerdings die Aussage zu,
dass der Proteingehalt der Plasmid-Präparationen unter selektiven Fällungsbedingungen
15 ng/µl nicht übersteigt und wahrscheinlich unter 5 ng/µl liegt, da diese Werte bei
Präparationen des plasmidfreien DH10B Stammes gemessen wurden.
Die für unsere Arbeitsgruppe wichtigste Qualitätskontrolle war allerdings die DNA-
Sequenzierung selbst. Die unter selektiven Bedingungen (18 & 19 µl PEG / 2-Propanol)
gefällten Plasmide wurden mit BigDye3.1-Reagenzien sequenziert. Die Sequenzanalyse
fand auf einem ABI3730xl Sequenzer mit einem 50 cm Kapillararray statt.
0%
2%
4%
6%
8%
10%
12%
14%
16%
Ant
eil v
on g
esam
t A26
0 (Ü
bers
tand
+Pel
let)
in P
elle
t
Aufreinigung mit35 µl 2-Propanol
Aufreinigung mit28 µl PEG/2-prop
Aufreinigung mit19 µl PEG/2-prop
Aufreinigung mit18 µl PEG/2-prop
Ergebnisse: Analyse der PEG-Präzipitation 47
0
100
200
300
400
500
600
700
800
900
60 80 100 120 140 160 180 200
Kulturvolumen (OD = 3) aus dem Plasmide aufgereinigt wurden [µl]
Lese
wei
te P
hred
>Q
20 [b
]
Aufreinigung mit 19 µlPEG/2-prop ohne RNAseAufreinigumg mit 19 µlPEG/2-prop mit RNAseAufreinigung mit 18 µlPEG/2-prop ohne RNAseAufreinigung 18 µlPEG/2-prop mit RNAse
Abb. 17: Leseweiten der Sequenzierung von PEG / 2-Propanol aufgereinigter Plasmid-DNA aus unterschiedlichen Zellmengen.
Der Vergleich der Leseweiten der verschiedenen Plasmid-Präparationen zeigte, dass die
Sequenzierung mit einer Leseweite von 700 - 800 Phred-Q20 Basen konstant gute
Ergebnisse lieferte. Die minimalen Qualitätsunterschiede zwischen Präparationen mit / ohne
RNAse und Fällung mit 18 / 19 µl PEG / 2-Propanol scheinen eher zufälliger Natur zu sein.
Interessant ist auch, dass die Sequenzierung mit unterschiedlichen Plasmid-Mengen von ca.
17 ng (Ausbeute aus 60 µl Zellen) – 40 ng (200 µl Zellen) gleichwertige Ergebnisse lieferten.
Die Sequenzierung von geringeren Template-Mengen um die 20 ng wurde aber vorgezogen,
da die hohen Signalstärken zu Auflösungsverlusten zu Beginn und am Ende der
Sequenzdaten führen konnten. Die Sequenzen waren auch jenseits der Phred Q20-
Leseweite auswertbar. Bis zu 950 b (mit 1 - 2% Sequenzierungsfehlern) konnten mittels
BLAST-Algorithmus auf dem humanen X-Chromosom, dem Ursprung des Plasmid-Inserts,
angeordnet werden.
Aus den zuvor verwendeten Bedingungen wurde für die Automatisierung die alkalische Lyse
in Gegenwart von RNAse gewählt. So konnte eine selektive Fällung in einem breiteren
Spektrum von Zelldichten gewährleistet werden. Zur direkten Aufreinigung der Plasmid-DNA
aus dem geklärten Überstand der alkalischen Lyse wurde 19 µl PEG / 2-Propanol verwendet,
da so die Verdunstung des 2-Propanols bei längeren Standzeiten während der
automatisierten Plasmid-Aufreinigung ausgeglichen werden konnte. Wie in Kap. 4.2
schematisch dargestellt, konnte auf dieser methodischen Basis ein hochdurchsatzfähiges
Plasmid-Aufreinigungssystem entwickelt werden.
Ergebnisse: Analyse der PEG-Präzipitation 48
3.1.5. Aufreinigung von PCR-Produkten in PEG / KAcetat / 2-Propanol
Im Gegensatz zur Aufreinigung von Plasmid-DNA muss eine Aufreinigung von PCR-
Produkten wesentlich kleinere DNA-Moleküle fällen. Außerdem sind die PCR-
Reaktionsbedingungen meist zu salzarm, um eine effektive Fällung ohne Salzzugabe zu
gewährleisten. Aus diesen Gründen wurde ein Präzipitationspuffer konzipiert, der in
Anlehnung an die Bedingungen für Plasmid-Aufreinigung neben PEG und 2-Propanol die
nötige Salzmenge in Form von Kaliumacetat-Puffer enthielt. Wie in Abb. 18 dargestellt,
konnten, durch die Zugabe verschiedener Volumenanteile an Präzipitationsreagenz, Be-
dingungen ermittelt werden, die die Aufreinigung von sehr kleinen PCR-Produkten
ermöglichten.
Abb. 18: Größenselektive Fällung von PCR-Produkten. Die PCR-Produkte wurden mit dem in den Spalten angegebenem Vielfachen des Probenvolumens (z.B. 0,7x) an Präzipitationsreagenz gefällt.
Eine dem 1,2fachen Volumen der PCR-Reaktion entsprechende Menge an
Präzipitationsreagenz konnte sämtliche Fragmente bis 100 b in unserem Testansatz mit
guten Ausbeuten fällen (Endkonzentration im Ansatz: 4,75% PEG / 35,6% 2-Propanol /
0,2 M KAcetat). Diese Bedingung konnte zur Aufreinigung der meisten PCR-Produkte
verwendet werden, da diese durch die größenselektive Fällung von überschüssigen Primern
und dNTPs getrennt wurden. In dem Fall, dass größere PCR-Produkte und zusätzlich um
den Faktor 0,5 kleinere unspezifische Produkte vorlagen, konnten geringere Volumina des
Fällungsreagenz eingesetzt werden. So konnten auch die unspezifischen Produkte entfernt
Fragment-
Größen [bp]
Ergebnisse: Analyse der PEG-Präzipitation 49
werden. Die Konzentration von aufgereinigten Proben konnte durch UV-Photometrie
bestimmt werden. Ebenso wie bei der Aufreinigung von Plasmiden waren für eine
erfolgreiche Sequenzierung der aufgereinigten PCR-Produkte keine weiteren Waschschritte
nötig (Ergebnisse nicht dargestellt).
Diese verbesserte Methode wurde u.a. erfolgreich zur Sequenzierung amplifizierter
Kandidatengene eingesetzt. In Kooperation mit Heymut Omran (Universitätsklinikum
Freiburg) konnten durch Analyse der DNAH5-Gene von 109 an Primärer Ciliärer Dyskinesie
erkrankten Patienten 33 neue Mutationen nachgewiesen werden, welche mit der
Erbkrankheit assoziiert sind (63).
3.1.6. Weitere Anwendungen der größenselektiven Präzipitation
Die größenselektive Präzipitation wurde zur Konstruktion von Shotgun-DNA-Banken
eingesetzt. Aufwendige Schritte, wie die Elution gewünschter Fragmentgrößen aus
Agarosegelen, konnten so ersetzt werden, und es wurde ermöglicht eine größere Anzahl von
Proben parallel zu bearbeiten (siehe Abb. 19).
Abb. 19: Selektion von sonifizierten DNA-Fragmenten im Bereich von 1 - 4 kb durch größenselektive Fällung. DNA wurde jeweils vor und nach der Fällung aufgetragen.
Die Ergebnisse der Shotgun-Sequenzierung von 4 BAC Klonen zeigten, dass eine
Größenverteilung der BAC-Fragmente im Bereich von 1 – 3 kb oder 2 – 4 kb erzielt wurde.
Dabei konnte die obere Grenze durch Dauer der Ultraschallbehandlung und die untere
Grenze durch Einsatz der PEG / Salzmenge beeinflusst werden (siehe Abb. 20).
vor nach vor nach vor nach nach vor Marker
4 kb
2 kb
1 kb
0,5 kb
Bassbac-35c1 Bassbac-46e19 Bassbac-31e6 Bassbac-18k1
Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 50
0
5
10
15
20
25
30
0 1000 2000 3000 4000 5000 6000 7000
Insertgröße [bp]
rel.
Häu
figke
it [%
]
Bassbac-31e6Bassbac-35c1Bassbac-46e19Bassbac-18k1
Abb. 20: Anhand der Sequenzdaten ermittelte Insertgrößenverteilung von 4 BAC-Shotgun-Banken, welche durch Anwendung von größenselektiver Präzipitation erstellt wurden.
3.2. Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung
3.2.1. Das 96-Well Format
Abb. 21 zeigt die verwendeten Komponenten zur Automatisierung der Plasmid-Präparation
im 96er MTP-Format. Der Roboterarm (A: F3, CRS-Robotics) bestückt den 96-Spitzen-
Pipettierer (B: Multimek96, Beckman-Coulter), die Zentrifuge (C: Rotanta, Hettich), sowie das
Karoussel (D: ISRA), welches Reagenzien und Kulturplatten beherbergt. Zusätzlich sind zwei
Magnetschüttler (Teleshake, Variomag) und eine Spitzenwaschstation integriert.
Abb. 21: Roboteranlage für Plasmid, Fosmid und BAC-DNA Aufreinigung im 96er MTP-Format.
Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 51
Der schematische Ablauf der Methode ist in Abb. 22 dargestellt. Der Ablauf wurde durch
verschiedene Testläufe herausgearbeitet und vermeidet essentielle Probleme, die bei der
Automatisierung anfangs auftraten (siehe 4.2.1).
Inkubation: in 1,5 ml 2YT bei 300 rpm und 37 C 18hPelletieren der Zellen und Dekantieren des Mediums
Resuspendieren der Zellen in S1+RNAse
O
Zell-Lyse durch S2-Puffer2 min mischen
Mit S3-Puffer neutralisierenKurz mischen
4x96
Zentrifugation 30 min bei 4000 rpm 25 CO
Überstand abnehmen und in leere 96 Mtp überführenIsopropanol zugeben
Mischen
4x96Elutionspuffer zugeben mischen
Überstand über Abfalltrog auskippenUmgedrehte Platten für 1 min bei 400 rpm trocken
zentrifugieren
Zentrifugation 30 min bei 4000 rpm 4 CO
4x96
Konzentrierte Proben von 4x96 MTPIn 1x 384er MTP überführen
Pro
benv
orbe
reitu
ng
(man
uell)
Pla
smid
-Isol
atio
n / -
Konz
entra
tion
Auf
rein
igun
g m
it P
EG /
NaC
l
Zugabe von PEG / NaCl LösungDurchmischung durch umdrehen der Platte
Zentrifugation 30 min bei 4000 rpm 25 CO
4x384
N=4
Überstand abnehmen und verwerfen70% Ethanol zugeben
durch umdrehen der Platte mischen
N=3
4x384
Überstand abnehmen und verwerfenProben trocknen
In gewünschtem Puffer und Volumen lösen4x384
Prob
enna
chbe
reitu
ng
(man
uell) Qualitätskontrolle und Konzentrationsabschätzung
Agarosegelelektrophorese von Stichproben
Abb. 22: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 96er Format.
Der mit der Anlage erzielte Probendurchsatz lag bei 1536 - 1920 Proben pro Tag und wurde
hauptsächlich durch die verwendeten 96 MTPs, sowie die mehrfachen Zentrifugations- und
Waschschritte begrenzt. Dieser Probendurchsatz war ausreichend für die Endsequenzierung
kleinerer Fosmid-Banken, wie sie zur Genomsequenzierung von Bakteriengenomen
Verwendung finden.
3.2.2. Das 384-Well Format
Erfolgreiche Versuche, DNA-Templates aus kleineren Kulturvolumina zu isolieren, ebneten
den Weg zu höherem Probendurchsatz durch Verwendung des 384er MTP-Formats.
Die hierzu verwendete Anlage (siehe Abb. 23) wurde ursprünglich von Holger Rauth (17) im
Rahmen des Humangenomprojektes für PCR-Anwendungen konzipiert. Der Umstieg auf
Plasmid-Präparation erforderte den Wechsel von Hydra 96 Pipettierrobotern mit fest
installierten Spitzen hin zu zwei 384er Systemen des Typs Biomek NX / Multimek 384
(Beckman-Coulter) mit wechselbaren Spitzen. Für Zentrifugationsschritte wurden zwei
Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 52
Zentrifugen (Rotanta, Hettich) installiert. Ein UV-Photometer (Spectramax plus 384,
Molecular Devices) wurde in die Anlage integriert. Quell- und Zielplatten werden in zwei
temperierbaren Karoussels (ISRA) und einem Kühlschrank beherbergt, diese bieten Platz für
mehr als 200 MTPs. Alle Geräte können von dem auf einer Schiene beweglichen
Roboterarm (A465, CRS-Robotics) bestückt werden.
Biomek NX Multimek 384
Deckel-abwurf
AbfallZentrifuge 2
Zentrifuge 1
Karoussel 1+ 2 für je 8 x 13 MTP temperierbar auf 8 Co
Kühlschrank mit 18 Plätzentemperierbar auf 4oC
Roboterarm auf Schiene beweglich
12 Thermocycler für PCR /cycle sequencing
UV-Photometer
Abfall
bidest.H O2
Abb. 23: Aufbau der „BigRobby“-Anlage zur automatisierten Plasmid-Aufreinigung im 384er-Format.
Der Ablauf der Plasmid-Aufreinigung mit der PEG / NaCl-Methode im 384er MTP-Format ist
in Abb. 24 schematisch dargestellt.
Inkubation: in 0,2 ml 2YT bei 1100 rpm und 37 C 17hPelletieren der Zellen und Dekantieren des Mediums
Resuspendieren der Zellen in S1+RNAse
O
Zell-Lyse durch S2-Puffer2 min mischen
Mit S3-Puffer neutralisierenKurz mischen
Pl1-8
Zentrifugation x min bei 4000 rpm 25 COÜberstand abnehmen und in leere 384 Mtp
überführenIsopropanol zugeben
Pl1-8Überstand über Abfalltrog auskippen
Umgedrehte Platten für 1 min bei 400 rpm trocken zentrifugieren in Zentrifuge 2
Zentrifugation x min bei 4000 rpm 4 CO
Pl1-8
Pro
benv
orbe
reitu
ng
(man
uell)
Pla
smid
-Isol
atio
n / -
Konz
entra
tion
Auf
rein
igun
g m
it P
EG /
NaC
l
Lösen der Proben in ElutionspufferUmpipettieren der DNA in Aufreinigungsplatte
Zentrifugation 30 min bei 4000 rpm 25 CO
16x384
Überstand abnehmen und verwerfen70% Ethanol zugeben
durch umdrehen der Platte mischen
N=3
16x384
Überstand abnehmen und verwerfenProben trocknen
In gewünschtem Puffer und Volumen lösen16x384
Prob
enna
chbe
reitu
ng
(man
uell) Qualitätskontrolle und Konzentrationsabschätzung
Agarosegelelektrophorese von Stichproben
Zell-Lyse durch S2-Puffer2 min mischen
Mit S3-Puffer neutralisierenKurz mischen
Pl1-16
Zentrifugation x min bei 4000 rpm 25 CO
Überstand abnehmen und in leere 384 Mtp überführen
Isopropanol zugeben
Zentrifugation x min bei 4000 rpm 4 CO
Pl9-16
Pl9-16Überstand über Abfalltrog auskippen
Umgedrehte Platten für 1 min bei 400 rpm trocken zentrifugieren in Zentrifuge 2
Pl9-16
Platten trocknen bei RT Pl1-16
Zugabe von PEG / NaCl LösungDurchmischung durch umdrehen der Platte 16x384
Abb. 24: Schematische Darstellung der automatisierten Plasmid-Aufreinigung im 384er MTP-Format.
Ergebnisse: Automatisierung der Plasmid-, Fosmid- und BAC-Aufreinigung 53
Der komplette Ablauf benötigte für 16 x 384 Proben etwa 12 h, so dass sich der
Probendurchsatz gegenüber dem 96er MTP-Format ca. 8fach gesteigert wurde. Dieser
erhöhte Durchsatz war einerseits durch das 384er MTP-Format bedingt (4fache Steigerung),
andererseits durch die effizientere Nutzung der Geräte (2fache Steigerung).
Durch die Kombination des bereits automatisierten Verfahrens für die alkalische Lyse und
der in 3.1.4 beschriebenen modifizierten PEG-Präzipitation in Gegenwart von KAcetat und
2-Propanol, konnte der Aufreinigungsprozess nochmals beschleunigt werden. Der ver-
besserte Prozess ist in Abb. 25 dargestellt.
Inkubation: in 0,2 ml 2YT bei 1100 rpm und 37 C 17hPelletieren der Zellen und Dekantieren des Mediums
Resuspendieren der Zellen in S1+RNAse
O
Zell-Lyse durch S2-Puffer2 min mischen
Mit S3-Puffer neutralisierenKurz mischen
Pl1-8
Zentrifugation x min bei 4000 rpm 25 COÜberstand abnehmen und in leere 384 Mtp
überführenPEG/Isopropanol-Mix zugeben
Pl1-8Überstand über Abfalltrog auskippen
Umgedrehte Platten für 1 min bei 1000 rpm trocken zentrifugieren in Zentrifuge 2
Zentrifugation x min bei 4000 rpm 4 CO
Pl1-8
Pro
benv
orbe
reitu
ng
(man
uell)
Pla
smid
-Isol
atio
n +A
ufre
inig
ung
Prob
enna
chbe
reitu
ng
(man
uell) Lösen der Proben in Elutionspuffer
Qualitätskontrolle aller Proben durch UV photometrische Messung
Zell-Lyse durch S2-Puffer2 min mischen
Mit S3-Puffer neutralisierenKurz mischen
Pl1-16
Zentrifugation x min bei 4000 rpm 25 CO
Überstand abnehmen und in leere 384 Mtp überführen
PEG/Isopropanol-Mix zugeben
Zentrifugation x min bei 4000 rpm 4 CO
Pl9-16
Pl9-16Überstand über Abfalltrog auskippen
Umgedrehte Platten für 1 min bei 1000 rpm trocken zentrifugieren in Zentrifuge 2
Pl9-16
Platten trocknen bei RT Pl1-16
Abb. 25: Schema des durch die PEG / 2-Propanol-Aufreinigungsmethode vereinfachten Ablaufs.
Durch Integration eines zweiten Biomek NX Pipettierers in die Anlage konnten nun 32
Platten in etwa 8 h bearbeitet werden, was einem theoretischen Probendurchsatz von 36.864
Templates pro Tag entspricht.
Ergebnisse: Endsequenzierung von Fosmiden und BACs 54
3.3. Endsequenzierung von Fosmiden und BACs
Die zuvor dargestellte Anlage erlaubte, neben der Plasmid-Präparation, die Aufreinigung von
großen Vektorkonstrukten (Fosmide 30 - 45 kb, BACs >100 kb) durch größenselektive
Präzipitation. Wie im Folgenden dargestellt, mussten hierfür Strategien entwickelt werden,
welche die geringen Ausbeuten dieser Vektorsysteme kompensieren konnten, um ihre
Endsequenzierung zu ermöglichen.
3.3.1. Steigerung der Fosmid-DNA Ausbeute durch induzierbare high-copy
Replikation
Fosmid-Vektoren des Typs pCC1Fos sind neben dem low-copy Ori des F-Plasmids mit
einem high-copy Ori des RK2-Plasmids ausgestattet. Durch Zusatz von L-Arabinose im
Medium kann der high-copy Mechanismus induziert werden und so die sonst niedrige
Ausbeute an Fosmid-DNA gesteigert werden. Die Anzucht in Medium mit L-Arabinose erwies
sich allerdings als problematisch, da das Wachstum der Zellen sich stark verlangsamte. Eine
Zugabe von L-Arabinose zu einem späteren Zeitpunkt konnte diesen Nachteil verhindern,
war aber in der Praxis nicht durchführbar, da die Kulturen meist mitten in der Nacht hätten
induziert werden müssen. Aus diesem Grund wurde versucht das Einsetzen der Induktion
durch Katabolitrepression mit D-Glucose zu verzögern. Die Wachstumskurven eines Fosmid-
Klons in Medien mit unterschiedlichen D-Glucose / L-Arabinose Anteilen zeigten, dass sich
bei einer Konzentration von 0,2% (w/v) L-Arabinose und 0,05% (w/v) D-Glucose die Induk-
tion in einer Verlangsamung des Wachstums äußerte. Im späteren Verlauf wurden allerdings
immer noch ähnlich hohe Zelldichten, wie bei Wachstum ohne Induktion, erzielt (Abb. 26).
Abb. 26: Zelldichte (OD600) von L-Arabinose (arab) induzierten copy control Fosmid-Klonen in Abhängigkeit von Inkubationszeit und Medienzusammensetzung. Von Beginn an induzierte Zellen (0% D-Glucose) wachsen deutlich langsamer als verzögert oder nicht induzierte Zellen. Die Glucosekonzentration (G) bestimmt das Einsetzen der Induktion zu unter-schiedlichen Zeiten. Das Abflachen der Kurven bei höheren OD ist auf Sauerstofflimitierung und inhibierende Stoffwechselprodukte zurückzuführen.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 50 100 150 200 250 300 350 400
t in M inuten
OD
600 (
1:5
verd
ünnt
)
arab 0% ; G 0,2%
arab 0,2% ; G 0,2%
arab 0,2% ; G 0,18%
arab 0,2% ; G 0,16%
arab 0,2% ; G 0,14%
arab 0,2% ; G 0,1%
arab 0,2% ; G 0,05%
arab 0,2% ; G 0%
Ergebnisse: Endsequenzierung von Fosmiden und BACs 55
Diese Wachstumsbedingungen wurden mit leichten Anpassungen (0,2% (w/v) L-Arabinose /
D-Glucose 0,03% (w/v)) auf die Kultivierung von Fosmid-Klonen in 384er MTPs übertragen
und ermöglichten es, ausreichende Mengen an Fosmid-DNA für die Sequenzierung aus
200 µl Kulturvolumen aufzureinigen. Die Ausbeute an Fosmid-DNA konnte durch Induktion
etwa 10 - 20fach gesteigert werden.
3.3.2. Vergleich von Fosmid-Endsequenzierung mit und ohne Induktion
Der Übergang von Fosmid-Präparation im 96er Format hin zum 384er Format erfolgte
zeitgleich mit der Sequenzierung des Genoms eines Archaebakteriums des Rice Cluster I,
so dass hier eine große Datenmenge beider Präparationsvarianten verglichen werden
konnte.
Die Fosmid-Präparation aus induzierten Kulturen im 384er MTP-Format erzielte gegenüber
der Präparation im 96er Format einen höheren Probendurchsatz und ca. 10% mehr End-
sequenzen mit einer Leseweite >500 bp (siehe Abb. 27). Dies konnte einerseits auf die
bessere Handhabung von 384er MTPs bei der Fosmid-Aufreinigung zurückgeführt werden,
andererseits auf den durch die Induktion erhöhten Anteil an Fosmid-DNA gegenüber
anderen Zellbestandteilen.
Abb. 27: Vergleich von jeweils 3.072 Fosmid-Endsequenzierungen im 96er MTP- und im 384er MTP-Format. Im 384er Format wurde die high-copy Replikation der Fosmide durch Zusatz von L-Arabinose und D-Glucose verzögert induziert.
74,7
11,6
3,410,3
84,9
6,22,5
6,3
0,0
10,0
20,0
30,0
40,0
50,0
60,0
70,0
80,0
90,0
>500 >300 >100 <100
Leseweite Q20 [b]
%
RC1 Fosmid Endsequenzen 96er Format (n=3072)RC1 Fosmid Endsequenzen 384er Format (n=3072)
Ergebnisse: Endsequenzierung von Fosmiden und BACs 56
3.3.3. BAC-Endsequenzierung
Um genügend BAC-DNA zur Bestimmung von Endsequenzen zu erhalten, mussten DNA-
Präparationen aus doppelten Ansätzen erstellt werden (2 x 384er MTP mit 200 µl je Well).
Außerdem wurde das Aufreinigungsprotokoll um einen Waschschritt mit 70% Ethanol
ergänzt, da wesentlich höhere Mengen der präparierten DNA für die Sequenzierung
eingesetzt wurden und deshalb Salzreste in den DNA-Präparationen die Sequenzierungs-
reaktion stören konnten. Weitere Anpassungen wurden an den Protokollen für
Sequenzierungsreaktionen, Thermocycler und Beladung der ABI3730xl-Sequencer
vorgenommen (siehe 2.3.2).
0
5000
10000
15000
20000
25000
30000
35000
250-
299
b
300-
349
b
350-
399
b
400-
449
b
450-
499
b
500-
549
b
550-
599
b
600-
649
b
650-
699
b
700-
749
b
750-
799
b
800-
849
b
850-
899
b
900-
949
b
950-
999
b
1000
-104
9 b
Klassen von Leseweiten
abso
lute
Häu
figke
it
Abb. 28: Leseweitenverteilung von 102.282 Endsequenzen einer BAC-Bank des D. labrax Genoms.
Wie in Abb. 28 dargestellt, konnten durch diese Anpassungen 102.282 BAC-Endsequenzen
einer genomischen BAC-Bank des Wolfsbarsches (Dicentrarchus labrax) bestimmt werden,
wobei die mittlere Leseweite bei 678 b lag (siehe auch Abb. 29).
Abb. 29: Elektropherogramm einer BAC-Endsequenzierung.
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 57
Wie in Tab. 19 dargestellt verliefen im Durchschnitt 89,3% der Sequenzierungen einer 384er
MTP erfolgreich (Kriterium: Q20 Leseweite > 300 b).
Tab. 19: Ergebnisse des D. labrax BAC-Endsequenzierungsprojekts.
ABI3730xl: 50 cm Kapillaren 36 cm Kapillaren 50 cm & 36 cm Kap.
abs. rel. abs. rel. abs. rel.
BAC-Ends 24480 75,4% 78348 80,4% 102828 79,2%
leerer Vektor 3279 10,1% 9846 10,1% 13125 10,1%
Fehlerhaft 4689 14,5% 9224 9,5% 13913 10,7%
Gesamt 32448 100,0% 97418 100,0% 129866 100,0%
Durchschn. Lesew. von
BAC-Ends einer 384er MTP
754 b +/- 62 b (n=85 MTPs)
655 b +/- 30 b (n=254 MTPs)
678 b +/- 60 b
Der Anteil an leeren BAC-Vektoren wurde nach Prozessierung der Sequenzen auf 10,1%
bestimmt, so dass im Durchschnitt die Enden von 79,2% der BAC-Klone sequenziert
wurden. Dies entsprach einer erfolgreichen Sequenzierung von ca. 88% der insertragenden
Klone. Die Sequenzanalyse wurde zunächst auf mit 50 cm Kapillaren bestückten ABI3730xl
Sequenzierern durchgeführt und erzielte Leseweiten (Q20) von durchschnittlich 754 b. Die
Sequenzierung von BAC-Templates reichte somit nahe an die Qualität von Plasmid-
Sequenzierung heran.
Um den Durchsatz der Sequenzanalyse auf den ABI3730xl Geräten zu verdoppeln, wurden
diese mit 36 cm Kapillaren ausgestattet. Die mittlere Leseweite reduzierte sich nun um 99 b
(13%) und erreichte dieselben Werte wie die Sequenzierung von Plasmid-DNA, was
daraufhin deutet, dass die Trennschärfe der Kapillaren nun die Leseweite limitierte und nicht
mehr die Unterschiede in der Qualität der DNA-Templates.
3.4. Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen
3.4.1. Anordnung der D. labrax BAC-Endsequenzen auf Referenzgenomen
Um das optimale Referenzgenom zur Anordnung der BAC-Endsequenzen zu ermitteln,
wurden 10.000 Sequenzen des Datensatzes auf vier verschiedenen Fischgenomen durch
BLASTN angeordnet. Dabei wurden eine Wordsize von 15 und ansonsten die
Grundeinstellungen der BLAST-Parameter verwendet, als maximales berücksichtiges E-
Value wurde 10-5 gewählt. Die Ergebnisse zeigten, dass D. rerio (Zebrafisch) am wenigsten
Homologien aufwies (1.128 von 10.000 angeordnete ES). T. nigroviridis und O. latipes lagen
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 58
etwa gleichauf (2.536 bzw. 2.702 angeordnete ES). G. aculeatus erwies sich als nächster
bereits sequenzierter Verwandter von Dicentrarchus labrax mit 4.359 angeordneten BAC-
Endsequenzen.
Danio rerio
Tetraodon nigroviridis
Oryzias latipes
Gasterosteus aculeatus
0,00%
10,00%
20,00%
30,00%
40,00%
50,00%
Ang
eord
nete
BAC
-End
sequ
enze
n
Abb. 30: Menge der auf verschiedenen Fischgenomen angeordneten BAC-Endsequenzen in Prozent.
3.4.2. Komparative Kartierung von D. labrax BAC-Klonen auf G. aculeatus
Der gesamte Datensatz von 102.828 Endsequenzen wurde auf den Chromosomen von
G. aculeatus durch BLASTN angeordnet. Durch geringere Stringenz der BLAST-Parameter
(W=7, q=1) konnten beide BAC-Endsequenzen von 21.581 Klonen angeordnet werden
(43162 Sequenzen). Zunächst wurden nur paarige Endsequenzen betrachtet, d.h.
Endsequenzen von einem BAC-Insert, welches von beiden Seiten ansequenziert und
angeordnet wurde.
Die Zuordnung der BLAST-Alignments zu Chromosomen von G. aculeatus ergab, dass die
Endsequenzen von 8.968 Klonen unterschiedlichen Chromosomen zugeordnet wurden
(Gruppe 1). 12.613 Klone wurden mit beiden Enden auf demselben Chromosom angeordnet
(Gruppe 2). Ein Vergleich der Häufigkeit von BLAST-Alignments für beide Gruppen zeigte,
dass die Zuordnung auf unterschiedliche Chromosomen hauptsächlich durch repetitive
Sequenzen bedingt war. Der Median der Alignmentanzahl lag bei 2 für paarige
Endsequenzen, welche auf demselben Chromosom angeordnet wurden, erreichte aber
einen Wert von 23 für paarige Endsequenzen auf unterschiedlichen Chromosomen.
Zusätzlich konnte nicht ausgeschlossen werden, dass die BAC-Bank von D. labrax chimäre
Klone enthielt, so dass die Klone der Gruppe1 für die komparative Genomkartierung nicht
verwendet wurden.
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 59
Um die Sicherheit der Anordnung von Klonen der Gruppe 2 zu erhöhen, wurden diese weiter
gefiltert, indem nur Endsequenzen berücksichtigt wurden, deren Abstand im Bereich der
Größenverteilung auf G. aculeatus lag (20 kb – 225 kb / siehe Abb. 45 unter 4.4.6), und
deren Endsequenzen die korrekte Orientierung aufwiesen (ES1 -> <- ES2). Auf diese Weise
wurden weitere 1.801 BAC-Klone (3.602 Endsequenzen) von der komparativen Kartierung
ausgeschlossen. 21.624 Endsequenzen von 10.812 BAC-Klonen waren konsistent und
konnten für die komparative Kartierung verwendet werden.
Die zunächst ausgeschlossenen Klone wurden erneut mit stringenteren Parametern durch
BLASTN (W=15) angeordnet und diesmal in der Weise gefiltert, dass nur Endsequenzen für
die Kartierung berücksichtigt wurden, welche 5 oder weniger Alignments auf G. aculeatus
zeigten. Für die Anordnung der Endsequenzen wurde die Position des Alignments mit dem
besten Score-Wert gewählt. Auf diese Weise konnten Endsequenzen von weiteren 20.286
einseitig sequenzierten Klonen in der komparativen Karte berücksichtigt werden.
Die aus den Daten ermittelte komparative Karte ist umseitig in Abb. 31 dargestellt und wird
unter 4.4.3 diskutiert.
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 60
Abb. 31: Genomweite Darstellung der komparativen Karte von D. labrax auf den
Chromosomen von G. aculeatus (grün = paarweise angeordnete BAC-ES, rot = nur eine ES von BACs angeordnet).
chr1
5ch
r16
chr1
7ch
r18
chr1
9ch
r20
chr2
116
1987
6418
1157
8814
6031
4116
2827
1620
2406
6019
7320
7111
7174
8717
2425
324
4431
717
9375
711
8082
018
4788
615
1899
817
3629
979
,54%
76,06
%77
,00%
69,64
%73
,82%
79,93
%81
,78%
2839
3439
3937
1614
616
413
613
917
417
110
9
G.ac
uleatu
s chr
omos
ome
chr1
chr2
chr3
chr4
chr5
chr6
chr7
chr8
chr9
chr1
0ch
r11
chr1
2ch
r13
chr1
4to
tal si
ze [b
p]28
1859
1423
2956
5216
7985
0632
6329
4812
2513
9717
0836
7527
9374
4319
3687
0420
2494
7915
6574
4016
7060
5218
4010
6720
0831
3015
2464
61
large
st BA
C co
ntig
[bp]
4475
141
2100
554
1914
933
3466
479
1342
356
5034
932
2349
428
1990
114
1487
582
1368
348
1957
589
2950
055
3468
445
9961
09co
vere
d by B
AC m
inima
l tilin
g path
74,44
%83
,53%
76,66
%72
,67%
79,59
%75
,81%
75,70
%75
,85%
67,28
%73
,21%
72,99
%75
,00%
79,10
%73
,79%
BAC
cont
igs62
4428
5929
2856
4742
3827
3841
37
numb
er of
BAC
s in m
inima
l tilin
g path
259
215
146
270
116
137
252
172
167
140
139
149
179
131
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 61
3.4.3. Verifikation von angeordneten BAC Klonen
Durch die Shotgun-Sequenzierung von 10 überlappenden BAC-Klonen, welche eine etwa
1,3 Mb große Region im Genom von D. labrax abdeckten, konnte die komparative
Anordnung von 145 BAC-Endsequenzen auf der homologen Region von G. aculeatus
überprüft werden. Die Herstellung der BAC-Shotgun-Banken erfolgte wie in 2.2.6 & 3.1.6
beschrieben.
11800000
12000000
12200000
12400000
12600000
12800000
13000000
13200000
0 200000 400000 600000 800000 1000000 1200000 1400000
BAC-Endsequenz Position auf D. labrax 1.3 mb scaffold
BAC-E
ndse
quen
z Pos
ition
auf
G. a
cule
atus
Chr
2
Abb. 32: Vergleich von durch komparative Kartierung auf G. aculeatus vorhergesagten Koordinaten von BAC-Endsequenzen und realen Koordinaten auf D. labrax.
Abb. 32 zeigt die durch BLAST ermittelten Positionen von 138 Endsequenzen auf beiden
Genomen. Es stellte sich heraus, dass 8 Endsequenzen auf Grund eines repetitiven
Sequenzmotivs falsch angeordnet wurden. Weitere 7 Endsequenzen konnten überhaupt
nicht angeordnet werden. Bei genauerer Betrachtung der komparativen Karte zeigte sich,
dass 14 der 15 nicht richtig angeordneten Sequenzen zu BAC-Klonen gehörten von denen
nur eine der zwei Endsequenzen angeordnet werden konnte. Diese waren zusätzlich mit
relativ niedriger Signifikanz angeordnet worden.
Von den für die komparative Kartierung wichtigeren Klone, deren Endsequenzen beide
positioniert werden konnten, waren 81 von 82 (98,8%) Endsequenzen richtig angeordnet.
Die fehlende Sequenz konnte wahrscheinlich aufgrund einer Sequenzierungslücke in der
D. labrax Sequenz nicht angeordnet werden.
3 Sequenzen !
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 62
3.4.4. Abgleich von genetischer und komparativer Karte von D. labrax
Von 182 Markern der genetischen Kopplungskarte von D. labrax (79) konnten 97 Marker
(53,3%) für einen Vergleich mit dem Genom von G. aculeatus verwendet werden. Die
Anordnung der Marker auf beiden Genomen ist in Abb. 33 auf dieser Seite und umseitig
dargestellt.
0.0DLA001511.0DLA016412.0DLA003823.2
27.837.1
DLA012245.0DLA013048.0DLA0051DLA013251.0
52.353.557.266.5
DLA001673.6
77.4DLA0021104.7
126.1132.6
DLA0139135.7DLA20DLA0113136.7DLA0048DLA0237e139.8
140.7141.1141.4
DLA0134141.8DLA0236DLA0209143.8DLA0213145.8DLA0251e149.9DLA0167162.4
1-Average
DLA01040.012.414.6
DLA0200DLA0102DLA0036DLA0147
17.0
DLA010618.0DLA000424.1DLA011825.1
39.6DLA013145.2DLA003960.9
2-Average
0.0DLA00265.3
12.6
DLA0223e30.031.0
DLA013335.139.546.6
DLA012748.7DLA011450.7SaGT41b56.3DLA0262e63.6
3-Average
0.0DLA003111.0DLA002417.1
18.0DLA0257e18.8DLA001319.7DLA011922.2
26.129.731.4
DLA000534.0DLA021935.3DLA024737.9DLA011538.9DLA004044.0DLA021259.5DLA003564.2
67.9
14-Average
G.a
cule
atus
Chr
V
G.a
cule
atus
Chr
IV
G.a
cule
atus
Chr
VII
G.a
cule
atus
Chr
XV
II
Map
ped
via
T.ni
grov
iridi
s C
hr11
0.0DLA01662.3
10.2DLA0148DLA0225e12.7DLY1315914.7DLA011715.7
18.7DLA023219.7DLA016020.8DLA019923.9
27.7DLA012547.7DLA0258e57.1
4-Average
0.0
DLA014915.023.5
DLA0112DLA0023k27.0DLA003231.3DLA000235.7DLA024044.6DLA015351.6
54.6DLA0274e62.4DLA0231e63.8DLA013765.9
68.7
5-Average
DLA02160.0DLA0211DLA00062.0
DLA0019DLASTR147.0
DLA001112.114.5
DLA22ST26.729.9
DLA0238e42.9DLA015045.1DLA0230e49.5
58.7DLA0272eDLA019163.2
DLA0275e77.6
6-Average
G.ac
ulea
tus
Chr
VIII
G.ac
ulea
tus
Chr
II
G.ac
ulea
tus
Chr
XIX
DLA00490.0DLA000912.0DLA012315.0DLA021517.0DLA010718.0SOX1020.4
23.4DLA016125.2DLA012827.2
28.7DLA017046.2DLA004256.0
66.7
7-Average
0.0DLA0280e2.3
5.4DLA00438.6
DLA0226eDLA0227e31.1DLA0192DLA010547.7
48.048.4
DLA001848.8DLA020755.7DLA0233e60.8
65.4DLA010381.4
8-Average
DLA00230.0DLA024510.0DLA000712.1DLA012120.2
9-Average
G.a
cule
atus
Chr
IX
G.a
cule
atus
Chr
X
G.a
cule
atus
Chr
XI
DLA00100.0DLA0273e1.1
3.3
DLA0120DLA0229e29.8DLA0218DLA0256eDLA016530.8DLA019333.9
43.3DLA014646.5
48.8
10-Average
0.02.7
DLA0267eDLA0202DLA01434.7
10.6DLA004111.8DLA017113.7
18.2DLA013522.5
29.429.832.3
11-Average
0.0DLA014113.8DLA023518.5DLA0046DLA012421.2DLA002023.2
26.331.932.7
DLA015835.738.443.850.366.9
12-Average
G.ac
ulea
tus
Chr
III
G.ac
ulea
tus
Chr
VI
G.ac
ulea
tus
Chr
XV
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 63
DLAMTP30.0DLA018811.2DLA0154DLA0111DLA0014DLA0242
14.2
28.2
13-Average
0.0DLA0277e10.9
14.2DLA001720.2DLA014221.2
23.6DLA024826.1
26.6DLA014036.6DLA005039.7
44.4
15-Average
0.0DLA0196DLA00129.6DLA004510.6Lab815.7
16.2DLA020116.7DLA016918.7
22.7DLA0254PXN128.9
16-Average
0.0
9.415.620.7
DLA002930.3DLA000836.5
24-Average
G.a
cule
atus
Chr
XVI
G.a
cule
atus
Chr
XX
G.a
cule
atus
Chr
I
0.0DLA004714.3
21.9DLA013827.3DLA0145DLA0034DLA0144DLA017330.4DLA1233.4DLA015734.4DLA0252e35.4
36.7DLA0261ERA40.5
17-Average
DLA02100.0DLA0198DLA00287.0
19.2
30.440.342.5
DLA003744.8DLA0033DLA0126DLA0195DLA015558.1
60.4
18-Average
0.0DLA01724.6DLA024312.6DLA0003DLA011618.3DLA015924.0DLA020534.1DLA021736.1
40.248.150.7
19-Average
G.ac
ulea
tus
Chr
XV
III
G.ac
ulea
tus
Chr
XIV
G.ac
ulea
tus
Chr
XX
I
0.02.3
DLA02036.5DLA01568.6
10.7DLA020412.7
15.4DLA0152DLA0249
36.4DLA0250e39.7
43.6
20-Average
0.0DLA0255e0.3
2.1DLA02416.3
6.8DLA01747.3
14.817.318.4
22-Average
G.a
cule
atus
Chr
XIII
G.a
cule
atus
Chr
XII
Abb. 33: Abgleich der genetischen Kopplungskarte von D. labrax (79) und dem Genom von G. aculeatus. Durch BLASTN signifikant positionierte Marker sind in rot dargestellt. Marker, welche mit niedriger Signifikanz angeordnet wurden, sind grün dargestellt. Für schwarz dargestellte Marker wurde keine Anordnung gefunden.
Allen 21 Chromosomen von G. aculeatus konnten 22 Kopplungsgruppen von D. labrax
zugeordnet werden. Die zwei fehlenden Kopplungsgruppen sind wahrscheinlich nur schlecht
kartiert und waren deshalb nicht anzuordnen. Das G. aculeatus Chromosom IV zeigte einen
großen Bereich, dem keine Kopplungsgruppen zugeordnet werden konnten. Hier liegen
möglicherweise zwei weitere Kopplungsgruppen von D. labrax, welche in der Kopplungs-
kartierung nur als Vielzahl kleinerer Fragmente vorkommen.
Die Zuordnungen von Chromosomen zu Kopplungsgruppen deutet daraufhin, dass die 24
Chromosomen von D. labrax durch Fusionsereignisse und Chromosomenbrüche aus den 21
Chromosomen von G. aculeatus rekonstruiert werden können und somit die Contigs der
komparativen BAC-Klonkarte aus 3.4.2 ebenfalls der genetischen Karte zugeordnet werden
können (Diskussion siehe 4.4.4).
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 64
3.4.5. Vergleich der Radiation Hybrid Kartierung von S. aurata mit G. aculeatus
Da genauere Kartierungen als die genetische Kopplungskartierung für D. labrax noch nicht
verfügbar sind, wurde alternativ eine Radiation Hybrid-Kartierung (RH) des Fisches Sparus
aurata mit G. aculeatus verglichen. Sparus aurata wird den Perciformes zugeordnet und ist
deshalb näher verwandt mit D. labrax als G. aculeatus. Ähnlichkeiten zwischen G. aculeatus
und S. aurata würden den Ergebnissen aus 3.4.4 mehr Signifikanz verleihen.
Von 725 Markern konnten 460 (63,5%) mit hoher Signifikanz auf dem Genom von
G. aculeatus durch BLASTN angeordnet werden.
Tab. 20: Oxford-Plot von 460 Markern der S. aurata Radiation Hybrid-Kartierung auf den Chromo-somen von G. aculeatus. Rot = mehr als 15, grün = 14 bis 5, hellblau = weniger als 5 übereinstimmende Marker.
Gasterosteus aculeatus Chr1 Chr2 Chr3 Chr4 Chr5 Chr6 Chr7 Chr8 Chr9 Chr10 Chr11 Chr12 Chr13 Chr14 Chr15 Chr16 Chr17 Chr18 Chr19 Chr20 Chr21
RH1 11 RH25 8 1 2 1 RH18 25 1 RH6 21 1 1
RH22 2 1 18 2 RH4 7
RH11 15 1 RH7 1 13 1
RH15 1 10 RH9 18 1 RH2 24 1
RH17 1 1 27 RH19 7 RH20 8 RH24 1 1 24 RH23 27 1 RH16 1 28 RH3 11 RH8 1 11
RH10 1 1 2 29 1 RH21 1 1 12 RH13 1 17 RH12 1 22 RH14 1 19
Spa
rus
aura
ta
RH5 13
Der Oxford-Plot in Tab. 20 zeigt, dass der überwiegende Teil der Marker einer RH-Gruppe
auch einem Chromosom von G. aculeatus zugeordnet wird. Dabei wird deutlich, dass drei
Fusionen von jeweils zwei S. aurata RH-Gruppen die Chromosomen 1, 4 und 7 von
G. aculeatus rekonstruieren und somit den Unterschied in der Chromosomenanzahl
zwischen den beiden Species erklären. Die zusammengehörenden RH-Gruppen 19 und 20
konnten von Sarropoulou et al. über eine genetische Kopplungskarte einem einzigen
S. aurata Chromosom zugewiesen werden und stellen keine Veränderung gegenüber dem
Genom von G. aculeatus dar (80).
Ergebnisse: Komparative Kartierung von Dicentrarchus labrax mit BAC-Endsequenzen 65
3.4.6. Sequenzierung von 109 BACs durch das GS20-System
Durch die komparative Kartierung von D. labrax war es möglich BAC-Klone auszuwählen,
welche den Großteil eines Chromosoms abdecken. Um die Kombination von neuen
Sequenzierungstechniken mit der Sanger-Sequenzierung zu erproben, wurden 109 minimal
überlappende BAC-Klone ausgewählt, welche das Chromosom 21 von G. aculeatus zu mehr
als 80% abdeckten.
Die Sequenzierung durch das GS20-System analysierte insgesamt 2.559.838 Sequenzen
mit einer mittleren Leseweite von 100 b. Durch den Newbler Assembler (Roche) konnten
2.412.497 Sequenzen (94,2%) zu Contigs assembliert werden. Nach Screening auf E. coli
und pCC1BAC-Vektorkontamination konnten 2.215.241 Sequenzen (91,8% der
assemblierten Daten) verwendet werden, welche mit 7.026 Contigs 12.496.066 b abdeckten.
Die 109 BACs wurden also im Durchschnitt 17,7fach abgedeckt, wobei beachtet werden
muss, dass Überlappungen von BAC-Inserts in dieser Rechnung doppelt gewichtet werden.
Betrachtet man die 1.000 größten Contigs (7,8 Mb), so bewegte sich die Abdeckung im
Bereich von 10 - 16fach. In der Häufigkeitsverteilung zeigte sich ein zweites, kleineres
Maximum im Bereich einer Abdeckung von 20 - 30fach, dieses wurde auf Überlappung von
Klonen und somit bei der Sequenzierung stöchiometrisch doppelt vorhandene Sequenzen
zurückgeführt (siehe Abb. 34). Das größte Contig umfasste 49.711 b.
0
50
100
150
200
250
0 3,5 7 10,5 14 17,5 21 24,5 28 31,5 35 38,5 42
Sequencing Coverage
Con
tig a
bs. H
äufig
keit
Abb. 34: Unterschiede des Sequencing Coverage der 1000 größten Contigs eines Pools von 109 auf dem GS20-System sequenzierten BAC-Inserts.
Ergebnisse: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 66
3.4.7. Hybridassemblierung von Sanger- und GS20-Sequenzdaten eines D. labrax
Chromosoms
Durch die Assemblierung der GS20-Sequenzdaten mit zusätzlichen Sanger-Sequenzdaten
wurde geprüft, ob die Kombination beider Methoden eine Verbesserung der Daten-
Assemblierung erzielen konnte.
Dazu wurde von dem Pool aus 109 BACs eine pUC19-Klonbank nach der Shotgun-Methode
erstellt und davon ausgehend zusätzlich zu den GS20-Daten 21.700 Sequenzen durch die
klassische Sanger-Methode erzeugt. Außerdem konnten aus 596.539 Sequenzen eines
Whole Genome Shotgun von D. labrax 16.927 Sequenzen gefunden werden, welche auf die
GS20-Daten passten. Ebenfalls konnten 1.344 BAC-Endsequenzen von 672 beidseitig
sequenzierten BAC-Klonen dem Chromosom zugeordnet werden und wurden dem
Datensatz hinzugefügt. Die Sanger-Sequenzdaten repräsentierten somit eine ca. 2fache
Abdeckung der etwa 12,5 Mb großen chromosomalen Regionen und ermöglichten anhand
von beidseitig sequenzierten Klonen die Zuordnung von einzelnen Contigs untereinander
(scaffolding).
Die Sanger-Sequenzdaten wurden mit den bereits assemblierten Daten des GS20-Systems
durch PHRAP assembliert. Das größte Contig umfasste nun 89.000 b. Von dem
resultierenden Datensatz konnten 1.698 Contigs auf dem Chromosom 21 von G. aculeatus
angeordnet werden, welche 12.060.442 b und somit 96,5% der erwarteten 12,5 Mb
abdeckten.
3.5. Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen
3.5.1. EST-Sequenzierung
Für ein in Kooperation mit der AG Mundlos (Charité / MPI f. Mol. Genetik) durchgeführtes
EST-Sequenzierungsprojekt, zur Untersuchung der differentiellen Genexpression während
der Knochenfrakturheilung bei Schafen, wurden 32.032 Plasmide erfolgreich sequenziert.
Weitere 15.177 Sequenzen wurden durch Sequenzierung von PCR-Produkten ermittelt. Ein
Vergleich der Sequenzdaten von Plasmid- und PCR-Templates zeigte, dass in den letzteren
Daten bestimmte Gene unterrepräsentiert waren. Dies deutet auf eine Benachteiligung
bestimmter Gene bei der Amplifikation durch PCR hin, welche durch Sequenzmotive oder
durch die starken Schwankungen der Insertgrößen in cDNA-Bibliotheken verursacht werden
kann (die Erfolgsrate der PCR nimmt zu größeren Inserts hin ab). Durch Sequenzierung von
Plasmid-Templates werden solche als Amplification-Bias bekannten Effekte reduziert. Mit der
Veröffentlichung der Daten verfünffachte sich die Anzahl an frei zugänglichen ESTs für Ovis
Ergebnisse: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 67
aries und es konnten Gene identifiziert werden, die bisher nicht mit der Knochenheilung in
Verbindung gebracht wurden (64).
3.5.2. Fosmid-Endsequenzierung für die Genomanalyse von G. forsetii
Fosmid-Bibliotheken werden für das Finishing von Genomprojekten eingesetzt. Die durch
das Transfektionssystem vorgegebene enge Verteilung der Insertgrößen zwischen 35 -
45 kb erleichtert die automatisierte Kontrolle von assemblierten Whole Genome Shotgun-
Daten (WGS). Lücken zwischen einzelnen Contigs können von Fosmiden überspannt
werden und so die Anordnung (Scaffolding) von Contigs erlauben, deren Orientierung
zueinander vorher unbekannt oder unsicher war. Das anschließende Finishing einer
Genomsequenz profitiert von Fosmid Daten, indem verbleibende Lücken durch Shotgun-
Sequenzierung eines Fosmids gerichtet geschlossen werden können.
Diese Strategie wurde unter anderem für die Genomsequenzierung des Bacterioplanktons
Gramella forsetii in Kooperation mit dem MPI für Marine Mikrobiologie in Bremen
angewendet. Dieser Organismus besitzt Gene für eine Vielzahl von proteo- und glycolytisch
aktiven Enzymen und ist scheinbar auf den Abbau von hochpolymerisierten organischen
Substanzen spezialisiert. Die Hypothese, dass diese Species damit eine wichtige Aufgabe im
marinen Kohlenstoffzyklus erfüllt, konnte durch die Analyse des 3,8 Mbp Genoms unterstützt
werden (65).
3.5.3. Genomsequenzierung eines Archaebakteriums des rice-cluster-I durch
Metagenomanalyse mit Hilfe von Fosmid-Endsequenzen
Fosmid-Bibliotheken stellen ein effizientes Werkzeug für die Analyse von Metagenomen dar,
d.h. die Analyse ganzer Mikroorganismenpopulationen eines Biotops. Dabei besitzt die
Endsequenzierung von Fosmiden gegenüber Plasmid-Sequenzierung den Vorteil, dass man
später über die Fosmid-Klone auf wesentlich größere Genombruchstücke zurückgreifen
kann. So wird es möglich einzelne Genome aus der Population über ausgewählte Fosmid-
Klone zu rekonstruieren, insofern die Abdeckung des Metagenoms durch Fosmide ausreicht
und eine Unterscheidung von ähnlichen Organismen anhand der Endsequenzdaten möglich
ist. Das bereits erwähnte RC-I-Projekt ist hierfür ein gutes Beispiel. Von der DNA einer
angereicherten Mischkultur aus dem Boden italienischer Reisfelder wurde eine Fosmid-Bank
erstellt. Durch die beidseitige Sequenzierung von 11.278 Fosmiden war es möglich, 3.734
Fosmide mit hoher Wahrscheinlichkeit einem Bakteriengenom zuzuordnen. Diese Anzahl
entsprach der 40fachen Abdeckung eines durchschnittlichen Bakteriengenoms, somit war es
rein statistisch betrachtet äußerst unwahrscheinlich, dass ein Bereich des Genoms nicht
abgedeckt wurde.
Ergebnisse: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 68
Die Endsequenzierung der Fosmid-Bibliothek ermöglichte somit die Genomanalyse einer
bisher nicht in reiner Form kultivierbaren methanogenen Archaea aus dem rice-cluster-I (RC-
I). Die DNA der 3.734 identifizierten Fosmide wurde vereinigt. Aus dieser DNA wurde eine
Shotgun-Bibliothek in pUC19-Vektoren erstellt. Durch die Kombination von 41.246 Shotgun-
Sequenzen und 22.556 Fosmid-Endsequenzen konnte das 3,18 Mbp Genom 12-fach
abgedeckt werden. Die Annotation des Genoms deutet darauf hin, dass die maßgeblich an
der Produktion des Treibhausgases Methan beteiligten RC-I Archaeen Stoffwechsel-
leistungen vollbringen können, welche von anderen methanogenen Bakterien bisher nicht
bekannt waren (66).
Diskussion: Beispiele anhand der Methode erfolgreich durchgeführter Kooperationen 69
4. Diskussion
Das MPI f. Molekulare Genetik hat, neben dem FLI-Jena und dem HZI-Braunschweig
(ehemals IMB bzw. GBF), seit der Teilnahme Deutschlands am Humangenomprojekt unter
der Federführung von Prof. Dr. Hans Lehrach eine Vorreiterrolle in der deutschen
Genomforschung. Gerade im Bereich der Automatisierung für die DNA-Sequenzierung im
Hochdurchsatz wurde seit Ende der 90er Jahre unter der Leitung von Dr. Richard Reinhardt
eine Infrastruktur geschaffen, welche es erlaubte einen maßgeblichen Beitrag zu nationalen
und internationalen Projekten zu leisten (67). Auf internationaler Ebene wird die
Sequenzanalyse von großen Forschungseinrichtungen wie Sanger-Center, Baylor HGSC,
TIGR, JGI, Genoscope und RIKEN dominiert. Für Institute wie das MPI f. Molekulare Genetik
ist es deshalb von besonderer Bedeutung Verfahren zu entwickeln, welche es ermöglichen
spezielle Problemstellungen bei der Sequenzanalyse im Hochdurchsatz zu lösen, um
weiterhin in internationale Projekte eingebunden zu bleiben. Die Endsequenzierung von
Fosmiden und BACs im Hochdurchsatz stand deshalb seit Anfang des Jahres 2003 im
Fokus der Entwicklung. Gerade für die Genomanalyse von großen eukaryotischen Genomen
ist die Endsequenzierung von Fosmiden und BACs von Bedeutung für die physikalische
Genomkartierung und eine hochwertige Assemblierung von Whole Genome Shotgun Daten.
Durch den Einsatz von drei ABI3730xl Sequenzierern am MPI für Molekulare Genetik im
Jahr 2003 war es außerdem nötig, neue Methoden für die Template-Präparation zu
etablieren, um den höheren Probendurchsatz dieser Geräte ausnutzen zu können.
Zusätzlich zur Produktion von Templates mittels PCR wurde versucht die Rolling Circle
Amplifikation (RCA) zu etablieren. Die Sequenzierungsergebnisse der RCA-Produkte waren
allerdings in den angestrebten niedrigen Reaktionsvolumen schwer reproduzierbar. Auf der
Suche nach einem geeigneten Aufreinigungsprotokoll für die RCA-Produkte wurde neben
der am MPI etablierten Aufreinigung mit magnetischen Partikeln eine auf PEG / NaCl-Fällung
basierende Methode untersucht.
Diese Methode lieferte wesentlich bessere Ausbeuten als die Aufreinigung mit Hilfe
magnetischer Partikel. Die Aufreinigung mit PEG / NaCl ermöglichte eine Messung der RCA-
Produktkonzentration und die Sequenzierung von RC-amplifizierten BACs und Fosmiden,
was ohne Aufreinigung nicht möglich war. Dennoch war die Reproduzierbarkeit der RC-
Amplifikationen weiterhin unbefriedigend (19).
Es zeigte sich, dass einfache DNA-Präparationen durch alkalische Lyse und 2-Propanol
Fällung von BACs, Fosmiden und Plasmiden, welche mit der PEG / NaCl-Methode
aufgereinigt wurden, bei geringeren Herstellungskosten besser sequenzierbar waren als
RCA-Produkte.
Diskussion: Phasendiagramme der PEG-Präzipitation 70
Die Automatisierung der PEG / NaCl basierten Methode im 96er und im 384er MTP-Format
wird im Folgenden in 4.2 diskutiert. Durch Experimente mit den Fällungsparametern
PEG / Salz, welche zuvor in 4.1 diskutiert werden, konnte diese Methode erheblich
verbessert werden und führte zu dem in Abb. 25 dargestellten Verfahren. Anpassung für die
Sanger-Sequenzierung verschiedener Vektorsysteme und ihre Eigenheiten werden in 4.3
betrachtet. Die komparative Genomkartierung des Wolfsbarschs (Dicentrarchus labrax)
mittels BAC-Endsequenzierung wurde durch das entwickelte Verfahren am MPI für
Molekulare Genetik durchführbar und wird in 4.4 diskutiert.
4.1. Phasendiagramme der PEG-Präzipitation
Die bisherigen Veröffentlichungen zur PEG-Präzipitation von DNA werten den Einfluss der
Salz-Konzentrationen auf die PEG-Fällung kaum. Zum Beispiel erwähnen Lis et al. nur
nebensächlich, dass beim PEG / NaCl-System die Präzipitation von DNA erst über 0,2 M
NaCl möglich wird (32). Die Größenselektion von DNA wird in der Literatur meist bei
konstanten Salzkonzentrationen und nur durch das Variieren der PEG-Konzentration erzielt.
Durch diese Vereinfachung wird zwar das Arbeiten mit der PEG-Präzipitationsmethode leicht
verständlich, gleichzeitig verliert man allerdings einen Freiheitsgrad bei der Komposition der
Fällungsansätze. Dies kann gerade bei der Automatisierung zu Problemen führen, weil hohe
Salzgehalte unnötige Waschschritte mit sich bringen bzw. hohe Viskosität und Dichte zu
Durchmischungsproblemen führen. Ein genaueres Verständnis der PEG / Salz-Systeme wird
erst durch Phasendiagramme möglich, welche die Löslichkeit von verschiedenen DNA-
Fragmentgrößen in Abhängigkeit von PEG- und Salz-Konzentration darstellen.
4.1.1. Das PEG / NaCl-System
Die unter 3.1 dargestellten Präzipitationsversuche lassen sich in Phasendiagrammen wie in
Abb. 35 (umseitig) zusammenfassen. Das PEG / NaCl System verhält sich wie von Lis et al.
beschrieben, es werden jedoch auch bisher unbeschriebene Eigenschaften deutlich (32). Bei
Konzentrationen im Bereich von 0,15 - 0,2 M NaCl ist immer noch eine Fällung möglich. Die
Trennschärfe leidet allerdings unter den geringen NaCl-Konzentrationen und wird
maßgeblich durch geringe Unterschiede in der Salzkonzentration beeinflusst. Die PEG-
Konzentration spielt in diesem Bereich eine untergeordnete Rolle.
Bei hohen Salzkonzentrationen > 1 M erreicht die Methode ihre maximale Trennschärfe, was
durch den vergrößerten Abstand der Präzipitationslinien deutlich wird. Hier verhält sich das
System umgekehrt und die Größenselektivität wird maßgeblich durch die PEG-Konzentration
beeinflusst.
Diskussion: Phasendiagramme der PEG-Präzipitation 71
0,15
0,25
0,35
0,45
0,55
0,65
0,75
0,85
0,95
3,5 5,5 7,5 9,5 11,5
PEG % (w/v)
NaC
l [M
]
700 bp calc1300 bp calc2000 bp calc4500 bp calc8000 bp calc17000 bp calc17000 bp8000 bp4500 bp2000 bp1300 bp700 bp
Abb. 35: PEG / NaCl-Phasendiagramm für die Löslichkeit von DNA unterschied-
licher Fragmentgrößen. Die Linien beschreiben mögliche Kombinationen von NaCl und PEG-Konzentrationen bei der eine bestimmte DNA-Größenfraktion unlöslich wird.
Wie in allen PEG / Salz-Systemen verringert sich die Trennschärfe mit zunehmender
Fragmentgröße, wobei im Bereich bis etwa 4000 bp Fragmentgrößen voneinander getrennt
werden können, welche sich in ihrer Größe um den Faktor 2 unterscheiden. Bei Fragmenten
>8000 bp wird eine Trennung immer schwieriger und ist mit großen Ausbeuteverlusten
verbunden.
4.1.2. Das PEG / MgCl2-System
Die Fällung mit PEG / MgCl2 wurde erstmals von Nicoletti et al. beschrieben, es wurden
jedoch auch hier keine Angaben zu den Einflussgrößen PEG / Salz-Konzentration ge-
macht (35). Das Phasendiagramm zeigt auf den ersten Blick ein ähnliches Verhalten wie das
PEG / NaCl-System.
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
1 3 5 7 9
PEG % (w/v)
MgC
l 2 [M
]
700 bp calc1300 bp calc2000 bp calc4500 bp calc8000 bp calc17000 bp calc17000 bp8000 bp4500 bp2000 bp1300 bp700 bp400 bp400 bp calc
Abb. 36: PEG / MgCl2-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher Fragmentgrößen. Die Linien beschreiben mögliche Kombinationen von MgCl2 und PEG-Konzentrationen bei der eine bestimmte DNA-Größenfraktion unlöslich wird.
Diskussion: Phasendiagramme der PEG-Präzipitation 72
Es ist jedoch auffällig, dass die Fällung schon bei wesentlich geringeren Ionenstärken erfolgt.
Außerdem scheint die Trennschärfe der Methode insbesondere bei Fragmentgrößen über
8 kb geringer zu sein als die der PEG / NaCl-Methode, zumindest konnte in den
Versuchsreihen seltener eine eindeutige Trennung erzielt werden. Beide Effekte sind
wahrscheinlich dadurch erklärbar, dass die zweifach geladenen Mg2+-Ionen stärker mit den
negativ geladenen Phosphatgruppen von verschiedenen DNA-Fragmenten wechselwirken
können als einfach geladene Na+-Ionen. Dadurch können schon geringere Konzentrationen
eine Fällung erzielen, allerdings leidet die Trennschärfe, weil unterschiedliche
Fragmentgrößen durch Mg2+-Ionen scheinbar zusammengehalten werden.
Ein Nachteil dieser Fällungsvariante ist, dass MgCl2 sich negativ auf nachfolgende
enzymatische Reaktionen auswirken kann. Die Verwendung von PEG / MgCl2 sollte aber in
Betracht gezogen werden, wenn es um die Entsalzung, Konzentration und Entfernung von
markierten ddNTPs nach der Sanger-Sequenzierungsreaktion geht, da im Anschluss keine
enzymatischen Reaktionen stattfinden und diese Methode wesentlich geringere Ionenstärken
verwendet und selektiver ist als die normalerweise verwendete Ethanol-Fällung in
Anwesenheit von NaAcetat-Puffer.
4.1.3. Das PEG / KAcetat-System
Bei der Verwendung der alkalischen Lyse für den Zellaufschluss werden große Mengen
Kalium Acetat-Puffer zur Neutralisation des hohen pH-Wertes eingesetzt (28). Es ist also
möglich auf den Zusatz anderer Salze zu verzichten und die Fällung durch alleinige Zugabe
von PEG-Lösung zu erzielen. Das Vermeiden von zusätzlichen Salzen im Fällungsansatz
kann dabei helfen, nachfolgende Waschschritte mit Ethanol zu vermeiden und die Plasmid-
Aufreinigung stark beschleunigen.
0,15
0,25
0,35
0,45
0,55
0,65
0,75
0,85
0,95
4 6 8 10 12 14 16
PEG % (w/v)
KA
ceta
t [M
]
17000 bp8000 bp4500 bp2000 bp1300 bp700 bp17000 calc8000 calc4500 calc2000 calc1300 calc700 calc
Abb. 37: PEG / Kaliumacetat-Phasendiagramm für die Löslichkeit von DNA unterschiedlicher Fragmentgrößen. Die Linien beschreiben mögliche Kombinationen von Kaliumacetat und PEG-Konzentrationen bei der eine bestimmte DNA-Größenfraktion unlöslich wird.
Diskussion: Phasendiagramme der PEG-Präzipitation 73
Ein Problem aller PEG-Methoden sind zunehmende Ausbeuteverluste bei niedrigen DNA-
Konzentrationen von unter 10 ng/µl im Fällungsansatz (36, 68). Gerade für die direkte
Plasmid-Aufreinigung aus dem geklärten Zelllysat ist es deshalb wichtig, dass die
Reagenzien, welche für die alkalische Lyse eingesetzt werden, in kleinen Volumen
verwendet werden. Ebenso muss das zugegebene Volumen an PEG reduziert werden, um
eine zu starke Verdünnung zu vermeiden. Dies hat zur Folge, dass stark konzentrierte PEG-
Lösungen pipettiert werden müssen, was sich negativ auf die Automatisierbarkeit der
Methode auswirkt, da es wegen hoher Viskosität zu Durchmischungs- und Pipettier-
problemen kommt.
Wie in 3.1.3 gezeigt wurde, können diese Probleme durch Zugabe von 2-Propanol zur
Fällung mit PEG / KAcetat aufgehoben werden. Durch Zusatz von 2-Propanol kann die
Fällung bei niedrigeren PEG-Konzentrationen durchgeführt werden, so dass Volumen,
Dichte, Viskosität und Oberflächenspannung reduziert werden. Dies hat zur Folge, dass eine
Fällung mit hoher Ausbeute direkt aus dem geklärten Zelllysat möglich wird und der
Fällungsüberstand durch Abzentrifugieren effizient entfernt werden kann. Die am DNA-Pellet
haftenden PEG und Salzreste verringern sich dabei soweit, dass weitere Waschschritte nicht
mehr benötigt werden. Die Messung der DNA-Konzentration kann dann kostengünstig mit
UV-Photometrie bewerkstelligt werden.
4.1.4. Fällungsparameter für die Plasmid-Präparation
Die Fällungsbedingungen für Plasmid-Präparationen können durchaus von den in 4.1.1,
4.1.2 und 4.1.3 dargestellten Diagrammen abweichen, welche mit bereits aufgereinigter DNA
erstellt wurden. Anzuchtmedium, Zelldichte und damit einhergehende Schwankungen der
Ionenstärke haben einen Einfluss auf die Parameter der Fällung, so dass diese angepasst
werden müssen.
Ein einfacher Weg diese Anpassung vorzunehmen ist es, die Plasmide durch alkalische Lyse
mit und ohne RNAse zu isolieren und dann verschiedene Konzentrationen von 2-Propanol
und PEG für die Fällung zu testen. Die optimalen Bedingungen sind gegeben, wenn die UV-
photometrischen Messwerte von RNAse behandelten Zellen denen gleichen, welche nicht
mit RNAse behandelt wurden. Ist dies der Fall, sind selektive Bedingungen erzielt worden,
welche Plasmid-DNA auch von größeren RNAs trennen. Die Messung des Proteingehalts
ergänzt diese Vorgehensweise und sollte ebenfalls eine effektive Trennung aufzeigen.
Durch diese Vorgehensweise konnten Bedingungen ermittelt werden, welche Plasmid-DNA
aus 40 µl geklärten Zelllysat selektiv ausfällt. Dazu wurde das 0,475fache Volumen (19 µl)
eines 10% PEG-6000 / 75% 2-Propanol-Gemisches benötigt. Die Fällung erfolgte also in
Gegenwart von etwa 3,2% PEG-6000, 24,2% 2-Propanol und 210 mM KAcetat, welches aus
der alkalischen Lyse stammt.
Diskussion: Phasendiagramme der PEG-Präzipitation 74
Im Vergleich zu bekannten Methoden konnten Salz- und PEG-Konzentrationen 2 - 3fach
reduziert werden, wodurch die Sequenzierung der ausgefällten DNA ohne weitere Wasch-
schritte möglich wurde (32, 35, 36). Die Durchmischung in Mikrotiterplatten durch einfache
Magnetschüttler wird durch die geringere Viskosität der Proben begünstigt. Des Weiteren ist
das PEG / 2-Propanol-Gemisch leichter als das Lysat, so dass es in den Kavitäten der
Mikrotiterplatten zuoberst auf der Flüssigkeitssäule sitzt, wo die Durchmischung turbulenter
erfolgt.
4.1.5. Fällungsparameter für die PCR-Produkt Aufreinigung
Die Aufreinigung von PCR-Produkten unterscheidet sich von der Plasmid-Aufreinigung vor
allem in der Größenordnung der Produkte. Während selbst kleine Plasmide aufgrund des
Vektoranteils eine Mindestgröße von > 2 kb aufweisen, können PCR-Produkte wesentlich
kleiner sein (kleine Produkte typischerweise 200 - 400 bp). Die Fällungsparameter müssen
also in Richtung kleinerer DNA-Fragmente verschoben werden. Dabei ist es wichtig, dass die
Trennung von PCR-Produkt und Primerresten erhalten bleibt. Die Fällung kleiner PCR-
Produkte in PEG / NaCl kann erst bei relativ hohen PEG- und Salz-Konzentrationen erfol-
gen (36). Die dadurch entstehenden Nachteile können wiederum durch die Verwendung von
PEG / KAcetat / 2-Propanol umgangen werden. In Anlehnung an die unter 4.1.4 genannten
Bedingungen können kleine PCR-Produkte (100 - 200 bp) von Primerresten in einem
Fällungsansatz mit 4,75% PEG-6000, 199 mM KAcetat und 35,5% 2-Propanol getrennt
werden.
4.1.6. Weitere Anwendungsmöglichkeiten der größenselektiven Präzipitation
Neben der Aufbereitung von DNA-Templates für die Sanger-Sequenzierung kann die
größenselektive Fällung auch für andere molekularbiologische Arbeiten eingesetzt werden.
Die Erstellung von DNA-Banken beinhaltet meist eine Größenselektion der zu klonierenden
DNA. Diese erfolgt durch Ausschneiden bestimmter Größenbereiche aus Agarosegelen,
oder durch chromatographische Säulen (69, 70). Diese Vorgehensweisen führen meist zu
stark verdünnten Proben, welche anschließend durch weitere Aufarbeitungsschritte
aufgereinigt und konzentriert werden müssen.
Durch Fällung in PEG / NaCl / 2-Propanol können diese Methoden ersetzt werden, wodurch
die parallele Bearbeitung einer größeren Menge DNAs möglich wird und die DNA direkt in
konzentrierter Form gewonnen werden kann. Experimente zeigten, dass diese Methode
auch auf Silica-Spin-Columns (Quiagen) durchgeführt werden kann (Ergebnisse n.
dargestellt), wobei die DNA nicht durch längere Zentrifugation pelletiert wird, sondern an die
Silicamembran gebunden wird, was die Bearbeitungszeit weiter verkürzt und die
Diskussion: Automatisierung durch Robotik 75
Handhabung auch für Ungeübte vereinfacht. Auch eine am MPI f. Molekulare Genetik von
Rauth et al. entwickelte und auf magnetischen Partikeln basierende Technologie (71) kann
prinzipiell als Träger für größenselektiv präzipitierte DNA dienen.
4.2. Automatisierung durch Robotik
Nach ersten erfolgreichen Sequenzierungen von PEG / NaCl gereinigter Fosmid- und BAC-
DNA wurde anfangs ein kleineres Robotersystem zur automatischen Template-DNA
Präparation aus 96 Well Platten verwendet (siehe 3.2.1). Dabei wurde die Plasmid-Isolation
zunächst mit alkalischer Lyse und 2-Propanolfällung bewerkstelligt, danach erfolgte ein
Aufreinigungsschritt mit PEG / NaCl. Die Trennung der Schritte Zellaufschluss / Kon-
zentration von der DNA-Aufreinigung musste erfolgen, weil die in 4.1 dargestellten
Zusammenhänge noch nicht bekannt waren. Diese Vorgehensweise wurde später auf das
384er MTP übertragen und schließlich durch die Anpassung der Fällungsparameter stark
vereinfacht, was den Ablauf entsprechend beschleunigte.
Im Folgenden werden Eigenschaften der Plasmid-Aufreinigung in PEG / Salz-Systemen
diskutiert, welche die Automatisierung erschwerten.
4.2.1. Das 96er MTP-Format
Die Automatisierung von zuvor im Labormaßstab manuell durchgeführten Methoden wird
meist durch Arbeitschritte behindert, die nur schlecht oder gar nicht durch Robotik ersetzt
werden können. So musste zum Beispiel das Resuspendieren der Zellpellets aus dem
automatisierten Ablauf herausgenommen werden. Scheinbar bildeten die in den Pellets sehr
dicht gepackten E. coli-Zellen Stoffe, welche sich nach der anschließenden Lyse durch
Bildung von Schleim negativ auswirken können. Dies führte zu vermehrten Ausfällen durch
verstopfende Spitzen. Deshalb war es notwendig, die Zellen direkt nach der Zentrifugation in
S1-Puffer zu resuspendieren, was von der Anlage nicht zuverlässig bewerkstelligt werden
konnte und manuell durchgeführt werden musste.
Die Bildung unlöslicher Substanzen an der Oberfläche des geklärten Zelllysats konnte
außerdem maßgeblich durch die Dichte des Lyseansatzes beeinflusst werden. Lag diese
über der Dichte der ausgefällten Substanzen, so setzten sich die Präzipitate nach der
Zentrifugation an der Flüssigkeitsoberfläche ab (Auftrieb). Die hohe Dichte des geklärten
Lysats war zum Großteil auf den Neutralisationspuffer (normalerweise 2,8 M – 3 M
Kaliumacetat) zurückzuführen. Wurde dieser Puffer auf ein Drittel verdünnt, reichte die
Pufferkapazität immer noch aus, um eine Neutralisation des Ansatzes zu gewährleisten, man
erzielte aber den Vorteil, dass sich weniger Präzipitat an der Flüssigkeitsoberfläche absetzte
und das ansonsten notwendige Filtrieren des Lysats vermieden werden konnte.
Diskussion: Automatisierung durch Robotik 76
Die Automatisierung des PEG / NaCl Aufreinigungsschritts wurde hauptsächlich durch
Durchmischungsprobleme beeinträchtigt. Nach der alkalischen Lyse wurden die durch
2-Propanolfällung aufkonzentrierten Proben von vier 96er MTPs in einer 384er MTP
gesammelt und durch Zugabe des einfachen Probenvolumens PEG 20% in 2,5 M NaCl
gefällt. Allerdings konnte die Durchmischung der viskosen und schweren PEG / NaCl-Lösung
mit der Plasmid-DNA auf keinem der verfügbaren Schüttler bewerkstelligt werden. Eine
einfache Lösung nutzte genau die Eigenschaften des PEG / NaCl-Gemisches, welche die
Durchmischung behinderte. Stellte man die Platte auf den Kopf, so floss in Folge der
Schwerkraft die PEG / NaCl - Phase nach unten, wobei eine langsame Durchmischung mit
der Plasmid-DNA erfolgte. Die Oberflächenspannung hielt die Lösung in den kleinen
Kavitäten fest. Nach mehrmaligem Umdrehen der offenen MTP durch den Roboterarm
konnte die Durchmischung dann auf einem Schüttler erzielt werden (siehe Abb. 38).
Ein weiteres Problem des PEG / NaCl-Aufreinigungsschrittes war die geringe Festigkeit des
DNA-Pellets. Wie in (19) gezeigt wurde, konnte der Überstand nicht einfach durch
Zentrifugation der umgedrehten Platte entfernt werden, da die Gefahr bestand, das Pellet zu
verlieren. Der Überstand musste deshalb abpipettiert und verbleibende PEG / NaCl-Reste
mit drei Ethanol-Waschschritten zeitaufwendig entfernt werden.
Abb. 38: Durchmischung von hochkonzentrierter PEG / NaCl-Lösung mit Plasmid-DNA durch Ein-wirkung der Schwerkraft.
4.2.2. Das 384er MTP-Format
Im Vergleich zum 96er MTP-Format konnte der Ablauf für die alkalische Lyse erheblich
beschleunigt werden, da jeweils zwei 384er MTPs als Stapel zentrifugiert wurden. Die
Anzahl bearbeiteter Proben pro Zentrifugationslauf verachtfachte sich so von 384 auf 3072.
Eine weitere Durchsatzsteigerung gegenüber dem 96er MTP-Format wurde durch Parallel-
isierung von Arbeitsschritten erzielt. Der verwendete Biomek NX war in der Lage, eigen-
ständig MTPs zu stapeln und konnte bis zu 16 MTPs unabhängig vom Roboterarm der
Anlage bearbeiten. Dadurch konnten Arbeitsschritte, wie die alkalische Lyse der Zellen,
2750
x g
Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 77
parallel zu Aufgaben, wie z.B. Be- und Entladen der Zentrifugen, erfolgen. Die
Zentrifugationszeiten wurden nicht mehr festgesetzt, sondern nach einer Mindestdauer an
die Zeit angepasst, die der Biomek NX benötigte, um die nächsten Platten bereitzustellen.
Durch diese Verbesserungen des Ablaufs wurden alle Kulturplatten schon relativ früh der
alkalischen Lyse unterzogen. Lange Standzeiten der Zellen in S1-Puffer, wie beim Ablauf für
96er MTPs, wurden vermieden, was sich positiv auf die Qualität der geklärten Zelllysate
auswirkte (Schleimbildung etc.). Die PEG / NaCl-Aufreinigung erfolgte nach dem bekannten
Schema, limitierte allerdings nun aufgrund der vielen Waschschritte den Probendurchsatz
des Verfahrens.
Der Probendurchsatz der Anlage war mit 12.288 Templates / d zunächst ausreichend, um
drei ABI3730xl-Sequenzierer auszulasten. Allerdings konnte der Sequenzierungsdurchsatz
auf diesen Geräten durch Verwendung schneller Elektrophorese-Protokolle ebenfalls
verbessert werden, so dass eine weitere Steigerung des Probendurchsatzes bei der
Template-Präparation notwendig war. Durch Implementation der direkten Template-
Aufreinigung aus dem Zelllysat, durch größenselektive Präzipitation in PEG / KAcetat / 2-
Propanol, konnte der Probendurchsatz weiter gesteigert werden.
Im Vergleich zu dem in Abb. 24 dargestellten Ablauf wird deutlich, dass die komplette
PEG / NaCl-Aufreinigung, welche zuvor etwa 50% der Zeit beanspruchte, eingespart wurde.
Die Zeit für die Bearbeitung von 16 x 384 Plasmiden verkürzte sich somit auf 6 - 7 h und es
wurden höhere Plasmid-DNA Ausbeuten erzielt, da keine Waschschritte mehr benötigt
wurden, die zu Ausbeuteverlusten führten. Die Qualität der DNA-Präparationen verbesserte
sich gegenüber der PEG / NaCl-Methode, weil die Parameter der PEG / 2-Propanol-Fällung
besser an die Problematik der Plasmid-Isolation angepasst wurden (optimierte Trennung von
RNA + Protein). Dies hatte den Vorteil, dass UV-photometrische Messungen zur
Qualitätskontrolle eingesetzt werden konnten. Eine Methode, die im Gegensatz zur zuvor
verwendeten Agarose-Gelelektrophorese mit hohem Probendurchsatz arbeitet und auto-
matisiert werden kann.
Die entwickelte Anlage produziert mittlerweile mehr als 80% der Template-DNA für die am
MPI f. Molekulare Genetik durchgeführten Sanger-Sequenzierungen. Seit Etablierung der
Methode wurden mehrere Millionen Plasmide für verschiedenste Sequenzierungsprojekte
aufgereinigt, wobei die Kosten bei unter 1 Cent pro Probe lagen. Eigenschaften der
unterschiedlichen Vektorsysteme und Anpassungen werden im Folgenden diskutiert.
4.3. Sequenzierung unter Verwendung von unterschiedlichen Vektortypen
Typische Prozessierungszeiten und DNA-Ausbeuten des in entwickelten Verfahrens für ver-
schiedene Vektorsysteme sind umseitig in Tab. 21 zusammengefasst.
Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 78
Tab. 21: Typische Ausbeuten und Leseweiten bei unterschiedlichen Vektorkonstrukten.
Vektor Prozesszeit (32 MTPs)
Ausbeute pro Klon (200 µl Kultur)
Anzahl möglicher Sequenzierungen
typische Leseweiten
(Q20 ABI3730xl)
plasmid (pUC ORI) 8h 400 - 800 ng ~ 20 750-850 b
plasmid (pBR ORI) 8h 200 - 400 ng ~ 10 700- 800 b
Cosmid 8h 300 - 600 ng ~ 6 650 - 750 b
Fosmid (copy control) 8h 300 - 600 ng ~ 6 650 - 750 b
Fosmid (low copy) 16h 60 - 120 ng 2 600 - 750 b
BAC (low copy) 16h 200 - 400 ng 2 600 - 750 b
Die DNA-Aufreinigung durch PEG / 2-Propanol / KAcetat ermöglichte es, eine Vielzahl von in
Sequenzierungsprojekten verwendeten Vektortypen zu sequenzieren. Die geringen
Ausbeuten von low-copy Vektoren wie Fosmiden oder BACs und Insertgrößen von 40 kb
bzw. 160 kb erschwerten allerdings die Sequenzierung. Erst durch die Optimierung von
Kulturbedingungen, Cycle-Sequencing und Probeninjektion auf den CGE-Sequenzierern
wurden hier Leseweiten erzielt, die vergleichbar mit der Sequenzierung von high-copy
Vektoren wie pUC19 waren.
4.3.1. Plasmid-Sequenzierung
Die Sequenzierung von kleinen high-copy Vektoren machen den Großteil der am MPI
sequenzierten Projekte aus. Dazu zählen auf pUC19-Plasmiden basierende Shotgun-
Sequenzierung von genomischer, Fosmid- und BAC-DNA oder EST-Sequenzierungen von
cDNA-Banken basierend auf Vektoren wie z.B. pDONR oder pAL32.
Wegen der hohen Kopienzahl pro Zelle lieferte der Aufreinigungsprozess dieser Plasmid-
Typen gute Ausbeuten, welche bis zu 20 Sequenzierungen pro Template erlaubten
(20 ng / Sequenzierung). Die Qualitätskontrolle durch UV-Photometrie funktionierte
zuverlässig, da der DNA-Anteil gegenüber gemessenem Hintergrund hoch war. Die
Sequenzierung von Plasmiden lieferte je nach Qualität der DNA-Bank 80 - 95% erfolgreiche
Sequenzierungen mit langen bis mittleren Leseweiten. Zu Problemen konnte es kommen,
wenn die Klone einer DNA-Bank ungleichmäßiges Wachstum aufwiesen, oder das
Wachstum aller Klone zu schwach war, um ausreichende Zelldichten zu liefern. Diese
Probleme wurden hauptsächlich bei Vektoren mit Kanamycin-Resistenz beobachtet und
konnten durch Vorkultur oder Inokulation mit größeren Volumina reduziert werden. Vektoren
mit Ampicillin- oder Chloramphenicol-Resistenz sollte daher der Vorzug bei der Konstruktion
von DNA-Banken gegeben werden.
Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 79
4.3.2. Fosmid-Endsequenzierung
Die Sanger-Sequenzierung von Fosmid-DNA-Templates ist im Allgemeinen schwieriger als
die von Plasmid-DNA. Einerseits sind Fosmide um den Faktor 6 – 10mal größer als
Plasmide. Andererseits liegen sie mit etwa 100 – 200fach niedrigerer Kopienzahl pro Zelle
vor (72). Daraus folgt, dass die DNA-Isolation und Aufreinigung von Fosmiden nur etwa
1/30 - 1/10 der Ausbeuten liefert, wie man sie bei Plasmiden erwartet. Gleichzeitig wird für
die Sequenzierung größerer Konstrukte entsprechend mehr DNA-Template benötigt.
Extrapoliert man die optimalen Werte für die Sequenzierung von Plasmid-DNA von etwa
20 ng pro Sequenzierung, so würde man etwa 200 ng DNA pro Fosmid-Endsequenzierung
benötigen, eine Fosmid-DNA-Menge, welche nicht aus 200 µl Kultur gewonnen werden
kann. Diese Problematik kann durch Anpassung von weiteren Parametern während des
Sequenzierungsablaufes verbessert werden.
Durch die Verdopplung der Menge an Sequenzierungsreagenzien bei gleichzeitiger
Verdopplung der Zyklenanzahl des Cycle-Sequencing konnte die theoretisch benötigte
Template-Menge halbiert werden, da mehr terminal markierte Sequenzierprodukte
entstanden. Die Beladung dieser Produkte auf CGE-Sequenzierer erfolgt durch
elektrokinetische Injektion. Hier konnte die Injektionszeit beeinflusst werden. Die Erhöhung
der Injektionszeit von 10 s (Plasmid-Sequenzierung) auf 20 s halbierte die benötigte
Template-Menge ein weiteres Mal, so dass eine Menge von 30 - 50 ng Fosmid-DNA für die
Sequenzierung ausreichte. Trotz dieser Anpassungen mussten Fosmide auf unserem
System in doppelter Ausführung bearbeitet werden, um genügend Template für das
Sequenzieren von beiden Seiten zu generieren. Deshalb reduzierte sich, wie in Tab. 21
dargestellt, der Probendurchsatz auf die Hälfte. Ein weiterer Nachteil war, dass wegen der
geringen Ausbeuten die UV-Messung bei low-copy Vektoren nicht mehr aussagekräftig war.
Die gemessenen Absorptionen stellten hauptsächlich den Hintergrund aus RNA und
Proteinresten dar.
Diese Nachteile konnten durch „Copy Control“ Fosmid-Vektoren, wie z.B. pCC1fos
aufgehoben werden (73). Neben dem Replikationsursprung des F-Plasmids beherbergt
dieser Vektor einen high-copy Replikationsursprung des RK2-Plasmids (38). Die Replikation
mit hoher Kopienzahl kann indirekt durch das Arabinose-Operon eng reguliert werden. Durch
den Zusatz von L-Arabinose in das Nährmedium wird die high-copy Replikation induziert.
Durch D-Glucose kann sie unterdrückt werden (Katabolitrepression).
Dies vereint die Vorteile von Fosmiden bei der Klonierung und Wartung der Library
(Strukturstabilität der Inserts durch Verringerung der Rekombinationswahrscheinlichkeit) mit
den Vorteilen von high-copy Vektoren (einfachere Isolation von großen DNA-Mengen,
verringerter Anteil an genomischer DNA). Tab. 21 zeigt, dass die Ausbeute an Fosmid-DNA
Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 80
auf unserem System durch Verwendung der pCC1-Fosmide 10 - 20fach gesteigert werden
konnte. Der Probendurchsatz von Fosmid-Templates stand so dem von Plasmiden in nichts
mehr nach.
4.3.3. BAC-Endsequenzierung
Im Gegensatz zu Fosmiden ist bei BAC-Vektoren die Insertgröße nicht durch ein
Transfektionssystem (bei Fosmiden der Phagenpartikel) beschränkt (37). Dies hat den
Vorteil, dass mit BAC-Bibliotheken sehr große durchschnittliche Insertgrößen von 120 –
300 kb möglich sind. Die Replikation der BAC-Vektoren erfolgt ebenso wie bei Fosmiden
durch den OriF des F-Plasmids. Die resultierende niedrige Kopienzahl von 1 – 2 pro Zelle
erschwert die Produktion von ausreichenden Template-Mengen für die Sequenzierung. Zwar
liegen die DNA-Ausbeuten bei gleicher Zelldichte entsprechend der Größe von BACs 3 -
5fach über der von Fosmiden, es wird allerdings auch entsprechend mehr DNA für eine
Sequenzierung benötigt (600 – 1000 ng pro Sequenzierung). Ebenso wie in 4.3.2
beschrieben war es möglich die benötigte Menge an DNA zu reduzieren, indem andere Se-
quenzierungsparameter (2fache Zyklenanzahl und Sequenzierungsreagenzien,
elektrokinetische Injektion 30 s) an BAC-Templates angepasst wurden. Die Steigerung der
BAC-DNA Ausbeute durch BAC-Vektoren, welche analog zu pCC1Fos-Vektoren mit einem
high-copy Replikationsursprung (pCC1BAC) ausgestattet sind, erwies sich als nicht
empfehlenswert. Der Grund hierfür ist, dass die Schwankungsbreite von Insertgrößen in
BAC-Bibliotheken wesentlich größer als bei Fosmid-Bibliotheken ist. Je nach Qualität der
Bibliothek gibt es z.B. bis zu 10% Klone, welche kein Insert tragen und lediglich eine Größe
von ca. 8 kb aufweisen. Die Kopienanzahl nach Induktion des high-copy Mechanismus wird
durch die maximale DNA-Syntheseleistung der Zelle limitiert, so dass kleine BACs bis zu
100fach, große BACs aber nur 2 - 3fach amplifiziert werden. Die resultierenden starken
Schwankungen der Template-Mengen führten bei der Sequenzanalyse zu Problemen durch
Überstrahlungseffekte zwischen verschiedenen Proben. Wegen der zuvor genannten
Gründe, halbierte sich der Probendurchsatz für BAC-Templates (siehe Tab. 21), da aus-
reichende Template-Mengen erst durch den Ansatz von zwei Präparationen gewährleistet
werden konnten.
Eine weitere Anpassung des Aufreinigungsprotokolls an BAC-DNA war ein kurzer
Waschschritt mit 70%-Ethanol, welcher aus Zeitgründen manuell durchgeführt wurde. Dieser
sollte verhindern, dass aufgrund der höheren Template-Volumina eingetragene Salze im
Sequenzierungsansatz die Sequenzierungsreaktion inhibieren. Trotz dieses zusätzlichen
Waschschritts ließ die Qualitätskontrolle von BAC-DNA durch UV-Photometrie, wie auch bei
Diskussion: Sequenzierung unter Verwendung von unterschiedlichen Vektortypen 81
low-copy Fosmiden, keine Rückschlüsse auf die genaue BAC-DNA-Konzentration zu, reichte
aber aus, um erfolgreiche von misslungenen BAC-Präparationen zu unterscheiden.
Die beidseitige Sequenzierung der BAC-Bibliothek des Wolfsbarschs (Dicentrarchus
labrax, (74)) zeigte, dass das entwickelte Verfahren die normalerweise an das 96er MTP-
Format gebundene BAC-DNA Aufreinigung im 384er MTP-Format erfolgreich bewältigen
konnte. Der Vergleich mit der Endsequenzierung von Templates einer BAC-Bibliothek von
Bos taurus (Rind), welche im 96er MTP-Format aufgereinigt wurden, zeigte, dass unsere
Aufreinigungsmethode ca. 10% mehr erfolgreiche Sequenzierungen erzielte, wobei im
Durchschnitt um 31,7% höhere Leseweiten erzielt wurden (46).
Überblick über die Endsequenzierungsergebnisse der D. labrax BAC-Bibliothek
13164
44832
einseitig sequenzierte BAC-Inserts (22,7%) beidseitig sequenzierte BAC-Inserts (77,3%)
Abb. 39: Anzahl einseitig und beidseitig sequenzierter BAC-Klone.
Für die weitere Auswertung des Datensatzes wurden zunächst die ansequenzierten Klone
mit Insert betrachtet. Aus Abb. 39 wird ersichtlich, dass die Mehrheit der Klone beidseitig
sequenziert werden konnte. Die von Whitaker et al. beschriebene durchschnittliche
Insertgröße der verwendeten BAC-Library beträgt ca. 160 kb (74). Die Genomgröße von
D. labrax wurde von Peruzzi et al. auf 763 Mb geschätzt (75). Das Genom wurde durch
beidseitig sequenzierte BAC-Klone also ca. 9,4fach abgedeckt. Die nur von einer Seite
ansequenzierten BAC-Klone deckten das Genom ca. 2,7fach ab. In 4.4 dargestellte
Vergleiche weisen darauf hin, dass die wirkliche Genomgröße von D. labrax unter dem von
Peruzzi et al. veröffentlichen Wert liegt. Daraus würde resultieren, dass die physikalische
Abdeckung des Genoms mit sequenzierten BAC-Klonen sogar noch höher ist.
Die hohe physikalische Genomabdeckung durch BAC-Klone reicht theoretisch aus, um damit
eine Genomkartierung zu ermöglichen. Allerdings ist die Wahrscheinlichkeit überlappende
BAC-Klone anhand der Endsequenzen zu finden sehr gering. Lediglich die Enden der Klone
sind bekannt, so dass die Sequenzdaten insgesamt weniger als das 0,1fache (69,7 Mb) der
Genomsequenz abdecken. Die Wahrscheinlichkeit, dass zwei Endsequenzen überlappen
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 82
beträgt also nur ca. 0,12 => 1% und reicht nicht aus, um genügend BAC-Klone aneinander
anzuordnen.
Eine Genomkartierung durch BAC-Endsequenzierung ist allerdings möglich, sobald
Referenzgenome nahe verwandter Species zur Verfügung stehen. Wie im Folgenden
dargestellt, war eine komparative Genomkartierung von D. labrax durch fortgeschrittene
Genomprojekte anderer Fischspecies möglich.
4.4. Komparative Genomkartierung von Dicentrarchus labrax
4.4.1. Referenzgenome
Die einleitend dargestellten evolutionären Beziehungen spiegeln sich in der Anzahl von
D. labrax BAC-Endsequenzen wieder, welche durch den BLAST-Algorithmus auf den
Sequenzen anderer Fischgenome angeordnet werden können. Das Genom von D. rerio war
für eine komparative Kartierung ungeeignet, da nur etwa 11,3% der BAC-Endsequenzen
angeordnet werden konnten. Die Genomsequenzdaten von Takifugu rubripes sind bisher
keinen Chromosomen zugeordnet, weshalb bei einer komparativen Genomkartierung
anhand dieser Daten essentielle Informationen, wie Anordnung einzelner BAC-Contigs
untereinander, verloren gehen würden.
Die Daten von O. latipes, G. aculeatus und T. nigroviridis sind für eine komparative
Anordnung von BAC-Klonen besser geeignet, da hier die Sequenzdaten größtenteils
Chromosomen zugeordnet sind. Ordnet man die BAC-Endsequenzen auf diesen Genomen
an, so erhält man die größte Anzahl Treffer für G. aculeatus, gefolgt von O. latipes und
T. nigroviridis.
4.4.2. Alignment der Endsequenzen auf T. nigroviridis und G. aculeatus
Die Anordnung von BAC-Endsequenzen auf den Genomen von T. nigroviridis und
G. aculeatus wurde durch Einstellungen von sensitiveren Parametern für den BLAST-
Algorithmus weiter verbessert. Zunächst wurde der Parameter Wordsize auf den
kleinstmöglichen Wert von 7 eingestellt. Die Wordsize legt die minimale exakte
Übereinstimmung von zwei Sequenzen fest, welche vom BLAST-Algorithmus berücksichtigt
wird, d.h. in diesem Fall sieben Nukleotide. Der Wahl der Parameter von BLAST kann die
Resultate von Homologievergleichen maßgeblich beeinflussen, dies wurde u.a. von Gotea et
al. eingehend untersucht (76).
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 83
Abb. 40: Vergleich der Anordnung von BAC-Endsequenzen auf dem Genom von G. aculeatus (links) und T. nigroviridis (rechts).
Auf dem Genom von T. nigroviridis konnten mit diesen Einstellungen 29.421 (28,6%) End-
sequenzen angeordnet werden. Wie in Abb. 40 dargestellt, konnte von einem Großteil der
Klone nur eine Endsequenz angeordnet werden. Von 3.105 Klonen konnten beide End-
sequenzen (6.210) auf denselben Chromosomen platziert werden (paarweise angeordnete
Endsequenzen). 3.584 Endsequenzen waren repetitiv, d.h. sie konnten an unterschiedlichen
Stellen im Genom mit sehr ähnlichen Qualitätswerten angeordnet werden und waren für eine
Kartierung ungeeignet.
Durch Verwendung des Genoms von G. aculeatus und weiterer Anpassungen der BLAST-
Parameter konnte die Menge angeordneter Endsequenzen gesteigert werden. Dazu wurde
die Wertung von nicht zueinander passenden Nukleotiden im Alignment von -3 auf -1
verringert, woraus resultierte, dass der BLAST-Algorithmus auch weniger genaue
Übereinstimmungen von Sequenzen berücksichtigte. Die Menge durch BLAST angeordneter
Endsequenzen steigerte sich so auf 63.448 (61,7%) um mehr als das Zweifache. Dies hatte
die positive Folge, dass der Anteil Klone, von denen beide Endsequenzen angeordnet
werden konnten, überproportional zunahm. Negativ wirkte sich die verringerte Stringenz
dagegen auf den Anteil der Endsequenzen aus, welche wegen Repetitivität nicht genau
angeordnet werden konnten.
Um fehlerhafte Anordnung durch unstringente BLAST-Parameter zu vermeiden, wurden
deshalb paarweise angeordnete Endsequenzen auf ihren Abstand und ihre Orientierung
zueinander hin überprüft (siehe 3.4.2). Diese Prüfung war bei Endsequenzen, welche nicht
paarweise angeordnet werden konnten, nicht möglich. Deshalb wurden diese erneut mit
stringenteren BLAST-Parametern (Wordsize 15) angeordnet. Diese Vorgehensweise
resultierte in den in Abb. 40 dargestellten Ergebnissen. Insgesamt wurden 41.910 (40,8%)
der BAC-Endsequenzen für eine komparative Kartierung verwendet, was einer 1,6fachen
Steigerung gegenüber den mit T. nigroviridis erzielten Ergebnissen entsprach. Die Anzahl
paarweise angeordneter Endsequenzen stieg dabei überproportional um den Faktor 3,5 auf
Angeordnete BAC-Endsequenzen auf T. nigroviridis (n=29427 / 28,6%)
6210
19633
3584
paarige ES auf selbem Chr. angeordnet nur eine ES angeordnetAnordnung aufgrund von Repetitivität verworfen
Angeordnete BAC-Endsequenzen auf G. aculeatus (n=63448 / 61,7%)
21624
20286
21538
paarige ES auf selbem Chr. angeordnet nur eine ES angeordnetAnordnung aufgrund von Repetitivität verworfen
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 84
21.624, diese 10.812 Klone decken das Genom von D. labrax ca. 2,3 - 2,8fach ab (in
Abhängigkeit von der geschätzten Genomgröße).
4.4.3. Die komparative Genomkarte von D. labrax
Die selektierten BLAST-Ergebnisse wurden in tabellarischer Form zusammengefasst. Die
Anordnung der BAC-Endsequenzen auf dem Genom von G. aculeatus konnte so durch
Sortierung nach Koordinaten und Chromosomen relativ einfach erfolgen. Für die Kartierung
sind paarweise angeordnete Endsequenzen eines BAC-Klons von besonderem Interesse, da
Überlappungen zwischen benachbarten BAC-Klonen relativ sicher vorhergesagt werden
können. Aus diesem Grund wurden alle paarig angeordneten BAC-Endsequenzen farblich
markiert und der Abstand zur nächsten Endsequenz berechnet.
In Tab. 22 ist die tabellarische Darstellung der Daten auszugsweise dargestellt. Abb. 41 zeigt
die graphische Darstellung dieser Daten. Hier wird deutlich, dass viele der angeordneten
Klone redundant sind. Im Folgenden sollte aus den angeordneten BAC-Klonen eine
Untergruppe gewählt werden, welche das kartierte Genom mit minimaler Redundanz
maximal abdeckt (minimal tiling path) (77).
Tab. 22: Tabellarische Darstellung von angeordneten BAC-Endsequenzen auf dem Genom von G. aculeatus (paarweise angeordnete ES grün).
Score
Ident. %
Start
End
BAC-Klon Name
Start auf Chr.
Ende auf Chr.
Chr.
Abstand paariger
ES
Klone in minimal tiling
path
434 77.46 400 470 1bassbac-1k14.r 12232892 12232962 groupII 109676Contig Start 12232892 bassbac-1k14.r
311 91.78 311 239 bassbac-140g18.r 12236213 12236285 groupII
372 87.62 266 162 bassbac-25b21.r 12244370 12244468 groupII
344 94.74 1 76 bassbac-97o21.r 12248023 12248098 groupII
715 78.84 91 381 1bassbac-16l18.f 12269277 12269562 groupII 119211
188 93.02 495 453 bassbac-112e6.f 12274627 12274669 groupII
614 93.53 579 441 bassbac-98o15.r 12287389 12287527 groupII
215 76.98 352 474 1bassbac-11k18.r 12302426 12302551 groupII 94803 bassbac-11k18.r
689 86.10 76 262 bassbac-62k15.r 12324994 12325178 groupII
1601 87.62 75 486 bassbac-112h16.f 12329464 12329875 groupII
383 90.91 810 441 1bassbac-1k14.f 12342195 12342568 groupII 109676 bassbac-1k14.f
281 80.43 1 715 1bassbac-137a10.r 12345123 12345857 groupII 113433
219 80.07 3 585 1bassbac-12j5.r 12345123 12345725 groupII 141772
414 84.88 1 290 1bassbac-57g12.f 12352517 12352806 groupII 131040
1111 81.13 198 442 1bassbac-101l2.r 12354146 12354410 groupII 142333 bassbac-101l2.r
214 92.00 151 102 bassbac-83e5.r 12354835 12354884 groupII
614 72.46 308 445 1bassbac-106n6.r 12368064 12368193 groupII 118774
988 74.67 571 120 1bassbac-16l18.r 12388038 12388488 groupII 119211
581 88.97 275 131 bassbac-128k18.r 12388344 12388488 groupII
1247 89.35 833 525 bassbac-21p9.r 12389350 12389659 groupII
710 80.56 108 1 1bassbac-11k18.f 12397122 12397229 groupII 94803 bassbac-11k18.f
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 85
Abb. 41: Grafische Darstellung des Bereichs aus Tab. 22.
Die Berechnung des minimal tiling path erfolgte zunächst durch das Kriterium der minimalen
Redundanz. Von einem BAC-Klon ausgehend, der nur zu einer Seite mit anderen BACs
überlappte (Bedingung für Start / Ende eines BAC-Contigs), wurde jener BAC als
Anschlussklon gewählt, welcher minimal mit dem Ausgangsklon überlappte. Die Ergebnisse
dieser Vorgehensweise waren allerdings unbefriedigend, da häufig Contigs gebildet wurden,
welche nicht die maximal mögliche Länge erreichten.
Aus diesem Grund wurde der minimal tiling path durch das Kriterium der Maximierung der
Contiglänge alternativ berechnet. Der Start-Klon wurde also durch jenen Anschlussklon
erweitert, welcher den größten Längenzuwachs des Contigs erzielte.
In Abb. 41 können beide Varianten nachvollzogen werden. Minimale Redundanz würde zur
Wahl der BACs 1k14, 11k18 und 106n6 führen, maximale Contiglänge zur Wahl der BACs
1k14, 11k18 und 101l2. Für die Berechnung des minimal tiling path von BAC-Contigs wurde
die Maximierung der Contiglänge bevorzugt, da so die maximale Contiglänge / Ge-
nomabdeckung bei minimierter Contiganzahl erzielt wird. Die Darstellung der berechneten
BAC-Contigs auf den 21 Chromosomen von G. aculeatus ist in Abb. 31 dargestellt.
Im Durchschnitt können 75,9% der Chromosomen von G. aculeatus durch D. labrax BAC-
Contigs abgedeckt werden, welche in Abb. 31 grün dargestellt sind und aus 3511 nach den
obigen Kriterien ausgewählten beidseitig sequenzierten BAC-Klonen bestehen. Das größte
Contig auf Chromosom 6 deckt dabei etwa 5 Mb ab und besteht aus 52 überlappenden BAC-
Klonen. In den roten Bereichen in Abb. 31 konnten nur einseitig sequenzierte Klone
positioniert werden, oder es handelt sich um Lücken in der Sequenz von G. aculeatus. Die
Mehrheit dieser Bereiche ist hauptsächlich an den Enden von Chromosomen positioniert. Es
ist anzunehmen, dass die repetitiven Strukturen von Telomeren die Kartierung dort
behindern (78). Zusätzlich ist die Qualität von Genomassemblys in diesen Bereichen
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 86
normalerweise weniger akkurat, so dass BAC-Endsequenzen möglicherweise im falschen
Abstand oder im Extremfall auf falschen Chromosomen angeordnet werden. BAC-Klone,
welche in diesen Bereichen angeordnet wurden, müssen oft aufgrund fehlerhaften Abstands
oder nicht konsistenter Orientierung der Endsequenzen zueinander ausgeschlossen werden,
da es nicht möglich ist sie von Chimären-Klonen zu unterscheiden. Auch an zentralen
Positionen auf den Chromosomen sind schlecht kartierte Bereiche zu finden. Hierbei handelt
es sich wahrscheinlich um Centromerregionen, welche ebenfalls hochrepetitiv sind.
Mit insgesamt 808 angeordneten nicht redundanten BAC-Contigs sind die Ergebnisse der
komparativen Kartierung denen anderer BAC basierter Kartierungsmethoden mindestens
ebenbürtig (39, 41).
4.4.4. Abgleich zwischen genetischer Kopplungskartierung und komparativer
Kartierung
Die berechneten BAC-Contigs deuten eine hohe Synthenie zwischen dem Genom von
G. aculeatus und D. labrax an. Andererseits ist es nicht sicher, ob benachbarte Contigs auch
im Genom von D. labrax wirklich nebeneinander positioniert sind oder ob die Lücke in der
Kartierung aufgrund von inter- oder intrachromosomalen Neuanordnungen im Laufe der
Evolution entstanden ist. Deshalb wurde versucht die Informationen aus einer genetischen
Kopplungskartierung von D. labrax mit den komparativen Daten abzugleichen. Dazu wurden
flankierende Sequenzen von Mikrosatelliten, welche für die genetische Kopplungskartierung
verwendet wurden (79), auf dem Genom von G. aculeatus mittels des BLAST-Algorithmus
angeordnet. Die relativ kurzen und repetitiven Sequenzdaten sind allerdings nur zu 53,3%
und mit relativ niedriger Signifikanz dem G. aculeatus Genom zuzuordnen.
Trotz der niedrigen Anzahl von angeordneten Mikrosatelliten wird auch hier die Synthenie
der G. aculeatus und D. labrax Genome deutlich. Marker, welche auf einer Kopplungsgruppe
liegen, sind auch auf dem Referenzgenom benachbart.
Vertikale schwarze Pfeile in Abb. 42 bezeichnen Bereiche des G. aculeatus Genoms auf
denen zwei oder mehr Marker einer Kopplungsgruppe von D. labrax angeordnet werden
konnten. Horizontale Pfeile bezeichnen einzelne Marker. Rote Pfeile bezeichnen
Chromosomen auf denen keine Marker gefunden wurden.
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 87
Abb. 42: Vergleich homologer Chromosomen von T. nigroviridis (grau), S. aurata (blau) und G. aculeatus, sowie komparativer BAC-Karte von D. labrax auf G. aculeatus (rot/grün) mit zugewiesenen Kopplungsgruppen (Pfeile, schwarz und rot) der genetischen Kopplungs-analyse von D. labrax.
Der Abstand der Marker voneinander ist zum Teil größer als 10 Mb und deutet darauf hin,
dass ganze Regionen und Chromosomen von G. aculeatus homolog zu D. labrax sind,
wobei die Auflösung allerdings zu gering ist, um eventuelle Inversionen und Deletionen zu
detektieren. Chromosom VII von G. aculeatus können zwei Kopplungsgruppen (3 und 14)
zugeordnet werden, d.h. der Bruch dieses Chromosoms trägt zur erhöhten
Chromosomenanzahl in D. labrax bei. Vergleicht man die Größe von Chromosomen und
Muster schlecht kartierter Bereiche (rot), so können auch Brüche des Chromosoms IV
angenommen werden. Die Chromosomen V & XVII scheinen dagegen in D. labrax fusioniert
zu sein, da auf diesen beiden Marker der Kopplungsgruppe 1 identifiziert wurden.
Um weitere Rückschlüsse zu ziehen, wurde auf Kartierungsergebnisse von Sparus aurata
(Goldbrasse) zurückgegriffen. Sparus aurata ist wie auch D. labrax den Perciformes
zugeordnet und besitzt ebenfalls 24 Chromosomen. Sarropoulou et al. (80) veröffentlichten
eine radiation hybrid-Kartierung (RH) des Sparus aurata Genoms. Im Gegensatz zur
genetischen Kopplungsanalyse, welche auf polymorphe Marker (Mikrosatelliten, AFLPs)
angewiesen ist, kann bei der RH-Kartierung jede Art von nicht repetitiver DNA-Sequenz als
Marker dienen. Für die Kartierung von Sparus aurata wurden hauptsächlich ESTs als Marker
verwendet, was sehr vorteilhaft für den Vergleich mit G. aculeatus war. So konnten 63,5%
der RH-Marker auf dem G. aculeatus Genom mit hoher Signifikanz angeordnet werden. In
Abb. 42 sind die RH-Gruppen von S. aurata in blau dargestellt, zusätzlich werden Vergleiche
mit T. nigroviridis Chromosomen aus (80) in grau dargestellt. Die zuvor durch den Vergleich
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 88
mit den genetischen Kopplungsgruppen von D. labrax angestellten Spekulationen wurden
durch den Vergleich mit S. aurata und T. nigroviridis unterstützt. Drei der vier vermuteten
Chromosomenbrüche (Chr I, IV und VII) sind in S. aurata und sogar in T. nigroviridis
vorhanden. Zwischen T. nigroviridis, S. aurata und G. aculeatus sind 13 Chromosomen über
weite Bereiche homolog, wobei die Anordnung der RH-Marker sich allerdings auf den
verschiedenen Genomen unterscheiden kann, d.h. intrachromosomale Neuanordnungen
können vorhanden sein (aus Gründen der Übersichtlichkeit in Abb. 42 nicht dargestellt).
Die in Abb. 42 dargestellten Vergleiche zeigen, dass relativ wenige inter- und intra-
chromosomale Veränderungen zwischen den Genomen verschiedener Acanthopterygii
stattgefunden haben. Es ist also anzunehmen, dass die komparative BAC-Klon Kartierung
von D. labrax anhand des G. aculeatus Genoms einer physikalischen Karte sehr nahe
kommt. Eine RH-Kartierung des Genoms von D. labrax ist derzeit in Arbeit (Francis Galibert,
Univertsité de Rennes, Frankreich). Die Integration der komparativen Kartierung von BAC-
Klonen, der RH-Kartierung und der genetischen Karte wird eine hochauflösende
physikalische Karte des D. labrax Genoms ermöglichen.
4.4.5. Verifikation von angeordneten BAC Klonen
Die komparative Karte konnte schon im frühen Stadium für die Identifikation von BAC-Klonen
eingesetzt werden. So wurden für Kooperationspartner zwei Klone identifiziert, welche die
zwei Isoformen (A1 & A2) der cyp19-Aromatase tragen (81, 82). Dazu wurden bekannte
mRNA-Sequenzen (AY138522, DQ177458) der cyp19-Aromatasen von D. labrax auf dem
Referenzgenom angeordnet und anschließend BAC-Klone (27g15 und 22g15) ausgewählt,
welche diese Bereiche überspannen. Die BAC-Inserts wurden durch die Shotgun-Strategie
komplett sequenziert und ermöglichten die Analyse der Cyp19-Gene mitsamt der Promotor-,
Intron- und Terminations-Regionen (siehe Abb. 43).
Transmembrane helix I-helix Ozol´s peptide Aromatase-specific Heme-binding
promoter
Translation
Cyp19A2 (brain isoform)
I III IV V VI VII X
Transcription Stop
II III IV V VI IX
StopTranslation
Cyp19A1 (gonadal isoform)
promoter
Transcription
VII VIIII
IXVIIIII
Abb. 43: Genstruktur der cyp19-Aromatase Isoformen, welche auf bassbac-27g15 und bassbac-22g15 identifiziert wurden (Quelle: Dr. Francesc Piferrer, CSIC, Barcelona, Spanien).
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 89
Diese rein bioinformatische Identifizierung von BAC-Klonen durch komparative Kartierung
erfolgte innerhalb von wenigen Minuten, während Vorgehensweisen wie PCR-Screening-
oder Filterhybridisierungs-Experimente Wochen in Anspruch nehmen können und häufig
falsch positive Resultate liefern.
Zur weiteren Prüfung der Kartierung wurden zehn Klone aus zwei benachbarten BAC-
Contigs ausgewählt. Jeder Klon wurde durch die Shotgun-Strategie sequenziert. Aus den
assemblierten Daten konnte ein ca. 1,3 Mb großes Scaffold gebildet werden. Die in dieser
Region auf dem G. aculeatus Genom angeordneten BAC-Endsequenzen konnten nun auf
der realen D. labrax Sequenz verifiziert werden. Die Ergebnisse in 3.4.3 zeigen, dass die
Fehlerrate bei paarweise angeordneten Sequenzen bei 1,23% liegt. Zusätzlich belegte die
Sequenzierung in diesem Fall, dass die Anordnung zweier in der komparativen Karte
benachbarter BAC-Contigs auch im D. labrax Genom erhalten war.
Dies verdeutlichte, dass die komparative Kartierung im Gegensatz zu genetischer
Kopplungskartierung oder Radiation Hybrid Kartierung einen schnellen Zugriff auf
spezifische Loci des Genoms über die angeordneten BAC-Klone erlaubt und so
weiterführende Studien von definierten Regionen oder Genen ermöglicht.
Es kann spekuliert werden, dass über die 10.812 komparativ beidseitig angeordneten BAC-
Klone auf mehr als 75% der Gene von D. labrax zugegriffen werden kann, da die schlecht
kartierten Bereiche des Genoms (~25%) zum Großteil in heterochromatischen Regionen
(Centromere, Telomere) des Genoms liegen, welche eine niedrigere Dichte von
proteinkodierenden Sequenzen als Euchromatin aufweisen.
4.4.6. Rückschlüsse auf die Genomgröße von D. labrax
Die sequenzierte 1,3 Mb Region wurde mit Hilfe der Vista Tools (83) auf den Genomen von
T. nigroviridis und G. aculeatus angeordnet. Die Graphen in Abb. 44 stellen die prozentuale
Identität der Sequenzen auf Nukleotidebene dar (Windowsize: 100 bp). Die Identität von
G. aculeatus ist dabei durchgehend größer als die von T. nigroviridis und reflektiert die in
4.4.2 dargestellten Resultate des Alignments der BAC-Endsequenzen auf den Genomen.
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 90
Abb. 44: Alignment eines 1,3 Mb Scaffold von D. labrax auf G. aculeatus und T. nigroviridis durch VISTA.
Die sequenzierte Region unterscheidet sich allerdings in allen drei Genomen in ihrer Größe.
Diese Unterschiede scheinen in direktem Zusammenhang mit der Genomgröße der Fische
zu stehen. Dabei ist die Region in D. labrax etwa 1,31fach größer als in G. aculeatus und
1,58fach größer als in T. nigroviridis. Ein weiterer Vergleich mit O. latipes (Medaka) zeigte,
dass hier die Region in D. labrax um 0,95fach kleiner war.
Die Betrachtung des Abstands paarig angeordneter Endsequenzen auf dem jeweiligen
Referenzgenomen zeigt, dass diese Werte nicht nur spezifisch für die gewählte Region sind,
sondern im Durchschnitt für die gesamten Genome gelten (siehe Abb. 45). Die Verhältnisse
der Verteilungsmaxima ergeben einen Faktor von 1,5 für das Größenverhältnis D. labrax / T.
nigroviridis, einen Faktor von 1,3 für D. labrax / G. aculeatus und einen Faktor von 0,88 für
D. labrax / O. latipes.
0
20
40
60
80
100
120
0 50000 100000 150000 200000 250000 300000
Abstand der BAC-Enden
Häu
figke
it (n
orm
alis
iert)
T.nigrovirids G.aculeatus D.labrax O.latipes
y = 494,64x
R2 = 0,9724
300
400
500
600
700
800
900
0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5
Größe der homologen Region [Mb]
Gen
omgr
öße
[Mb]
Abb. 45: Darstellung der Verteilung „virtueller“ Insertgrößen beidseitig angeordneter BACs auf Genomen von T. nigroviridis, G. aculeatus und O. latipes, sowie reale Insertgrößenverteilung der BACs in D. labrax (links). Abhängigkeit von Genomgröße und Größe homologer Bereiche (rechts).
2k 42k 82k 122k 162k 202k 242k 282k 322k 371k 411k 451k 491k 531k 571k 611k 651k
100%
50%
660k 700k 740k 780k 820k 860k 900k 940k 980k
100%
50%
bassbac2911bassbac46e19
bassbac35c1bassbac10k6 bassbac93m21 bassbac25b21bassbac62k15bassbac119g5
bassbac1k14 bassbac88h11
Dicentrarchus labrax: 1.3 Mb von 10 überlappenden BACs
Gasterosteus aculeatus Chr 2: 0.99 Mb
Tetraodon nigroviridis Chr 5: 0.82 Mb
Diskussion: Komparative Genomkartierung von Dicentrarchus labrax 91
Interpoliert man die Werte, welche sich aus dem Sequenzvergleich ergeben, so errechnet
sich für D. labrax eine Genomgröße von ca. 640 Mb (siehe Abb. 45). Mit den Werten aus
dem genomweiten Vergleich der Abstände paariger BAC-Endsequenzen ermittelt man eine
Genomgröße von ca. 605 Mb. Es ist also anzunehmen, dass das Genom von D. labrax bis
zu 160 Mb kleiner sein könnte, als bisher angenommen wurde (75).
Wie von Imai et al. gezeigt wurde, werden ähnliche Zusammenhänge auch zwischen
genomischen Bereichen von Fugu rubripes und O. latipes gefunden (84). Die Evolution der
Genomgröße von Teleosten wird dabei hauptsächlich durch Veränderungen in nicht-
kodierenden Bereichen getrieben. Mehr als die Hälfte (54%) des Größenunterschieds
machen Veränderungen in repetitiven Sequenzmotiven aus. Ein weiterer großer Anteil der
Sequenzunterschiede ist hauptsächlich in Introns und nicht-repetitiven Sequenzen zwischen
Genen angeordnet. Größenunterschiede in ORFs haben einen Anteil von weniger als 0,1%.
4.4.7. Nutzung von ultra-hochdurchsatz Sequenzierungstechniken
Die komparative Kartierung durch BAC-Klone ermöglichte es das D. labrax Genom in
kleinere Bereiche aufzuteilen, welche mit dem Roche GS20-Sequenzer sequenziert wurden.
Diese Sequenzierungsstrategie sollte spätere Probleme bei der Assemblierung der Daten
einschränken und wurde mit 109 BACs, welche 9,6 Mb des Chr XXI von G. aculeatus als
minimal tiling path abdeckten, getestet.
Sequenzierungen des BAC-Pools auf einem GS20-Sequencer erzeugten ca. 220 Mb
Sequenzdaten, was einer durchschnittlich 16 - 17fachen Abdeckung der BAC-Klone
entsprach. Trotz der hohen Abdeckung erzeugte die Assemblierung der Daten eine hohe
Anzahl von 7026 Contigs. Der Vergleich mit einem bakteriellen Genomprojekt (Erwinia sp.),
welches ebenfalls mit dem GS20-System bearbeitet wurde zeigte deutliche Unterschiede in
der Anzahl von Contigs pro Mb Sequenzdaten (siehe Abb. 46).
Vergleich der Sequenzierung von bakterieller- und Fisch-DNA mit dem GS20-System
0
500
1000
1500
2000
2500
3000
0 5 10 15 20
sequencing coverage
Anz
ahl d
er C
ontig
s pr
o M
b Co
ntig
-S
eque
nzda
ten
Erwinia sp.D.labrax
Abb. 46: Vergleich von Sequenzierungsergebnissen des GS20-Systems.
Diskussion: Ausblick 92
Bei gleicher Abdeckung der Sequenz ist die Anzahl der assemblierten Contigs des
eukaryotischen Genoms wesentlich höher als die Contiganzahl eines prokaryotischen
Genoms. Der negative Einfluss repetitiver Sequenzen auf die Datenassemblierung, welche
von den kurzen Leseweiten des GS20-Systems nicht überspannt werden können, wird hier
deutlich. Aus diesem Grund wurden zusätzlich zu den GS20-Daten, Sequenzdaten durch
Plasmid-Sequenzierung erzeugt. Eine zweifache Chromosomenabdeckung dieser Daten
reichte bereits aus, um die Qualität der Genom-Assemblierung erheblich zu verbessern
(1.698 Contigs decken 12,06 Mb ab), außerdem erlauben die beidseitig sequenzierten
Plasmide die Anordnung von Contigs zu Scaffolds.
Abb. 47: Vista Alignment der Sequenzdaten von 109 BACs, welche mit dem GS20 System gepoolt sequenziert wurden. Die Sequenzierungsergebnisse decken die durch komparative Kartier-ung vorhergesagten Bereiche auf Chr 21 von G. aculeatus ab.
Das Alignment der Daten zeigte, dass die ca. 12,06 Mb der 1.698 größten Contigs die
kartierten Bereiche von G. aculeatus Chr XXI abdecken. 8 Lücken in der komparativen Karte
konnten anhand von BAC-Klonen, welche nicht auf G. aculeatus aber auf der Sequenz von
D. labrax angeordnet werden, geschlossen werden.
Wie bei der Sequenzierung von Bakteriengenomen (85) kann die Kombination von Sanger-
Sequenzierung und Sequenzierungstechniken der zweiten Generation eine schnellere und
kostengünstigere Analyse von eukaryotischen Chromosomen und Genomen ermöglichen.
4.5. Ausblick
Wie dargestellt, ermöglichte die automatisierte Template-DNA Aufreinigung durch
größenselektive Präzipitation in PEG / Salz-Systemen die hochdurchsatz Sequenzierung
verschiedenster Vektortypen. Insbesondere von BACs und Fosmiden, welche aufgrund ihrer
Größe und niedriger Template-Ausbeuten schwieriger zu sequenzieren sind, konnten
Endsequenzen im Hochdurchsatz bestimmt werden. Dabei erzielte das Verfahren eine mehr
als 10fache Kostenreduktion gegenüber kommerziell erhältlichen Systemen (23, 25).
1Mb 2Mb 3Mb 4Mb 5Mb 6Mb 7Mb 8Mb 9Mb 10Mb
Diskussion: Ausblick 93
sequenzierte 384 well MTPs pro Jahr
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
2003 (geschätztauf Basis von 4
mon)
2004 2005 2006 2007 (geschätzt)
Jahr
Anz
ahl
Abb. 48: Entwicklung des Sequenzierungsdurchsatzes am MPI f. Molekulare Genetik. Die Umstellung der Template-Präparation von PCR zu Plasmid-Aufreinigung erfolgte Ende 2004.
Der Probendurchsatz des installierten Systems ist mittlerweile mit dem von bekannten
Anlagen an großen Sequenzierungszentren vergleichbar (21, 24). So konnte die Anzahl
sequenzierter Templates am MPI f. Molekulare Genetik seit Einführung der Methode
kontinuierlich gesteigert werden. Ende des Jahres 2007 wird sich der erzielte
Sequenzierungsdurchsatz gegenüber 2004 mehr als vervierfacht haben, wobei eine weitere
Steigerung möglich ist (siehe Abb. 48).
Neben Kostenreduktion und Durchsatzsteigerung war die Möglichkeit der Endsequenzierung
von BAC- und Fosmid-Klonen im Hochdurchsatz eine wichtige Innovation für die
Sequenzierungsgruppe des MPI f. Molekulare Genetik. Auch in Zukunft, wenn ein Großteil
der Sequenzdatenproduktion über Technologien wie Pyrosequencing oder Sequencing by
Synthesis bereitgestellt werden wird, werden Fosmid- und BAC-Endsequenzen benötigt, um
qualitativ hochwertige Genomassemblys zu ermöglichen. Obwohl die Daten paariger
Endsequenzen nur ein Bruchteil der in einem solchen Genomprojekt verarbeiteten Sequenz-
informationen ausmachen werden, werden sie einen großen Anteil an den Projektkosten
haben (85). Aus diesem Grunde ist eine kostengünstige Methode für BAC- und Fosmid-
Endsequenzierung ein Wettbewerbsvorteil im hart umkämpften Feld der Genom-
sequenzierung.
Die neuen Sequenzierungstechnologien verringern die Kosten für Sequenzierungsprojekte
u.a. dadurch, dass keine Klon-Bibliotheken mehr konstruiert und gelagert werden müssen
(13, 15). Sie haben dadurch allerdings auch den Nachteil, dass nach der Sequenzierung
nicht auf charakterisierte Klone zurückgegriffen werden kann, was für viele Anwendungen
notwendig ist. Charakterisierte Klone, als wichtige Ressource in der Genomforschung, sind
deshalb ein weiteres Argument für die Sequenzierung nach Sanger. Gleichzeitig werden
Diskussion: Ausblick 94
damit auch automatisierte Aufreinigungssysteme für Plasmid, Fosmid und BAC-DNA in
Zukunft weiterhin benötigt.
In unserer Arbeitgruppe ermöglichte die BAC-Endsequenzierung im Hochdurchsatz die
komparative Genomkartierung von D. labrax ohne aufwendige Methoden wie BAC-
Filterhybridisierung oder BAC-Fingerprinting. Das Ergebnis von 808 BAC-Contigs und
Informationen über deren Lage, ist den Resultaten von zuvor genannten Methoden, welche
zur Kartierung anderer Fischgenome eingesetzt wurden, mindestens ebenbürtig (39, 41). Die
komparative Karte erlaubt Wissenschaftlern einen schnellen Zugriff auf große Regionen des
Genoms von D. labrax anhand von charakterisierten BAC-Klonen und wird die Forschung an
dieser und verwandten Species weiter beschleunigen.
Wie gezeigt wurde, bot die Kombination von Sequenzierungstechnologien der zweiten
Generation, Sanger-Sequenzierung und Kartierung des D. labrax-Genoms anhand von BAC-
Klonen die Möglichkeit, die Sequenzierung großer Teile eines D. labrax-Chromosoms
durchzuführen. Diese Strategie soll in naher Zukunft die Sequenzierung des gesamten
Genoms ermöglichen. Im Rahmen dieser Arbeit wurde am MPI f. Molekulare Genetik bereits
mit einer low coverage WGS-Sanger-Sequenzierung des Genoms von D. labrax begonnen
(Stand 11/2007: 500 Mb Sequenzdaten).
Mit der komparativen Genomkarte, einem WGS-Sanger-Datensatz und der Möglichkeit durch
BAC-Pools gerichtet Chromosomen auf neuer Sequenzierungstechnologie zu analysieren,
sind die Grundbedingungen für ein D. labrax Genomprojekt geschaffen worden.
Zusammenfassung: 95
5. Zusammenfassung
Ein limitierender Faktor des Probendurchsatzes und der Kosten von DNA-Sequenzierung
mittels der Sanger-Methode ist die zuverlässige Herstellung qualitativ hochwertiger DNA als
Template für die Sequenzierungsreaktion. Durch größenselektive Präzipitation in PEG / Salz-
Gemischen ist es möglich ein weites Spektrum von DNA-Templates für die Sequenzierung
aufzubereiten.
Die genauere Betrachtung der Einflussgrößen PEG- und Salz-Konzentration auf die
größenselektive Fällung ermöglichte es, die problematischen rheologischen Eigenschaften
von PEG / Salz-Gemischen durch Zusatz von 2-Propanol zu verbessern und ein
automatisiertes Verfahren für die Aufreinigung von Plasmid-, Fosmid- und BAC-DNA im
384er Format zu entwickeln. Die konzipierte Anlage bewältigt bis zu 36.834 Proben pro Tag,
wobei die Kosten pro Probe unter 0,01 Euro betragen.
Mehrere Millionen DNA-Templates für zahlreiche Sequenzierungsprojekte wurden mit Hilfe
der Anlage aufgereinigt. Besonders profitierte die Endsequenzierung von Fosmid- und BAC-
Banken von dem System.
So konnten 102.282 Endsequenzen einer BAC-Bank von Dicentrarchus labrax (Wolfsbarsch)
bestimmt werden. Durch den Vergleich der Endsequenzen mit dem nahe verwandten Fisch
G. aculeatus (Stichling) war es möglich BAC-Klone anzuordnen und eine hochauflösende
komparative Genomkarte zu erstellen. Der Abgleich der Karte mit der genetischen
Kopplungskartierung von D. labrax und Kartierungen anderer Fischgenome zeigte, dass die
komparative Kartierung einer physikalischen Karte des Genoms nahe kommt.
Indem 109 überlappende BAC-Klone anhand der Kartierung ausgewählt wurden, konnten
durch Nutzung von Sequenzierungstechniken der zweiten Generation (GS20, Roche / 454)
in Kombination mit Sanger-Sequenzierung große Bereiche eines D. labrax-Chromosoms
sequenziert werden (> 80%). Die komparative Kartierung des Genoms erweist sich somit als
sinnvoller Schritt für eine zukünftige Sequenzierung von D. labrax anhand neuer
Sequenzierungstechniken.
Quellen: 96
6. Quellen
(1) Watson JD & Crick FH (1953).
Molecular structure of nucleic acids. A structure for deoxyribose nucleic acid. Nature. 171:737-738.
(2) Nirenberg MW & Matthaei JH (1961).
The dependence of cell-free protein synthesis in E. coli upon naturally occurring or synthetic polyribonucleotides. Proc Natl Acad Sci U S A. 47:1588-1602.
(3) Sanger F, Nicklen S, Coulson AR (1977).
DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A. 74:5463-5467.
(4) Maxam A & Gilbert W (1977).
A new method of sequencing DNA. Proc Natl Acad Sci U S A. 74:560-564.
(5) Saiki RK, Scharf S, Faloona F, Mullis KB, Horn GT, Erlich HA, Arnheim N (1985).
Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia. Science. 230:1350-1354.
(6) Mullis K, Faloona F, Scharf S, Saiki R, Horn G, Erlich H (1986).
Specific enzymatic amplification of DNA in vitro: the polymerase chain reaction. Cold Spring Harb. 51:263–273.
(7) Anderson S (1981).
Shotgun DNA sequencing using cloned DNase I-generated fragments. Nucleic Acids Res. 9:3015-3027.
(8) Blattner FR, Plunkett G 3rd, Bloch CA, Perna NT, Burland V, Riley M, Collado-Vides J, Glasner JD,
Rode CK, Mayhew GF, Gregor J, Davis NW, Kirkpatrick HA, Goeden MA, Rose DJ, Mau B,
Shao Y (1997).
The complete genome sequence of Escherichia coli K-12. Science. 277:1453-1474.
(9) Zhang J, Voss KO, Shaw DF, Roos KP, Lewis DF, Yan J, Jiang R, Ren H, Hou JY, Fang Y,
Puyang X, Ahmadzadeh H, Dovichi NJ (1999).
A multiple-capillary electrophoresis system for small-scale DNA sequencing and analysis. Nucleic Acids Res. 27:e36.
Quellen: 97
(10) International Human Genome Sequencing Consortium (2001).
Initial sequencing and analysis of the human genome. Nature. 409:860-921.
(11) Venter JC, et al. (2001).
The sequence of the human genome. Science. 291:1304-1581.
(12) Bennett ST, Barnes C, Cox A, Davies L, Brown C (2004).
Toward the 1,000 dollars human genome. Pharmacogenomics. 6:373-382. Review. (13) Shendure J, Porreca GJ, Reppas NB, Lin X, McCutcheon JP, Rosenbaum AM, Wang MD, Zhang
K, Mitra RD, Church GM (2005).
Accurate multiplex polony sequencing of an evolved bacterial genome. Science. 309:1728-1732.
(14) Matsumura H, Ito A, Saitoh H, Winter P, Kahl G, Reuter M, Kruger DH, Terauchi R (2005).
SuperSAGE. Cell Microbiol. 7:11-18. Review.
(15) Margulies M, Egholm M, Altman WE, Attiya S, Bader JS, Bemben LA, Berka J, Braverman MS,
Chen YJ, Chen Z, Dewell SB, Du L, Fierro JM, Gomes XV, Godwin BC, He W, Helgesen S,
Ho CH, Irzyk GP, Jando SC, Alenquer ML, Jarvie TP, Jirage KB, Kim JB, Knight JR, Lanza
JR, Leamon JH, Lefkowitz SM, Lei M, Li J, Lohman KL, Lu H, Makhijani VB, McDade KE,
McKenna MP, Myers EW, Nickerson E, Nobile JR, Plant R, Puc BP, Ronan MT, Roth GT,
Sarkis GJ, Simons JF, Simpson JW, Srinivasan M, Tartaro KR, Tomasz A, Vogt KA, Volkmer
GA, Wang SH, Wang Y, Weiner MP, Yu P, Begley RF, Rothberg JM (2005).
Genome sequencing in microfabricated high-density picolitre reactors. Nature. 437:376-380.
(16) Hofmann MA, Brian DA (1991).
Sequencing PCR DNA amplified directly from a bacterial colony. Biotechniques. 11:30-31.
(17) Rauth H (1997).
Verfahrenstechnik und Automatisierung nicht radioaktiver Highthroughput DNA-Sequenzierung. Diplomarbeit. TFH-Berlin.
(18) Dean FB, Nelson JR, Giesler TL, Lasken RS (2001).
Rapid amplification of plasmid and phage DNA using Phi 29 DNA polymerase and multiply-primed rolling circle amplification. Genome Res. 11:1095-1099.
Quellen: 98
(19) Kuhl H (2003).
Anwendung der rolling circle DNA Amplifikation im 384er Mikrotiterplattenformat zur Bestimmung von BAC Endsequenzen im Hochdurchsatz. Diplomarbeit. TU-Berlin.
(20) Dean FB, Hosono S, Fang L, Wu X, Faruqi AF, Bray-Ward P, Sun Z, Zong Q, Du Y, Du J, Driscoll
M, Song W, Kingsmore SF, Egholm M, Lasken RS (2002).
Comprehensive human genome amplification using multiple displacement amplification. Proc Natl Acad Sci USA. 99:5261-5266.
(21) Elkin CJ, Richardson PM, Fourcade HM, Hammon NM, Pollard MJ, Predki PF, Glavina T,
Hawkins TL (2001).
High-throughput plasmid purification for capillary sequencing. Genome Res. 11:1269-1274.
(22) DeAngelis MM, Wang DG, Hawkins TL. (1995).
Solid-phase reversible immobilization for the isolation of PCR products. Nucleic Acids Res. 23:4742-4743.
(23) http://www.agencourt.com/products/SPRIsolutions/SPRI/ (Stand Juni 2007)
(24) Itoh M, Kitsunai T, Akiyama J, Shibata K, Izawa M, Kawai J, Tomaru Y, Carninci P, Shibata Y,
Ozawa Y, Muramatsu M, Okazaki Y, Hayashizaki Y (1999).
Automated filtration-based high-throughput plasmid preparation system. Genome Res. 9:463-470.
(25) http://www.brinkmann.com/utilities/download_pdf.asp?DR=downloads%2Fpdf%2Fmanuals%
2Feppendorf&FN=Perfectprep_Plasmid384_0302.pdf (Stand Juni 2007)
(26) Dederich DA, Okwuonu G, Garner T, Denn A, Sutton A, Escotto M, Martindale A, Delgado O,
Muzny DM, Gibbs RA, Metzker ML. (2002).
Glass bead purification of plasmid Template DNA for high throughput sequencing of mammalian genomes. Nucleic Acids Res. 30:e32.
(27) http://www.genome.ou.edu/Zymark_384_well_isolation.html (Stand Juni 2007)
(28) Birnboim HC, Doly J. (1979).
A rapid alkaline extraction procedure for screening recombinant plasmid DNA.
Nucleic Acids Res. 7:1513-1523.
(29) http://www.corning.com/Lifesciences/technical_information/techDocs/protocol_
filtrexplasmidprep.pdf (Stand Juni 2007)
(30) Marra MA, Kucaba TA, Hillier LW, Waterston RH (1999).
High-throughput plasmid DNA purification for 3 cents per sample. Nucleic Acids Res. 27:e37.
(31) http://docs.appliedbiosystems.com/pebiodocs/00113199.pdf
Quellen: 99
(32) Lis JT, Schleif R (1975).
Size fractionation of double-stranded DNA by precipitation with polyethylene glycol. Nucleic Acids Res. 2:383-389.
(33) Atha DH, Ingham KC (1982).
Mechanism of precipitation of proteins by polyethylene glycols. Analysis in terms of excluded volume. J Biol Chem. 256:12108-12117.
(34) Pulleyblank D, Michalak M, Daisley SL, Glick R (1983).
A method for the purification of E. coli plasmid DNA by homogeneous lysis and polyethylene glycol precipitation. Mol Biol Rep. 9:191-195.
(35) Nicoletti VG, Condorelli DF (1993).
Optimized PEG method for rapid plasmid DNA purification: high yield from "midi-prep". Biotechniques. 14:532-534, 536.
(36) Schmitz A, Riesner D (2006).
Purification of nucleic acids by selective precipitation with polyethylene glycol 6000. Anal Biochem. 354:311-3.
(37) Shizuya H, Birren B, Kim UJ, Mancino V, Slepak T, Tachiiri Y, Simon M (1992).
Cloning and stable maintenance of 300-kilobase-pair fragments of human DNA in Escherichia coli using an F-factor-based vector. Proc Natl Acad Sci USA. 89:8794-8797.
(38) Wild J, Hradecna Z, Szybalski W (2002).
Conditionally amplifiable BACs: switching from single-copy to high-copy vectors and genomic clones. Genome Res. 12:1434-1444.
(39) Khorasani MZ, Hajizadeh S, Fathollahi Y, Semnanian S (2004).
A first generation physical map of the medaka genome in BACs essential for positional cloning and clone-by-clone based genomic sequencing. Mech Dev. 121:903-913.
(40) Tao Q, Chang YL, Wang J, Chen H, Islam-Faridi MN, Scheuring C, Wang B, Stelly DM, Zhang
HB (2001).
Bacterial artificial chromosome-based physical map of the rice genome constructed by restriction fingerprint analysis. Genetics. 158:1711-1724.
(41) Katagiri T, Kidd C, Tomasino E, Davis JT, Wishon C, Stern JE, Carleton KL, Howe AE, Kocher
TD (2005).
A BAC-based physical map of the Nile tilapia genome. BMC Genomics. 6:89.
Quellen: 100
(42) Luo M-C, Thomas C, You FM, Hsiao J, Ouyang S, Buell CR, Malandro M, McGuire PE, Anderson
OD, Dvorak J (2003).
High-throughput fingerprinting of bacterial artificial chromosomes using the SNaP-shot labeling kit and sizing of restriction fragments by capillary electrophoresis. Genomics. 82:378-389.
(43) Altschul SF, Gish W, Miller W, Myers EW, Lipman DJ (1990).
Basic local alignment search tool. J Mol Biol. 215:403-410.
(44) Altschul SF, Madden TL, Schäffer AA, Zhang J, Zhang Z, Miller W, Lipman DJ (1997).
Gapped BLAST and PSI-BLAST: a new generation of protein database search programs. Nucleic Acids Res. 25:3389-3402. Review.
(45) Fujiyama A, Watanabe H, Toyoda A, Taylor TD, Itoh T, Tsai SF, Park HS, Yaspo ML, Lehrach H,
Chen Z, Fu G, Saitou N, Osoegawa K, de Jong PJ, Suto Y, Hattori M, Sakaki Y (2002).
Construction and analysis of a human-chimpanzee comparative clone map. Science. 295:131-134.
(46) Larkin DM, Everts-van der Wind A, Rebeiz M, Schweitzer PA, Bachman S, Green C, Wright CL,
Campos EJ, Benson LD, Edwards J, Liu L, Osoegawa K, Womack JE, de Jong PJ, Lewin HA
(2003).
A cattle-human comparative map built with cattle BAC-ends and human genome sequence. Genome Res. 13:1966-1972.
(47) http://www.fishbase.org (Stand Nov 2007)
(48) Nebel C, Romestand B, Negre-Sadargues G, Grousset E, Aujoulat F, Bacal J, Bonhomme F,
Charmantier G (2005).
Differential freshwater adaptation in juvenile sea-bass Dicentrarchus labrax: involvement of gills and urinary system. J Exp Biol. 208:3859-3871.
(49) Kaushik SJ, Coves D, Dutto G, Blanc D (2004).
Almost total replacement of fish meal by plant protein sources in the diet of a marine teleost, the European seabass, Dicentrarchus labrax. Aquaculture. 230:391-404.
(50) Pifferer F, Blazquez M, Navarro L, Gonzales A (2005).
Genetic, endocrine, and enviromental components of sex determination and differentiation in the European sea bass (Dicentrarchus labrax L.). Gen Comp Endocrinol. 142:102-110.
(51) Jekosch K (2004).
The zebrafish genome project: sequence analysis and annotation. Methods Cell Biol. 77:225-239.
Quellen: 101
(52) Kasahara M, Naruse K, Sasaki S, Nakatani Y, Qu W, Ahsan B, Yamada T, Nagayasu Y, Doi K,
Kasai Y, Jindo T, Kobayashi D, Shimada A, Toyoda A, Kuroki Y, Fujiyama A, Sasaki T,
Shimizu A, Asakawa S, Shimizu N, Hashimoto S, Yang J, Lee Y, Matsushima K, Sugano S,
Sakaizumi M, Narita T, Ohishi K, Haga S, Ohta F, Nomoto H, Nogata K, Morishita T, Endo T,
Shin-I T, Takeda H, Morishita S, Kohara Y (2007).
The medaka draft genome and insights into vertebrate genome evolution. Nature. 447:714-719.
(53) http://www.ensembl.org/Gasterosteus_aculeatus/index.html (Dezember 2006)
(54) Jaillon O, Aury JM, Brunet F, Petit JL, Stange-Thomann N, Mauceli E, Bouneau L, Fischer C,
Ozouf-Costaz C, Bernot A, Nicaud S, Jaffe D, Fisher S, Lutfalla G, Dossat C, Segurens B,
Dasilva C, Salanoubat M, Levy M, Boudet N, Castellano S, Anthouard V, Jubin C, Castelli V,
Katinka M, Vacherie B, Biémont C, Skalli Z, Cattolico L, Poulain J, De Berardinis V, Cruaud C,
Duprat S, Brottier P, Coutanceau JP, Gouzy J, Parra G, Lardier G, Chapple C, McKernan KJ,
McEwan P, Bosak S, Kellis M, Volff JN, Guigó R, Zody MC, Mesirov J, Lindblad-Toh K, Birren
B, Nusbaum C, Kahn D, Robinson-Rechavi M, Laudet V, Schachter V, Quétier F, Saurin W,
Scarpelli C, Wincker P, Lander ES, Weissenbach J, Roest Crollius H (2004).
Genome duplication in the teleost fish Tetraodon nigroviridis reveals the early vertebrate proto-karyotype. Nature. 431:946-957.
(55) Aparicio S, Chapman J, Stupka E, Putnam N, Chia JM, Dehal P, Christoffels A, Rash S, Hoon S,
Smit A, Gelpke MD, Roach J, Oh T, Ho IY, Wong M, Detter C, Verhoef F, Predki P, Tay A,
Lucas S, Richardson P, Smith SF, Clark MS, Edwards YJ, Doggett N, Zharkikh A, Tavtigian
SV, Pruss D, Barnstead M, Evans C, Baden H, Powell J, Glusman G, Rowen L, Hood L, Tan
YH, Elgar G, Hawkins T, Venkatesh B, Rokhsar D, Brenner S (2002).
Whole-genome shotgun assembly and analysis of the genome of Fugu rubripes. Science. 297:1301-1310.
(56) Miya M, Kawaguchi A, Nishida M (2001).
Mitogenomic exploration of higher teleostean phylogenies: a case study for moderate-scale evolutionary genomics with 38 newly determined complete mitochondrial DNA sequences. Mol Biol Evol. 18:1993-2009.
(57) Rabus R, Wilkes H, Schramm A, Harms G, Behrends A, Amann R, Widdel F (1999).
Anaerobic utilization of alkylbenzenes and n-alkanes from crude oil in an enrichment culture of denitrifying bacteria affiliating with the beta-subclass of Proteobacteria. Environ Microbiol. 1:145-157.
(58) Ewing B, Green P (1998).
Basecalling of automated sequencer traces using phred. II. Error probabilities.
Genome Res. 8:186-194.
Quellen: 102
(59) H.-H. Chou and M.H. Holmes (2001).
DNA sequence quality trimming and vector removal. Bioinformatics. 17:1093-1104.
(60) Zhang Z, Schwartz S, Wagner L, Miller W (2000).
A greedy algorithm for aligning DNA sequences. J Comput Biol. 7:203-214.
(61) http://www.phrap.org (Stand Juli 2007)
(62) Gordon D, Abajian C, Green P (2002).
Consed: a graphical tool for sequence finishing. Genome Res. 8:195-202.
(63) Hornef N, Olbrich H, Horvath J, Zariwala MA, Fliegauf M, Loges NT, Wildhaber J, Noone PG,
Kennedy M, Antonarakis SE, Blouin JL, Bartoloni L, Nüsslein T, Ahrens P, Griese M, Kuhl H,
Sudbrak R, Knowles MR, Reinhardt R, Omran H (2006).
DNAH5 mutations are a common cause of primary ciliary dyskinesia with outer dynein arm defects.
Am J Respir Crit Care Med. 174:120-126.
(64) Hecht J, Kuhl H, Haas SA, Bauer S, Poustka AJ, Lienau J, Schell H, Stiege AC, Seitz V,
Reinhardt, Duda GN, Mundlos S, Robinson PN (2006).
Gene identification and analysis of transcripts differentially regulated in fracture healing by EST sequencing in the domestic sheep. BMC Genomics. 7:172.
(65) Bauer M, Kube M, Teeling H, Richter M, Lombardot T, Allers E, Wurdemann CA, Quast C, Kuhl
H, Knaust F, Woebken D, Bischof K, Mussmann M, Choudhuri JV, Meyer F, Reinhardt R,
Amann RI, Glockner FO (2006).
Whole genome analysis of the marine Bacteroidetes'Gramella forsetii' reveals adaptations to degradation of polymeric organic matter. Environ Microbiol. 8:2201-2213.
(66) Erkel C, Kube M, Reinhardt R, Liesack W (2006).
Genome of Rice Cluster I archaea--the key methane producers in the rice rhizosphere. Science. 313:370-372.
(67) Chromosome 21 mapping and sequencing consortium (2000).
The DNA sequence of human chromosome 21. Nature. 405:311-319.
(68) Paithankar KR, Prasad KS (1991).
Precipitation of DNA by polyethylene glycol and ethanol. Nucleic Acids Res. 19:1346.
(69) Hegen PN (1994).
Recovering DNA from agarose gels. Trends Biochem Sci. 19:388-389.
Quellen: 103
(70) Kasai K (1993).
Size-dependent chromatographic separation of nucleic acids. J Chromatogr. 618:203-221. Review.
(71) Rauth H, Reinhardt R, Nordhoff E (2001).
Method for binding nucleic acids to a solid phase. European Patent EP1214406.
(72) Kim UJ, Shizuya H, de Jong PJ, Birren B, Simon MI (1992).
Stable propagation of cosmid sized human DNA inserts in an F factor based vector. Nucleic Acids Res. 20:1083-1085.
(73) http://www.epicentre.com (Stand Juli 2007)
(74) Whitaker HA, McAndrew BJ, Taggart JB (2006).
Construction and characterization of a BAC library for the European sea bass Dicentrarchus labrax. Anim Genet. 37:526.
(75) Peruzzi S., Chatain B., Menu B (2005).
Flow cytometric determination of genome size in European seabass (Dicentrarchus labrax), gilthead seabream (Sparus aurata), thinlip mullet (Liza ramada), and European eel (Anguilla anguilla) Aquat. Living Resour. 18:77-81.
(76) Gotea V, Veeramachaneni V, Makałowski W (2003).
Mastering seeds for genomic size nucleotide BLAST searches. Nucleic Acids Res. 31:6935-6941.
(77) Hollich V, Johnson E, Furlong EE, Beckmann B, Carlson J, Celniker SE, Hoheisel JD (2004).
Creation of a minimal tiling path of genomic clones for Drosophila: provision of a common resource. Biotechniques. 37:282-284.
(78) Sun X, Le HD, Wahlstrom JM, Karpen GH (2003).
Sequence analysis of a functional Drosophila centromere. Genome Res. 13:182-194.
(79) Chistiakov DA, Hellemans B, Haley CS, Law AS, Tsigenopoulos CS, Kotoulas G, Bertotto D,
Libertini A, Volckaert FA (2005).
A microsatellite linkage map of the European sea bass Dicentrarchus labrax L. Genetics. 170:1821-1826.
(80) Sarropoulou E, Franch R, Louro B, Power DM, Bargelloni L, Magoulas A, Senger F, Tsalavouta
M, Patarnello T, Galibert F, Kotoulas G, Geisler R (2007).
A gene-based radiation hybrid map of the gilthead sea bream Sparus aurata refines and exploits conserved synteny with Tetraodon nigroviridis. BMC Genomics. 8:44.
Quellen: 104
(81) Blazquez M, Piferrer F (2004).
Cloning, sequence analysis, tissue distribution, and sex-specific expression of the neural form of P450 aromatase in juvenile sea bass (Dicentrarchus labrax). Mol Cell Endocrinol. 219:83-94.
(82) Galay-Burgos M, Gealy C, Navarro-Martín L, Piferrer F, Zanuy S, Sweeney GE (2006).
Cloning of the promoter from the gonadal aromatase gene of the European sea bass and identification of single nucleotide polymorphisms. Comp Biochem Physiol A Mol Integr Physiol. 145:47-53.
(83) http://genome.lbl.gov/vista/index.shtml (Stand Juli 2007)
(84) Imai S, Sasaki T, Shimizu A, Asakawa S, Hori H, Shimizu N (2007).
The genome size evolution of medaka (Oryzias latipes) and fugu (Takifugu rubripes). Genes Genet Syst. 82:135-144.
(85) Goldberg SM, Johnson J, Busam D, Feldblyum T, Ferriera S, Friedman R, Halpern A, Khouri H,
Kravitz SA, Lauro FM, Li K, Rogers YH, Strausberg R, Sutton G, Tallon L, Thomas T, Venter
E, Frazier M, Venter JC (2006).
A Sanger/pyrosequencing hybrid approach for the generation of high-quality draft assemblies of marine microbial genomes. Proc Natl Acad Sci U S A. 103:11240-11245.