Post on 05-Apr-2015
transcript
Online Datenbanken für Bioinformatiker
Einführung BioinformatikEinführung Bioinformatik Oktober 2003
Inhaltsverzeichnis2.1. Datenbanken für Nukleotidsequenzen
2.2. Proteindatenbanken
2.3. Enzym - und Metabolismusdatenbanken
2.4. Datenbanken für Protein - Raumstrukturen
2.5. Chemische Faktendatenbanken
2.6. Bibliographische Datenbanken
2.1. Datenbanken für Nukleotidsequenzen
• Annotation: verbale Kommentierung von Sequenz-Daten
• Gemeinschaftsprojekt von:• National Center for Biotechnology Information
(NCBI, Bethesda bei Washington), • European Bioinformatics Institute
(EBI, Hinxton bei Cambridge), Teil des EMBL • National Institute of Genetics (in Mishima, Japan)
2.1. Datenbanken für Nukleotidsequenzen (2)
• Datenbanken enthalten DNA- und RNA- (d.h. cDNA)-Sequenzen, vollständige Genome, einzelne Gene und ESTs
• Neue Einträge in Reihenfolge:
Ohne Annotation vorläufiger Eintrag
ungeprüfter Eintrag Standard
2.1. Datenbanken für Nukleotidsequenzen (3)
• GenBank (USA)• http://www.ncbi.nlm.nih.gov/Genbank/GenbankSearch.html
2.1. Datenbanken für Nukleotidsequenzen (4)
• EMBL (Europa)• http://www.ebi.ac.uk/embl/
2.1. Datenbanken für Nukleotidsequenzen (5)
• DDBJ = DNA Data Bank of Japan• http://www.nig.ac.jp/index-e.html
Textdateien mit genau festgelegtem Format.
Identifier
Aspergillus niger phosphofructokinase
4658 Basenpaare
Fungi
In EMBL: Jede Zeile beginnt mit 2 Großbuchstaben.ID ANPFKA standard; DNA; FUN; 4658 BP.
Genom von H. influenzae:
ID L42023 standard; circular DNA; CON; 1830138 BP...SQ Sequence 1830138 BP; 567623 A; 350723 C; 347436 G; 564241 T; 115 other;
tatggcaatt aaaattggta tcaatggttt tggtcgtatc ggccgtatcg tattccgtgc 60 agcacaacac cgtgatgaca ttgaagttgt aggtattaac gacttaatcg acgttgaata 120 catggcttat atgttgaaat atgattcaac tcacggtcgt ttcgacggca ctgttgaagt 180 gaaagatggt aacttagtgg ttaatggtaa aactatccgt gtaactgcag aacgtgatcc 240 agcaaactta aactggggtg caatcggtgt tgatatcgct gttgaagcga ctggtttatt 300 cttaactgat gaaactgctc gtaaacatat cactgcaggc gcaaaaaaag ttgtattaac 360 tggcccatct aaagatgcaa cccctatgtt cgttcgtggt gtaaacttca acgcatacgc 420......................
Bakterien haben ringförmige DNA!
ggattaaaat gggatgcttt tatcacatca atcatcgact gattttnctc ttttgcagcc 47640
Nicht identifizierte Nukleotide („n“)
Sequence Retrieval System (SRS)
http://srs.ebi.ac.uk
Suche mit Booleschen Operatoren & [und], | [oder] und ! [nicht]
Mit „Quick search“ sehr viele, unspezifische Treffer.Besser „Standard search“.
Unterhalten am EBI. Man kann auch in anderen Datenbankenals EMBL suchen.
?? Zuerst auf „Start a temporary project“ klicken.
2.1. Datenbanken für Nukleotidsequenzen (9)
• Sequence Retrieval System (SRS)
2.1. Datenbanken für Nukleotidsequenzen (10)
• Suchmaske
2.1. Datenbanken für Nukleotidsequenzen (11)
• Standard Search
2.1. Datenbanken für Nukleotidsequenzen (12)
• Suchergebnis
Spezielle Genomdatenbanken
• Entrez Genome (NCBI)• http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Genome
Spezielle Genomdatenbanken (2)
• TIGR-Genom-Datenbank• http://www.tigr.org/tdb/
Gen - Namen
Phosphoglucoisomerase: g6p, Isoformen g6p1, g6p2, g6pA, ...
Phosphofruktokinase: k6p (früher pfk), Isoformen k6p1, k6P2,...
Transaldolase: tal
2.2. Proteindatenbanken
• Swiss-Prot - am Schweizer Institut für Bioinformatik (SIB)
• http://us.expasy.org/sprot
2.2. Proteindatenbanken (2)
• PROSITE• http://www.expasy.org/prosite/
2.2. Proteindatenbanken (3)
• TrEMBL• http://www.ebi.ac.uk/trembl/index.html
2.2. Proteindatenbanken (4)
• Entrez Protein ( am NCBI )• http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Protein
2.3. Enzym - und Metabolismus - Datenbanken
• ENZYME ( Teil von Swiss-Prot )• http://www.expasy.org/enzyme/
2.3. Enzym - und Metabolismus - Datenbanken (2)
• BRENDA
2.3. Enzym - und Metabolismus - Datenbanken (3)
• KEGG ( Kyoto Encyclopedia of Genes and Genomes )
• http://www.genome.ad.jp/kegg/kegg2.html
2.3. Enzym - und Metabolismus - Datenbanken (3b)
• Anzeige zu Citrate Cycle
2.3. Enzym - und Metabolismus - Datenbanken (4)
• WIT ( What Is There )• http://www-unix.mcs.anl.gov/compbio/
2.3. Enzym - und Metabolismus - Datenbanken (5)
• BioCyc• http://biocyc.org/
2.4. Datenbanken für Protein - Raumstrukturen
• PDB= Protein Data Bank
• http://www.rcsb.org/pdb
2.4. Datenbanken für Protein - Raumstrukturen (2)
• Ergebnis der Suche nach :Deoxy Human Hemoglobin
2.4. Datenbanken für Protein - Raumstrukturen (3)
2.4. Datenbanken für Protein - Raumstrukturen (4)
• Entrez Structure• http://www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=Structure•
2.4. Datenbanken für Protein - Raumstrukturen (5)
• SWISS -3DIMAGE• http://www.expasy.org/sw3d/
2.5. Chemische Faktendatenbanken
• BEILSTEIN
Beilstein (2)
Beilstein (3)
2.5. Chemische Faktendatenbanken (2)
• REGISTRY
Registry (2)
• Suche
Registry (3)
• Kurzeintrag aus
SciFinder Scholar
Registry (4)
• Dokument
aus Registry
Registry (5)
• Vollanzeige
2.6. Bibliographische Datenbanken
• Web of Science
• Chemical Abstracts und Medline in SciFinder Scholar
• weitere Datenbanken
Web of Science
die Datenbank ist auch unter dem Namen
Science Citation Index bekannt
Titelanzeige im Web of Science
• Bibliographische Angaben, Abstract
Chemical Abstracts und Medline in SciFinder Scholar
Zugang zu SciFinder Scholar an der FSU Jena
• Direktzugang
• alphabetische oder systematische Liste der ThULB
SciFinder Scholar für Bioinformatiker
• SciFinder Scholar im Fachinformationsportal
Internetanleitung zu SciFinder Scholar
• Weitere Materialien
Chemical Abstracts
• http://www.cas.org/
CA in SciFinder Scholar
CA in SciFinder Scholar (2)
CA in SciFinder Scholar (3)
Medline
http://www.dimdi.de/de/db/gui/gui-freeinfo.htm
Medline beim DIMDI
Medline in SciFinder Scholar
Medline in SciFinder Scholar (2)
Medline in SciFinder Scholar (3)
Medline bei PubMed
http://www4.ncbi.nlm.nih.gov/PubMed/