Das Genom - mehr "Schrott" als Proteine

     

2,7 Milliarden Dollar für drei Milliarden Buchstaben - der weltweite Jubel über die Sequenzierung des menschlichen Genoms war teuer erkauft1. Aber es hat sich gelohnt. Denn erst nachdem auch scheinbar sinnlose Buchstaben entziffert waren, dämmerte es Genom-Forschern, dass sie eine wichtige Aufgabe erfüllen.

Die Antwort auf diese Fragen soll die Sequenzierung von noch mehr Genomen liefern. Das 1000 Genomes Project etwa ist über sein ursprüngliches Ziel hinausgeschossen und hat 2700 menschliche Genome sequenziert3. Hunderte von Tierarten sind bereits sequenziert, und tausende weitere werden noch dazu kommen. Auch vor ausgestorbenen Arten macht man nicht Halt: Ein Mammut aus der Eiszeit und sogar der Neanderthaler wurden sequenziert.

Nur scheinbar einfach: Vier Buchstaben bilden den genetischen Code, abgeleitet aus den Namen der Basen: A, T, G und C (Bild: US NLM)

Die drei Milliarden Buchstaben (oder genauer: DNA-Basen) codieren nur für eine erstaunlich geringe Zahl von Protein-Genen - nach letzter Schätzung gibt es nur wenig mehr als 20 000. Erwartet hat die Forscher bis zu 100 000. Der Mensch hat also nicht mehr Gene als die meisten Tier- und Pflanzenarten, die meist etwa 10 000 bis 30 000 Protein-Gene vorweisen können.

98 % Schrott?

Doch die Genome der meisten Tierarten sind deutlich kleiner. Nur ein Beispiel: Der winzige Wasserfloh schafft es, 31 000 Gene in 200 Millionen Basen zu verpacken. Die Zahl der Protein-Gene diktiert also nicht die Größe des Genoms. Damit ist klar: Das Genom ist mehr als eine Blaupause für Proteine.

Nur etwa 2 % des Genoms sind für die Herstellung von Proteinen zuständig. Die restlichen 98 % wurden lange Zeit als überflüssig erachtet und abschätzig als "DNA-Schrott" bezeichnet. Aber zur Über­raschung der Wissenschaftler sind diese sogenannten nicht-codierenden Bereiche äußerst aktiv: Ein großer Teil wird regelmäßig abgelesen und ermöglicht die Produktion von RNA, dem Schwestermolekül der DNA2. Die Funktion der meisten dieser RNAs bleibt jedoch unbekannt.

Werbung

Was aber auffällt: Je komplexer ein Organismus, desto größer sein Genom. Das Erbgut von Säugetieren etwa enthält wesentlich mehr Buchstaben als das von Insekten, aber eine ähnlich hohe Zahl an Protein-Genen: Die Genome unterscheiden sich also vor allem in den nicht-codierenden Bereichen. Die Komplexität von Lebewesen und der "DNA-Schrott" hängen also irgendwie zusammen - aber auch hier gibt es mehr offene Fragen als Antworten.

Aufwand und Kosten der DNA-Sequenzierung sind heute auf Bruchteile zusammengeschrumpft, die jüngsten menschlichen Genomsequenzen haben gerade mal noch 5 000 Dollar gekostet. Mit der neuesten Technologie sollen Preise von 1000 US ­$ realistisch sein - die Kosten stehen der Sequenzierwut also nicht im Wege.

Vielleicht werden Wissenschaftler ja wirklich bald so viel Daten gesammelt haben, dass die vollständige Funktion des Genoms entschlüsselt werden kann. Doch wahrscheinlicher ist, dass noch für sehr lange Zeit viele Rätsel des Genoms ungelöst bleiben.

1 The International Human Genome Mapping Consortium, Nature 2001, vol. 409, pp. 934-941 (link)
2 The ENCODE Project Consortium, Nature 2007, vol. 447, pp. 799-816 (link)
3 Genomes by the thousand, Nature 2010, vol. 467, pp. 1026-27 (link)
Nur scheinbar einfach: Vier Buchstaben bilden den genetischen Code, abgeleitet aus den Namen der Basen: A, T, G und C (Bild: US NLM)
Werbung

Mehr...

  • Das Gen: Ein überholtes Konzept? mehr...
  • Das Chromosom: Organisator der Erbinformation mehr...
  • Das ENCODE-Projekt: 80 % des Genoms sind aktiv mehr...
  • SNPs: Einzigartige Markierungen im Genom mehr...
  • Epigenetik: Wie die Umwelt das Genom formt mehr...
  • Tumorgenome: Grundlage für neue Therapien? mehr...
  • Gene und Sex: Vom Sinn der geschlechtlichen Fortpflanzung mehr...

Häufig besucht

zellstoff - der Blog

28. September
Neue Krebstherapien kosten Milliarden - oder nur hunderte Millionen?
Eine Analyse rechnet vor, was die Entwicklung neuer Medikamente kostet. Das Ergebnis liegt deutlich unter bisherigen Schätzungen - doch der Ansatz ist umstritten.
mehr...

Kurz und knapp 

  • das menschliche Genom umfasst 3 Milliarden Buchstaben und etwa 20 000 Proteingene
  • nur aus einem kleinen Teil des Genoms entstehen Proteine, doch ein großer Teil wird in RNA umgeschrieben