Die Entstehung des genetischen Codes (1/2)

Zufall oder perfektes Design – was sagt die Wissenschaft?

Die Entstehung des genetischen Codes (1/2)

Foto: Pixabay.com / geralt

Die Evolution des genetischen Codes bleibt rätselhaft. Ist er ein „eingefrorener Zufall“, wie der Nobelpreisträger Francis CRICK vor 50 Jahren annahm? Ist er das Ergebnis natürlicher Wechselwirkungen zwischen RNA-Molekülen und Aminosäuren? Oder ist er das Ergebnis eines Optimierungsprozesses? In der Fachwelt herrscht nur Konsens darüber, dass er sich in mehreren Schritten entwickelte und weniger zufällig zu sein scheint, als CRICK glaubte. Gelegentlich wird behauptet, der Code sei „optimal“ und seine Perfektion ein Indiz für seinen intelligenten Ursprung. Die These zweier Wissenschaftler, seine Struktur sei statistisch so auffällig, dass sie als Signale außerirdischer Urheber zu werten seien, schaffte es sogar in eine referierte Fachzeitschrift! Was ist dran an solchen Behauptungen? Bevor wir Argumente bemühen, müssen wir erörtern, was der genetische Code ist und diskutieren, was er über seine Entstehung verrät.

Was ist der genetische Code?

Einfach ausgedrückt beschreibt der genetische Code die Art, wie lebende Zellen die Abfolge der „Buchstaben“ auf dem Erbmolekül in eine Abfolge von Aminosäuren (Proteine) übersetzen. Streng genommen definiert er, welche Sorte von Aminosäure-Transporter mit welcher Sorte Aminosäure „beladen“ wird – doch der Reihe nach.

Proteine sind lange Ketten von Aminosäuren, die sich je nach Abfolge ihrer Einzelbausteine (Sequenz) charakteristisch falten. Je nach Faltung und Sequenz erfüllen sie die verschiedensten Funktionen. Sie sind die universellen Bauelemente aller Organismen: Als Strukturproteine dienen sie Geweben und Zellen als Gerüststoffe (z. B. Keratin und Kollagen); als Enzyme treiben sie verschiedenste Stoffwechselprozesse voran; als Immunglobuline (Antikörper) wiederum erkennen und binden sie körperfremde Stoffe.

Um Proteine herzustellen, schreiben die Zellen die in den Genen der DNA gespeicherte „Information“ in sogenannte Boten-RNA (mRNA) um. Wie die DNA so ist auch die zum abgelesenen DNA-Strang komplementäre mRNA ein Kettenmolekül. Die Bausteine dieser Kette sind die Nukleotide, die über ein „Rückgrat“ aus Ribose-Zucker und Phosphat-Einheiten miteinander verbunden sind. Jedes Nukleotid trägt einen „Buchstaben“ in Gestalt einer der vier Nukleinbasen Adenin, Uracil, Guanin und Cytosin (kurz: A, U, G und C). Je drei dieser Buchstaben (Basentripletts oder Codons) bilden sozusagen ein „Wort“, das für eine bestimmte Aminosäure codiert (Abb. 1).

In den Protein-Fabriken der Zellen, den sogenannten Ribosomen, werden die verschiedenen mRNA-Stränge „abgelesen“. Dabei wird an jedes Codon ein dazu passender Aminosäure-Transporter angelagert, der Transfer-RNA oder tRNA genannt wird. Jede Sorte tRNA ist mit einer bestimmten Sorte Aminosäure beladen und besitzt ein charakteristisches Basentriplett, welches das komplementäre(1) Gegenstück eines der mRNA-Codons bildet. Entsprechend wird es Anti-Codon genannt.

Die Ribosomen bringen die Codons der mRNA und die korrespondierenden Anti-Codons der tRNA so zusammen, dass sie passend aneinander binden. Dann werden die Aminosäuren der nebeneinander aufgereihten tRNA-Moleküle chemisch verknüpft – so wächst das neue Protein schrittweise, das heißt um eine Aminosäure nach der anderen (Abb. 2). Dies geschieht solange, bis ein Stopp-Signal das Ribosom „anweist“, die Synthese zu beenden.

Abb. 1 Die „Sonne“ des genetischen Codes: Die Buchstaben im innersten Kreis stehen für die 1. Base eines mRNACodons, die im mittleren Ring für die zweite und die im äußeren Ring für die dritte CodonBase. So steht zum Beispiel das Codon GUA auf der mRNA für eine Aminosäure namens Valin (Val).

Insgesamt existieren 4³ = 64 Möglichkeiten, die vier Buchstaben zu Basentripletts (Codons bzw. Anticodons) anzuordnen – und damit theoretisch für etwa 60 mögliche Aminosäuren zu codieren. Es existieren aber nur 20 proteinogene („kanonische“) Aminosäuren, die genetisch codiert sind. Folglich entfallen (von zwei Ausnahmen abgesehen) auf jede Aminosäure mehrere Codons – in der Regel je zwei oder vier. Im Fachjargon wird dieser Code als degeneriert bezeichnet. Damit ist gemeint, dass bezüglich der Aminosäuren keine eindeutige Code-Zuordnung existiert. Dazu kommen drei Stopp-Codons, die der Zelle „anzeigen“, wenn die ProteinSynthese komplett ist.

Abb. 2 Schema zur Protein-Herstellung. Zunächst wird von dem betreffenden Gen auf der DNA, dessen „Buchstaben“Abfolge für das entsprechende Protein codiert, eine Kopie in Form einer Boten-RNA (mRNA-Strang) angelegt. Dabei codieren jeweils drei benachbarte Nukleinbasen (A, U, G oder C), die sog. Codons oder Basentripletts, für eine bestimmte Aminosäure. Als „Transporter“ für die Aminosäuren fungiert die so genannte Transfer-RNA (tRNA). Jede Sorte ist mit einer bestimmten Aminosäure beladen und kann mit einem Ende (dem so genannten Anti-Codon) an genau einem der Basentripletts auf der mRNA andocken. Das Ribosom bringt die mRNA und eine beladene tRNA so zusammen, dass sich das Basentriplett auf der mRNA und das dazu passende (komplementäre) Anti-Codon der tRNA aneinanderlagern. Die Aminosäuren zweier benachbarter tRNAs werden dann miteinander verknüpft. Dann lagert sich das nächste passende tRNA-Molekül an die mRNA an, wobei die entsprechende Aminosäure an die bereits bestehende Aminosäurekette geknüpft wird. Dieser Prozess setzt sich so lange fort, bis ein Stopp-Codon den Prozess unterbricht.

Einige Besonderheiten des genetischen Standardcodes

Theoretisch gesehen existieren 2064 mögliche Zuordnungen zwischen 20 Aminosäuren und 64 Basentripletts. Anders gesagt, es existieren mehr als 1083 denkbare Alternativen zum genetischen Code! Das ist eine ungeheuer große Zahl; sie ist größer als die Anzahl aller Elementarteilchen im sichtbaren Universum. Umso erstaunlicher, dass alle heutigen Lebewesen, wenn man von seltenen Abweichungen im Detail absieht, nur die in Abb. 1 beschriebene Zuordnung des genetischen Codes besitzen.

Diese Universalität des genetischen Standardcodes legt nahe, dass er sich schon sehr früh in seiner Geschichte voll ausdifferenzierte und dann „fixiert“ wurde. In den letzten 3,5 Mrd. Jahren scheint er sich nur noch in wenigen Taxa geringfügig verändert zu haben; der genetische Standardcode entspricht also genau jenem Code, den der letzte gemeinsame Vorfahr aller heutigen Lebensformen (LUCA) besaß.

Warum ausgerechnet dieser Code? Ist er ein eingefrorener Zufall (frozen accident)? Dagegen spricht, dass sich der Standardcode im Vergleich zu allen möglichen Zufallscodes als sehr robust erweist: Nur ein einziger unter einer Million zufälliger Code-Schlüssel würde weniger Fehler erlauben als der Code von LUCA (VOGEL 1998).

Eine andere Hypothese besagt, dass die Aminosäuren aufgrund ihrer individuellen chemisch-strukturellen Eigenschaften eine Affinität zu bestimmten Codons aufweisen. Vertreter dieses sogenannten stereochemischen Modells halten es für plausibel, dass sich der genetische Code zunächst aus einem Ensemble sich selbst vermehrender RNA-Moleküle (sogenannter Ribozyme) organisierte, die direkt (ohne Umweg über einen „Transporter“) bestimmte Aminosäuren binden. Experimentelle Daten, die diese Interpretation stützen, erbrachte eine am Department für Biology und Chemie/Biochemie der University of Colorado ansässige Forschergruppe:

YARUS, WIDMANN & KNIGHT (2009) rekonstruierten die Struktur RNA-gebundener Aminosäuren und die spezifischen Wechselwirkungen zwischen Aminosäuren und RNA. Die bevorzugt auftretenden Beziehungen wurden dann darauf untersuchen, ob die Bindungsstellen Ähnlichkeiten mit dem genetischen Code aufweisen. Es wurde geprüft, ob sie der heutigen Verknüpfung zwischen Aminosäuren und den jeweiligen Anticodons auf der tRNA entsprechen. Dabei ergab sich eine robuste, gegenüber Störfaktoren wenig anfällige Beziehung zwischen den Aminosäuren und den erkennenden Basentripletts in bzw. nahe den analysierten RNA-Bindungsstellen. Die Wahrscheinlichkeit, dass die Basentripletts mit den RNA-Bindungsstellen der Aminosäuren in rein zufälligem Zusammenhang standen, erwies sich als äußerst gering.

Allerdings fanden sich solche Beziehungen nur für eine geringe Anzahl Codons. Dies legt nahe, dass es in der Evolution des Codes zwar eine stereochemische Ära gegeben haben könnte, die auf Unterschieden in der Stabilität der Bindung zwischen Aminosäuren und Tertiärstrukturen der RNA-Bindungsstellen basierte. Doch das stereochemische Modell kann sicher nicht die alleinige Erklärung liefern.

Vieles deutet darauf hin, dass die Zuordnung zwischen Codons und Aminosäuren irgendwie in der Evolution auf diese Formen hin adaptiv optimiert wurde.

Was verrät der genetische Code über seine Entstehung?

Wie kann man sich die allmähliche Differenzierung des genetischen Codes vorstellen? Francis CRICK vertrat die Hypothese, dass dem heutigen (kommafreien) TriplettCode ein Triplett basierter DublettCode „mit Komma“ voranging, das heißt ein solcher, bei dem die dritte Base bedeutungsleer ist.(2)  Dies ist heute noch bei einer Reihe von Aminosäuren der Fall, zum Beispiel bei Glycin, Alanin, Serin und Valin. Ein solcher Code hätte 4²=16 Codons, wäre also für maximal 15 Aminosäuren ausreichend.

Dass es sich hier meist um Aminosäuren handelt, die sich unter abiotischen Bedingungen im Labor (in „UrsuppenExperimenten“) sowie bei Vulkanausbrüchen in größter Menge bilden, ist äußerst bemerkenswert (Tab.1; modifiziert nach KAISER 2009).

Tabelle 1 Aminosäuren, die sich unter abiotischen Bedingungen (im Labor) und bei Vulkanausbrüchen am häufigsten bilden sowie in Proteinen durchschnittlich am häufigsten vertreten sind. Häufigkeit von oben nach unten abnehmend.

 

Abiotische Experimente

In steriler Vulkanlava

Durchschnitt in Proteinen

Glycin

Glycin

Alanin

Alanin

Alanin

Glycin

Glutaminsäure

Glutaminsäure

Leucin

Asparaginsäure

Asparaginsäure

Serin, Lysin

Serin

Serin

Valin

Valin

Leucin, Valin

Asparaginsäure

 

 

Dies spricht dafür, dass anfangs kaum mehr als eine Handvoll natürlich gebildeter Aminosäuren am Proteinaufbau beteiligt war:

„J. T. WONG (1975) hat das komplexe Muster und die biosynthetischen ‚Familien’ der 20 Aminosäuren scharfsinnig analysiert und erkannt, dass sich ein genetischer Apparat zuerst nur mit wenigen (6–8) Aminosäuren zum Aufbau primitiver Proteine etabliert hat, so dass sich Replikationsfehler in DNA bzw. RNA – die zu Anfang sicher sehr häufig waren – in dem weitgehend degenerierten UrCode wenig auswirkten. Später gingen einige Codons der Ur-Aminosäuren auf neue, von ihnen biosynthetisch abgeleitete über, wie z. B. im Fall von Glutaminsäure zu Glutamin, Prolin und anderen. Ein Vergleich der so identifizierten primären mit den abiotisch am meisten gefundenen und den häufigsten in durchschnittlichem Protein ist verblüffend (FOLLMANN 1999, S. 51).

Einige Wissenschaftler sind sogar der Meinung, dass zum Entstehungszeitpunkt lediglich die mittlere Base eines Codons für die vier häufigsten abiotischen Aminosäuren (Glycin, Alanin, Glutamin und Asparaginsäure) codierte. Dieser Code hätte sich schrittweise über einen Dublett-Code mit bedeutungsleerer erster oder dritter Codon-Base zum heutigen Triplett-Code expandiert (WU, BAGBY & VAN DEN ELSEN 2005).

Die Vorzüge dieses Entstehungsmodells bestehen darin, dass es zwanglos die Nähe von Glutaminsäure und Asparaginsäure sowie von Glutamin und Asparagin und Asparaginsäure und Asparagin erklären würde, ebenso die Einzel-Codons für Tryptophan und Methionin: Sie zweigten von Isoleucin bzw. von einem Stopp-Codon ab. Dabei werden unvermeidlich ähnliche Codons für chemisch ähnliche Aminosäuren codieren, andernfalls würde die Differenzierung ins Chaos münden.

Es würde ebenfalls erklären, warum die mittleren Code-Basen blockweise für Aminosäuren mit ähnlichen Eigenschaften codieren: Im heutigen Code steht „U“ als mittlere Base zum Beispiel für die hydrophoben Aminosäuren, „C“ für die intermediären sowie „G“ und „A“ für die polaren und amidischen Aminosäuren. Diese Differenzierung geschah durch natürliche Selektion, so dass einige „merkwürdige“ Reminiszenzen, wie etwa die sechs Codons für Arginin, Leucin und Serin, übrigblieben.

Warum codiert der TriplettCode nur für 20 Aminosäuren?

WU, BAGBY & VAN DEN ELSEN (2005) gehen davon aus, dass ein primordialer Code, in dem lediglich die mittlere Base informationstragend war, zunächst in einen Dublett-Code mit zwei verschiedenen Sorten Codons expandierte: Bei der einen Sorte war die dritte Codon-Base bedeutungsleer (Präfix-Codon), bei der anderen Sorte die erste Codon-Base (Suffix-Codon). Ein solcher Code besäße 2 x 16 = 32 Codons. Als Beleg für ihr Modell führen sie an, dass noch heute Relikte solcher Präfix und Suffix-Codons zu existieren scheinen, und zwar in Form spezieller Enzyme.

Um die Transporter (tRNA) mit Aminosäuren zu „beladen“, braucht es sogenannte Aminoacylt-RNA-Synthetasen (kurz: RS). Eine Besonderheit ist, dass einige RS (ThrRS, ProRS und ValRS) ihre tRNA anhand ihrer ersten beiden Anti-Codon-Basen „erkennen“, andere wiederum anhand der letzten beiden Basen (Abb. 3). Interessanterweise existieren auch RS, die unabhängig vom Anti-Codon ihre tRNA „erkennen“. AlaRS, SerRS und LeuRS nutzen andere Strukturmotive, nämlich die Haarnadelschleife und den „Kleeblattstiel“ der tRNA. WU et al. (2005) sehen darin einen Beleg dafür, dass der primordiale Code nur für wenige kurzkettige Aminosäuren codierte.

Abb. 3 Die RS für die Aminosäuren Threonin, Prolin und Valin interagieren nur mit den ersten beiden AntiCodonBasen (PräfixCodons). Bei dem gramnegativen Bakterium Thermus thermophilus hingegen existieren RS, die „ihre“ tRNAMoleküle nur an den letzten beiden CodonBasen „erkennen“. Nach WU, BAGBY & VAN DEN ELSEN (2005, S. 60).

Die Autoren untersuchten nun, was passieren würde, wenn die zwei Sorten Dublett-Codons (Präfix und Suffix-Codons) zu heutigen Triplett-Codons expandierten: Theoretisch entstünden daraus zwei identische Triplett-Codes. Die praktische Konsequenz wäre, dass die 16 überlappenden Codon-Zuweisungen aus jeder Sorte um Positionen im neuen Triplett-Code konkurrieren würden. Gesetzt den Fall, die Präfix-Codons würden an der dritten Position allen vier möglichen Basen jeweils eine andere Aminosäure (oder Stopp-Signal) zuweisen und selbiges würde spiegelbildlich für die Suffix-Codons gelten, ergäben sich 32 Codierungen (WU et al. 2005, S. 57.)

Nun hat es einen Selektionsvorteil, wenn überlappende Präfix und Suffix-Codons für Aminosäuren mit ähnlichen physikalisch-chemischen Eigenschaften codieren. Dies macht die Translation weniger anfällig für Fehler und verhindert, dass die „Zusammenführung“ der überlappenden Dublett-Codons zum heutigen Triplett-Code zu einer „Translations-Krise“ führt. Zudem erweist es sich als vorteilhaft, wenn die Präfix-Codons nach ihrer Expansion an der letzten Basen-Position nicht zwischen allen vier Codon-Basen, sondern nur zwischen Pyrimidin und Purin-Basen unterscheiden. So codieren zum Beispiel C/U sowie A/G an dritter Basen-Position bei ansonsten gleichen Basen fast immer für dieselbe Aminosäure. Damit ergeben sich statt der 32 nur noch 24 mögliche Codierungen (vgl. WU, BAGBY & VAN DEN ELSEN 2005, S. 58f.).

Somit bietet dieses Entstehungsmodell Raum für etwas weniger als zwei Dutzend Aminosäuren. Das ist genau das, was man beobachtet: Ein Triplett-Code mit 64 Codons und 20 Aminosäuren, wobei die Hälfe der Codons (wegen der Zusammenführung von Präfix und Suffix-Codons) zweifach degeneriert ist und rund ein Viertel (wegen der ungleichen Expansion von Präfix und Suffix-Codons) vierfach: Je zwei oder vier Codons stehen für die gleiche Aminosäure.

Alles in allem scheint der genetische Standardcode ein Mischgebilde basierend auf stereochemischen Gesetzmäßigkeiten, adaptiver Optimierung mit schrittweiser Differenzierung und „frozen accident“ zu sein (KOONIN 2017). Unter Einbeziehung dieser Aspekte präsentiert KOONIN ein experimentell prüfbares Entstehungs-Modell. Es kombiniert eine bestimmte Version des stereochemischen Modells, wonach Aminosäuren durch bestimmte Strukturmotive in Protot-RNAs „erkannt“ werden, mit der Expansion des genetischen Codes via tRNA-Duplikation und der Idee des „frozen accidents“.

Fortsetzung in Teil 2.

Dipl.-Ing. Martin Neukamm ist Chemie-Ingenieur an der TU München und geschäftsführender Redakteur der AG Evolutionsbiologie im Verband Biologie, Biowissenschaften und Biomedizin in Deutschland. Er ist Herausgeber mehrerer Bücher darunter „Darwin heute: Evolution als Leitbild in den modernen Wissenschaften“.

AG Evolutionsbiologie Youtube-Kanal und Facebook-Seite.

Fußnoten

(1) Komplementarität bedeutet, dass sich Codons und Anti-Codons nach dem Schlüssel-Schloss-Prinzip perfekt paaren. Das ist gegeben, wenn sich stets die Nukleinbasen A/U bzw. G/C gegenüberliegen.

(2) Heute wird angenommen, dass das Translationssystem als Triplett basierte Maschine entstand, da eine korrekte Positionierung der Anti-Codon-Schleife im Ribosom aus stereochemischen und thermodynamischen Gründen mit zwei Codon-Basen nicht mehr gewährleistet ist (GUSEV & SCHULZE-MAKUCH 2004). Dies schließt keineswegs die Entstehung eines Dublett-Codes „mit Komma“ aus, in dem nur die ersten beiden Codon-Basen informativ sind (PATEL 2005; IKEHARA & NIIHARA 2007).

Hier geht's zum Originalartikel...

Kommentare

  1. userpic
    Rom

    Um die Antwort zu erahnen muss man sich nicht wie der Autor ins jede Detail der Genetik vertiefen. Es reicht sich die Feder eines Papageien anzuschauen um zu sagen das diese Perfekte Konstruktion nicht durch Zufall alleine entstanden sein kann, um so mehr als die Natur nur aus solchen Zufällen besteht. Das freut die Kreationisten und wurmt die Atheisten. Mann muss sich aber nur die Zeitleiste der Entwicklung/Evolution anzuschauen um einen allwissenden Schöpfer auszuschließen. Gäbe es so einen so würde man meinen sollten seine "Schöpfungen" wie aus dem Nichts fertig entwickelt auftauchen. Dem ist aber so nicht, die ganze Evolutionsgeschichte ist voller Fehler und Sackgassen wie man gut aus den Relikten der Archäologie erkennen kann. Die ersten 1,5 Milliarden Jahre ist nicht viel was man nicht nur durch Zufall erklären könnte passiert(Viren, Bakterien, Algen und so ein Kram). Erst vor 2,1 Milliarden Jahren als die Mehrzeller auftauchen beginnt sich die Geschichte zu beschleunigen. Wie in der Forschung bewiesen besitzen diese schon rudimentäre Rechenleistung und können gezielt auf die Umwelt reagieren. Sogar mit Zielgerichteter Veränderung der Gene. All diese Werkzeuge gingen nicht verloren sonder haben sich weiterentwickelt und sind in jedem Wesen auch uns weiter vorhanden und tätig. Der wirkliche Boom ereignet sich aber erst vor ca 500 Millionen Jahren als durch die Entwicklung des Nervensystems eine Steigerung der Rechenleistung erfolgt was zur Explosion der Diversität und Qualität führt. Nachgewiesen ist, das Botenstoffe wie Dopamin und viele andere Gene ein und ausschalten. Womit bewiesen ist das auch wir unsere Entwicklung obwohl unbewusst bis auf die DNA steuern. Insofern ist die gesamte Pracht der Natur meines Erachtens Folge intelligenter Selbstorganisation der Organismen.

    Antworten

    Neuer Kommentar

    (Mögliche Formatierungen**dies** für fett; _dies_ für kursiv und [dies](http://de.richarddawkins.net) für einen Link)

    Ich möchte bei Antworten zu meinen Kommentaren benachrichtigt werden.

    * Eingabe erforderlich