Cladogram

Ein cladogram ist ein Diagramm, das in cladistics verwendet ist, der Beziehungen unter Organismen zeigt. Ein cladogram ist nicht jedoch ein Entwicklungsbaum; viele Entwicklungsbäume können aus einem einzelnen cladogram abgeleitet werden. Ein cladogram verwendet Linien dass Zweig von in verschiedenen Richtungen, die an Gruppen von Organismen enden. Es gibt viele Gestalten von cladograms, aber sie alle haben Linien dass Zweig von von anderen Linien. Die Linien können zurück dazu verfolgt werden, wo sie Zweig von und diese, sich von Punkten verzweigend, sind, wo, wie man glaubt, ein gemeinsamer Ahne bestanden hat. Obwohl traditionell solche cladograms größtenteils auf der Grundlage von morphologischen Charakteren, DNA und RNS sequencing Daten erzeugt wurden und rechenbetonte phylogenetics jetzt in der Generation von cladograms sehr allgemein verwendet werden.

Das Erzeugen eines cladogram

Ein sehr vereinfachtes Verfahren, für einen cladogram zu erzeugen, ist:

  1. Sammeln Sie und organisieren Sie Daten
  2. Denken Sie möglichen cladograms
  3. Wählen Sie besten cladogram aus

Schritt 1: Sammeln Sie und organisieren Sie Daten

Eine cladistic Analyse beginnt mit den folgenden Daten:

  • eine Liste von taxa (zum Beispiel, Arten), um organisiert zu werden
  • eine Liste von Eigenschaften, die zu vergleichen
sind
  • für jeden taxon setzt der Wert von jeder der verzeichneten Eigenschaften oder des Charakters fest

Zum Beispiel, als sie 20 Arten von Vögeln analysiert haben, könnten die Daten sein:

  • die Liste der 20 Arten
  • Eigenschaften wie Genom-Folge, Skelettanatomie, biochemische Prozesse und Feder-Färbung
  • für jede der 20 Arten, seiner besonderen Genom-Folge, Skelettanatomie, biochemischen Prozesse und Feder-Färbung

Alle Daten werden dann in eine "taxon-Buchstaben Matrix" organisiert, die die Basis ist, um phylogenetic Analyse durchzuführen.

Molekular gegen morphologische Daten

Die Eigenschaften, die verwendet sind, um einen cladogram zu schaffen, können als irgendein morphologisch (synapsid Schädel, warm Vollblut-, notochord, einzellig, usw.) oder molekular (DNA, RNS oder andere genetische Information) grob kategorisiert werden. Vor dem Advent der DNA sequencing hat die ganze cladistic Analyse morphologische Daten verwendet.

Als DNA ist sequencing preiswerter geworden, und leichtere, molekulare Systematik ist eine immer populärere Weise geworden, phylogenies wieder aufzubauen. Das Verwenden eines Geiz-Kriteriums ist nur eine von mehreren Methoden, einen phylogeny aus molekularen Daten abzuleiten; maximale Wahrscheinlichkeit und Schlussfolgerung von Bayesian, die ausführliche Modelle der Folge-Evolution vereinigen, sind non-Hennigian Weisen, Folge-Daten zu bewerten. Eine andere starke Methode, phylogenies wieder aufzubauen, ist der Gebrauch von genomic retrotransposon Anschreiber, die, wie man denkt, für das Problem des Rückfalls diese Plage-Folge Daten weniger anfällig sind. Wie man auch allgemein annimmt, haben sie ein niedriges Vorkommen von homoplasies, weil es einmal gedacht wurde, dass ihre Integration ins Genom völlig zufällig war; das scheint mindestens manchmal, jedoch nicht der Fall zu sein.

Plesiomorphies und synapomorphies

Der Forscher muss entscheiden, welche Charakter-Staaten vor dem letzten gemeinsamen Ahnen der Art-Gruppe (plesiomorphies) da gewesen sind, und die im letzten gemeinsamen Ahnen (synapomorphies) da gewesen sind und also vergleichsweise zu einem oder mehr outgroups tun. Die Wahl eines outgroup ist ein entscheidender Schritt in der cladistic Analyse, weil verschiedener outgroups Bäume mit tief verschiedenen Topologien erzeugen kann. Bemerken Sie, dass nur synapomorphies von Nutzen im Charakterisieren clades sind.

Vermeiden Sie homoplasies

Ein homoplasy ist ein Charakter, der durch vielfache Arten wegen einer Ursache außer der allgemeinen Herkunft geteilt wird. Die zwei Haupttypen von homoplasy sind Konvergenz (Äußeres desselben Charakters in mindestens zwei verschiedenen Abstammungen) und Rückfall (die Rückkehr zu einem Erbcharakter). Der Gebrauch von homoplasies, wenn er einen cladogram baut, ist manchmal unvermeidlich, aber soll wenn möglich, vermieden werden.

Ein weithin bekanntes Beispiel von homoplasy wegen der konvergenten Evolution würde der Charakter, "Anwesenheit von Flügeln sein". Obwohl die Flügel von Vögeln, Fledermäusen und Kerbtieren derselben Funktion, jeder entwickelt unabhängig dienen, wie durch ihre Anatomie gesehen werden kann. Wenn ein Vogel, Fledermaus und ein geflügeltes Kerbtier für den Charakter eingekerbt wurden, "die Anwesenheit von Flügeln" würde ein homoplasy in den dataset eingeführt, und das würde die Analyse verwechseln, vielleicht auf ein falsches Entwicklungsdrehbuch hinauslaufend.

Homoplasies kann häufig völlig in morphologischem datasets durch das Definieren von Charakteren genauer und das Steigern ihrer Zahl vermieden werden. Wenn es "Superbäume" (datasets analysiert, so viele taxa eines verdächtigten clade wie möglich vereinigend), kann es unvermeidlich werden, Charakter-Definitionen einzuführen, die ungenau sind, weil sonst die Charaktere überhaupt für eine Vielzahl von taxa nicht gelten könnten; um mit dem "Flügel"-Beispiel weiterzugehen, würde die Anwesenheit von Flügeln ein nützlicher Charakter kaum sein, wenn sie einen phylogeny ganzen Metazoa versucht, weil die meisten von diesen Flügel überhaupt nicht haben. Vorsichtige Wahl und Definition von Charakteren sind so ein anderes wichtiges Element in Cladistic-Analysen. Mit einem fehlerhaften outgroup oder Codierung wird keine Methode der Einschätzung wahrscheinlich einen phylogeny das Darstellen der Entwicklungswirklichkeit erzeugen.

Schritt 2: Denken Sie möglichen cladograms

Wenn es gerade einige Arten gibt, die organisieren werden, ist es möglich, diesen Schritt manuell zu tun, aber die meisten Fälle verlangen ein Computerprogramm. Es gibt Hunderte von Computerprogrammen, die verfügbar sind, um cladistics zu unterstützen. Sieh phylogenetic Baum für mehr Information über baumerzeugende Computerprogramme.

Weil die Gesamtzahl von möglichem cladograms factorially mit der Zahl der Arten anbaut, ist es für ein Computerprogramm unpraktisch, um jeden individuellen cladogram zu bewerten. Ein typisches cladistic Programm beginnt durch das Verwenden heuristischer Techniken, um eine kleine Zahl vom Kandidaten cladograms zu identifizieren. Viele cladistic Programme setzen dann die Suche mit den folgenden wiederholenden Schritten fort:

  1. Bewerten Sie den Kandidaten cladograms, indem Sie sie mit den charakteristischen Daten vergleichen
  2. Erkennen Sie die besten Kandidaten, die mit den charakteristischen Daten am meisten im Einklang stehend
sind
  1. Schaffen Sie zusätzliche Kandidaten, indem Sie mehrere Varianten von jedem der besten Kandidaten vom vorherigen Schritt schaffen
  2. Verwenden Sie Heuristik, um mehreren neuen Kandidaten cladograms ohne Beziehung zu den vorherigen Kandidaten zu schaffen
  3. Wiederholen Sie diese Schritte, bis die cladograms aufhören, besser zu werden

Computerprogramme, die Cladograms-Gebrauch-Algorithmen erzeugen, die sehr rechenbetont intensiv sind, weil das cladogram Problem NP-hard ist.

Schritt 3: Wählen Sie besten cladogram aus

Es gibt mehrere Algorithmen, die verfügbar sind, um den "besten" cladogram zu identifizieren. Die meisten Algorithmen verwenden einen metrischen, um zu messen, wie konsequent ein Kandidat cladogram mit den Daten ist. Die meisten cladogram Algorithmen verwenden die mathematischen Techniken der Optimierung und Minimierung.

Im Allgemeinen, cladogram Generationsalgorithmen muss als Computerprogramme durchgeführt werden, obwohl einige Algorithmen manuell durchgeführt werden können, wenn die Dateien (zum Beispiel, gerade einige Arten und einige Eigenschaften) trivial sind.

Einige Algorithmen sind nur nützlich, wenn die charakteristischen Daten (DNA, RNS) molekular sind; andere Algorithmen sind nur nützlich, wenn die charakteristischen Daten morphologisch sind. Andere Algorithmen können verwendet werden, wenn die charakteristischen Daten sowohl molekulare als auch morphologische Daten einschließen.

Algorithmen für cladograms schließen kleinste Quadrate, Nachbarverbinden, Geiz, maximale Wahrscheinlichkeit und Schlussfolgerung von Bayesian ein.

Biologen gebrauchen manchmal den Begriff Geiz für eine spezifische Art des cladogram Generationsalgorithmus und manchmal als ein Überbegriff für alle cladogram Algorithmen.

Algorithmen, die Optimierungsaufgaben durchführen (wie Gebäude cladograms) können zur Ordnung empfindlich sein, in der die Eingangsdaten (die Liste der Arten und ihrer Eigenschaften) präsentiert wird. Das Eingeben der Daten in verschiedenen Ordnungen kann denselben Algorithmus veranlassen, verschiedenen "besten" cladograms zu erzeugen. In diesen Situationen sollte der Benutzer die Daten in verschiedenen Ordnungen eingeben und die Ergebnisse vergleichen.

Das Verwenden verschiedener Algorithmen auf einer einzelnen Datei kann manchmal verschiedenen "besten" cladograms nachgeben, weil jeder Algorithmus eine einzigartige Definition dessen haben kann, was "am besten" ist.

Wegen der astronomischen Zahl von möglichem cladograms können Algorithmen nicht versichern, dass die Lösung die gesamte beste Lösung ist. Ein nichtoptimaler cladogram wird ausgewählt, wenn sich das Programm auf einem lokalen Minimum aber nicht dem gewünschten globalen Minimum niederlässt. Um zu helfen, dieses Problem zu beheben, verwenden viele cladogram Algorithmen eine vorgetäuschte Ausglühen-Annäherung, um die Wahrscheinlichkeit zu vergrößern, dass der ausgewählte cladogram der optimale ist.

Statistik von Cladogram

Konsistenz-Index

Der Konsistenz-Index (CI) misst den Betrag von homoplasy in einem cladogram. Es wird durch das Zählen der minimalen Zahl von Änderungen in einem dataset und das Teilen davon durch die wirkliche Zahl von auf dem cladogram erforderlichen Änderungen berechnet.

Retentionsindex

Der Retentionsindex (RI) ist auch ein Maß des Betrags von homoplasy sondern auch misst, wie gut synapomorphies den Baum erklären. Es wird berechnet, das Produkt der maximalen Zahl von Änderungen auf einem Baum und der Zahl von Änderungen auf dem Baum nehmend, der durch das Produkt der maximalen Zahl von Änderungen auf dem Baum und der minimalen Zahl von Änderungen im dataset geteilt ist.

Der wiederschuppige Retentionsindex (FERNSTEUERUNG) wird durch das Multiplizieren des CI durch den RI erhalten. Der Homoplasy-Index (HI) ist einfach 1-CI.

Länge-Unterschied-Test von Incongruence (oder Teilungsgleichartigkeitstest)

Der incongruence Länge-Unterschied-Test (ILD) ist ein Maß dessen, wie die Kombination von verschiedenem datasets (z.B morphologisch und molekular, plastid und Kerngene) zu einem längeren Baum beiträgt. Es wird durch das erste Rechnen der Gesamtbaumlänge jeder Teilung und des Summierens von ihnen gemessen. Dann wiederholt werden durch das Bilden von zufällig gesammelten Teilungen gemacht, die aus den ursprünglichen Teilungen bestehen. Die Längen werden summiert. Ein p Wert von 0.01 wird für 100 erhalten wiederholt, wenn 99 wiederholt, haben längere vereinigte Baumlängen.


Randal L. Schwartz / Gehen Sie Strategie und Taktik
Impressum & Datenschutz