Struktureller genomics

Struktureller genomics bemüht sich, die 3-dimensionale Struktur jedes durch ein gegebenes Genom verschlüsselten Proteins zu beschreiben. Diese Genom-basierte Annäherung berücksichtigt eine Methode des hohen Durchflusses des Struktur-Entschlusses durch eine Kombination von experimentellen und modellierenden Annäherungen. Der Hauptunterschied zwischen strukturellem genomics und traditioneller Strukturvorhersage ist, dass struktureller genomics versucht, die Struktur jedes durch das Genom verschlüsselten Proteins zu bestimmen, anstatt sich auf ein besonderes Protein zu konzentrieren. Mit verfügbaren Folgen des vollen Genoms kann Struktur-Vorhersage schneller durch eine Kombination von experimentellen und modellierenden Annäherungen besonders getan werden, weil die Verfügbarkeit der Vielzahl von sequenced Genomen und vorher gelösten Protein-Strukturen Wissenschaftlern der Musterprotein-Struktur auf den Strukturen vorher gelösten homologs erlaubt.

Weil Protein-Struktur mit der Protein-Funktion nah verbunden wird, hat der strukturelle genomics das Potenzial, um Kenntnisse der Protein-Funktion zu informieren. Zusätzlich zum Aufklären von Protein-Funktionen kann struktureller genomics verwendet werden, um neuartige Protein-Falten und potenzielle Ziele für die Rauschgift-Entdeckung zu identifizieren. Struktureller genomics schließt das Bringen einer Vielzahl von Annäherungen an den Struktur-Entschluss, einschließlich experimenteller Methoden mit genomic Folgen oder Modellieren-basierte Annäherungen ein, die auf der Folge oder Strukturhomologie zu einem Protein der bekannten Struktur gestützt sind oder auf chemischen und physischen Grundsätzen für ein Protein ohne Homologie zu jeder bekannten Struktur gestützt sind.

Im Vergleich mit der traditionellen Strukturbiologie kommt der Entschluss von einer Protein-Struktur durch eine genomics Strukturanstrengung häufig (aber nicht immer), bevor irgendetwas bezüglich der Protein-Funktion bekannt ist. Das erhebt neue Herausforderungen in strukturellem bioinformatics, d. h. Bestimmung der Protein-Funktion von seiner 3D-Struktur.

Struktureller genomics betont hohen Durchfluss-Entschluss von Protein-Strukturen. Das wird in hingebungsvollen Zentren von strukturellem genomics durchgeführt.

Während die meisten Strukturbiologen Strukturen von individuellen Proteinen oder Protein-Gruppen verfolgen, verfolgen Fachmänner in strukturellem genomics Strukturen von Proteinen auf einem Genom breite Skala. Das bezieht in großem Umfang Klonen, Ausdruck und Reinigung ein. Ein Hauptvorteil dieser Annäherung ist Wirtschaft der Skala. Andererseits wird der wissenschaftliche Wert einiger resultierender Strukturen zuweilen infrage gestellt. Ein Artikel Science vom Januar 2006 analysiert das genomics Strukturfeld.

Ein Vorteil von strukturellem genomics, wie die Protein-Struktur-Initiative, besteht darin, dass die wissenschaftliche Gemeinschaft unmittelbaren Zugang zu neuen Strukturen, sowie zu Reagenzien wie Klone und Protein bekommt. Ein Nachteil ist, dass viele dieser Strukturen Proteine der unbekannten Funktion sind und entsprechende Veröffentlichungen nicht haben. Das verlangt neue Weisen, diese Strukturinformation der breiteren Forschungsgemeinschaft mitzuteilen. Der Bioinformatics Kern des Gemeinsamen Zentrums für strukturellen genomics (JCSG) hat kürzlich eine mit Sitz in wiki Annäherung nämlich The Open Protein Structure Annotation Network (TOPSAN) entwickelt, um Protein-Strukturen zu kommentieren, die aus dem hohen Durchfluss genomics Strukturzentren erscheinen.

Absichten

Eine Absicht von strukturellem genomics ist, neuartige Protein-Falten zu identifizieren. Experimentelle Methoden des Protein-Struktur-Entschlusses verlangen Proteine, die ausdrücken und/oder kristallisieren so, der die Arten von Protein-Falten von Natur aus beeinflussen kann, die das experimentelle Angaben aufhellt. Ein genomic, Modellieren-basierte Annäherung wie ab initio das Modellieren kann besser im Stande sein, neuartige Protein-Falten zu identifizieren, als die experimentellen Annäherungen, weil sie durch experimentelle Einschränkungen nicht beschränkt werden.

Protein-Funktion hängt von 3. Struktur ab, und diese 3. Strukturen werden mehr hoch erhalten als Folgen. So haben die Struktur-Entschluss-Methoden des hohen Durchflusses von strukturellem genomics das Potenzial, um unser Verstehen von Protein-Funktionen zu informieren. Das hat auch potenzielle Implikationen für die Rauschgift-Entdeckung und Protein-Technik. Außerdem vergrößert jedes Protein, das zur Strukturdatenbank hinzugefügt wird, die Wahrscheinlichkeit, dass die Datenbank homologe Folgen anderer unbekannter Proteine einschließen wird. Protein Structure Initiative (PSI) ist eine vielseitige Anstrengung, die von den Nationalen Instituten für die Gesundheit mit verschiedenen akademischen und industriellen Partnern gefördert ist, die zum Ziel hat, Kenntnisse der Protein-Struktur mit einer Strukturgenomics-Annäherung zu vergrößern und Methodik des Struktur-Entschlusses zu verbessern.

Methoden

Struktureller genomics nutzt vollendete Genom-Folgen auf mehrere Weisen aus, um Protein-Strukturen zu bestimmen. Die Genfolge des Zielproteins kann auch im Vergleich zu einer bekannten Folge sein, und Strukturinformation kann dann aus der Struktur des bekannten Proteins abgeleitet werden. Struktureller genomics kann verwendet werden, um neuartige auf anderen Strukturdaten gestützte Protein-Falten vorauszusagen. Struktureller genomics kann auch Modellieren-basierte Annäherung nehmen, die sich auf die Homologie zwischen dem unbekannten Protein und einer gelösten Protein-Struktur verlässt.

de novo Methoden

Vollendete Genom-Folgen erlauben jeden offenen Lesen-Rahmen (ORF), den Teil eines Gens, das wahrscheinlich die Folge für den mRNA und das Protein enthalten wird, um geklont und als Protein ausgedrückt zu werden. Diese Proteine werden dann gereinigt und kristallisiert, und dann einem von zwei Typen des Struktur-Entschlusses unterworfen: Röntgenstrahl-Kristallographie und Nuclear Magnetic Resonance (NMR). Die ganze Genom-Folge berücksichtigt das Design jeder erforderlichen Zündvorrichtung, um alle ORFs zu verstärken, sie in Bakterien zu klonen, und sie dann ausdrückt. Durch das Verwenden eines ganzen Genoms nähern sich dieser traditionellen Methode des Protein-Struktur-Entschlusses, alle durch das Genom verschlüsselten Proteine können sofort ausgedrückt werden. Diese Annäherung berücksichtigt den Strukturentschluss von jedem Protein, das durch das Genom verschlüsselt wird.

Modellieren-basierte Methoden

ab initio das Modellieren

Diese Annäherung verwendet Protein-Folge-Daten und die chemischen und physischen Wechselwirkungen von verschlüsselten Aminosäuren, um die 3. Strukturen von Proteinen ohne Homologie zu gelösten Protein-Strukturen vorauszusagen. Eine hoch erfolgreiche Methode für ab initio das Modellieren ist das Programm von Rosetta, das das Protein in kurze Segmente teilt und kurze polypeptide Kette in eine niedrige Energie lokale Angleichung einordnet. Rosetta ist für den kommerziellen Gebrauch und für den nichtkommerziellen Gebrauch durch sein öffentliches Programm, Robetta verfügbar.

Das Folge-basierte Modellieren

Diese modellierende Technik vergleicht die Genfolge eines unbekannten Proteins mit Folgen von Proteinen mit bekannten Strukturen. Abhängig vom Grad der Ähnlichkeit zwischen den Folgen kann die Struktur des bekannten Proteins als ein Modell verwendet werden, für die Struktur des unbekannten Proteins zu lösen. Wie man betrachtet, verlangt das hoch genaue Modellieren mindestens 50 % Aminosäure-Folge-Identität zwischen dem unbekannten Protein und der gelösten Struktur. 30-50-%-Folge-Identität gibt ein Modell der Zwischengenauigkeit, und die Folge-Identität unter 30 % gibt Modelle der niedrigen Genauigkeit. Es ist vorausgesagt worden, dass mindestens 16,000 Protein-Strukturen in der Größenordnung von allen Strukturmotiven werden beschlossen werden müssen, mindestens einmal und so das Erlauben die Struktur jedes unbekannten Proteins vertreten zu werden, genau durch das Modellieren gelöst zu werden. Ein Nachteil dieser Methode ist jedoch, dass Struktur mehr erhalten wird als Folge und so das Folge-basierte Modellieren kann nicht die genaueste Weise sein, Protein-Strukturen vorauszusagen.

Das Einfädeln

Das Einfädeln von Basen das Strukturmodellieren auf Falte-Ähnlichkeiten aber nicht Folge-Identität. Diese Methode kann helfen, entfernt zusammenhängende Proteine zu identifizieren, und kann verwendet werden, um molekulare Funktionen abzuleiten.

Beispiele von strukturellem Genomics

Es gibt zurzeit mehrere andauernde Anstrengungen, die Strukturen für jedes Protein in einem gegebenen proteome zu lösen.

Thermotogo maritima proteome

Eine aktuelle Absicht des Gemeinsamen Zentrums für Strukturellen Genomics (JCSG), ein Teil von Protein Structure Initiative (PSI) soll die Strukturen für alle Proteine in Thermotogo maritima, einer thermophillic Bakterie lösen. T. maritima wurde als ein Strukturgenomics-Ziel ausgewählt, das auf seinem relativ kleinen Genom gestützt ist, das aus 1,877 Genen und der Hypothese besteht, dass die von einer thermophilic Bakterie ausgedrückten Proteine leichter sein würden zu kristallisieren.

Lesley et al used Escherichia coli, um alle offen lesenden Rahmen (ORFs) von T. martima auszudrücken. Diese Proteine wurden dann kristallisiert, und Strukturen wurden für erfolgreich kristallisierte Proteine mit der Röntgenstrahl-Kristallographie bestimmt. Unter anderen Strukturen hat diese Strukturgenomics-Annäherung den Entschluss von der Struktur des TM0449 Proteins berücksichtigt, das, wie man fand, eine neuartige Falte ausgestellt hat, weil es Strukturhomologie mit keinem bekannten Protein geteilt hat.

Die Mycobacterium-Tuberkulose proteome

Die Absicht des TB Genomics Strukturkonsortiums ist, die Strukturen von potenziellen Rauschgift-Zielen in Mycobacterium-Tuberkulose, die Bakterie zu bestimmen, die Tuberkulose verursacht. Die Entwicklung von neuartigen Rauschgift-Therapien gegen Tuberkulose ist gegeben das wachsende Problem des Vielrauschgifts widerstandsfähige Tuberkulose besonders wichtig.

Völlig sequenced Genom der M. Tuberkulose hat Wissenschaftlern erlaubt, viele dieser Protein-Ziele in Ausdruck-Vektoren für die Reinigung und den Struktur-Entschluss durch die Röntgenstrahl-Kristallographie zu klonen. Studien haben mehrere Zielproteine für den Struktur-Entschluss einschließlich extracellular Proteine identifiziert, die an pathogenesis, Eisendurchführungsproteinen, aktuellen Rauschgift-Zielen und Proteinen beteiligt werden können, die vorausgesagt sind, um neuartige Falten zu haben. Bis jetzt sind Strukturen für 708 der durch M. Tuberkulose verschlüsselten Proteine bestimmt worden.

Protein-Struktur-Datenbanken und Klassifikationen

Protein Data Bank (PDB): Behältnis für die Protein-Folge und Strukturinformation

UniProt: Stellt Folge und funktionelle Information zur Verfügung

Strukturklassifikation von Proteinen (SCOP Klassifikationen): hierarchische Annäherung

Klasse, Architektur, Topologie und Homologe Superfamilie (CATH): hierarchische Annäherung

Siehe auch

  • Genomics
  • Omics
  • Struktureller proteomics
  • Protein-Struktur-Initiative
  • Baker EN, Arcus AL, Lott JS. 2003. Protein-Struktur-Vorhersage und Analyse als ein Werkzeug für funktionellen genomics. ''Angewandter Bioinformatics'' 2 (3 Suppl): S3-S10.
  • Goulding CW ''und al''. 2003. Struktureller genoimcs der ''Mycobacterium-Tuberkulose'': ein einleitender Bericht des Fortschritts an UCLA. ''Biophysical Chemie'' 105: 361-370.
  • Lesley SA ''und al''. 2002. Struktureller genomics von ''Thermotoga maritima'' proteome durchgeführt in einer Struktur-Entschluss-Rohrleitung des hohen Durchflusses. ''PNAS'' 99 (18):11664-11669.
  • Skolnick J, Fetrow JS und Kolinski A. 2000. Struktureller genomics und seine Wichtigkeit für die Genfunktionsanalyse. ''Natur-Biotechnologie'' 18:283-287.

Links


Source is a modification of the Wikipedia article Structural genomics, licensed under CC-BY-SA. Full list of contributors here.
Felsiger Hügel / Vandalia
Impressum & Datenschutz