Netz von Bayesian

Ein Bayesian Netz, Netz von Bayes, Glaube-Netz, hierarchisches Modell von Bayes (ian) oder geleitetes acyclic grafisches Modell sind ein probabilistic grafisches Modell (ein Typ des statistischen Modells), der eine Reihe zufälliger Variablen und ihre bedingten Abhängigkeiten über einen geleiteten acyclic Graphen (DAG) vertritt. Zum Beispiel konnte ein Netz von Bayesian die probabilistic Beziehungen zwischen Krankheiten und Symptomen vertreten. Gegebene Symptome, das Netz kann verwendet werden, um die Wahrscheinlichkeiten der Anwesenheit verschiedener Krankheiten zu schätzen.

Der Begriff wird hierarchisches Modell manchmal als ein besonderer Typ des Netzes von Bayesian betrachtet, aber hat keine formelle Definition. Manchmal wird der Begriff für Modelle mit drei oder mehr Niveaus von zufälligen Variablen vorbestellt; andere Zeiten wird es für Modelle mit latenten Variablen vorbestellt. Im Allgemeinen, jedoch, wird jedes gemäßigt komplizierte Netz von Bayesian gewöhnlich "hierarchisch" genannt.

Formell werden Netze von Bayesian acyclic Graphen geleitet, deren Knoten zufällige Variablen im Sinn von Bayesian vertreten: Sie können erkennbare Mengen, latente Variablen, unbekannte Rahmen oder Hypothesen sein. Ränder vertreten bedingte Abhängigkeiten; Knoten, die nicht verbunden werden, vertreten Variablen, die von einander bedingt unabhängig sind. Jeder Knoten wird mit einer Wahrscheinlichkeitsfunktion vereinigt, die als Eingang einen besonderen Satz von Werten für die Elternteilvariablen des Knotens nimmt und die Wahrscheinlichkeit der durch den Knoten vertretenen Variable gibt. Zum Beispiel, wenn die Eltern Variablen von Boolean dann sind, konnte die Wahrscheinlichkeitsfunktion durch einen Tisch von Einträgen, einem Zugang für jede der möglichen Kombinationen seiner Eltern vertreten werden, die wahr oder falsch sind. Ähnliche Ideen können auf den ungeleiteten, und vielleicht zyklische, Graphen angewandt werden; solcher werden Netze von Markov genannt.

Effiziente Algorithmen bestehen, die Schlussfolgerung und das Lernen in Netzen von Bayesian durchführen. Netze von Bayesian, dass Musterfolgen von Variablen (z.B Rede-Signale oder Protein-Folgen) dynamische Netze von Bayesian genannt werden. Generalisationen von Netzen von Bayesian, die vertreten und Entscheidungsprobleme unter der Unklarheit beheben können, werden Einfluss-Diagramme genannt.

Mathematische Einführung

Gegebene Daten und Parameter, eine einfache Analyse von Bayesian fängt mit einer vorherigen Wahrscheinlichkeit (vorherig) und Wahrscheinlichkeit an, um eine spätere Wahrscheinlichkeit zu schätzen.

Häufig hängt das vorherige darauf der Reihe nach von anderen Rahmen ab, die in der Wahrscheinlichkeit nicht erwähnt werden. Also, das vorherige muss durch eine Wahrscheinlichkeit ersetzt werden, und ein vorheriger auf den kürzlich eingeführten Rahmen ist erforderlich, auf eine spätere Wahrscheinlichkeit hinauslaufend

:

Das ist das einfachste Beispiel eines hierarchischen Modells von Bayes.

Der Prozess kann wiederholt werden; zum Beispiel können die Rahmen der Reihe nach von zusätzlichen Rahmen abhängen, die ihr eigenes vorheriges verlangen werden. Schließlich muss der Prozess mit priors enden, die von keinen anderen unerwähnten Rahmen abhängen.

Einleitende Beispiele

Nehmen Sie an, dass wir die Mengen jeder mit normalerweise verteilten Fehlern der bekannten Standardabweichung, gemessen haben

:

x_i \sim N (\theta_i, \sigma^2)

</Mathematik>

Nehmen Sie an, dass wir uns für das Schätzen interessieren. Eine Annäherung würde das Verwenden einer maximalen Wahrscheinlichkeitsannäherung schätzen sollen; da die Beobachtungen unabhängig sind, faktorisiert die Wahrscheinlichkeit, und die maximale Wahrscheinlichkeitsschätzung ist einfach

:

\theta_i = x_i

</Mathematik>

Jedoch, wenn die Mengen verbunden sind, so dass zum Beispiel wir denken können, dass die Person selbst von einem zu Grunde liegenden Vertrieb angezogen worden ist, dann zerstört diese Beziehung die Unabhängigkeit und deutet ein komplizierteres Modell, z.B, an

:

x_i \sim N (\theta_i, \sigma^2),

</Mathematik>:

\theta_i\sim N (\varphi, \tau^2)

</Mathematik>

mit der unpassenden priors Wohnung, Wohnung. Wenn das ein identifiziertes Modell ist (d. h. dort eine einzigartige Lösung für die Rahmen des Modells besteht), und der spätere Vertrieb der Person dazu neigen wird, sich zu bewegen, oder weg von den maximalen Wahrscheinlichkeitsschätzungen zu ihrem allgemeinen bösartigen zurückzuweichen. Dieses Zusammenschrumpfen ist ein typisches Verhalten in hierarchischen Modellen von Bayes.

Definitionen und Konzepte

Es gibt mehrere gleichwertige Definitionen eines Netzes von Bayesian. Für das ganze folgende, lassen Sie G = (V, E) ein geleiteter acyclic Graph (oder DAG) sein, und X = (X) eine Reihe zufälliger Variablen sein zu lassen, die durch V mit einem Inhaltsverzeichnis versehen ist.

Definition von Factorization

X ist ein Netz von Bayesian in Bezug auf G, wenn seine gemeinsame Wahrscheinlichkeitsdichte-Funktion (in Bezug auf ein Produktmaß) geschrieben werden kann, weil ein Produkt der individuellen Dichte, bedingt durch ihre Elternteilvariablen fungiert:

wo Papa (v) der Satz von Eltern von v (d. h. jene Scheitelpunkte ist, die direkt zu v über einen einzelnen Rand hinweisen).

Für jeden Satz von zufälligen Variablen kann die Wahrscheinlichkeit jedes Mitgliedes eines gemeinsamen Vertriebs von bedingten Wahrscheinlichkeiten mit der Kettenregel (gegeben eine topologische Einrichtung X) wie folgt berechnet werden:

Vergleichen Sie das mit der Definition oben, die als geschrieben werden kann:

für jeden, der ein Elternteil von ist

Der Unterschied zwischen den zwei Ausdrücken ist die bedingte Unabhängigkeit der Variablen von einigen ihrer Nichtnachkommen in Anbetracht der Werte ihrer Elternteilvariablen.

Lokales Eigentum von Markov

X ist ein Netz von Bayesian in Bezug auf G, wenn er das lokale Eigentum von Markov befriedigt: Jede Variable ist seiner Nichtnachkommen gegeben seine Elternteilvariablen bedingt unabhängig:

:

wo de (v) der Satz von Nachkommen von v ist.

Das kann auch in Begriffen ausgedrückt werden, die der ersten Definition, als ähnlich

sind

: für jeden, der nicht ein Nachkomme für jeden ist, der ein Elternteil von ist

Bemerken Sie, dass der Satz von Eltern eine Teilmenge des Satzes von Nichtnachkommen ist, weil der Graph acyclic ist.

Das Entwickeln Bayesian Netze

Um ein Netz von Bayesian zu entwickeln, entwickeln wir häufig zuerst einen DAG G solch, dass wir X glauben, befriedigt das lokale Eigentum von Markov in Bezug auf G. Manchmal wird das durch das Schaffen eines kausalen DAG getan. Wir stellen dann den bedingten Wahrscheinlichkeitsvertrieb jeder Variable gegeben seine Eltern in G fest. In vielen Fällen, insbesondere im Fall, wo die Variablen getrennt sind, wenn wir den gemeinsamen Vertrieb X definieren, um das Produkt dieses bedingten Vertriebs, dann X zu sein, ist ein Netz von Bayesian in Bezug auf G.

Decke von Markov

Die Decke von Markov eines Knotens ist sein Satz von benachbarten Knoten: seine Eltern, seine Kinder und irgendwelche anderen Eltern seiner Kinder. X ist ein Netz von Bayesian in Bezug auf G, wenn jeder Knoten aller anderen Knoten im Netz in Anbetracht seiner Decke von Markov bedingt unabhängig ist.

D-Trennung

Diese Definition kann allgemeiner durch das Definieren des "d" - Trennung von zwei Knoten gemacht werden, wo d gerichtet eintritt. Lassen Sie P eine Spur sein (d. h. eine Sammlung von Rändern, die einem Pfad ähnlich ist, aber jeder können dessen Ränder jede Richtung haben), vom Knoten u zu v. Dann, wie man sagt, ist P d-separated durch eine Reihe von Knoten Z, wenn, und nur wenn (mindestens) ein des folgenden hält:

  1. P enthält eine Kette, x  M  y, solch, dass der mittlere Knoten M in Z, ist
  2. P enthält eine Kette, x  M  y, solch, dass der mittlere Knoten M in Z, ist
  3. P enthält eine Gabel, x  M  y, solch, dass der mittlere Knoten M in Z oder ist
  4. P enthält eine umgekehrte Gabel (oder collider), x  M  y, solch, dass der mittlere Knoten M ist nicht in Z und keinem Nachkommen der M, in Z ist.

So, wie man sagt, sind u und v d-separated durch Z, wenn alle Spuren zwischen ihnen d-separated sind. Wenn u und v nicht d-separated sind, werden sie d-connected genannt.

X ist ein Netz von Bayesian in Bezug auf G wenn, für irgendwelche zwei Knoten u, v:

:

wo Z ein Satz ist, welcher d-separates u und v. (Ist die Decke von Markov der minimale Satz von Knoten der d-separates Knoten v von allen anderen Knoten.)

Kausale Netze

Obwohl Bayesian Netze häufig verwendet werden, um kausale Beziehungen zu vertreten, braucht das nicht der Fall zu sein: Ein geleiteter Rand von u bis v verlangt nicht, dass X von X kausal abhängig ist. Das wird durch die Tatsache dass Netze von Bayesian auf den Graphen demonstriert:

:sind

gleichwertig: Das ist sie erlegen genau dieselben bedingten Unabhängigkeitsvoraussetzungen auf.

Ein kausales Netz ist ein Netz von Bayesian mit einer ausführlichen Voraussetzung dass die Beziehungen, kausal sein. Die zusätzliche Semantik der kausalen Netze gibt dass an, wenn ein Knoten X aktiv veranlasst wird, in einem gegebenen Staat x zu sein (eine schriftliche Handlung, wie (X=x) tun), dann die Wahrscheinlichkeitsdichte-Funktionsänderungen zu derjenigen des erhaltenen Netzes durch den Ausschnitt der Verbindungen von den Eltern von X zu X und das Setzen X zum verursachten Wert x. Mit diesen Semantik kann man den Einfluss des Außeneingreifens von vor dem Eingreifen erhaltenen Daten voraussagen.

Beispiel

Nehmen Sie an, dass es zwei Ereignisse gibt, die Gras veranlassen konnten, nass zu sein: Entweder der Sprinkler ist auf, oder es regnet. Nehmen Sie außerdem an, dass der Regen eine direkte Wirkung auf den Gebrauch des Sprinklers hat (nämlich, dass, wenn es regnet, der Sprinkler gewöhnlich nicht angemacht wird). Dann kann die Situation mit einem (gezeigten) Netz von Bayesian modelliert werden. Alle drei Variablen haben zwei mögliche Werte, T (für den wahren) und F (für den falschen).

Die gemeinsame Wahrscheinlichkeitsfunktion ist:

:

wo die Namen der Variablen zu G = Gras nass, S = Sprinkler und R = Regen abgekürzt worden sind.

Das Modell kann auf Fragen wie antworten "Wie ist die Wahrscheinlichkeit, dass es regnet, in Anbetracht des Grases ist nass?" durch das Verwenden der bedingten Wahrscheinlichkeitsformel und das Summieren über alle Ärger-Variablen:

:

\frac {\\mathrm P (\mathit {G}

T, \mathit {R} =T)} {\\mathrm P (\mathit {G} =T) }\

\frac {\\sum_ {\\mathit {S} \in \{T, F\} }\\mathrm P (\mathit {G}

T, \mathit {S}, \mathit {R} =T)} {\\sum_ {\\mathit {S}, \mathit {R} \in \{T, F\}} \mathrm P (\mathit {G} =T, \mathit {S}, \mathit {R}) }\

</Mathematik>::

Als im Beispiel-Zähler wird ausführlich hingewiesen, die gemeinsame Wahrscheinlichkeitsfunktion wird verwendet, um jede Wiederholung der Summierungsfunktion zu berechnen. Im Zähler marginalisierend und im Nenner marginalisierend und.

Wenn, andererseits, wir auf eine interventional Frage antworten möchten: "Wie ist die Wahrscheinlichkeit, dass es, vorausgesetzt, dass wir nass das Gras regnen würde?" die Antwort würde durch die erhaltene Postinterventionsgelenk-Vertriebsfunktion durch das Entfernen des Faktors vom Vorinterventionsvertrieb geregelt. Wie erwartet, ist die Wahrscheinlichkeit des Regens durch die Handlung ungekünstelt:.

Wenn außerdem wir den Einfluss voraussagen möchten, zu drehen

der Sprinkler auf, wir haben

mit dem entfernten Begriff, dass die Handlung zeigend

hat eine Wirkung auf das Gras, aber nicht auf den Regen.

Diese Vorhersagen können wenn einige der nicht ausführbar

sein

Variablen, sind als im grössten Teil der Politikeinschätzung unbemerkt

Probleme. Die Wirkung der Handlung kann noch sein

vorausgesagt, jedoch, wann auch immer ein Kriterium "Hintertür" genannt hat, ist

zufrieden. Es stellt das fest, wenn ein Satz Z Knoten beobachtet werden kann

das d-separates (oder Blöcke) alle heimlichen Pfade von X bis Y

dann.

Ein heimlicher Pfad ist derjenige, der mit einem Pfeil in endet

X. Sätze, die das heimliche Kriterium befriedigen, werden genannt

"genügend" oder "zulässig". Zum Beispiel, der Satz

Z=R ist zulässig, für die Wirkung von S=T vorauszusagen

auf G, weil R d-separate der (einzige) heimliche Pfad

SRG. Jedoch, wenn S nicht beobachtet wird, gibt es keinen

anderer Satz dass d-separates dieser Pfad und die Wirkung

den Sprinkler auf (S=T) auf dem Gras zu drehen, kann (G)

nicht

werden Sie von passiven Beobachtungen vorausgesagt. Wir sagen dann das

P (Gdo (S=T)) wird nicht "identifiziert".

Das widerspiegelt die Tatsache dass, interventional fehlend

Daten, wir können wenn die beobachtete Abhängigkeit zwischen nicht bestimmen

S und G ist wegen einer kausalen Verbindung oder wegen unechten

geschaffen durch einen häufigen Grund, R. (sieh das Paradox von Simpson)

Zu bestimmen, ob eine kausale Beziehung identifiziert wird

von einem willkürlichen Netz von Bayesian mit unbemerkten Variablen,

man kann die drei Regeln "der-Rechnung" verwenden

und Test, ob alle Begriffe tun, kann vom entfernt werden

der Ausdruck dieser Beziehung, so bestätigend, dass die gewünschte Menge von Frequenzdaten schätzenswert ist.

Das Verwenden eines Netzes von Bayesian kann beträchtliche Beträge des Gedächtnisses sparen, wenn die Abhängigkeiten im gemeinsamen Vertrieb spärlich sind. Zum Beispiel verlangt eine naive Weise, die bedingten Wahrscheinlichkeiten von 10 zwei geschätzten Variablen als ein Tisch zu versorgen, Abstellraum für Werte. Wenn der lokale Vertrieb keiner Variable von mehr als 3 Elternteilvariablen abhängt, muss die Netzdarstellung von Bayesian nur an den meisten Werten versorgen.

Ein Vorteil von Netzen von Bayesian besteht darin, dass es für einen Menschen intuitiv leichter ist (ein spärlicher Satz) direkte Abhängigkeiten und lokalen Vertrieb zu verstehen, als ganzer gemeinsamer Vertrieb.

Schlussfolgerung und das Lernen

Es gibt drei Hauptinterferenzaufgaben für Netze von Bayesian.

Das Schließen unbemerkter Variablen

Weil ein Netz von Bayesian ein ganzes Modell für die Variablen und ihre Beziehungen ist, kann es verwendet werden, um auf Probabilistic-Abfragen nach ihnen zu antworten. Zum Beispiel kann das Netz verwendet werden, um aktualisierte Kenntnisse des Staates einer Teilmenge von Variablen herauszufinden, wenn andere Variablen (die Beweis-Variablen) beobachtet werden. Dieser Prozess, den späteren Vertrieb von ausgesagten Variablen zu schätzen, wird probabilistic Schlussfolgerung genannt. Das spätere gibt einen universalen genügend statistischen für Entdeckungsanwendungen, wenn man Werte für die variable Teilmenge wählen will, die etwas Funktion des erwarteten Schadensumfangs, zum Beispiel die Wahrscheinlichkeit des Entscheidungsfehlers minimieren. Ein Bayesian Netz kann so als ein Mechanismus betrachtet werden, um den Lehrsatz von Buchten auf komplizierte Probleme automatisch anzuwenden.

Die allgemeinsten genauen Interferenzmethoden sind: Variable Beseitigung, die (durch die Integration oder Summierung) die nichtbeobachteten Nichtanfragenvariablen eins nach dem anderen durch das Verteilen der Summe über das Produkt beseitigt; Clique-Baumfortpflanzung, die die Berechnung versteckt, so dass viele Variablen auf einmal und neue Beweise gefragt werden können, kann schnell fortgepflanzt werden; und das rekursive Bedingen und UND/ODER Suche, die einen Raum-Zeit-Umtausch berücksichtigen und die Leistungsfähigkeit der variablen Beseitigung vergleichen, wenn genug Raum verwendet wird. Alle diese Methoden haben Kompliziertheit, die im treewidth des Netzes Exponential-ist. Die allgemeinsten ungefähren Interferenzalgorithmen sind Wichtigkeitsstichprobenerhebung, stochastische MCMC Simulation, Minieimer-Beseitigung, verrückte Glaube-Fortpflanzung, hat Glaube-Fortpflanzung und abweichende Methoden verallgemeinert.

Das Parameter-Lernen

Um das Netz von Bayesian völlig anzugeben und so völlig den gemeinsamen Wahrscheinlichkeitsvertrieb zu vertreten, ist es notwendig, für jeden Knoten X der Wahrscheinlichkeitsvertrieb für X bedingt auf die Eltern von X anzugeben. Der Vertrieb X bedingt auf seine Eltern kann jede Form haben. Es ist üblich, mit dem getrennten oder Vertrieb von Gaussian zu arbeiten, da das Berechnungen vereinfacht. Manchmal sind nur Einschränkungen auf einen Vertrieb bekannt; man kann dann den Grundsatz des maximalen Wärmegewichtes verwenden, um einen einzelnen Vertrieb, denjenigen mit dem größten Wärmegewicht gegeben die Einschränkungen zu bestimmen. (Analog, im spezifischen Zusammenhang eines dynamischen Netzes von Bayesian, gibt man allgemein den bedingten Vertrieb für die zeitliche Evolution des verborgenen Staates an, um die Wärmegewicht-Rate des implizierten stochastischen Prozesses zu maximieren.)

Häufig schließt dieser bedingte Vertrieb Rahmen ein, die unbekannt sind und von Daten manchmal mit der maximalen Wahrscheinlichkeitsannäherung geschätzt werden müssen. Die direkte Maximierung der Wahrscheinlichkeit (oder der späteren Wahrscheinlichkeit) ist häufig kompliziert, wenn es unbemerkte Variablen gibt. Eine klassische Annäherung an dieses Problem ist der Erwartungsmaximierungsalgorithmus, der abwechselt, hat Computerwissenschaft Werte der unbemerkten durch beobachtete Daten bedingten Variablen erwartet, mit der Maximierung der ganzen Wahrscheinlichkeit (oder später) ist das Annehmen, das vorher erwartete Werte geschätzt hat, richtig. Unter milden Regelmäßigkeitsbedingungen läuft dieser Prozess auf der maximalen Wahrscheinlichkeit (oder Maximum später) Werte für Rahmen zusammen.

Mehr völlig soll die Annäherung von Bayesian an Rahmen Rahmen als zusätzliche unbemerkte Variablen behandeln und einen vollen späteren Vertrieb über alle Knoten zu schätzen, die auf beobachtete Daten bedingt sind, dann die Rahmen zu integrieren. Diese Annäherung kann teuer sein und zu großen Dimensionsmodellen führen, so in der Praxis sind klassische Annäherungen des Anlegens von Parametern üblicher.

Das Struktur-Lernen

Im einfachsten Fall wird ein Netz von Bayesian von einem Experten angegeben und wird dann verwendet, um Schlussfolgerung durchzuführen. In anderen Anwendungen ist die Aufgabe, das Netz zu definieren, für Menschen zu kompliziert. In diesem Fall müssen die Netzstruktur und die Rahmen des lokalen Vertriebs von Daten erfahren werden.

Automatisch ist das Lernen der Graph-Struktur eines Netzes von Bayesian eine innerhalb des Maschinenlernens verfolgte Herausforderung. Die Grundidee geht zu einem Wiederherstellungsalgorithmus zurück

entwickelt durch das Wiederverderben und Pearl (1987) und Reste

auf der Unterscheidung zwischen den drei möglichen Typen von

angrenzende Drillinge haben in einem geleiteten acyclic Graphen (DAG) erlaubt:

</ol>

Typ 1 und Typ 2 vertreten dieselben Abhängigkeiten (und sind gegeben unabhängig), und sind deshalb, nicht zu unterscheidend. Typ 3 kann jedoch seitdem einzigartig identifiziert werden und ist geringfügig unabhängig, und alle anderen Paare sind abhängig. So, während die Skelette (die Graphen, die von Pfeilen beraubt sind) dieser drei Drillinge, identisch sind, ist der directionality der Pfeile teilweise identifizierbar. Dieselbe Unterscheidung gilt, wenn und allgemeine Eltern haben, außer dass man zuerst auf jenen Eltern bedingen muss. Algorithmen sind entwickelt worden, um das Skelett des zu Grunde liegenden Graphen systematisch zu bestimmen und dann alle Pfeile zu orientieren, deren directionality durch die bedingte beobachtete Unabhängigkeit diktiert wird.

Eine alternative Methode des Strukturlernens verwendet Optimierung gestützte Suche. Es verlangt eine Zählen-Funktion und eine Suchstrategie. Eine allgemeine zählende Funktion ist spätere Wahrscheinlichkeit der Struktur gegeben die Lehrdaten. Die Zeitvoraussetzung eines erschöpfenden Suchzurückbringens unterstützt eine Struktur, die die Kerbe maximiert, ist in der Zahl von Variablen Superexponential-. Eine lokale Suchstrategie nimmt zusätzliche Änderungen vor hat darauf gezielt, die Kerbe der Struktur zu verbessern. Ein globaler Suchalgorithmus wie Kette von Markov Monte Carlo kann vermeiden, in lokalen Minima gefangen zu werden. Friedman u. a. das Gespräch über das Verwenden gegenseitiger Information zwischen Variablen und Entdeckung einer Struktur, die das maximiert. Sie tun das durch das Einschränken des Elternteilkandidaten ist zu k Knoten und erschöpfend die Suche darin untergegangen.

Beschränkungen von priors

Etwas Sorge ist erforderlich, wenn man priors in einem hierarchischen Modell besonders auf Skala-Variablen an höheren Niveaus der Hierarchie wie die Variable im Beispiel wählt. Die üblichen priors wie Jeffreys vorherig arbeiten häufig nicht, weil der spätere Vertrieb (nicht normalizable) unpassend sein wird, und gemachte Schätzungen durch die Minderung des erwarteten Schadensumfangs unzulässig sein werden.

Anwendungen

Netze von Bayesian werden verwendet, um Kenntnisse in der rechenbetonten Biologie und bioinformatics (Gen Durchführungsnetze, Protein-Struktur, Genausdruck-Analyse zu modellieren, epistasis von GWAS Dateien erfahrend) Medizin, biosurveillance, Dokumentenklassifikation, Informationsgewinnung, Bildverarbeitung, Datenfusion, Entscheidungshilfe-Systeme, Technik, spielend, und Gesetz.

Geschichte

Der Begriff "Netze von Bayesian" wurde von Judea Pearl 1985 ins Leben gerufen, um drei Aspekte zu betonen:

  1. Die häufig subjektive Natur der Eingangsinformation.
  2. Das Vertrauen auf dem Bedingen von Bayes als die Basis, um Information zu aktualisieren.
  3. Die Unterscheidung zwischen kausalen und überzeugenden Weisen des Denkens, das das postum veröffentlichte Papier von Thomas Bayes von 1763 unterstreicht.

Gegen Ende der 1980er Jahre haben die zukunftsträchtigen Textschließen mit Unsicherheiten in Intelligenten Systemen und Schließen mit Unsicherheiten in Expertensystemen die Eigenschaften von Netzen von Bayesian zusammengefasst und haben geholfen, Netze von Bayesian als ein Studienfach zu gründen.

Informelle Varianten solcher Netze wurden zuerst vom gesetzlichen Gelehrten John Henry Wigmore in der Form von Karten von Wigmore verwendet, um Probe-Beweise 1913 zu analysieren. Ein anderer verschiedener, genannter Pfad Diagramme, wurde vom Genetiker Sewall Wright entwickelt und in sozialen und Verhaltenswissenschaften (größtenteils mit geradlinigen parametrischen Modellen) verwendet.

Siehe auch

Software:

  • WinBUGS, OpenBUGS
  • Gerade ein andere Probierer von Gibbs (JAGS)
  • SamIam

Referenzen

Allgemeine Verweisungen

  • Kapitel 5.
  • .

:Also erscheint als

:An frühere Version erscheint als Technischer Bericht MSR TR 95 06, Microsoft Research am 1. März 1995. Das Papier ist sowohl über den Parameter als auch über die Struktur, die in Netzen von Bayesian erfährt.

.
  • Dieses Papier präsentiert variable Beseitigung für Glaube-Netze.

Links

Software:

Die Liga von Herren (Film) / Geleiteter acyclic Graph
Impressum & Datenschutz