Statistik von Multivariate

Statistik von Multivariate ist eine Form der Statistik, die die gleichzeitige Beobachtung und Analyse von mehr als einer statistischer Variable umfasst. Die Anwendung der multivariate Statistik ist multivariate Analyse. Methoden der bivariate Statistik, zum Beispiel einfaches geradliniges rückwärts Gehen und Korrelation, sind spezielle Fälle der multivariate Statistik, an der zwei Variablen beteiligt werden.

Statistiksorgen von Multivariate, die verschiedenen Ziele und den Hintergrund von jeder der verschiedenen Formen der multivariate Analyse verstehend, und wie sie sich auf einander beziehen. Die praktische Durchführung der multivariate Statistik zu einem besonderen Problem kann mit mehreren Typen von univariate und multivariate Analyse verbunden sein, um die Beziehungen zwischen Variablen und ihrer Relevanz zum wirklichen Problem zu verstehen, das wird studiert.

Außerdem, multivariate Statistik ist mit multivariate Wahrscheinlichkeitsvertrieb, in Bezug auf beide beschäftigt:

:*how können diese verwendet werden, um den Vertrieb von beobachteten Daten zu vertreten;

:*how sie können als ein Teil der statistischen Schlussfolgerung besonders verwendet werden, wo mehrere verschiedene Mengen von Interesse zu derselben Analyse sind.

Typen der Analyse

Es gibt viele verschiedene Modelle, jeden mit seinem eigenen Typ der Analyse:

  1. Die Analyse von Multivariate der Abweichung (MANOVA) erweitert die Analyse der Abweichung, um Fälle zu bedecken, wo es mehr als eine abhängige gleichzeitig zu analysierende Variable gibt: Siehe auch MANCOVA.
  2. Regressionsanalyse von Multivariate versucht, eine Formel zu bestimmen, die beschreiben kann, wie Elemente in einem Vektoren von Variablen gleichzeitig auf Änderungen in anderen antworten. Für geradlinige Beziehungen basieren Regressionsanalysen hier auf Formen des allgemeinen geradlinigen Modells.
  3. Hauptteilanalyse (PCA) schafft einen neuen Satz von orthogonalen Variablen, die dieselbe Information wie der ursprüngliche Satz enthalten. Es lässt die Äxte der Schwankung rotieren, um einen neuen Satz von orthogonalen Äxten, bestellt zu geben, so dass sie abnehmende Verhältnisse der Schwankung zusammenfassen.
  4. Faktorenanalyse ist PCA ähnlich, aber erlaubt dem Benutzer, eine bestimmte Anzahl von synthetischen Variablen, weniger herauszuziehen als der ursprüngliche Satz, die restliche unerklärte Schwankung als Fehler verlassend. Die herausgezogenen Variablen sind als latente Variablen oder Faktoren bekannt; jeder kann für covariation in einer Gruppe von beobachteten Variablen verantwortlich sein sollen.
  5. Kanonische Korrelationsanalyse findet geradlinige Beziehungen unter zwei Sätzen von Variablen; es ist das verallgemeinerte (d. h. kanonisch) Version der bivariate Korrelation.
  6. Überfülle-Analyse ist der kanonischen Korrelationsanalyse ähnlich, aber erlaubt dem Benutzer, eine bestimmte Anzahl von synthetischen Variablen von einem Satz von (unabhängigen) Variablen abzuleiten, die so viel Abweichung wie möglich in einem anderen (unabhängigen) Satz erklären. Es ist eine multivariate Entsprechung des rückwärts Gehens.
  7. Ähnlichkeitsanalyse (CA) oder gegenseitige Mittelwertbildung, findet (wie PCA) eine Reihe synthetischer Variablen, die den ursprünglichen Satz zusammenfassen. Das zu Grunde liegende Modell nimmt chi-karierte Unähnlichkeiten unter Aufzeichnungen (Fälle) an. Dort ist auch (oder "beschränkt") Ähnlichkeitsanalyse (CCA) kanonisch, für die gemeinsame Schwankung in zwei Sätzen von Variablen (wie kanonische Korrelationsanalyse) zusammenzufassen.
  8. Mehrdimensionales Schuppen umfasst verschiedene Algorithmen, um eine Reihe synthetischer Variablen zu bestimmen, die am besten die pairwise Entfernungen zwischen Aufzeichnungen vertreten. Die ursprüngliche Methode ist Hauptkoordinatenanalyse (gestützt auf PCA).
  9. Diskriminanten-Analyse oder kanonische variate Analyse, versucht zu gründen, ob eine Reihe von Variablen verwendet werden kann, um zwischen zwei oder mehr Gruppen von Fällen zu unterscheiden.
  10. Geradlinige Diskriminanten-Analyse (LDA) schätzt einen geradlinigen Propheten von zwei Sätzen von normalerweise verteilten Daten, um Klassifikation von neuen Beobachtungen zu berücksichtigen.
  11. Sich sammelnde Systeme teilen Gegenstände in Gruppen zu (genannt Trauben), so dass Gegenstände (Fälle) von derselben Traube einander ähnlicher sind als Gegenstände von verschiedenen Trauben.
  12. Das rekursive Verteilen schafft einen Entscheidungsbaum, der versucht, Mitglieder der auf einer dichotomen abhängigen Variable gestützten Bevölkerung richtig zu klassifizieren.
  13. Künstliche Nervennetze erweitern rückwärts Gehen und sich sammelnde Methoden zu nichtlinearen multivariate Modellen.

Wichtiger Wahrscheinlichkeitsvertrieb

Es gibt eine Reihe des Wahrscheinlichkeitsvertriebs, der in Multivariate-Analysen verwendet ist, die eine ähnliche Rolle zum entsprechenden Satz des Vertriebs spielen, der in der univariate Analyse verwendet wird, wenn die Normalverteilung zu einem dataset passend ist. Dieser multivariate Vertrieb ist:

:*Multivariate-Normalverteilung

:*Wishart-Vertrieb

:*Multivariate-Studenten-T-Vertrieb.

Der Umgekehrte-Wishart Vertrieb ist in der Schlussfolgerung von Bayesian, zum Beispiel in Bayesian multivariate geradliniges rückwärts Gehen wichtig. Zusätzlich ist der T-squared Vertrieb von Hotelling ein univariate Vertrieb, den T-Vertrieb des Studenten verallgemeinernd, der in der multivariate Hypothese-Prüfung verwendet wird.

Geschichte

Das 1958-Lehrbuch von Anderson, Eine Einführung in die Multivariate Analyse, hat eine Generation von Theoretikern erzogen und hat Statistiker angewandt; das Buch von Anderson betont Hypothese-Prüfung über Wahrscheinlichkeitsverhältnis-Tests und die Eigenschaften von Potenzfunktionen: Annehmbarkeit, Unbefangenheit und Monomuskeltonus.

Software & Werkzeuge

Es gibt eine riesige Menge von Softwarepaketen und anderen Werkzeugen für die multivariate Analyse, einschließlich:

  • Calc
  • MiniTab
  • R
  • SAS (Software)
  • sciPy für die Pythonschlange
  • SPSS
  • Stata
  • STATISTICA
  • TMVA - Werkzeug für die Multivariate Datenanalyse in der WURZEL
  • Der Unzerhacker

Siehe auch

  • Bewertung der Kovarianz matrices
  • Wichtige Veröffentlichungen in der multivariate Analyse
  • Multivariate, der prüft
  • Strukturierte Datenanalyse (Statistik)
  • RV Koeffizient

Weiterführende Literatur

Links


Source is a modification of the Wikipedia article Multivariate statistics, licensed under CC-BY-SA. Full list of contributors here.
Miyamoto Musashi / Am 18. Mai
Impressum & Datenschutz