Karierter Mittelfehler

In der Statistik ist der karierte Mittelfehler (MSE) eines Vorkalkulatoren eine von vielen Weisen, den Unterschied zwischen Werten zu messen, die von einem Vorkalkulatoren und den wahren Werten der Menge einbezogen sind, die wird schätzt. MSE ist eine Risikofunktion, entsprechend dem erwarteten Wert des karierten Fehlerverlustes oder quadratischen Verlustes. MSE misst den Durchschnitt der Quadrate der "Fehler". Der Fehler ist der Betrag, durch den sich der vom Vorkalkulatoren einbezogene Wert von der zu schätzenden Menge unterscheidet. Der Unterschied kommt wegen der Zufälligkeit vor, oder weil der Vorkalkulator für Information nicht verantwortlich ist, die eine genauere Schätzung erzeugen konnte.

Der MSE ist der zweite Moment (über den Ursprung) vom Fehler, und vereinigt so sowohl die Abweichung des Vorkalkulatoren als auch seine Neigung. Für einen unvoreingenommenen Vorkalkulatoren ist der MSE die Abweichung. Wie die Abweichung hat MSE dieselben Einheiten des Maßes wie das Quadrat der Menge, die wird schätzt. In einer Analogie zur Standardabweichung, die Quadratwurzel von MSE nehmend, gibt die Wurzel nach Mittelquadratfehler oder Wurzel bedeuten Quadratabweichung (RMSE oder RMSD), der dieselben Einheiten wie die Menge hat, die wird schätzt; für einen unvoreingenommenen Vorkalkulatoren ist der RMSE die Quadratwurzel der Abweichung, die als die Standardabweichung bekannt ist.

Definition und grundlegende Eigenschaften

Der MSE eines Vorkalkulatoren in Bezug auf den geschätzten Parameter wird als definiert

:

Der MSE ist der Summe der Abweichung und der karierten Neigung des Vorkalkulatoren gleich

:

Der MSE bewertet so die Qualität eines Vorkalkulatoren in Bezug auf seine Schwankung und Unbefangenheit. Bemerken Sie, dass der MSE zum erwarteten Wert des absoluten Fehlers nicht gleichwertig ist.

Da MSE eine Erwartung ist, ist es nicht eine zufällige Variable. Es kann eine Funktion des unbekannten Parameters sein, aber es hängt von keinen zufälligen Mengen ab. Jedoch, wenn MSE für einen besonderen Vorkalkulatoren des wahren Werts geschätzt wird, über den nicht bekannt ist, wird es dem Bewertungsfehler unterworfen sein. In einem Sinn von Bayesian bedeutet das, dass es Fälle gibt, in denen er als eine zufällige Variable behandelt werden kann.

Alternativer Gebrauch

In der Regressionsanalyse der Begriff wird karierter Mittelfehler manchmal verwendet, um sich auf die Schätzung der Fehlerabweichung zu beziehen: Die restliche Summe von Quadraten hat sich durch die Zahl von Graden der Freiheit geteilt. Das ist eine beobachtete Menge gegeben eine besondere Probe (und ist folglich beispielabhängig), wohingegen die Definition oben eine Funktion der Rahmen des Wahrscheinlichkeitsvertriebs eines unbekannten Parameters ist. Für mehr Details, sieh Fehler und residuals in der Statistik.

Auch in der Regressionsanalyse, "bedeuten karierter Fehler", häufig gekennzeichnet als "aus der Probe karierter Mittelfehler", kann sich auf den Mittelwert der karierten Abweichungen der Vorhersagen von den wahren Werten über einen Testraum aus der Probe beziehen, der durch ein über einen besonderen Beispielraum geschätztes Modell erzeugt ist. Das ist auch eine beobachtete Menge, und sie ändert sich durch die Probe und durch den Testraum aus der Probe.

Beispiele

Nehmen Sie an, dass wir eine zufällige Probe der Größe n von einer Bevölkerung haben. Der übliche Vorkalkulator für das bösartige ist der Beispieldurchschnitt

:

der einen erwarteten Wert von μ hat (so ist es unvoreingenommen), und ein Mittelquadratfehler von

:

Für einen Vertrieb von Gaussian ist das der beste unvoreingenommene Vorkalkulator (d. h. er hat den niedrigsten MSE unter allen unvoreingenommenen Vorkalkulatoren), aber nicht, sagen wir, für eine Rechteckverteilung.

Der übliche Vorkalkulator für die Abweichung ist

:

\frac {1} {n-1 }\\ist abgereist (\sum_ {ich

1\^n X_i^2-n\overline {X} ^2\right). </Mathematik>

Das ist unvoreingenommen (sein erwarteter Wert ist), und sein MSE ist

:

&= \frac {1} {n} \left (\gamma_2 +\frac {2n} {n-1 }\\Recht) \sigma^4, \end {richten} </Mathematik> {aus}

wo der vierte Hauptmoment des Vertriebs oder der Bevölkerung ist und das Übermaß kurtosis ist.

Jedoch kann man andere Vorkalkulatoren verwenden, für die zu proportional sind, und eine passende Wahl immer einen niedrigeren Mittelquadratfehler geben kann. Wenn wir definieren

:

&= \frac {1} {ein }\\sum_ {i=1} ^n\left (X_i-\overline {X }\\, \right) ^2\end {richten} </Mathematik> {aus}

dann ist der MSE

:

\operatorname {MSE} (S^2_a) &= \operatorname {E }\\ist (\left (\frac {n-1} S^2_ {n-1}-\sigma^2\right) ^2 \right) \\abgereist

&= \frac {n-1} {n a^2} [(n-1) \gamma_2+n^2+n] \sigma^4-\frac {2 (n-1)} {ein }\\sigma^4 +\sigma^4

\end {richten} </Mathematik> {aus}

Das wird wenn minimiert

:

Für einen Vertrieb von Gaussian, wo das bedeutet, wird der MSE minimiert, wenn man die Summe dadurch teilt, wohingegen für einen Vertrieb von Bernoulli mit p = 1/2 (ein Münzflip), der MSE dafür minimiert wird. (Bemerken Sie, dass dieser besondere Fall des Vertriebs von Bernoulli das niedrigstmögliche Übermaß kurtosis hat; das kann durch die Ungleichheit von Jensen wie folgt bewiesen werden. Der vierte Hauptmoment ist ein für das Quadrat der Abweichung gebundener oberer, so dass kleinster Wert für ihr Verhältnis ein, deshalb ist, ist kleinster Wert für das Übermaß kurtosis-2, erreicht zum Beispiel durch einen Bernoulli mit p=1/2.) So, egal was der kurtosis, wir eine "bessere" Schätzung bekommen (im Sinne, einen niedrigeren MSE zu haben), dadurch, den unvoreingenommenen Vorkalkulatoren ein kleines bisschen herunterzuschrauben. Sogar unter unvoreingenommenen Vorkalkulatoren, wenn der Vertrieb nicht Gaussian das beste ist (Minimum bedeuten Quadratfehler), kann der Vorkalkulator der Abweichung nicht sein

Der folgende Tisch gibt mehreren Vorkalkulatoren der wahren Rahmen der Bevölkerung, μ und σ für den Fall von Gaussian.

Bemerken Sie dass:

  1. Die für die Abweichungsvorkalkulatoren gezeigten MSEs nehmen i.i.d. so dass an. Das Ergebnis dafür folgt leicht von der Abweichung, die ist.
  2. Unvoreingenommene Vorkalkulatoren können Schätzungen mit der kleinsten Gesamtschwankung (wie gemessen, durch MSE) nicht erzeugen: Der MSE dessen ist größer als dieser oder.
  3. Vorkalkulatoren mit der kleinsten Gesamtschwankung können beeinflusste Schätzungen erzeugen: normalerweise Unterschätzungen σ durch

Interpretation

Ein MSE der Null, bedeutend, dass der Vorkalkulator Beobachtungen des Parameters mit der vollkommenen Genauigkeit voraussagt, ist das Ideal, aber ist praktisch nie möglich.

Werte von MSE können zu vergleichenden Zwecken verwendet werden. Zwei oder mehr statistische Modelle können mit ihrem MSEs als ein Maß dessen verglichen werden, wie gut sie einen gegebenen Satz von Beobachtungen erklären: Das unvoreingenommene Modell mit dem kleinsten MSE wird allgemein als das beste Erklären der Veränderlichkeit in den Beobachtungen interpretiert und wird den besten unvoreingenommenen Vorkalkulatoren oder MVUE (Minimale Abweichung Unvoreingenommener Vorkalkulator) genannt.

Beide geradlinigen Techniken des rückwärts Gehens wie Analyse der Abweichung schätzen den MSE als ein Teil der Analyse und verwenden den geschätzten MSE, um die statistische Bedeutung der Faktoren oder Propheten unter der Studie zu bestimmen. Die Absicht des Versuchsplanes ist, Experimente auf solche Art und Weise zu bauen, dass, wenn die Beobachtungen analysiert werden, der MSE Null hinsichtlich des Umfangs von mindestens einem der geschätzten Behandlungseffekten nah ist.

MSE wird auch in mehreren schrittweisen Techniken des rückwärts Gehens als ein Teil des Entschlusses betreffs verwendet, wie viele Propheten von einem Kandidaten untergehen, um in ein Modell für einen gegebenen Satz von Beobachtungen einzuschließen.

Anwendungen

  • Minderung MSE ist ein Schlüsselkriterium im Auswählen estimators:see Fehler der Minimum Mean-Square. Unter unvoreingenommenen Vorkalkulatoren ist der minimale MSE zur Minderung der Abweichung gleichwertig, und wird durch den MVUE erhalten. Jedoch kann ein voreingenommener Vorkalkulator tiefer MSE haben; sieh Vorkalkulator-Neigung.
  • Im statistischen Modellieren des MSE, den Unterschied zwischen den wirklichen Beobachtungen und der durch das Modell vorausgesagten Antwort vertretend, wird verwendet, um zu bestimmen, ob das Modell die Daten nicht passt, oder ob das Modell durch das Entfernen von Begriffen vereinfacht werden kann.

Als eine Verlust-Funktion

Karierter Fehlerverlust ist eine der am weitesten verwendeten Verlust-Funktionen in der Statistik, obwohl sein weit verbreiteter Gebrauch mehr von der mathematischen Bequemlichkeit stammt als Rücksichten des wirklichen Verlustes in Anwendungen. Carl Friedrich Gauss, der den Gebrauch des karierten Mittelfehlers eingeführt hat, war seiner Eigenmächtigkeit bewusst und war in Übereinstimmung mit Einwänden dagegen auf diesem Boden. Die mathematischen Vorteile des karierten Mittelfehlers sind in seinem Gebrauch beim Analysieren der Leistung des geradlinigen rückwärts Gehens besonders offensichtlich, weil es erlaubt, die Schwankung in einem dataset in die Schwankung zu verteilen, die durch das Modell und die durch die Zufälligkeit erklärte Schwankung erklärt ist.

Kritik

Der Gebrauch des karierten Mittelfehlers ist ohne Frage vom Entscheidungstheoretiker James Berger kritisiert worden. Karierter Mittelfehler ist die Verneinung des erwarteten Werts einer spezifischer Dienstprogramm-Funktion, der quadratischen Dienstprogramm-Funktion, die die passende Dienstprogramm-Funktion nicht sein kann, unter einer gegebenen Verkettung von Umständen zu verwenden. Es, gibt jedoch, einige Drehbücher, wo karierter Mittelfehler als eine gute Annäherung an eine Verlust-Funktion dienen kann, die natürlich in einer Anwendung vorkommt.

Wie Abweichung hat karierter Mittelfehler den Nachteil, schwer outliers zu beschweren. Das ist ein Ergebnis des Quadrierens jedes Begriffes, der effektiv Gewichte große Fehler schwerer als kleine. Dieses Eigentum, das in vielen Anwendungen unerwünscht ist, hat Forscher dazu gebracht, Alternativen wie der absolute Mittelfehler oder diejenigen zu verwenden, die auf der Mittellinie gestützt sind.

Siehe auch

Karierter MittelvorhersagefehlerDer Mean Square hat Abweichung beschwertMittelprozentsatz-FehlerKarierte Abweichungen
  • Maximalverhältnis des Signals zum Geräusch
  • Wurzel Mittelquadratabweichung

Referenzen


Barnes Wallis / Peter Quennell
Impressum & Datenschutz