Abweichung

In der Wahrscheinlichkeitstheorie und Statistik ist die Abweichung ein Maß dessen, wie weit eine Reihe von Zahlen ausgedehnt wird. Es ist einer von mehreren Deskriptoren eines Wahrscheinlichkeitsvertriebs, beschreibend, wie weit die Zahlen vom bösartigen (erwarteter Wert) liegen. Insbesondere die Abweichung ist einer der Momente eines Vertriebs. In diesem Zusammenhang bildet es einen Teil einer systematischen Annäherung an das Unterscheiden zwischen dem Wahrscheinlichkeitsvertrieb. Während andere solche Annäherungen entwickelt worden sind, sind diejenigen, die auf Momenten gestützt sind, in Bezug auf die mathematische und rechenbetonte Einfachheit vorteilhaft.

Die Abweichung ist ein Parameter, der teilweise entweder der wirkliche Wahrscheinlichkeitsvertrieb einer beobachteten Bevölkerung von Zahlen oder der theoretische Wahrscheinlichkeitsvertrieb einer Probe (eine nicht völlig beobachtete Bevölkerung) von Zahlen beschreibt. Im letzten Fall kann eine Probe von Daten von solch einem Vertrieb verwendet werden, um eine Schätzung seiner Abweichung zu bauen: In den einfachsten Fällen kann diese Schätzung die Beispielabweichung sein, die unten definiert ist.

Grundlegende Diskussion

Beispiele

Die Abweichung einer zufälligen Variable oder Vertriebs ist die Erwartung, oder bösartig, von der karierten Abweichung dieser Variable von seinem erwarteten Wert oder bösartig. So ist die Abweichung ein Maß des Betrags der Schwankung der Werte dieser Variable, alle möglichen Werte und ihre Wahrscheinlichkeiten oder weightings in Betracht ziehend (nicht nur die Extreme, die die Reihe geben).

Zum Beispiel, ein vollkommener sechsseitiger, sterben wenn geworfen, hat Wert von erwartet

:

Seine erwartete absolute Abweichung — die bösartige von den ebenso wahrscheinlichen absoluten Abweichungen vom bösartigen — ist

:

Aber seine erwartete karierte Abweichung — seine Abweichung (die bösartigen von den ebenso wahrscheinlichen karierten Abweichungen) — ist

:

Als ein anderes Beispiel, wenn eine Münze zweimal geworfen wird, ist die Zahl von Köpfen: 0 mit der Wahrscheinlichkeit 0.25, 1 mit der Wahrscheinlichkeit 0.5 und 2 mit der Wahrscheinlichkeit 0.25. So ist die bösartige von der Zahl von Köpfen 0.25 × 0 + 0.5 × 1 + 0.25 × 2 = 1, und die Abweichung ist 0.25 × (0  1) + 0.5 × (1  1) + 0.25 × (2  1) = 0.25 + 0 + 0.25 = 0.5.

Einheiten des Maßes

Verschieden von der erwarteten absoluten Abweichung hat die Abweichung einer Variable Einheiten, die das Quadrat der Einheiten der Variable selbst sind. Zum Beispiel wird eine in Zoll gemessene Variable eine Abweichung in Quadratzoll messen lassen. Deshalb bedeutet das Beschreiben von Dateien über ihre Standardabweichung oder Wurzel, dass Quadratabweichung häufig über das Verwenden der Abweichung bevorzugt wird. Im Würfel-Beispiel ist die Standardabweichung 2.9  1.7, ein bisschen größer als die erwartete absolute Abweichung 1.5.

Die Standardabweichung und die erwartete absolute Abweichung können beide als ein Hinweis der "Ausbreitung" eines Vertriebs verwendet werden. Die Standardabweichung ist der algebraischen Manipulation zugänglicher, als die erwartete absolute Abweichung, und, zusammen mit der Abweichung und seiner Generalisationskovarianz, oft in der theoretischen Statistik verwendet wird; jedoch neigt die erwartete absolute Abweichung dazu, robuster zu sein, weil es zu outliers weniger empfindlich ist, der aus Maß-Anomalien oder einem übermäßig Vertrieb mit dem schweren Schwanz entsteht.

Das Schätzen der Abweichung

Wirklicher Vertrieb wie der Vertrieb des gestrigen Regens im Laufe des Tages ist normalerweise, verschieden vom Verhalten von vollkommenen Würfeln oder einem idealen Vertrieb wie die Normalverteilung nicht völlig bekannt, weil es unpraktisch ist, um für jeden Regentropfen verantwortlich zu sein. Stattdessen schätzt man das bösartige und die Abweichung des ganzen Vertriebs als das geschätzte bösartige und die Abweichung einer Probe von n Beobachtungen gezogen angemessen zufällig vom ganzen Beispielraum, in diesem Beispiel der Satz aller Maße des gestrigen Niederschlags in allen verfügbaren Regenmaßen.

Diese Methode der Bewertung ist in der Nähe vom optimalen mit der Verwahrung, dass es die Abweichung durch einen Faktor (n  1) / n unterschätzt. (Zum Beispiel, wenn n = 1 die Abweichung einer einzelnen Beobachtung offensichtlich Null unabhängig von der wahren Abweichung ist). Das gibt eine Neigung, die dafür korrigiert werden sollte, wenn n durch das Multiplizieren durch n / (n  1) klein ist. Wenn das bösartige auf eine andere Weise bestimmt wird als von denselben Proben, die verwendet sind, um die Abweichung dann zu schätzen, entsteht diese Neigung nicht, und die Abweichung kann als diese der Proben sicher geschätzt werden.

Um die Beziehung zwischen der Bevölkerungsabweichung und der Beispielabweichung zu illustrieren, nehmen Sie an, dass in (nicht völlig beobachtet) Bevölkerung von numerischen Werten der Wert 1 1/3 der Zeit vorkommt, kommt der Wert 2 1/3 der Zeit vor, und der Wert 4 kommt 1/3 der Zeit vor. Die bösartige Bevölkerung ist (1/3) [1 + 2 + 4] = 7/3. Die ebenso wahrscheinlichen Abweichungen von der bösartigen Bevölkerung sind 1 − 7/3, 2 − 7/3, und 4 − 7/3. Die Bevölkerungsabweichung — die erwartete karierte Abweichung vom Mittel-7/3 — ist (1/3) [(−4/3) + (−1/3) + (5/3)] = 14/9. Nehmen Sie jetzt wegen eines einfachen Beispiels an, dass wir eine sehr kleine Probe von n = 2 Beobachtungen nehmen, und die neun ebenso wahrscheinlichen Möglichkeiten für den Satz von Zahlen innerhalb dieser Probe denken: (1, 1), (1, 2), (1,4), (2, 1), (2,2), (2, 4), (4,1), (4, 2), und (4, 4). Für diese neun möglichen Proben ist die Beispielabweichung der zwei Zahlen beziehungsweise 0, 1/4, 9/4, 1/4, 0, 4/4, 9/4, 4/4, und 0. Mit unserem Plan, zwei Werte zu beobachten, konnten wir damit enden, einige dieser Beispielabweichungen zu schätzen (und tatsächlich wenn wir hypothetisch ein Paar von Zahlen oft beobachten konnten, würden wir jede dieser Beispielabweichungen 1/9 der Zeit schätzen). So der erwartete Wert, über alle möglichen Proben, die von der Bevölkerung der geschätzten Beispielabweichung gezogen werden könnten, ist (1/9) [0 + 1/4 + 9/4 + 1/4 + 0 + 4/4 + 9/4 + 4/4 + 0] = 7/9. Dieser Wert von 7/9 für den erwarteten Wert unserer Beispielabweichungsberechnung ist eine wesentliche Unterschätzung der wahren Bevölkerungsabweichung, die wir als 14/9 geschätzt haben, weil unsere Beispielgröße von gerade zwei Beobachtungen so klein war. Aber wenn wir uns für diese Neigung nach unten anpassen, indem wir unsere geschätzte Beispielabweichung multiplizieren, welch auch immer es, durch n / sein kann (n − 1) = 2 / (2 − 1) = 2 dann würde unsere Schätzung der Bevölkerungsabweichung irgendwelcher 0, 1/2, 9/2, 1/2, 0, 4/2, 9/2, 4/2, und 0 sein. Der Durchschnitt von diesen ist tatsächlich die richtige Bevölkerungsabweichung von 14/9 also durchschnittlich über alle möglichen Proben wir würden die richtige Schätzung der Bevölkerungsabweichung haben.

Die Abweichung einer reellwertigen zufälligen Variable ist sein zweiter Hauptmoment, und sie ist auch zufällig sein zweiter cumulant. Da etwas Vertrieb keinen bösartigen hat, haben einige keine Abweichung. Das bösartige besteht, wann auch immer die Abweichung besteht, aber das gegenteilige ist nicht notwendigerweise wahr.

Definition

Wenn eine zufällige Variable X den erwarteten (bösartigen) Wert hat, dann wird durch die Abweichung X gegeben:

:

\operatorname {Var} (X) = \operatorname {E }\\ist [(X - \mu) ^2 \right] abgereist. \,

</Mathematik>

D. h. die Abweichung ist der erwartete Wert des karierten Unterschieds zwischen der Verwirklichung der Variable und die bösartige Variable. Diese Definition umfasst zufällige Variablen, die getrennt, oder keiner (oder gemischt) dauernd sind. Es kann wie folgt ausgebreitet werden:

:

\operatorname {Var} (X)

&= \operatorname {E }\\verlassen [(X - \mu) ^2 \right] \\

&= \operatorname {E }\\verlassen [X^2 - 2\mu X + \mu^2 \right] \\

&= \operatorname {E }\\ist [X^2 \right] - 2\mu \,\operatorname {E} [X] + \mu^2 \\abgereist

&= \operatorname {E }\\ist [X^2 \right] - 2\mu^2 + \mu^2 \\abgereist

&= \operatorname {E }\\ist [X^2 \right] - \mu^2 \\abgereist

&= \operatorname {E }\\ist [X^2 \right] - (\operatorname {E} [X]) ^2 abgereist.

\end {richten} </Mathematik> {aus}

Ein mnemonischer für den obengenannten Ausdruck ist vom Quadrat minus das Quadrat von bösartigen "bösartig".

Die Abweichung der zufälligen Variable X wird normalerweise als Var (X), oder einfach σ (ausgesprochenes "Sigma quadratisch gemacht") benannt.

Dauernde zufällige Variable

Wenn die zufällige Variable X mit der Wahrscheinlichkeitsdichte-Funktion f (x), dauernd

ist:

wo der erwartete Wert ist, d. h.

:

und wo die Integrale bestimmte Integrale sind, die für x genommen sind, der sich über die Reihe X erstreckt.

Wenn ein dauernder Vertrieb keinen erwarteten Wert hat, wie für den Vertrieb von Cauchy der Fall ist, hat er keine Abweichung auch. Vieler anderer Vertrieb, für den der erwartete Wert auch besteht, hat keine begrenzte Abweichung, weil das Integral in der Abweichungsdefinition abweicht. Ein Beispiel ist ein Vertrieb von Pareto, dessen Index k befriedigt


Gleichförmiger Raum / Vacuole
Impressum & Datenschutz