Schiefe

In der Wahrscheinlichkeitstheorie und Statistik ist Schiefe ein Maß der Asymmetrie des Wahrscheinlichkeitsvertriebs einer reellwertigen zufälligen Variable. Der Schiefe-Wert kann positiv oder negativ, oder sogar unbestimmt sein. Qualitativ, eine Verneinung verdrehen zeigt an, dass der Schwanz auf der linken Seite der Wahrscheinlichkeitsdichte-Funktion länger ist, als die richtige Seite und der Hauptteil der Werte (vielleicht einschließlich der Mittellinie) rechts vom bösartigen lügen. Ein positiver verdreht zeigt an, dass der Schwanz rechts länger ist, als die linke Seite und der Hauptteil der Werte links vom bösartigen lügen. Ein Nullwert zeigt an, dass die Werte relativ an beiden Seiten des bösartigen, normalerweise aber nicht notwendigerweise der Andeutung eines symmetrischen Vertriebs gleichmäßig verteilt werden.

Einführung

Denken Sie den Vertrieb auf der Zahl. Die Bars auf der richtigen Seite des Vertriebs spitzen sich verschieden zu als die Bars auf der linken Seite. Diese spitz zulaufenden Seiten werden Schwänze genannt, und sie stellen ein Sehmittel zur Verfügung, um zu bestimmen, welche von den zwei Arten der Schiefe ein Vertrieb hat:

  1. : Der linke Schwanz ist länger; die Masse des Vertriebs wird rechts von der Zahl konzentriert. Es hat relativ wenige niedrige Werte. Wie man sagt, wird der Vertrieb nach links verdreht, nach links verfolgt, oder nach links verdreht. Beispiel (Beobachtungen): 1,1001,1002,1003.
  2. : Der rechte Schwanz ist länger; die Masse des Vertriebs wird auf den verlassenen der Zahl konzentriert. Es hat relativ wenige hohe Werte. Wie man gesagt wird, ist der Vertrieb Recht-schief, mit dem richtigen Schwanz, oder nach rechts verdreht. Beispiel (Beobachtungen): 1,2,3,1000.

Wenn der Vertrieb dann symmetrisch ist, ist das bösartige der Mittellinie gleich, und der Vertrieb wird in der Nähe von der Nullschiefe haben. (Wenn, außerdem, der Vertrieb, dann das bösartige = Mittellinie = Weise unimodal ist.) Das ist eines Münzwerfens oder der Reihe 1,2,3,4 der Fall... Bemerken Sie jedoch, dass das gegenteilige im Allgemeinen nicht wahr ist, d. h. Nullschiefe nicht andeutet, dass das bösartige der Mittellinie gleich ist.

"Viele Lehrbücher," weist ein 2005 Artikel hin, "unterrichten eine Faustregel feststellend, dass das bösartige von der Mittellinie unter dem Recht richtig ist, verdrehen, und verlassen der Mittellinie unter dem linken verdrehen. [Aber] diese Regel scheitert mit der überraschenden Frequenz. Es kann im mehrmodalen Vertrieb, oder im Vertrieb scheitern, wo ein Schwanz lang ist, aber der andere ist schwer. Meistens aber scheitert die Regel im getrennten Vertrieb, wo die Gebiete nach links und das Recht auf die Mittellinie nicht gleich sind. Solcher Vertrieb widerspricht nicht nur der Lehrbuch-Beziehung zwischen dem bösartigen, mittleren, und verdreht, sie widersprechen auch der Lehrbuch-Interpretation der Mittellinie."

Definition

Die Schiefe einer zufälligen Variable X ist der dritte standardisierte Moment, hat γ angezeigt und hat als definiert

:

\gamma_1 = \operatorname {E }\\Groß [\big (\tfrac {X-\mu} {\\Sigma }\\groß) ^ {\\! 3 }\\, \Big]

= \frac {\\mu_3} {\\sigma^3}

= \frac {\\operatorname {E }\\groß [(X-\mu) ^3\big]} {\\\\(\operatorname {E }\\groß [(X-\mu) ^2 \big]) ^ {3/2} }\

= \frac {\\kappa_3} {\\kappa_2^ {3/2} }\\,

</Mathematik>

wo μ der dritte Moment über den Mittel-μ ist, ist σ die Standardabweichung, und E ist der Erwartungsmaschinenbediener. Die letzte Gleichheit drückt Schiefe in Bezug auf das Verhältnis des dritten cumulant κ und 1.5th Macht des zweiten cumulant κ aus. Das ist der Definition von kurtosis als der vierte durch das Quadrat des zweiten cumulant normalisierte cumulant analog.

Die Schiefe wird auch manchmal angezeigt Verdrehen [X].

Die Formel-Ausdrücken-Schiefe in Bezug auf den Nichthauptmoment E [X] kann durch die Erweiterung der vorherigen Formel, ausgedrückt werden

:

\begin {richten }\aus

\gamma_1

&= \operatorname {E }\\bigg [\Big (\frac {X-\mu} {\\Sigma }\\Groß) ^ {\\! 3\\, \bigg] \\

& = \frac {\\operatorname {E} [X^3] - 3\mu\operatorname E [X^2] + 3\mu^2\operatorname E [X] - \mu^3} {\\sigma^3 }\\\

&= \frac {\\operatorname {E} [X^3] - 3\mu (\operatorname E [X^2]-\mu\operatorname E [X]) - \mu^3} {\\sigma^3 }\\\

&= \frac {\\operatorname {E} [X^3] - 3\mu\sigma^2 - \mu^3} {\\sigma^3 }\\.

\end {richten }\aus

</Mathematik>

Beispielschiefe

Weil eine Probe von N-Werten die Beispielschiefe ist

:

g_1 = \frac {m_3} {m_2^ {3/2}}

= \frac {\\tfrac {1} {n} \sum_ {i=1} ^n (x_i-\overline {x}) ^3} {\\ist (\tfrac {1} {n} \sum_ {i=1} ^n (x_i-\overline {x}) ^2\right) ^ {3/2} }\\, abgereist

</Mathematik>

wo die bösartige Probe ist, ist M der dritte Beispielhauptmoment, und M ist die Beispielabweichung.

Gegebene Proben von einer Bevölkerung, die Gleichung für die Beispielschiefe ist oben ein voreingenommener Vorkalkulator der Bevölkerungsschiefe. (Bemerken Sie, dass für einen getrennten Vertrieb die Beispielschiefe (0/0) unbestimmt sein kann, so wird sein erwarteter Wert unbestimmt sein.) Der übliche Vorkalkulator der Bevölkerungsschiefe ist

:

G_1 = \frac {k_3} {k_2^ {3/2}} = \frac {\\sqrt {n \, (n-1)}} {n-2 }\\; g_1,

</Mathematik>

wo der einzigartige symmetrische unvoreingenommene Vorkalkulator des dritten cumulant ist und der symmetrische unvoreingenommene Vorkalkulator des zweiten cumulant ist. Leider wird dennoch allgemein beeinflusst (obwohl es offensichtlich den richtigen erwarteten Wert der Null für einen symmetrischen Vertrieb hat). Sein erwarteter Wert kann sogar das entgegengesetzte Zeichen von der wahren Schiefe haben. Zum Beispiel hat ein Mischvertrieb, der aus sehr dünnem Gaussians besteht, an &minus;99, 0.5, und 2 mit Gewichten 0.01 im Mittelpunkt gestanden, 0.66, und 0.33 hat eine Schiefe ungefähr &minus;9.77, aber in einer Probe 3, hat einen erwarteten Wert von ungefähr 0.32, da gewöhnlich alle drei Proben im positiv geschätzten Teil des Vertriebs sind, der der andere Weg verdreht wird.

Die Abweichung der Schiefe einer Probe der Größe n von einer Normalverteilung ist

6n (n - 1) / [(n - 2) (n + 1) (n + 3)]

Eine ungefähre Alternative ist 6/n, aber das ist für kleine Proben ungenau.

Eigenschaften

Schiefe, kann als wenn unendlich

sein

:

oder unbestimmt, als wenn

:

In diesem letzten Beispiel ist der dritte cumulant unbestimmt. Man kann auch Vertrieb wie haben

:

wo sowohl die zweiten als auch dritten cumulants unendlich sind, so ist die Schiefe wieder unbestimmt.

Wenn Y die Summe des n Unabhängigen ist und identisch zufällige Variablen, alle mit dem Vertrieb X verteilt hat, dann ist der dritte cumulant von Y n Zeiten dieser X und der zweite cumulant von Y sind n Zeiten dieser X, so. Das zeigt, dass die Schiefe der Summe kleiner ist, weil es sich einem Vertrieb von Gaussian in Übereinstimmung mit dem Hauptgrenzwertsatz nähert.

Anwendungen

Schiefe hat Vorteile in vielen Gebieten. Viele Modelle nehmen Normalverteilung an; d. h. Daten sind über das bösartige symmetrisch. Die Normalverteilung hat eine Schiefe der Null. Aber in Wirklichkeit können Datenpunkte nicht vollkommen symmetrisch sein. Also, ein Verstehen der Schiefe des dataset zeigt an, ob Abweichungen vom bösartigen dabei sind, positiv oder negativ zu sein.

Der K-Squared-Test von D'Agostino ist ein Normalitätstest der Güte-passend, der auf der Beispielschiefe und Probe kurtosis gestützt ist.

Andere Maßnahmen der Schiefe

Die Schiefe-Koeffizienten von Pearson

Karl Pearson hat einfachere Berechnungen als ein Maß der Schiefe vorgeschlagen: Die Weise von Pearson oder der erste Schiefe-Koeffizient, der durch definiert ist

sowie der zweite oder Mittelschiefe-Koeffizient von Pearson, der durch definiert ist

Von einem Standard cumulant Vergrößerung um eine Normalverteilung anfangend, kann man wirklich dem zeigen

Schiefe = 6 (bedeuten &minus; Mittellinie) / Standardabweichung (1 + kurtosis / 8) + O (Schiefe).

Man sollte beachten, dass über gegebenen Gleichheiten häufig sogar ungefähr nicht halten und diese empirischen Formeln heutzutage aufgegeben werden.

Es gibt keine Garantie, dass das dasselbe Zeichen wie einander oder als die gewöhnliche Definition der Schiefe sein wird.

Quantile hat Maßnahmen gestützt

Eine Schiefe-Funktion

:

kann definiert werden, wo F die kumulative Vertriebsfunktion ist. Das führt zu einem entsprechenden gesamten Maß der Schiefe, die als das Supremum davon über die Reihe 1/2u definiert ist, während ein anderes Maß durch die Integrierung des Zählers und Nenners dieses Ausdrucks erhalten werden kann. Das Maß von Galton der Schiefe ist γ (u) bewertet an u=3/4, während andere Namen für diese dieselbe Menge "Bowley Schiefe", "Index des Weihnachtsfestes-Kendall" und "quartile Schiefe" sind. Die Funktion γ (u) satifies-1 γ (u) 1, und ist bestimmt, ohne die Existenz irgendwelcher Momente des Vertriebs zu verlangen.

Das Maß von Kelley der Schiefe verwendet u = 0.1.

L-Momente

Der Gebrauch von L-Momenten im Platz von Momenten stellt ein Maß der als die L-Schiefe bekannten Schiefe zur Verfügung.

Der Schiefe-Koeffizient von Cyhelský

Ein einfacher Schiefe-Koeffizient ist auf die individuellen und bösartigen Beispielbeobachtungen zurückzuführen gewesen:

:a = (Zahl von Beobachtungen unter dem bösartigen - Zahl von Beobachtungen über dem bösartigen) / Gesamtzahl von Beobachtungen

Der Schiefe-Koeffizient Annäherungen an die Normalverteilung. Wenn Datei mindestens 45 Werte hat dann fast normal zu sein. Vertrieb, wenn Daten vom normalen oder der Rechteckverteilung genommen werden, ist dasselbe. Verhalten in anderem Vertrieb ist zurzeit unbekannt. Obwohl dieses Maß sehr leicht ist zu verstehen, ist analytische Annäherung schwierig.

Entfernungsschiefe

Ein Wert der der Null gleichen Schiefe deutet nicht an, dass der Wahrscheinlichkeitsvertrieb symmetrisch ist. So gibt es ein Bedürfnis nach einem anderen Maß der Asymmetrie, die dieses Eigentum hat: Solch ein Maß wurde 2000 eingeführt. Es wird Entfernungsschiefe genannt und durch dSkew angezeigt. Wenn X eine zufällige Variable ist, die Werte im d-dimensional Euklidischen Raum nimmt, X hat begrenzte Erwartung, X' ist eine unabhängige identisch verteilte Kopie X und zeigt die Norm im Euklidischen Raum dann an ein einfaches Maß der Asymmetrie ist

:dSkew (X): = 1 - E || X-X' || / E || X + X' ||, wenn X nicht 0 mit der Wahrscheinlichkeit ein, ist

und dSkew (X): = 1 für X = 0 (mit der Wahrscheinlichkeit 1). Entfernungsschiefe ist immer zwischen 0 und 1, ist 0 gleich, wenn, und nur wenn X diagonal symmetrisch ist (X und-X hat denselben Wahrscheinlichkeitsvertrieb), und 1 gleich ist, wenn, und nur wenn X eine Nichtnullkonstante mit der Wahrscheinlichkeit ein ist. So gibt es einen einfachen konsequenten statistischen Test der diagonalen auf der Beispielentfernungsschiefe gestützten Symmetrie:

:dSkew (X): = 1- || x - x / x + x.

Der Koeffizient von Groeneveld & Meeden

Groeneveld & Meeden hat vorgeschlagen

verdrehen Sie = (μ - m) / (E | X - M |)

wo μ das bösartige ist, ist M die Mittellinie, || ist der absolute Wert, und E ist der Erwartungsmaschinenbediener als ein alternatives Maß des Verdrehens.

Siehe auch

  • Schiefe-Gefahr
  • Kurtosis riskieren
  • Gestalt-Rahmen
  • Verdrehen Sie Normalverteilung
  • Die K-squared von D'Agostino prüfen

Referenzen

  • Johnson, NL, Kotz, S, Balakrishnan N (1994) Dauernder Univariate Vertrieb, Vol 1, 2. Ausgabe Wiley ISBN0 471 58495 9

Außenverbindungen


Source is a modification of the Wikipedia article Skewness, licensed under CC-BY-SA. Full list of contributors here.
Stan Kelly-Bootle / Heiliger Columba (Begriffserklärung)
Impressum & Datenschutz