Quantile

Quantiles sind Punkte genommen regelmäßig von der kumulativen Vertriebsfunktion (CDF) einer zufälligen Variable. Das Teilen von bestellten Daten in im Wesentlichen gleich-große Datenteilmengen ist die Motivation für-quantiles; die quantiles sind die Datenwerte, die die Grenzen zwischen Konsekutivteilmengen kennzeichnen. Stellen Sie einen anderen Weg, der-quantile für eine zufällige Variable ist der solcher Wert, dass die Wahrscheinlichkeit, dass die zufällige Variable weniger sein wird als, höchstens und die Wahrscheinlichkeit ist, dass die zufällige Variable mehr sein wird, als höchstens ist. Es gibt des-quantiles, ein für jede Zufriedenheit der ganzen Zahl

Spezialisierter quantiles

Einige q-quantiles haben spezielle Namen:

  • Der 2-quantile wird die Mittellinie genannt
  • Die 3-quantiles werden s oder s  T genannt
  • Die 4-quantiles werden quartiles  Q genannt
  • Die 5-quantiles werden s  QU genannt
  • Die 6-quantiles werden s  S genannt
  • Die 10-quantiles werden Zehntelwerte  D genannt
  • Die 12-quantiles werden Duett-Zehntelwerte  Dd genannt
  • Die 20-quantiles werden s  V genannt
  • Die 100-quantiles werden Prozentanteile  P genannt
  • Die 1000-quantiles werden permilles  Pr genannt

Mehr allgemein kann man die Quantile-Funktion für jeden Vertrieb denken. Das wird für echte Variablen zwischen der Null und ein definiert und ist mathematisch das Gegenteil der kumulativen Vertriebsfunktion.

Quantiles einer Bevölkerung

Für eine Bevölkerung von getrennten Werten oder für eine dauernde Bevölkerungsdichte ist der th-quantile der Datenwert, wo sich die kumulative Vertriebsfunktion trifft. Das ist ein th-quantile für eine Variable wenn

:

und

: (oder, gleichwertig,).

Weil eine begrenzte Bevölkerung von Werten 1... vom niedrigsten bis höchsten mit einem Inhaltsverzeichnis versehen hat, kann der th-quantile dieser Bevölkerung über den Wert dessen geschätzt werden. Wenn nicht eine ganze Zahl ist, dann treiben Sie zur folgenden ganzen Zahl zusammen, um den passenden Index zu bekommen; der entsprechende Datenwert ist der th-quantile. Andererseits, wenn eine ganze Zahl dann ist, kann jede Zahl vom Datenwert an diesem Index zum Datenwert des folgenden als der quantile genommen werden, und es ist (obwohl willkürlich) herkömmlich, um den Durchschnitt jener zwei Werte zu nehmen (sieh das Schätzen des quantiles).

Wenn, anstatt ganze Zahlen zu verwenden, und, der "-quantile" auf einer reellen Zahl damit basiert

Beispiele

Gleich-große Bevölkerung

Denken Sie eine befohlene Bevölkerung von 10 Datenwerten {3, 6, 7, 8, 8, 10, 13, 15, 16, 20}.

  • Die Reihe des ersten quartile ist 10× (1/4) = 2.5, der zu 3 zusammentreibt, bedeutend, dass 3 die Reihe in der Bevölkerung ist (von meist bis größte Werte), an dem ungefähr 1/4 der Werte weniger sind als der Wert des ersten quartile. Der dritte Wert in der Bevölkerung ist 7.
  • Die Reihe des zweiten quartile (dasselbe als die Mittellinie) ist 10× (2/4) = 5, der eine ganze Zahl ist, während die Zahl von Werten (10) eine gerade Zahl ist, so wird der Durchschnitt sowohl der fünften als auch sechsten Werte genommen - der (8+10)/2 = 9 ist, obwohl jeder Wert von 8 bis zu 10 genommen werden konnte, um die Mittellinie zu sein.
  • Die Reihe des dritten quartile ist 10× (3/4) = 7.5, der zu 8 zusammentreibt. Der achte Wert in der Bevölkerung ist 15.

Sonderbar-große Bevölkerung

Denken Sie eine befohlene Bevölkerung von 11 Datenwerten {3, 6, 7, 8, 8, 9, 10, 13, 15, 16, 20}.

  • Der erste quartile wird durch 11&times bestimmt; (1/4) = 2.75, der zu 3 zusammentreibt, bedeutend, dass 3 die Reihe in der Bevölkerung ist (von meist bis größte Werte), an dem ungefähr 1/4 der Werte weniger sind als der Wert des ersten quartile. Der dritte Wert in der Bevölkerung ist 7.
  • Der zweite Quartile-Wert (dasselbe als die Mittellinie) wird durch 11&times bestimmt; (2/4) = 5.5, der zu 6 zusammentreibt. Deshalb 6 ist die Reihe in der Bevölkerung (von meist bis größte Werte), an dem ungefähr 2/4 der Werte weniger sind als der Wert des zweiten quartile (oder Mittellinie). Der sechste Wert in der Bevölkerung ist 9.
  • Der dritte Quartile-Wert für das ursprüngliche Beispiel wird oben durch 11&times bestimmt; (3/4) = 8.25, der zu 9 zusammentreibt. Der neunte Wert in der Bevölkerung ist 15.

Diskussion

Standardisierte Testergebnisse werden als ein Student allgemein missdeutet, der "im 80. Prozentanteil zählt," zum Beispiel, als ob der 80. Prozentanteil ein Zwischenraum ist, "um darin" zu zählen, der es nicht ist; man kann "an" einem Prozentanteil, oder zwischen zwei Prozentanteilen, aber nicht "in" einem Prozentanteil zählen. Vielleicht durch dieses Beispiel wird es dass die Studentenhunderte zwischen den 80. und 81. Prozentanteilen gemeint.

Wenn ein Vertrieb symmetrisch ist, dann ist die Mittellinie das bösartige (so lange der Letztere besteht). Aber, im Allgemeinen, unterscheiden sich die Mittellinie und das bösartige. Zum Beispiel mit einer zufälligen Variable, die einen Exponentialvertrieb hat, wird jede besondere Probe dieser zufälligen Variable grob eine 63-%-Chance haben, weniger zu sein, als das bösartige. Das ist, weil der Exponentialvertrieb einen langen Schwanz für positive Werte hat, aber Null für negative Zahlen ist.

Quantiles sind nützliche Maßnahmen, weil sie gegen den Vertrieb mit dem langen Schwanz und outliers weniger empfindlich sind. Empirisch, wenn die Daten, die analysieren werden, gemäß einem angenommenen Vertrieb nicht wirklich verteilt werden, oder wenn es andere potenzielle Quellen für outliers gibt, die weit vom bösartigen entfernt werden, dann kann quantiles nützlichere beschreibende Statistik sein als Mittel und andere Moment-zusammenhängende Statistik.

Nah verbunden ist das Thema von am wenigsten absoluten Abweichungen, eine Methode des rückwärts Gehens, das zu outliers robuster ist als, ist kleinste Quadrate, in denen die Summe des absoluten Werts der beobachteten Fehler im Platz des karierten Fehlers verwendet wird. Die Verbindung besteht darin, dass das bösartige die einzelne Schätzung eines Vertriebs ist, der erwarteten karierten Fehler minimiert, während die Mittellinie erwarteten absoluten Fehler minimiert. Am wenigsten absolute Abweichungen teilen die Fähigkeit, gegen große Abweichungen in abgelegenen Beobachtungen relativ unempfindlich zu sein, obwohl noch bessere Methoden des robusten rückwärts Gehens verfügbar sind.

Die quantiles einer zufälligen Variable werden unter zunehmenden Transformationen im Sinn bewahrt, der, zum Beispiel, wenn die Mittellinie einer zufälligen Variable dann ist, die Mittellinie dessen ist, wenn eine willkürliche Wahl von einem Wertbereich nicht gemacht worden ist, einen besonderen quantile anzugeben. (Sieh quantile Bewertung unten für Beispiele solcher Interpolation.) kann Quantiles auch in Fällen verwendet werden, wo nur Ordnungsdaten verfügbar sind.

Das Schätzen des quantiles einer Bevölkerung

Es gibt mehrere Methoden, für den quantiles zu schätzen. Die umfassendste Breite von Methoden ist auf der R Programmiersprache verfügbar, die neun Probe quantile Methoden einschließt. SAS schließt fünf Probe quantile Methoden ein, STATA schließt zwei ein, und Microsoft Excel schließt denjenigen ein.

Tatsächlich schätzen die Methoden Q, die Schätzung für den kth q-quantile, wo p = k / q, von einer Probe der Größe N durch die Computerwissenschaft eines echten geschätzten Index h. Wenn h eine ganze Zahl ist, ist der hth kleinste von den N-Werten, x, die Quantile-Schätzung. Sonst wird Runden- oder Interpolationsschema verwendet, um die Quantile-Schätzung von h, x, und x. zu schätzen (Für die Notation, sieh Fußboden und Decke-Funktionen).

Schätzungstypen schließen ein:

Bemerken Sie, dass r-3 und r-4 h = (N + 1) / 2 wenn p = 1/2 nicht geben.

Der Standardfehler einer Quantile-Schätzung kann im Allgemeinen über die Stiefelstrippe geschätzt werden. Die Methode von Maritz-Jarrett kann auch verwendet werden. Bemerken Sie, dass sich Bayesian der quantile Bewertung nähert (zusammen mit einem glaubwürdigen Zwischenraum), scheitert mit einem unpassenden vorherigen, und ein richtiger vorheriger ist erforderlich.

Siehe auch


Source is a modification of the Wikipedia article Quantile, licensed under CC-BY-SA. Full list of contributors here.
Quantization (Physik) / Geschichte Qatars
Impressum & Datenschutz