Kasten-Anschlag

In der beschreibenden Statistik, einem Kasten-Anschlag oder boxplot (auch bekannt als ein Diagramm des Kastens-Und-Schnurrhaars oder Anschlag) ist ein günstiger Weg, grafisch Gruppen von numerischen Daten durch ihre Fünf-Zahlen-Zusammenfassungen zu zeichnen: Die kleinste Beobachtung (Beispielminimum), senken Sie quartile (Q1), Mittellinie (Q2), oberer quartile (Q3), und größte Beobachtung (Beispielmaximum). Ein boxplot kann auch anzeigen, welche Beobachtungen falls etwa, als outliers betrachtet werden könnten.

Boxplots zeigen Unterschiede zwischen Bevölkerungen, ohne irgendwelche Annahmen des zu Grunde liegenden statistischen Vertriebs zu machen: Sie sind nichtparametrisch.

Der Abstand zwischen den verschiedenen Teilen des Kastens hilft, den Grad der Streuung (Ausbreitung) und Schiefe in den Daten anzuzeigen, und outliers zu identifizieren. Boxplots kann entweder horizontal oder vertikal angezogen werden.

Alternative Formen

Kasten und Schnurrhaar-Anschläge sind in ihrem Gebrauch des Kastens gleichförmig: Der Boden und die Spitze des Kastens sind immer der 25. und 75. Prozentanteil (der niedrigere und obere quartiles, beziehungsweise), und das Band in der Nähe von der Mitte des Kastens ist immer der 50. Prozentanteil (die Mittellinie). Aber die Enden der Schnurrhaare können mehrere mögliche alternative Werte, unter ihnen vertreten:

  • das Minimum und Maximum aller Daten (als in der Abbildung 2)
  • die niedrigste Gegebenheit noch innerhalb von 1.5 IQR tiefer quartile und die höchste Gegebenheit noch innerhalb von 1.5 IQR des oberen quartile (als in der Abbildung 3)
  • eine Standardabweichung oben und unter den bösartigen von den Daten
  • der 9. Prozentanteil und der 91. Prozentanteil
  • der 2. Prozentanteil und der 98. Prozentanteil.

Irgendwelche zwischen den Schnurrhaaren nicht eingeschlossenen Daten sollten als ein outlier mit einem Punkt, kleinem Kreis oder Stern geplant werden, aber gelegentlich wird das nicht getan.

Einige Kasten-Anschläge schließen einen zusätzlichen Charakter ein, um die bösartigen von den Daten zu vertreten.

Auf einigen Kasten-Anschlägen wird eine Kreuzschraffur auf jedem Schnurrhaar vor dem Ende des Schnurrhaars gelegt.

Selten können Kasten-Anschläge ohne Schnurrhaare überhaupt präsentiert werden.

Wegen dieser Veränderlichkeit ist es passend, die Tagung zu beschreiben, die für die Schnurrhaare und outliers in der Überschrift für den Anschlag wird verwendet.

Die ungewöhnlichen Prozentanteile 2 %, 9 %, 91 %, werden 98 % manchmal für die Schnurrhaar-Kreuzschraffur und Schnurrhaar-Enden verwendet, um die Sieben-Zahlen-Zusammenfassung zu zeigen. Wenn die Daten normalerweise verteilt werden, werden die Positionen der sieben Zeichen auf dem Kasten-Anschlag ebenso unter Drogeneinfluss sein.

Schwankungen

Mehrere Schwankungen auf dem traditionellen Kasten-Anschlag sind beschrieben worden. Zwei der allgemeinsten sind variable Breite-Kasten-Anschläge und eingekerbte Kasten-Anschläge (sieh Abbildung 4).

Variable Breite-Kasten-Anschläge illustrieren die Größe jeder Gruppe, deren Daten durch das Bilden der Breite des zur Größe der Gruppe proportionalen Kastens geplant wird. Eine populäre Tagung ist, die Kasten-Breite proportional zur Quadratwurzel der Größe der Gruppe zu machen.

Eingekerbte Kasten-Anschläge wenden eine "Kerbe" oder das Einengen des Kastens um die Mittellinie an. Kerben sind im Angebot eines rauen Handbuches zur Bedeutung des Unterschieds von Mittellinien nützlich; wenn die Kerben von zwei Kästen nicht überlappen, bietet das Beweise eines statistisch bedeutenden Unterschieds zwischen den Mittellinien an. Die Breite der Kerben ist zur interquartile Reihe der Probe proportional und zur Quadratwurzel der Größe der Probe umgekehrt proportional. Jedoch gibt es Unklarheit über den passendsten Vermehrer (weil sich das abhängig von der Ähnlichkeit der Abweichungen der Proben ändern kann). Eine Tagung ist zu verwenden.

Vergegenwärtigung

Der boxplot ist eine schnelle Weise, einen oder mehr Sätze von Daten grafisch zu untersuchen. Boxplots kann primitiver scheinen als ein histogram oder Kerndichte-Schätzung, aber sie sind wirklich im Vorteil. Sie nehmen weniger Raum auf und sind deshalb besonders nützlich, um Vertrieb unter mehreren Gruppen oder Sätzen von Daten zu vergleichen (sieh Abbildung 1 für ein Beispiel). Wahl der Zahl und Breite von Behälter-Techniken können das Äußere eines histogram schwer beeinflussen, und die Wahl der Bandbreite kann das Äußere einer Kerndichte-Schätzung schwer beeinflussen.

Als schauend auf einen statistischen Vertrieb ist intuitiver, als das Schauen an einem boxplot, den boxplot gegen die Wahrscheinlichkeitsdichte-Funktion (theoretischer histogram) für einen normalen N (0,1σ) Vertrieb vergleichend, ein nützliches Werkzeug sein kann, für den boxplot (Abbildung 5) zu verstehen.

Siehe auch

  • Forschungsdatenanalyse
  • Funktioneller Boxplots
  • Geige-Anschlag

Links


Kampf des weißen Bergs / Samuel Smiles
Impressum & Datenschutz