Datei

Eine Datei (oder dataset) ist eine Datenerfassung, die gewöhnlich in der tabellarischen Form präsentiert ist. Jede Säule vertritt eine besondere Variable. Jede Reihe entspricht einem gegebenen Mitglied der fraglichen Datei. Es verzeichnet Werte für jede der Variablen, wie Höhe und Gewicht eines Gegenstands. Jeder Wert ist als eine Gegebenheit bekannt. Die Datei kann Daten für ein oder mehr Mitglieder entsprechend der Zahl von Reihen umfassen.

Nichttabellarische Dateien können die Form von erhöhten Reihen von Charakteren wie eine XML Datei annehmen.

Geschichte

Historisch ist der Begriff im Großrechner-Feld entstanden, wo es eine bestimmte Bedeutung sehr in der Nähe von der zeitgenössischen Computerdatei hatte.

Eigenschaften

Eine Datei hat mehrere Eigenschaften, die seine Struktur und Eigenschaften definieren. Diese schließen die Zahl und Typen der Attribute oder Variablen und der verschiedenen statistischen Maßnahmen ein, die auf sie wie Standardabweichung und kurtosis angewandt werden können.

Im einfachsten Fall gibt es nur eine Variable, und dann besteht die Datei aus einer Einzelspalte von Werten, häufig vertreten als eine Liste. Trotz des Namens ist solch eine univariate Datei nicht ein Satz im üblichen mathematischen Sinn, da ein gegebener Wert mehrmals vorkommen kann. Normalerweise ist die Ordnung nicht von Bedeutung, und dann, wie man betrachten kann, ist die Sammlung von Werten ein Mehrsatz aber nicht eine (bestellte) Liste.

Die Werte können Zahlen, wie reelle Zahlen oder ganze Zahlen sein, zum Beispiel eine Höhe einer Person in Zentimeter vertretend, aber können auch nominelle Daten (d. h., sein, aus numerischen Werten nicht bestehend), zum Beispiel eine Ethnizität einer Person vertretend. Mehr allgemein können Werte einigen der als ein Niveau des Maßes beschriebenen Arten sein. Für jede Variable werden die Werte normalerweise alle derselben Art sein. Jedoch, dort kann auch Werte "verpassen", die irgendwie angezeigt werden müssen.

In Statistikdateien, die gewöhnlich von wirklichen erhaltenen Beobachtungen durch die Stichprobenerhebung einer statistischen Bevölkerung und jeder Reihe gekommen sind, entspricht den Beobachtungen auf einem Element dieser Bevölkerung. Dateien können weiter durch Algorithmen zum Zweck erzeugt werden, bestimmte Arten der Software zu prüfen. Eine moderne statistische Analyse-Software wie PSPP präsentiert noch ihre Daten in der klassischen Datei Mode.

Klassische Dateien

Mehrere klassische Dateien sind umfassend in der statistischen Literatur verwendet worden:

Siehe auch

Referenzen

Außenverbindungen


Source is a modification of the Wikipedia article Data set, licensed under CC-BY-SA. Full list of contributors here.
DDT / DMA
Impressum & Datenschutz