Charakter (Computerwissenschaft)

Im Computer und der maschinenbasierten Fernmeldefachsprache ist ein Charakter eine Einheit der Information, die grob einem Graphem, einem Graphem ähnlicher Einheit oder Symbol, solcher als in einem Alphabet oder Silbenschrift in der schriftlichen Form einer natürlichen Sprache entspricht.

Beispiele von Charakteren schließen Briefe, numerische Ziffern und allgemeine Satzzeichen (solcher als"." oder "-") ein. Das Konzept schließt auch Kontrollcharaktere ein, die Symbolen in einer besonderen natürlichen Sprache nicht entsprechen, aber eher zu anderen Bit der Information hat gepflegt, Text auf einer oder mehr Sprachen zu bearbeiten. Beispiele von Kontrollcharakteren schließen Wagen-Rückkehr oder Etikett, sowie Instruktionen Druckern oder anderen Geräten ein, die zeigen oder sonst Text bearbeiten.

Charaktere werden normalerweise in Schnuren verbunden.

Charakter-Verschlüsselung

Computer und Nachrichtenausrüstung vertreten Charaktere mit einem Charakter, der verschlüsselt, der jeden Charakter etwas — einer Menge der ganzen Zahl zuteilt, die durch eine Folge von Bit normalerweise vertreten ist —, der versorgt oder durch ein Netz übersandt werden kann. Zwei Beispiele von populärem encodings sind ASCII und der UTF-8, der für Unicode verschlüsselt. Während der grösste Teil des Charakters encodings Karte-Charaktere zu Zahlen und/oder Bit-Folgen, Morsezeichen-Code stattdessen Charaktere mit einer Reihe von elektrischen Impulsen der unterschiedlichen Länge vertritt.

Fachsprache

Historisch ist der Begriff Charakter von Industriefachleuten weit gebraucht worden, um sich auf einen verschlüsselten Charakter, häufig wie definiert, durch die Programmiersprache oder API zu beziehen). Ebenfalls ist Codierung weit verwendet worden, um sich auf ein spezifisches Repertoire von Charakteren zu beziehen, die zu spezifischen Bit-Folgen oder numerischen Codes kartografisch dargestellt worden sind. Der Begriff glyph wird gebraucht, um ein besonderes Sehäußeres eines Charakters zu beschreiben. Viele Computerschriftarten bestehen aus glyphs, die durch den numerischen Code des entsprechenden Charakters mit einem Inhaltsverzeichnis versehen werden.

Mit dem Advent und der weit verbreiteten Annahme von Unicode und Bit-Agnostiker, der Formen verschlüsselt, wird ein Charakter als eine Einheit der Information zunehmend gesehen, von jeder besonderen Sehmanifestation unabhängig. Der ISO/IEC 10646 (Unicode) Internationaler Standard definiert Charakter oder abstrakten Charakter als "ein Mitglied von einer Reihe von Elementen, die für die Organisation, Kontrolle oder Darstellung von Daten verwendet ist". Die Definition von Unicode ergänzt das mit erklärenden Zeichen, die den Leser dazu ermuntern, zwischen Charakteren, Graphemen und glyphs unter anderem zu differenzieren.

Zum Beispiel wird der hebräische Brief aleph ("  ") häufig von Mathematikern verwendet, um bestimmte Arten der Unendlichkeit anzuzeigen, aber es wird auch im gewöhnlichen hebräischen Text verwendet. In Unicode wird dieser zwei Gebrauch als verschiedene Charaktere betrachtet, und hat zwei verschiedene Unicode numerische Bezeichner ("Codepunkte"), obwohl sie identisch gemacht werden können. Umgekehrt kann der chinesische logogram für Wasser ("  ") ein ein bisschen verschiedenes Äußeres in japanischen Texten haben, als es in chinesischen Texten tut, und lokale Schriftbilder das widerspiegeln können. Aber dennoch in Unicode werden sie als derselbe Charakter betrachtet, und teilen denselben Codepunkt.

Der Unicode Standard differenziert auch zwischen diesen abstrakten Charakteren und codierten Charakteren oder verschlüsselten Charakteren, die mit numerischen Codes paarweise angeordnet worden sind, die ihre Darstellung in Computern erleichtern.

Rotforelle

Auf der C Programmiersprache ist eine Byte-Entität der festen Größe, die groß genug ist, um einen Charakter-Wert von ASCII oder anderem encodings zu versorgen. Da häufig nur 256 verschiedene Werte in einem Byte versorgt werden können, ist es unmöglich, Charaktere von Unicode und anderen modernen Sätzen in a zu versorgen. Stattdessen werden größere Lagerungseinheiten solcher als, oder mehr als ein Byte pro Charakter wie UTF-8, verwendet.

Leider hat die Tatsache, dass ein Charakter in einem Byte versorgt wurde, zu den zwei Begriffen geführt, die austauschbar im grössten Teil der Dokumentation verwenden werden. Das macht häufig die Dokumentation verwirrend und/oder irreführend, wenn Mehrbyte encodings wie UTF-8 verwendet wird, und zu ineffizienten und falschen Durchführungen von Schnur-Manipulationsfunktionen geführt hat.

Wortcharakter

Ein "Wort"-Charakter hat spezielle Bedeutung in einigen Aspekten der Computerwissenschaft. Ein "Wortcharakter" bedeutet normalerweise einen Buchstaben vom Alphabet A-Z (Großbuchstaben oder untere Umschaltung), die Ziffern 0 bis 9, und das Unterstreichen.

Siehe auch

  • Füllen Sie Charakter
  • Das Kombinieren des Charakters
  • Universale Codierungscharaktere

Links


E.T. der Außerirdische / Leichter Reiter
Impressum & Datenschutz