knowledgr.de

Charakter (Computerwissenschaft)

Neues Wissen!

Im Computer und der maschinenbasierten Fernmeldefachsprache ist ein Charakter eine Einheit der Information, die grob einem Graphem, einem Graphem ähnlicher Einheit oder Symbol, solcher als in einem Alphabet oder Silbenschrift in der schriftlichen Form einer natürlichen Sprache entspricht.

Beispiele von Charakteren schließen Briefe, numerische Ziffern und allgemeine Satzzeichen (solcher als"." oder "-") ein. Das Konzept schließt auch Kontrollcharaktere ein, die Symbolen in einer besonderen natürlichen Sprache nicht entsprechen, aber eher zu anderen Bit der Information hat gepflegt, Text auf einer oder mehr Sprachen zu bearbeiten. Beispiele von Kontrollcharakteren schließen Wagen-Rückkehr oder Etikett, sowie Instruktionen Druckern oder anderen Geräten ein, die zeigen oder sonst Text bearbeiten.

Charaktere werden normalerweise in Schnuren verbunden.

Charakter-Verschlüsselung

Computer und Nachrichtenausrüstung vertreten Charaktere mit einem Charakter, der verschlüsselt, der jeden Charakter etwas — einer Menge der ganzen Zahl zuteilt, die durch eine Folge von Bit normalerweise vertreten ist —, der versorgt oder durch ein Netz übersandt werden kann. Zwei Beispiele von populärem encodings sind ASCII und der UTF-8, der für Unicode verschlüsselt. Während der grösste Teil des Charakters encodings Karte-Charaktere zu Zahlen und/oder Bit-Folgen, Morsezeichen-Code stattdessen Charaktere mit einer Reihe von elektrischen Impulsen der unterschiedlichen Länge vertritt.

Fachsprache

Historisch ist der Begriff Charakter von Industriefachleuten weit gebraucht worden, um sich auf einen verschlüsselten Charakter, häufig wie definiert, durch die Programmiersprache oder API zu beziehen). Ebenfalls ist Codierung weit verwendet worden, um sich auf ein spezifisches Repertoire von Charakteren zu beziehen, die zu spezifischen Bit-Folgen oder numerischen Codes kartografisch dargestellt worden sind. Der Begriff glyph wird gebraucht, um ein besonderes Sehäußeres eines Charakters zu beschreiben. Viele Computerschriftarten bestehen aus glyphs, die durch den numerischen Code des entsprechenden Charakters mit einem Inhaltsverzeichnis versehen werden.

Mit dem Advent und der weit verbreiteten Annahme von Unicode und Bit-Agnostiker, der Formen verschlüsselt, wird ein Charakter als eine Einheit der Information zunehmend gesehen, von jeder besonderen Sehmanifestation unabhängig. Der ISO/IEC 10646 (Unicode) Internationaler Standard definiert Charakter oder abstrakten Charakter als "ein Mitglied von einer Reihe von Elementen, die für die Organisation, Kontrolle oder Darstellung von Daten verwendet ist". Die Definition von Unicode ergänzt das mit erklärenden Zeichen, die den Leser dazu ermuntern, zwischen Charakteren, Graphemen und glyphs unter anderem zu differenzieren.

Zum Beispiel wird der hebräische Brief aleph (" ") häufig von Mathematikern verwendet, um bestimmte Arten der Unendlichkeit anzuzeigen, aber es wird auch im gewöhnlichen hebräischen Text verwendet. In Unicode wird dieser zwei Gebrauch als verschiedene Charaktere betrachtet, und hat zwei verschiedene Unicode numerische Bezeichner ("Codepunkte"), obwohl sie identisch gemacht werden können. Umgekehrt kann der chinesische logogram für Wasser (" ") ein ein bisschen verschiedenes Äußeres in japanischen Texten haben, als es in chinesischen Texten tut, und lokale Schriftbilder das widerspiegeln können. Aber dennoch in Unicode werden sie als derselbe Charakter betrachtet, und teilen denselben Codepunkt.

Der Unicode Standard differenziert auch zwischen diesen abstrakten Charakteren und codierten Charakteren oder verschlüsselten Charakteren, die mit numerischen Codes paarweise angeordnet worden sind, die ihre Darstellung in Computern erleichtern.

Rotforelle

Auf der C Programmiersprache ist eine Byte-Entität der festen Größe, die groß genug ist, um einen Charakter-Wert von ASCII oder anderem encodings zu versorgen. Da häufig nur 256 verschiedene Werte in einem Byte versorgt werden können, ist es unmöglich, Charaktere von Unicode und anderen modernen Sätzen in a zu versorgen. Stattdessen werden größere Lagerungseinheiten solcher als, oder mehr als ein Byte pro Charakter wie UTF-8, verwendet.

Leider hat die Tatsache, dass ein Charakter in einem Byte versorgt wurde, zu den zwei Begriffen geführt, die austauschbar im grössten Teil der Dokumentation verwenden werden. Das macht häufig die Dokumentation verwirrend und/oder irreführend, wenn Mehrbyte encodings wie UTF-8 verwendet wird, und zu ineffizienten und falschen Durchführungen von Schnur-Manipulationsfunktionen geführt hat.

Wortcharakter

Ein "Wort"-Charakter hat spezielle Bedeutung in einigen Aspekten der Computerwissenschaft. Ein "Wortcharakter" bedeutet normalerweise einen Buchstaben vom Alphabet A-Z (Großbuchstaben oder untere Umschaltung), die Ziffern 0 bis 9, und das Unterstreichen.

Siehe auch

Füllen Sie Charakter
Das Kombinieren des Charakters
Universale Codierungscharaktere

Links

Charaktere: Eine kurze Einführung durch das Linux Informationsprojekt (LINFO)
ISO/IEC TR 15285:1998 fasst das Charakter-Modell des ISO/IEC zusammen, sich auf Fachsprache-Definitionen konzentrierend und zwischen Charakteren und glyphs differenzierend

Charakter-Verschlüsselung
Fachsprache
Rotforelle
Wortcharakter
Siehe auch
Links

Siehe auch:
2. Computergrafik
Apostroph
Bidirektionaler Text
Birmanisches Alphabet
Charakter
Computerdatenlagerung
Computerzahl-Format
Datenübertragung
IBM 650
Integrität der Charakter-Zählung
ISO 8601
Karte-Sortierer von IBM
Kennwort
Kontrollcharakter
Kürzung, Kopie und Teig
Liste von Datenstrukturen
Makro-(Informatik)
Monoid
Offener Standard
Pilcrow
Reihe-Datenstruktur
Schnur (Informatik)
Steve Wozniak
Typ Data
Unicode
Vektor-Grafik
Verbindungen (WWW-Browser)

E.T. der Außerirdische / Leichter Reiter Impressum & Datenschutz