Frequenzanalyse

In cryptanalysis ist Frequenzanalyse die Studie der Frequenz von Briefen oder Gruppen von Briefen in einem ciphertext. Die Methode wird als eine Hilfe zum Brechen klassischer Ziffern verwendet.

Frequenzanalyse basiert auf der Tatsache, dass, in jedem gegebenen Strecken der geschriebenen Sprache, bestimmte Briefe und Kombinationen von Briefen mit unterschiedlichen Frequenzen vorkommen. Außerdem gibt es einen charakteristischen Vertrieb von Briefen, der grob dasselbe für fast alle Proben dieser Sprache ist. Zum Beispiel, in Anbetracht einer Abteilung der englischen Sprache, und sind am üblichsten, während, und selten sind. Ebenfalls, und sind die allgemeinsten Paare von Briefen (hat bigrams oder Digraphe genannt), und, und sind die allgemeinsten Wiederholungen. Der Quatsch-Ausdruck "ETAOIN SHRDLU" vertritt die 12 häufigsten Briefe im typischen englischen Sprachtext.

In einigen Ziffern werden solche Eigenschaften der natürlichen Sprache plaintext im ciphertext bewahrt, und diese Muster haben das in einem ciphertext-einzigen Angriff auszunutzende Potenzial.

Frequenzanalyse für einfache Ersatz-Ziffern

In einer einfachen Ersatz-Ziffer wird jeder Brief des plaintext durch einen anderen ersetzt, und jeder besondere Brief im plaintext wird immer in denselben Brief im ciphertext umgestaltet. Zum Beispiel, wenn sich alle Ereignisse des Briefs in den Brief verwandeln, würde eine ciphertext Nachricht, die zahlreiche Beispiele des Briefs enthält, zu einem cryptanalyst andeuten, der vertritt.

Der grundlegende Gebrauch der Frequenzanalyse soll zuerst die Frequenz von ciphertext Briefen aufzählen und dann erratene plaintext Briefe mit ihnen vereinigen. Mehr 's im ciphertext als irgend etwas anderes weisen darauf hin, dass das im plaintext entspricht, aber das ist nicht sicher; und sind auch in Englisch sehr üblich, so könnte irgendein ihrer auch sein. Es wird kaum ein plaintext sein, oder die weniger üblich sind. So muss der cryptanalyst eventuell mehrere Kombinationen von mappings zwischen ciphertext und plaintext Briefen versuchen.

Der kompliziertere Gebrauch der Statistik, kann wie das Betrachten von Zählungen von Paaren von Briefen (digrams), Drillingen (trigrams) und so weiter konzipiert werden. Das wird getan, um mehr Auskunft zum cryptanalyst zum Beispiel zu geben, und fast immer zusammen in dieser Ordnung in Englisch vorzukommen, wenn auch selbst selten ist.

Ein Beispiel

Nehmen Sie an, dass Vorabend das Kryptogramm unten abgefangen hat, und, wie man bekannt, es encrypted das Verwenden einer einfachen Ersatz-Ziffer ist:

LIVITCSWPIYVEWHEVSRIQMXLEYVEOIEWHRXEXIPFEMVEWHKVSTYLXZIXLIKIIXPIJVSZEYPERRGERIM WQLMGLMXQERIWGPSRIHMXQEREKIETXMJTPRGEVEKEITREWHEXXLEXXMZITWAWSQWXSWEXTVEPMRXRSJ GSTVRIEYVIEXCVMUIMWERGMIWXMJMGCSMWXSJOMIQXLIVIQIVIXQSVSTWHKPEGARCSXRWIEVSWIIBXV IZMXFSJXLIKEGAEWHEPSWYSWIWIEVXLISXLIVXLIRGEPIRQIVIIBGIIHMWYPFLEVHEWHYPSRRFQMXLE PPXLIECCIEVEWGISJKTVWMRLIHYSPHXLIQIMYLXSJXLIMWRIGXQEROIVFVIZEVAEKPIEWHXEAMWYEPP XLMWYRMWXSGSWRMHIVEXMSWMGSTPHLEVHPFKPEZINTCMXIVJSVLMRSCMWMSWVIRCIGXMWYMX

Für dieses Beispiel werden Großbuchstaben verwendet, um ciphertext anzuzeigen, Kleinbuchstaben werden verwendet, um plaintext anzuzeigen (oder schätzt auf solchen), und ~ wird verwendet, um eine Annahme auszudrücken, dass ciphertext Brief den plaintext Brief vertritt.

Eve konnte Frequenzanalyse verwenden, um zu helfen, die Nachricht entlang den folgenden Linien zu lösen: Zählungen der Briefe im Kryptogramm zeigen, dass das der allgemeinste einzelne Brief, allgemeinster bigram ist, und der allgemeinste trigram. ist, ist der allgemeinste Brief auf der englischen Sprache, ist der allgemeinste bigram und der allgemeinste trigram. Das weist stark dass ~, ~ und ~ darauf hin. Der zweite allgemeinste Brief im Kryptogramm ist; seit den ersten und zweiten häufigsten Briefen auf der englischen Sprache, und werden verantwortlich gewesen, Eve glaubt dass ~, der dritte häufigste Brief. Versuchsweise diese Annahmen machend, wird die folgende teilweise entschlüsselte Nachricht erhalten.

heVeTCSWPeYVaWHaVSReQMthaYVaOeaWHRtatePFaMVaWHKVSTYhtZetheKeetPeJVSZaYPaRRGaReM WQhMGhMtQaReWGPSReHMtQaRaKeaTtMJTPRGaVaKaeTRaWHatthattMZeTWAWSQWtSWatTVaPMRtRSJ GSTVReaYVeatCVMUeMWaRGMeWtMJMGCSMWtSJOMeQtheVeQeVetQSVSTWHKPaGARCStRWeaVSWeeBtV eZMtFSJtheKaGAaWHaPSWYSWeWeaVtheStheVtheRGaPeRQeVeeBGeeHMWYPFhaVHaWHYPSRRFQMtha PPtheaCCeaVaWGeSJKTVWMRheHYSPHtheQeMYhtSJtheMWReGtQaROeVFVeZaVAaKPeaWHtaAMWYaPP thMWYRMWtSGSWRMHeVatMSWMGSTPHhaVHPFKPaZeNTCMteVJSVhMRSCMWMSWVeRCeGtMWYMt

Mit diesen anfänglichen Annahmen kann Eve Muster entdecken, die ihre Wahlen, solcher als "" bestätigen. Außerdem deuten andere Muster weitere Annahmen an. ""könnte" sein", der ~ bedeuten würde. Ähnlich ""konnte als" erraten werden", ~ und ~ tragend. Außerdem, ""könnte" sein", ~ gebend. Diese Annahmen ausfüllend, kommt Eve:

hereTCSWPeYraWHarSseQithaYraOeaWHstatePFairaWHKrSTYhtmetheKeetPeJrSmaYPassGasei WQhiGhitQaseWGPSseHitQasaKeaTtiJTPsGaraKaeTsaWHatthattimeTWAWSQWtSWatTraPistsSJ GSTrseaYreatCriUeiWasGieWtiJiGCSiWtSJOieQthereQeretQSrSTWHKPaGAsCStsWearSWeeBtr emitFSJtheKaGAaWHaPSWYSWeWeartheStherthesGaPesQereeBGeeHiWYPFharHaWHYPSssFQitha PPtheaCCearaWGeSJKTrWisheHYSPHtheQeiYhtSJtheiWseGtQasOerFremarAaKPeaWHtaAiWYaPP thiWYsiWtSGSWsiHeratiSWiGSTPHharHPFKPameNTCiterJSrhisSCiWiSWresCeGtiWYit

Der Reihe nach deuten diese Annahmen noch andere an (zum Beispiel, ""konnte" sein", ~ einbeziehend), und so weiter, und es relativ aufrichtig ist, um den Rest der Briefe abzuleiten, schließlich den plaintext nachgebend.

hereuponlegrandarosewithagraveandstatelyairandbroughtmethebeetlefromaglasscasei nwhichitwasencloseditwasabeautifulscarabaeusandatthattimeunknowntonaturalistsof courseagreatprizeinascientificpointofviewthereweretworoundblackspotsnearoneextr emityofthebackandalongoneneartheotherthescaleswereexceedinglyhardandglossywitha lltheappearanceofburnishedgoldtheweightoftheinsectwasveryremarkableandtakingall thingsintoconsiderationicouldhardlyblamejupiterforhisopinionrespectingit

An diesem Punkt würde es eine gute Idee für Eve sein, Räume und Zeichensetzung einzufügen:

Hierauf ist Legrand mit einer ernsten und stattlichen Luft entstanden, und hat mir den Käfer gebracht

von einem Glasfall, in dem es eingeschlossen wurde. Es war ein schöner scarabaeus, und an

diese Zeit, die Naturforschern natürlich ein großer Preis in einem wissenschaftlichen Punkt unbekannt

ist

der Ansicht. Es gab zwei runde Gefahrenstellen in der Nähe von einem äußerstem Ende des Rückens und einen

lange eine Nähe der andere. Die Skalen waren außerordentlich hart und mit dem ganzen glänzend

Äußeres von poliertem Gold. Das Gewicht des Kerbtiers, war und, sehr bemerkenswert

alle Dinge berücksichtigend, konnte ich Jupiter für seine Meinung kaum verantwortlich machen

das Respektieren davon.

In diesem Beispiel vom Goldprogrammfehler waren die Annahmen des Vorabends alle richtig. Das würde jedoch nicht immer der Fall sein; die Schwankung in der Statistik für individuellen plaintexts kann bedeuten, dass anfängliche Annahmen falsch sind. Es kann notwendig sein, falsche Annahmen denselben Weg zurückzuverfolgen oder die verfügbare Statistik in viel mehr Tiefe zu analysieren, als die etwas vereinfachten Rechtfertigungen eingereicht das obengenannte Beispiel.

Es ist auch möglich, dass der plaintext den erwarteten Vertrieb von Brief-Frequenzen nicht ausstellt. Kürzere Nachrichten werden wahrscheinlich mehr Schwankung zeigen. Es ist auch möglich, künstlich verdrehte Texte zu bauen. Zum Beispiel sind komplette Romane geschrieben worden, die den Brief "" zusammen - eine Form der als ein lipogram bekannten Literatur weglassen.

Geschichte und Gebrauch

Die erste bekannte registrierte Erklärung der Frequenzanalyse (tatsächlich, jeder Art von cryptanalysis) wurde im 9. Jahrhundert von Al-Kindi, einer arabischen Polymathematik, in Einem Manuskript bei der Entzifferung Kryptografischer Nachrichten gegeben. Es ist darauf hingewiesen worden, dass nahe die Textstudie von Qur'an, der zuerst gebracht ist, um dieses Arabisch anzuzünden, eine charakteristische Brief-Frequenz hat. Sein Gebrauch hat sich ausgebreitet, und ähnliche Systeme wurden in europäischen Staaten zurzeit der Renaissance weit verwendet. Vor 1474 hatte Cicco Simonetta ein Handbuch über die Entzifferung von Verschlüsselungen des lateinischen und italienischen Textes geschrieben. Arabische Brief-Frequenz und eine ausführliche Studie des Briefs und Wortfrequenzanalyse des kompletten Buches von Qur'an werden durch Intellaren Artikel zur Verfügung gestellt.

Mehrere Schemas wurden von Kryptographen erfunden, um diese Schwäche in einfachen Ersatz-Verschlüsselungen zu vereiteln. Diese haben eingeschlossen:

  • Der Gebrauch von Homophonen - mehrere Alternativen zu den allgemeinsten Briefen in sonst monoalphabetischen Ersatz-Ziffern (zum Beispiel, für Englisch, sowohl X als auch Y könnte ciphertext plaintext E bedeuten).
  • Polyalphabetischer Ersatz, d. h. der Gebrauch von mehreren Alphabeten - gewählt im geordneten, mehr oder weniger gewundenen, Wege (scheint Leone Alberti, erst gewesen zu sein, um das vorzuschlagen); und
  • Polygrafischer Ersatz, Schemas, wo Paare oder Drillinge von plaintext Briefen als Einheiten für den Ersatz, aber nicht einzelne Briefe (zum Beispiel, die Ziffer von Playfair behandelt werden, die von Charles Wheatstone Mitte des 19. Jahrhunderts erfunden ist).

Ein Nachteil aller dieser Versuche, Frequenzzählen-Angriffe zu vereiteln, ist, dass es Komplikation sowohl des Chiffrierens als auch der Entzifferung vergrößert, zu Fehlern führend. Berühmt, wie man sagt, hat ein britischer Außenminister die Ziffer von Playfair zurückgewiesen, weil, selbst wenn Schuljungen erfolgreich gewachsen sein konnten, weil sich Wheatstone und Playfair gezeigt hatten, 'unsere Attachés es nie erfahren konnten!'.

Die Rotor-Maschinen der ersten Hälfte des 20. Jahrhunderts (zum Beispiel, die Mysterium-Maschine) waren zur aufrichtigen Frequenzanalyse im Wesentlichen geschützt.

Jedoch haben andere Arten der Analyse ("Angriffe") erfolgreich Nachrichten von einigen jener Maschinen decodiert.

Frequenzanalyse verlangt nur ein grundlegende Verstehen der Statistik der plaintext Sprache und eines Problems, Sachkenntnisse, und, wenn durchgeführt, mit der Hand, etwas Toleranz für die umfassende Brief-Buchhaltung lösend. Während des Zweiten Weltkriegs (WWII) haben sowohl die Briten als auch die Amerikaner codebreakers rekrutiert, indem sie Kreuzworträtsel in Hauptzeitungen gelegt haben und Wettbewerbe dafür gestartet haben, wer sie das schnellste lösen konnte. Mehrere der durch die Achse-Mächte verwendeten Ziffern waren zerbrechliche Verwenden-Frequenzanalyse (zum Beispiel, einige der konsularischen Ziffern, die von den Japanern verwendet sind). Mechanische Methoden des Brief-Zählens und der statistischen Analyse (allgemein Karte-Typ-Maschinerie von IBM) wurden zuerst in WWII vielleicht durch den SIS der US-Armee verwendet. Heute ist die harte Arbeit des Brief-Zählens und der Analyse durch die Computersoftware ersetzt worden, die solche Analyse in Sekunden ausführen kann. Mit der modernen Rechenmacht werden klassische Ziffern kaum jeden echten Schutz für vertrauliche Daten zur Verfügung stellen.

Frequenzanalyse in der Fiktion

Frequenzanalyse ist in der Fiktion beschrieben worden. Edgar Allan Poe "Der Goldprogrammfehler" und das Märchen von Sherlock Holmes von Herrn Arthur Conan Doyle "Das Abenteuer der Tanzenden Männer" ist Beispiele von Geschichten, die den Gebrauch der Frequenzanalyse beschreiben, um einfache Ersatz-Ziffern anzugreifen. Die Ziffer in der Geschichte von Poe ist mit mehreren Betrug-Maßnahmen verkrustet, aber das ist mehr ein literarisches Gerät als irgendetwas Bedeutendes kryptografisch.

Siehe auch

Themen in der Geheimschrift
  • Das Gesetz von Zipf
  • Eine Leere, ein Roman von Georges Perec. Der ursprüngliche französische Text wird ohne den Brief e geschrieben, wie die englische Übersetzung ist. Die spanische Version enthält keinen a.

Weiterführende Literatur

  • Helen Fouché Gaines, "Cryptanalysis", 1939, Dover. Internationale Standardbuchnummer 0-486-20097-3
  • Abraham Sinkov, "Elementarer Cryptanalysis: Eine Mathematische Annäherung", Die Mathematische Vereinigung Amerikas, 1966. Internationale Standardbuchnummer 0-88385-622-0.

Links


Thomas Tenison / Plaintext
Impressum & Datenschutz