Metaphone

:Lawrence Philips adressiert hier um. Für den Footballspieler, sieh Lawrence Phillips.

Metaphone ist ein fonetischer Algorithmus, ein Algorithmus veröffentlicht 1990, um Wörter durch ihre englische Artikulation mit einem Inhaltsverzeichnis zu versehen. Es übertrifft im Wesentlichen den Algorithmus von Soundex durch das Verwenden der Information über Schwankungen und Widersprüchlichkeiten in der englischen Rechtschreibung und Artikulation, um eine genauere Verschlüsselung zu erzeugen, die einen besseren Job tut, Wörter und Namen zu vergleichen, die ähnlich klingen. Als mit Soundex sollten ähnliche tönende Wörter dieselben Schlüssel teilen. Metaphone ist als ein eingebauter Maschinenbediener in mehreren Systemen einschließlich späterer Versionen von PHP verfügbar.

Der ursprüngliche Autor hat später eine neue Version des Algorithmus erzeugt, den er Doppelten Metaphone genannt hat. Gegen den ursprünglichen Algorithmus, dessen Anwendung auf Englisch nur beschränkt wird, zieht diese Version sich schreibende Besonderheiten mehrerer anderer Sprachen in Betracht. 2009 hat Lawrence Philips eine dritte Version, genannt Metaphone 3 veröffentlicht, der eine Genauigkeit von etwa 99 % für englische Wörter, nichtenglische Wörter erreicht, die für Amerikaner, und Vornamen und Familiennamen allgemein vertraut sind, die in den Vereinigten Staaten gefunden sind, gemäß modernen Technikstandards gegen ein Testgeschirr von bereitem richtigem encodings entwickelt worden sein.

Verfahren

Codes von Metaphone verwenden die 16 konsonanten Symbole 0BFHJKLMNPRSTWXY. '0' vertritt "th" (als eine ASCII Annäherung &Theta), 'X' vertritt "sch" oder "ch", und andere vertreten ihre üblichen englischen Artikulationen. Die Vokale AEIOU werden auch verwendet, aber nur am Anfang des Codes.

  1. Fall-Duplikat angrenzende Briefe, abgesehen von C.
  2. Wenn das Wort mit 'KN', 'GN', 'PN' beginnt, lassen 'AE', 'WR', den ersten Brief fallen.
  3. Lassen Sie 'B' wenn nach 'der M' am Ende des Wortes fallen.
  4. 'C' verwandelt sich zu 'X', wenn gefolgt, von 'IA' oder 'H' (wenn im letzten Fall es ein Teil von '-sch-nicht ist ', in welchem Fall es sich zu 'K' verwandelt). 'C' verwandelt sich zu 'S', wenn gefolgt, von 'mir', 'E' oder 'Y'. Sonst verwandelt sich 'C' zu 'K'.
  5. 'D' verwandelt sich zu 'J', wenn gefolgt, von 'GE', 'GY' oder 'GI'. Sonst verwandelt sich 'D' zu 'T'.
  6. Lassen Sie 'G', wenn gefolgt, von 'H' fallen, und 'H' ist nicht am Ende oder vor einem Vokal. Lassen Sie 'G', wenn gefolgt, von 'N' oder 'NED' fallen, und ist am Ende.
  7. 'G' verwandelt sich zu 'J' wenn, bevor 'ich', 'E' oder 'Y', und es nicht in 'GG' ist. Sonst verwandelt sich 'G' zu 'K'.
  8. Lassen Sie 'H' wenn nach dem Vokal und nicht vor einem Vokal fallen.
  9. 'CK' verwandelt sich zu 'K'.
  10. 'PH' verwandelt sich zu 'F'.
  11. 'Q' verwandelt sich zu 'K'.
  12. 'S' verwandelt sich zu 'X', wenn gefolgt, von 'H', 'IO' oder 'IA'.
  13. 'T' verwandelt sich zu 'X', wenn gefolgt, von 'IA' oder 'IO'. 'TH' verwandelt sich zu '0'. Lassen Sie 'T', wenn gefolgt, von 'CH' fallen.
  14. 'V' verwandelt sich zu 'F'.
  15. 'WH' verwandelt sich zu 'W' wenn am Anfang. Lassen Sie 'W' wenn nicht gefolgt von einem Vokal fallen.
  16. 'X' verwandelt sich zu 'S' wenn am Anfang. Sonst, 'X' verwandelt sich zu 'KS'.
  17. Lassen Sie 'Y' wenn nicht gefolgt von einem Vokal fallen.
  18. 'Z' verwandelt sich zu 'S'.
  19. Lassen Sie alle Vokale fallen, wenn es der Anfang nicht ist.

Doppelter Metaphone

Der Doppelte Metaphone fonetische Verschlüsselungsalgorithmus ist die zweite Generation dieses Algorithmus. Seine Durchführung wurde im Problem im Juni 2000 von C/C ++ Benutzerzeitschrift beschrieben.

Es wird "Doppelt" genannt, weil es sowohl eine Vorwahl als auch einen sekundären Code für eine Schnur zurückgeben kann; das ist für einige zweideutige Fälle sowie für vielfache Varianten von Nachnamen mit der allgemeinen Herkunft verantwortlich. Zum Beispiel gibt die Verschlüsselung des Namens "Schmied" einen primären Code von SM0 und einen sekundären Code von XMT nach, während der Name "Schmidt" einen primären Code von XMT und einen sekundären Code von SMT nachgibt - haben beide XMT gemeinsam.

Verdoppeln Sie Versuche von Metaphone, für unzählige Unregelmäßigkeiten in Englisch des slawischen, germanischen, keltischen, griechischen, französischen, italienischen, spanischen, chinesischen und anderen Ursprungs verantwortlich zu sein. So verwendet es einen viel komplizierteren ruleset, um zu codieren, als sein Vorgänger; zum Beispiel prüft es für etwa 100 verschiedene Zusammenhänge des Gebrauches des Briefs C allein.

Metaphone 3

Eine Berufsversion wurde im Oktober 2009, entwickelte von demselben Autor, Lawrence Philips veröffentlicht. Metaphone 3 verbessert weiter fonetische Verschlüsselung von Wörtern auf der englischen Sprache, nichtenglische Wörter, die für Amerikaner, und Vornamen und in den Vereinigten Staaten allgemein gefundene Familiennamen vertraut sind. Es verbessert Verschlüsselung für für Eigennamen insbesondere in einem beträchtlichen Ausmaß. Der Autor behauptet, dass im Allgemeinen es Genauigkeit für alle Wörter von den etwa 89 % von Doppeltem Metaphone zu mehr als 99 % verbessert. Entwickler können auch jetzt Schalter setzen in zu codieren, um den Algorithmus zu veranlassen, Schlüssel von Metaphone zu verschlüsseln, 1) nichtanfängliche Vokale in Betracht ziehend, sowie 2) geäußerte und stimmlose Konsonanten verschieden verschlüsselnd. Das erlaubt dem Ergebnis-Satz, näher eingestellt zu werden, wenn der Entwickler findet, dass die Suchergebnisse zu viele Wörter einschließen, die dem Suchbegriff nah genug nicht ähneln. Metaphone 3 wird als Quellcode in C ++, Java und C#. verkauft

Siehe auch

  • Caverphone
  • Soundex
  • Identifizierung von Staat New York und Nachrichtendienstsystem
  • Match-Schätzungsannäherung

Links

http://www.codeproject.com/string/dmetaphone1.asp

Metaphone Durchführungen

Verdoppeln Sie Metaphone Durchführungen

http://web.archive.org/web/20080101012741/http://www.cuj.com/documents/s=8038/cuj0006philips/
  • C# sieh:
http://www.codeproject.com/KB/recipes/dmetaphone5.aspx http://search.cpan.org/dist/Text-DoubleMetaphone/ http://pecl.php.net/package/doublemetaphone http://commons.apache.org/codec/userguide.html http://www.atomodo.com/code/double-metaphone http://www.postgresql.org/docs/current/static/fuzzystrmatch.html http://www.atomodo.com/code/double-metaphone
  • Plausch, Quieken, auch mit SoundEx, sieht:
http://www.squeaksource.com/SoundsLike.html
  • Visuell Grundlegend sieh:
http://www.snakelegs.org/2008/01/18/double-metaphone-visual-basic-implementation/ http://bytes.com/topic/access/answers/192513-metaphone-source-code/

Fonetischer Algorithmus / Audiovideoauslassung
Impressum & Datenschutz