Wenn man bei der Programmierung nicht nur vergleichen will, ob zwei Zeichenketten vollkommen gleich sind ("abc" == "abd" ? ), sondern auch wissen will, inwieweit sich die erste Zeichenkette von der zweiten unterscheidet (z. B. wenn der Benutzer einen Tippfehler gemacht hat), hat man die Wahl zwischen verschiedenen Algorithmen, die jeweils Vor- und Nachteile haben oder für spezielle Fälle entwickelt wurden.
Nun, diese Website ist genau dafür da: Geben Sie zwei Beispielstrings ein, und sie wird verschiedene Algorithmen anwenden und Ihnen die Unterschiede mitteilen. Je nach den Zeichenfolgen, die Sie identifizieren möchten, wissen Sie nach ein paar Tests, welcher Algorithmus und welcher Schwellenwert für Ihren Fall am besten geeignet ist. Das Programm testet alle diese Verfahren in einem Durchgang und gibt einen Prozentsatz für die Ähnlichkeit der Zeichenketten zurück:
- Levenshtein
- NeedlemanWunch
- Smith-Waterman
- Smith-Waterman Gotoh
- Smith-Waterman Gotoh Windowed Affine
- Jaro
- Jaro Winkler
- QGrams Entfernung
- Blockabstand
- Kosinus-Ähnlichkeit
- Euklidischer Abstand
- Chapman Längenabweichung
- Überlappungskoeffizient
(einige sind direkt in Ihre bevorzugte Sprache integriert, andere benötigen externe Bibliotheken oder müssen von Ihnen programmiert werden)
Anmerkung: die Seite befindet sich hinter einer Bot-Blocking-Mauer, Cloudflare-ähnlich, nervig, aber nichts Besonderes (außer dem hässlichen Screenshot für uns)