En codificación, cuando se quiere ser más inteligente que comparando si 2 cadenas son perfectamente iguales ( "abc" == "abd" ? ) ... como cuánto es la primera cadena diferente de la segunda (como si el usuario introdujo algo con un error tipográfico) , usted tiene las opciones entre varios algoritmos, cada uno con pros y contras o hecho para casos especiales.
Bueno, este sitio es exactamente para esto: proporcionar dos cadenas de muestra y se aplicará varios algoritmos y le dirá las diferencias. Dependiendo de las cadenas que quieras identificar,, en un par de pruebas, sabrás el mejor algoritmo y umbral a aplicar para tu caso. Prueba todo esto de una sola vez y devuelve un porcentaje de similitud de las cadenas:
- Levenshtein
- NeedlemanWunch
- Smith-Waterman
- Smith-Waterman Gotoh
- Smith-Waterman Gotoh Windowed Affine
- Jaro
- Jaro Winkler
- Distancia QGrams
- Bloque Distancia
- Similitud del coseno
- Distancia euclidiana
- Desviación de la longitud de Chapman
- Coeficiente de solapamiento
(algunos se integran directamente en tu lenguaje favorito, otros necesitan librerías externas o ser codificados por ti)
Nota: el sitio está detrás de un muro de bloqueo de bots, tipo Cloudflare, molesto, pero nada muy especial (salvo la fea captura de pantalla para nosotros)