La promesa es evaluar los modelos actuales de IA en línea a través de las preferencias humanas, y lo hace con éxito. Toma todas las herramientas de IA en línea más recientes y las clasifica según diversos criterios y propósitos, como rendimiento general, matemáticas, escritura creativa, programación y mucho más, incluyendo el lenguaje utilizado.
Sí, esto depende del voto humano y, por lo tanto, está sujeto a algunas influencias externas, pero la autoridad del sitio y la cantidad de votantes hacen que esa evaluación sea muy relevante y actualizada.





