يكمن الهدف في تقييم نماذج الذكاء الاصطناعي الحالية على الإنترنت من خلال تفضيلات المستخدمين، وهو ما ينجح فيه هذا النظام. فهو يأخذ أحدث أدوات الذكاء الاصطناعي المتاحة على الإنترنت ويصنفها وفقًا لمعايير وأهداف متعددة، مثل: الأداء العام، والرياضيات، والكتابة الإبداعية، والبرمجة، وغير ذلك الكثير، بما في ذلك اللغة المستخدمة.
نعم، هذا يعتمد على تصويت البشر، وبالتالي يخضع لبعض التأثيرات الخارجية، لكن سلطة الموقع وعدد المصوتين يجعلان هذا التقييم ذا صلة كبيرة ومحدثًا.





