Según Deep Tide TechFlow, el 24 de mayo, Swarms reveló en la plataforma X el lanzamiento de un nuevo sistema de evaluación de IA llamado “Council Of Judges”, diseñado para mejorar la calidad de respuesta de los agentes a través de evaluaciones colaborativas. Este sistema utiliza múltiples agentes de IA profesionales que trabajan en conjunto, evaluando y mejorando el contenido de las respuestas, reduciendo significativamente los errores y aumentando la precisión.
El sistema utiliza seis evaluadores profesionales, cada uno de los cuales examina diferentes aspectos de la respuesta: precisión (verificación de afirmaciones fácticas y confiabilidad de las fuentes), utilidad (evaluación del valor práctico y eficacia en la resolución de problemas) y no malicia, entre otros.
En términos de implementación técnica, el sistema funciona a través de una arquitectura de procesamiento paralelo, lo que permite realizar múltiples evaluaciones simultáneamente, optimizando el uso de recursos (utilizando el 75% de la capacidad de procesamiento disponible) y manteniendo la eficiencia a través de un almacenamiento en caché inteligente.