Anthropic lanza $100M la iniciativa de ciberseguridad con el modelo de IA restringido Claude Mythos

Anthropic anunció Project Glasswing el martes, una iniciativa de ciberseguridad que se compromete a aportar hasta $100 millones en créditos de uso para Claude Mythos Preview, un modelo de frontera no lanzado todavía que, según la empresa, puede encontrar y explotar vulnerabilidades de software de forma autónoma a un nivel que supera a todos salvo a los investigadores de seguridad humanos más expertos.

En lugar de un lanzamiento público, Anthropic ha restringido Claude Mythos Preview a 12 socios de lanzamiento, entre ellos Amazon $AMZN +0.46% Web Services, Apple $AAPL -2.07%, Broadcom $AVGO +6.21%, Cisco $CSCO +0.30%, CrowdStrike $CRWD +6.18%, Google $GOOGL +1.82%, JPMorganChase, la Linux Foundation, Microsoft $MSFT -0.16%, Nvidia $NVDA +0.26% y Palo Alto Networks $PANW +4.89% —todos los cuales lo desplegarán de forma exclusiva para fines de seguridad defensiva. También recibirán acceso más de 40 organizaciones adicionales que construyen o mantienen infraestructura de software crítica.

Contenido relacionado

Alibaba lanzó un clúster de IA de 10,000 chips usando sus propios chips

La fundadora de WomenofGenAI, Aakriti Srikanth, sobre destacarse a medida que evoluciona la industria tecnológica

En las últimas semanas, Anthropic usó Mythos Preview para identificar miles de vulnerabilidades de día cero en todos los sistemas operativos y navegadores web principales, dijo la empresa. Los hallazgos específicos incluyeron una falla que se remonta a 27 años en OpenBSD y una vulnerabilidad separada en la biblioteca de procesamiento de video FFmpeg – una que había pasado desapercibida en cinco millones de ejecuciones por herramientas de pruebas automatizadas, a pesar de tener aproximadamente 16 años. El modelo también encadenó múltiples vulnerabilidades del kernel de Linux para lograr el control total de una máquina desde una cuenta de usuario ordinaria.

No se incluyó capacitación especializada en ciberseguridad para construir Mythos Preview, señaló Anthropic: la capacidad del modelo para sondear software en busca de debilidades es un subproducto de los mismos avances generales en codificación y razonamiento que lo definen en otros ámbitos, lo que significa que los atributos que lo ayudan a corregir fallas son inseparables de aquellos que podrían orientarse a explotarlas.

Anthropic aportará $4 millones en donaciones directas junto con los créditos de uso, incluyendo $2.5 millones para Alpha-Omega y la Open Source Security Foundation a través de la Linux Foundation, y $1.5 millones para la Apache Software Foundation. Los socios que agoten el fondo de créditos de uso pagarán $25 por cada millón de tokens de entrada y $125 por cada millón de tokens de salida. El modelo está disponible a través de la Claude API, Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.

“Los peligros de equivocarse son evidentes, pero si lo logramos bien, existe una oportunidad real de crear un internet y un mundo fundamentalmente más seguros que los que teníamos antes de la llegada de las capacidades cibernéticas impulsadas por IA”, dijo el CEO Dario Amodei en una publicación en X $TWTR 0.00%, según CNBC.

En declaraciones por escrito publicadas junto con el anuncio de Anthropic, el CTO de CrowdStrike, Elia Zaitsev, lanzó una advertencia contundente: el modelo “demuestra lo que ahora es posible para los defensores a escala, y los adversarios inevitablemente buscarán explotar las mismas capacidades”, y tareas que antes exigían meses de trabajo “ahora ocurren en minutos con IA”, según The New York Times.

Anthropic dijo que ha estado en discusiones continuas con funcionarios del gobierno de EE. UU., incluida la Cybersecurity and Infrastructure Security Agency, sobre las capacidades del modelo. En un plazo de 90 días, la empresa dijo que planea publicar un informe público sobre las vulnerabilidades encontradas y parcheadas, así como recomendaciones sobre cómo deberían evolucionar las prácticas de seguridad.

La existencia del modelo ya había salido a la luz públicamente después de que materiales de borrador internos aparecieran en una ubicación no asegurada en los servidores de Anthropic; la empresa atribuyó la exposición a una configuración incorrecta en una herramienta de gestión de contenidos de un tercero. En esos documentos, el modelo se mencionaba con el nombre en clave “Capybara”.

📬 Regístrate para el Daily Brief

Nuestro boletín gratuito, rápido y divertido sobre la economía global, que llega todos los días laborables por la mañana.

Regístrate

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado