Entrenamiento facial con IA que termina siendo víctima de deepfakes: la oscura verdad de la industria gris de la IA en todo el mundo

MarketWhisper

AI灰色產業

Una profunda investigación del periódico británico The Guardian revela una industria gris global de rápido crecimiento: miles de personas comunes de Sudáfrica, India y Estados Unidos están intercambiando sus voces, rostros, videos de su caminar y registros de llamadas privadas por tarifas de entrenamiento de IA. Dado que la demanda de datos humanos de alta calidad por parte de las empresas de IA ha superado el alcance disponible en la red pública, han surgido plataformas de recopilación pagadas como Kled AI, Silencio y Neon Mobile.

Dos casos reales: quién está vendiendo y por qué

Esta fiebre global de datos de IA tiene un impulso especialmente directo en los países en desarrollo.

Jacobus Louw, un joven de 27 años de Ciudad del Cabo, Sudáfrica, completó una tarea de “navegación urbana” en Kled AI, intercambiando un video de su caminar por 14 dólares, aproximadamente 10 veces el salario mínimo local. Él admite que es consciente del costo de la privacidad, pero debido a una enfermedad del sistema nervioso que lo ha impedido trabajar durante años, ha ahorrado 500 dólares vendiendo videos cotidianos y se inscribió en un curso de formación de masajista. “Como sudafricano, recibir dólares vale más de lo que la gente imagina”, dice Louw.

Sahil Tigga, un estudiante de 22 años en Ranchi, India, vende grabaciones de ruido ambiental a través de Silencio, ganando más de 100 dólares al mes; Ramelio Hill, un aprendiz de soldadura de 18 años en Chicago, EE. UU., vendió aproximadamente 11 horas de registros de llamadas privadas a Neon Mobile por 0.50 dólares por minuto, ganando alrededor de 200 dólares. Su lógica es simple y directa: las empresas de tecnología ya tienen acceso a una gran cantidad de sus datos personales, así que, ¿por qué no obtener también una parte del pastel?

Cómo la escasez de datos de IA ha impulsado esta industria gris

Las mejoras en IA generativa como ChatGPT y Gemini dependen de una gran cantidad de datos humanos de alta calidad, pero conjuntos de datos abiertos de uso común como C4, RefinedWeb y Dolma han comenzado a restringir su uso comercial. Los investigadores estiman que las empresas de IA se quedarán sin textos nuevos y de alta calidad para 2026. El uso de datos sintéticos generados por IA para el entrenamiento ha demostrado resultar en modelos que producen “basura” llena de errores y colapsos, lo que aumenta aún más la escasez de datos humanos reales.

Las plataformas de recopilación pagadas que han surgido han formado un nuevo ecosistema global de trabajo digital:

Kled AI: adquisición de fotos y videos cotidianos por tarea

Silencio: recaudación de audio ambiental a través de crowdsourcing, liquidando en forma de tokens criptográficos

Neon Mobile: adquisición de grabaciones de conversaciones y llamadas a 0.50 dólares por minuto

Luel AI (apoyado por Y Combinator): recopilación de diálogos multilingües a aproximadamente 0.15 dólares por minuto

ElevenLabs: permite a los usuarios clonar digitalmente su voz, con una tarifa base de 0.02 dólares por minuto

Bouke Klein Teeselink, profesor de economía en el King’s College de Londres, señala que el trabajo de entrenamiento de IA es una nueva categoría laboral que crecerá significativamente. Las empresas de IA que pagan por la recopilación también lo hacen para evitar depender completamente de la extracción web, que podría dar lugar a disputas de derechos de autor.

Deepfake y autorización irreversible: el costo real de la industria gris

Los riesgos legales de estas plataformas son prácticamente desconocidos para los usuarios. Enrico Bonadio, profesor de derecho en la Universidad St George de Londres, señala que los acuerdos de licencia suelen otorgar a las plataformas “derechos globales, exclusivos, irrevocables, transferibles y libres de regalías”, permitiéndoles vender, exhibir, almacenar y crear obras derivadas, y los proveedores prácticamente no tienen una forma real de retirar su consentimiento o renegociar.

La experiencia del actor neoyorquino Adam Coy es un caso representativo. Él otorgó su imagen a un software de edición de videos de IA llamado Captions por 1,000 dólares, con un acuerdo que especificaba que no podía ser utilizado para propaganda política o contenido pornográfico, con una duración de licencia de un año. Pero poco después, un amigo suyo descubrió un video en Instagram que alcanzó millones de vistas, en el que “él” se presenta como “doctor de vagina”, promoviendo suplementos médicos no comprobados para mujeres embarazadas. “Los comentarios eran extraños, porque estaban evaluando mi apariencia, pero no era yo”, dice Coy. Desde entonces, no ha aceptado más trabajos de datos de IA.

Mark Graham, profesor de la Universidad de Oxford, concluye que este trabajo es estructuralmente “inestable, sin posibilidades de ascenso, y en realidad es un callejón sin salida”, siendo el único ganador a largo plazo “las plataformas del hemisferio norte, que obtienen todo el valor duradero”.

Preguntas frecuentes

¿Qué es la industria gris del entrenamiento de IA y por qué se llama “gris”?

La industria gris del entrenamiento de IA se refiere a una serie de plataformas de recopilación pagadas que compran voces, rostros, videos y registros de llamadas a usuarios comunes a cambio de compensación, para ser utilizados en el entrenamiento de modelos de IA. Se llama “gris” porque las transacciones parecen legales, pero el uso final de los datos es opaco, los términos de licencia son extremadamente asimétricos y existen riesgos de abuso potencial, como el uso en deepfakes, navegando entre la conformidad y la explotación.

¿Cuáles son los riesgos legales específicos de vender datos personales para entrenar IA?

Los proveedores a menudo otorgan a las plataformas derechos de uso irrevocables sobre datos biométricos sin comprender completamente los términos. Jennifer King, investigadora de la Universidad de Stanford, señala que los consumidores enfrentan el riesgo de que sus datos sean reutilizados de maneras “que no les gustan, no comprenden o no anticiparon, y para entonces prácticamente no hay vías de reparación”. El incidente de la brecha de seguridad de Neon Mobile ha demostrado que después de una filtración de datos, la plataforma puede incluso no notificar a los usuarios afectados.

¿Cuál es la relación entre esta industria gris y el ecosistema de criptomonedas?

Algunas plataformas de entrenamiento de IA (como Silencio) liquidan compensaciones en forma de tokens criptográficos, utilizando pagos descentralizados para reducir las barreras de cobro transfronterizo, permitiendo a los usuarios de países en desarrollo recibir ingresos directamente en forma de stablecoins o tokens nativos. Esto convierte al mercado de datos de IA en una importante rama de la aplicación del mundo real de las criptomonedas, al tiempo que plantea múltiples consideraciones sobre valoración de tokens, liquidez y ética de datos.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

A16z propone un BaaS para la versión de stablecoins ( banca como servicio ), ¿la próxima batalla en los mercados de crédito on-chain?

Informe más reciente de a16z Crypto: el sistema financiero global se está reconstruyendo sobre una nueva infraestructura, y la velocidad de esta transformación podría ser incluso mayor que la que el mundo exterior al sector cripto imagina. Su fuerza impulsora central son las stablecoins. a16z considera que las stablecoins ya no son solo un medio de intercambio usado dentro de las bolsas de criptomonedas, sino que están evolucionando gradualmente hasta convertirse en una nueva capa subyacente de infraestructura para productos financieros globales, y están dando lugar a una nueva modalidad de «banco como servicio» (Banking-as-a-Service,

ChainNewsAbmediahace2h

Perspectivas de Bitcoin ARK 2026: el ETF + DAT representan el 12% de la oferta, estimación de la capitalización del mercado cripto para 2030 de 28 billones

ARK Grandes Ideas 2026 señala que las instituciones han logrado gestionar el 12% de la oferta circulante de BTC mediante la adopción de la aceleración y la fusión de ETF+DAT, y que el gobierno federal y los gobiernos estatales han ido comprando de manera progresiva, formando un soporte a largo plazo. En 2025, el retroceso fue el más bajo de la historia y la volatilidad disminuyó. Para 2030, la capitalización de mercado será de aproximadamente 28 billones de dólares, BTC de aproximadamente 4,2 billones, con un crecimiento anual del 60-61%. Las stablecoins de los mercados emergentes sustituyen parte de la demanda de reservas en BTC; los inversores a largo plazo deberían centrarse en compras estructurales y en la gestión del riesgo.

ChainNewsAbmediahace3h

Informe de Fidelity Digital Assets de Q2: Aumenta la Dominancia de Bitcoin, los Datos On-Chain Muestran Señales de Estabilización

Mensaje de Gate News, 27 de abril — Fidelity Digital Assets publicó su Informe de Señales de Q2 2026, destacando señales de estabilización en múltiples métricas on-chain a pesar de una consolidación temprana en el segundo trimestre en el mercado de cripto. La cuota de mercado de Bitcoin siguió en aumento, con el capital concentrándose

GateNewshace4h

Los nuevos altcoins superan a los tokens más antiguos en 2025, según los datos se observa divergencia en el rendimiento de los exchanges

Mensaje de Gate News, 27 de abril — En 2025, los altcoins lanzados recientemente superaron significativamente a los tokens más antiguos, marcando un cambio en la forma en que se asigna la liquidez en todo el mercado cripto. Mientras que los altcoins más antiguos registraron pérdidas netas entre el 18% y el 23%, los altcoins listados recientemente en 2025 mantuvieron un 5% de ganancias netas,

GateNewshace5h

El marco MiCA de Europa hace que las stablecoins en euros sean «seguras pero no competitivas», según informa la asociación Blockchain

Mensaje de Gate News, 27 de abril — La asociación Blockchain for Europe publicó el lunes un informe que concluye que el marco (MiCA) de la Regulación de Mercados en Criptoactivos de la Unión Europea ha mejorado significativamente la seguridad de las stablecoins en euros, pero al mismo tiempo ha socavado su competitividad comercial

GateNewshace6h

Los fondos cripto globales registran entradas semanales de $1.2B mientras el bitcoin lidera un aumento de capital institucional

Mensaje de Gate News, 27 de abril — Los productos de inversión en cripto globales emitidos por gestores de activos, incluidos BlackRock, ARK 21Shares y Fidelity, registraron $1.2 mil millones en entradas netas la semana pasada, según datos de CoinShares. Los productos basados en Bitcoin lideraron la carga con $932.5 millones, impulsando las entradas de fondos de bitcoin en lo que va de año a aproximadamente 1.2B

GateNewshace9h
Comentar
0/400
Sin comentarios