Reddit ha demandado a Perplexity AI por seguir usando el contenido de Reddit para entrenar su modelo de IA después de advertencias previas de no extraer el contenido de la plataforma.
A medida que los sistemas de IA dependen cada vez más de contenido en línea disponible públicamente para entrenarse y generar respuestas, empresas como Reddit están tratando de trazar límites firmes sobre lo que se considera datos “públicos” y “privados”.
La trampa de Reddit expone un presunto robo de datos
Reddit ha demandado a Perplexity, una empresa de inteligencia artificial de 20 mil millones de dólares, acusándola de recopilar datos ilegalmente a través de su plataforma. Según documentos judiciales presentados el miércoles en un tribunal federal de Manhattan, Reddit afirmó que Perplexity ignoró las instrucciones de no extraer su contenido y continuó utilizando los datos de Reddit para generar respuestas de inteligencia artificial.
La denuncia afirma que Reddit había impedido explícitamente que Perplexity recopilara sus datos, pero el motor de respuestas de la empresa de inteligencia artificial seguía generando resultados con contenido de Reddit. «El aumento fue tanmatic que un observador externo planteó la hipótesis de que se debía a que Perplexity había firmado un acuerdo de licencia con Reddit», afirma la demanda. «En realidad, no existe ninguna licencia entre Perplexity y Reddit».
Para demostrar su sospecha, Reddit diseñó una ingeniosa prueba digital. Creó una publicación "trampa" que solo podía ser encontrada por el motor de búsqueda de Google. Google tiene un acuerdo legítimo de licencia de contenido con Reddit, por lo que cualquier empresa sin dicho acuerdo no debería haber podido acceder a la publicación.
La empresa lo describió como el equivalente en línea de una "factura marcada". Si el sistema de Perplexity reprodujera el contenido de esa publicación oculta, Reddit sabría que había burlado sus medidas de seguridad, posiblemente extrayendo datos de los resultados de búsqueda de Google, conocidos como SERP.
En cuestión de horas, la publicación de prueba supuestamente privada comenzó a aparecer en las respuestas generadas por la herramienta de inteligencia artificial de Perplexity.
“La única forma en que Perplexity pudo haber obtenido ese contenido de Reddit y luego haberlo usado en su 'motor de respuestas' es si ella y/o sus coacusados extrajeron los SERP de Google”, afirma la demanda.
Reddit nombró a tres empresas de extracción de datos en la demanda: Oxylabs UAB, AWM Proxy y SerpApi. Las acusó de ayudar a Perplexity a obtener acceso no autorizado a las publicaciones de Reddit o de venderle datos de Reddit.
Las acusaciones de Reddit fueron negadas
las acusaciones de Reddit . El portavoz de la compañía, Jesse Dwyer, declaró que Perplexity "no tolerará amenazas contra la transparencia y el interés público". La compañía también declaró en una publicación en Reddit tras la presentación de la demanda que "no entrena modelos de IA con contenido".
Representantes de las demás empresas mencionadas en la demanda también emitieron declaraciones. Un portavoz de SerpApi afirmó que planea defenderse enérgicamente en los tribunales. El director de gobernanza y estrategia de Oxylabs, Denas Grybauskas, declaró que su empresa estaba conmocionada y decepcionada, y añadió que Oxylabs siempre ha sido y seguirá siendo pionera y líder del sector en la recopilación de datos públicos.
En agosto, Cloudflare, una empresa de infraestructura de internet, reveló que había realizado una prueba similar para comprobar si Perplexity cumplía las normas de rastreo web. Cloudflare afirmó haber creado páginas marcadas con un código que indicaba a los bots de Perplexity que no accedieran a ellas, pero aun así detectó que los rastreadores de la empresa de inteligencia artificial visitaban las páginas restringidas.
El director ejecutivo de Cloudflare, Matthew Prince, fue noticia al comparar el comportamiento de Perplexity con el de los “hackers norcoreanos”.
Algunas empresas de inteligencia artificial supuestamente "con buena reputación" actúan más como hackers norcoreanos. Es hora de denunciarlas, avergonzarlas y bloquearlas duramente. https://t.co/vqMzGRHZPf
— Matthew Prince 🌥 (@eastdakota) 4 de agosto de 2025
“Algunas empresas de inteligencia artificial supuestamente 'con buena reputación' actúan más como hackers norcoreanos”, escribió Prince en X. “Es hora de denunciarlos, avergonzarlos y bloquearlos por completo”. La demanda de Reddit citó las declaraciones de Prince como parte de su argumento.
Afila tu estrategia con mentoría + ideas diarias: 30 días de acceso gratuito a nuestro programa de trading



