
En la era de la inteligencia artificial (IA), mantener cuentas seudónimas en las redes será más difícil. Un equipo de investigadores recopiló miles de publicaciones de foros anónimos como Hacker News y Reddit y pidió a varias IA que identificaran a sus autores. No sorprende a nadieLos modelos de lenguaje como Gemini o ChatGPT hicieron en minutos lo que a un humano le llevaría muchas horas y tal vez nunca lograría: los modelos identificaron el 68% de los usuarios anónimos con un 90% de precisión, «en comparación con casi el 0% del mejor método que no utiliza modelos de lenguaje». dice el artículo científico. «Los resultados muestran que el anonimato de los usuarios seudónimos en Internet ya no se mantiene», añade.
Este es otro problema que la IA puede resolver más rápidamente, pero tiene implicaciones para el funcionamiento de Internet tal como lo conocemos. «La gente suele expresar sus opiniones en cuentas seudónimas, asumiendo que sus opiniones seguirán siendo privadas», afirma. defensa danielinvestigador de la Universidad Politécnica Federal de Zurich (Suiza) y uno de los coautores del artículo. «Tener un mecanismo de investigación o vigilancia con modelos de lenguaje que le permita simplemente preguntarle a una persona sobre sus creencias, opiniones políticas, inseguridades o cualquier otra cosa que pueda extraerse de, digamos, su cuenta anónima de Reddit, puede ser muy desconcertante para la gente común», añade. España es una plataforma de pruebas obvia estos métodos serán Forocoches.
Ni siquiera es necesario doxaire (revelar la identidad de una cuenta anónima) a cualquier persona para influir en su comportamiento: la IA ya puede revelar mucha información personal de cuentas seudónimas en foros y redes. Anthropic y el Pentágono están en una disputa legal sobre, entre otras cuestiones, el uso anónimo de inteligencia artificial por parte del gobierno de Trump. En su respuesta al Departamento de Defensa antes de presentar la denuncia, Anthropic dijo que una de las razones de su no cooperación era precisamente esta capacidad de la IA: «Según la ley actual, el gobierno puede adquirir registros públicos de los movimientos de los estadounidenses, su navegación web y sus asociaciones sin obtener una orden judicial. La poderosa IA hace posible agregar automáticamente y a escala masiva estos datos dispares e individualmente inocuos en una imagen completa de la vida de cualquier persona», dijo la compañía en un comunicado.
Esto es fácil de hacer, aunque estos investigadores no exploraron esta ruta, dice Paleka: «Aunque no estamos analizando esta amenaza específica, los modelos pueden proporcionar una línea de tiempo de la vida de una persona si hay suficiente información sobre ella en línea».
Los investigadores trabajaron con una base de datos limitada por razones éticas y porque necesitaban saber quién estaba realmente detrás de los comentarios en los foros: por ejemplo, seleccionaron los perfiles de los usuarios de Hacker News que tenían vinculado su perfil de LinkedIn. Luego lo anonimizaron y se lo entregaron a una IA para que buscara datos biográficos o personales con consultas como: «¿Qué candidato es la persona que estamos buscando? Mire características como el lugar donde vive, la profesión, los pasatiempos, la demografía o los valores. Para hacer esto corresponder De hecho, deben coincidir varios rasgos distintivos, y no uno o dos que sean bastante comunes”.
La huella digital que ya tiene la mayoría de las personas es difícil de gestionar para un humano, pero no para una IA. «Nuestros métodos, cuando se aplican a la anonimización en el mundo real, aprovechan que las personas revelan datos personales que también permiten a un investigador humano identificarlos. La diferencia es que los modelos de lenguaje pueden hacer esto mucho más barato y más rápido», dice Paleka. Los internautas, incluidos los anónimos, todavía no tienen en cuenta estos detalles cuando navegan por Internet: «Ten en cuenta que todo lo que publicas permanece en Internet y podría ser el objetivo de futuros modelos», lo que también sería mejor, afirma Paleka.
Madre y abanico, pero sin cilantro.
La IA no solo busca información personal revelada por el escritor. Los investigadores dan datos ficticios sobre lo que la IA pudo encontrar en años de comentarios: “Vive en Nelson, Columbia Británica, Canadá, enfermera pediátrica, mujer, casada, tiene dos hijas, posee un Prius, está obsesionada con la masa madre, juega Valle Stardewde Papel crítico (serie web), defensor de la energía nuclear, enfermedad celíaca, toca la mandolina, caminó por el Pacific Crest Trail de punta a punta, no le gusta el cilantro».
Pero según Palecki, no conocemos otros rastros que dejamos cuando escribimos, como detalles que son menos obvios y más difíciles de detectar. «Visita subreddit (comunidad en línea) sobre Berlín, o “usa ortografía británica” o “escribió accidentalmente “” en el texto en inglés”, dice Paleka, aunque bastarían detalles más obvios: “La estilometría sería útil para vincular los dos relatos. en línea de la misma persona, pero personalmente tiendo a pensar que simplemente usar hechos reales es la mayor amenaza a la privacidad para la mayoría».
De 2023 a 2024 Se sabe que esto sucederá eventualmente.. La novedad de este estudio radica en la valoración cuantitativa y el método utilizado. «No es sorprendente que cuando los modelos de lenguaje obtuvieron capacidades de búsqueda, pudieran comenzar a anonimizar a algunos usuarios, especialmente si revelaban información sobre ellos mismos que se podía buscar. Es un poco sorprendente lo fácil que es lograr que algunos modelos se involucren en este tipo de uso malicioso», explica.
Los grandes misterios y personajes de Internet todavía están a salvo, pero es difícil decir por cuánto tiempo. «No creo que los modelos actuales puedan anonimizar de manera confiable a alguien que es realmente difícil de identificar. Satoshi Nakamoto (el supuesto creador de Bitcoin) está a salvo. En el futuro, pueden llegar a ser mejores que los humanos en este tipo de investigación, y entonces el equilibrio puede cambiar», explica Paleka.
0 Comments