La privacidad diferencial es un conjunto de técnicas matemáticas que tienen como objetivo analizar un conjunto de datos, manteniendo siempre la privacidad de los datos.
Qué es privacidad diferencial?
Es decir, una vez que se aplican estas técnicas, podemos obtener información útil sobre el conjunto de datos. Sin embargo, no obtendremos información personal de los individuos que han proporcionado dichos datos.
¿Dónde se emplea?
Sobre todo, la privacidad diferencial se emplea en el machine learning (entrenamiento de algoritmos). Es una técnica que se usa para garantizar que con los datos empleados no se puede identificar a los usuarios. Sin embargo, no es el único uso que se le da o se le puede dar en el futuro.
Hay que destacar que es un sistema relativamente reciente (surgió en 2006) y, aunque algunas compañías ya lo ponen en práctica, aún se sigue desarrollándose.
¿Cómo protege nuestros datos?
Para proteger nuestros datos mientras se extrae información de los mismos, la privacidad diferencial añade el ruido estadístico. Aplicado a los datos personales, hace que estos no se puedan vincular a los interesados que los facilitaron.
Usar estas técnicas se garantiza de manera matemática que de los resultados del análisis de un conjunto de datos no se podrá inferir información personal sobre cada individuo cuyos datos formen parte del conjunto. Por otro lado, también garantiza mantener la privacidad en caso de filtraciones de la base de datos o un ataque sobre ellos.
A diferencia de las técnicas de seudonimización, la privacidad diferencial evita la posibilidad de reidentificar a un usuario.
Beneficios de la privacidad diferencial
La técnica mencionada aporta diferentes beneficios. El mayor de ellos el de asegurar la privacidad de los datos.
Otro de sus beneficios es que los resultados obtenidos del análisis de datos resulten útiles.
Este equilibrio entre la privacidad y la utilidad del análisis de los datos, convierte a la privacidad diferencial en una técnica muy útil para llevar a cabo análisis de usuarios sin vulnerar sus datos personales. Esto es así, porque no se podrá inferir información sobre un individuo concreto, sino sobre el conjunto al que pertenecen los datos que analizamos.