martes, 18 de junio de 2019

La K-Anonimidad como medida de la privacidad

Fuente de la imagen: mvc archivo propio
Según la Agencia Española de Protección de Datos (AEPD), el tratamiento masivo de datos mediante el uso de técnicas basadas en big data, inteligencia artificial o machine learning, obliga a la implementación de garantías o mecanismos para preservar la privacidad y el derecho a la protección de datos personales, entre ellas las basadas en la anonimización. En una realidad en la que las fuentes de las que proceden los datos, pese a ser independientes, se interconectan, existe la posibilidad de crear un rastro electrónico de las personas, incluso habiendo eliminado los datos que explícitamente les identifican. Si bien el objetivo de los procesos de anonimización es preservar la privacidad de las personas cuyos datos son objeto de tratamiento, los datos, convenientemente agrupados y cruzados con otras fuentes de información, pueden utilizarse para identificarlas e incluso establecer relaciones con categorías especiales de datos asociadas a estas. Existe un determinado riesgo de que, una vez que se ha anonimizado un conjunto de datos, se pueda revertir esa anonimización, reidentificando a la persona. 

Te transcribo lo anterior porque parte de la tarde del lunes la pasé hojeando la nueva nota técnica publicada por la AEPD, de la que ya informé en el Sitio Protección de Datos, orientada precisamente a las organizaciones que aborden procesos de anonimización sobre conjuntos de datos. Se denomina "La K-Anonimidad como medida de la privacidad"[1]. Tiene como objetivo mostrar cuáles son los límites en la efectividad de esos procesos de anonimización, hasta qué punto la información está realmente anonimizada y cómo se puede gestionar el riesgo de reidentificación. Para realizar esta gestión de riesgos, la nota técnica analiza la K-anonimidad, una técnica utilizada cuando se tratan grandes grupos de datos y que, entre otros aspectos, permite estudiar el grado de identificación que podría existir en ese conjunto de datos supuestamente anónimo. En consecuencia, permite cuantificar hasta qué punto se preserva el anonimato de los sujetos presentes en un conjunto de datos en el que se han eliminado los identificadores. Fuente de la información: AEPD. Fuente de la imagen: mvc archivo propio.
______________________
[1] Si quieres acceder al documento, clickea AQUÍ. Sitio visitado el 18/06/2019.