Big Data. La revolución de los datos masivos

Viktor Mayer-Schönberger
278 páginas
Turner, Madrid, 2013

Las revelaciones de Edward Snowden sobre los programas de la Agencia Nacional de Seguridad estadounidense (NSA, por sus siglas en inglés) han venido a ampliar y confirmar la información publicada en 2010 por el diario The Washington Post.  En aquel reportaje, elaborado durante más de dos años, se alertaba sobre los incontables programas del Pentágono para recabar millones de datos electrónicos –tanto en el extranjero como en territorio nacional– que se habían estado implementando con especial intensidad desde septiembre de 2001. ‘Un mundo oculto, creciendo sin control’ se tituló el resultado de aquella investigación sobre la alianza entre agencias gubernamentales estadounidenses y empresas privadas para monitorizar, almacenar y procesar datos de todo tipo, sobre todo comunicaciones electrónicas, desde e-mails a transferencias bancarias.

El desarrollo de las capacidades computacionales de los nuevos procesadores y la aplicación de métodos de análisis de datos, basados en buena medida en el empleo de complejos algoritmos, permite analizar esa cantidad descomunal de información –los big data– para obtener evidencias que hasta hace pocos años, en el mejor de los casos, estaban condenadas a permanecer sepultadas en los archivos estatales y, en el peor de los casos, a no ser siquiera registradas. La previsión es que en un futuro la información que se obtenga procesando los big data sea cada vez mayor, más precisa y más útil. Pero ¿quién se beneficiará de esa información?

En su libro Big Data. La revolución de los datos masivos, el profesor de Oxford Viktor Mayer-Schönberger y el editor de datos de la revista The Economist, Kenneth Cukier, ofrecen un repaso bastante amplio a las posibilidades que ofrecerá el análisis de los big data, tanto a sus oportunidades como a sus amenazas, entre las que se encontraría en un lugar destacado la vulneración de la privacidad.

El libro, publicado este mismo año antes de las filtraciones de Snowden, menciona los programas secretos de la NSA sin profundizar demasiado en ellos. Los autores se centran sobre todo en explicar los usos comerciales provenientes de los big data que se han puesto en práctica en los últimos años. Los grandes beneficiarios –además de los gobiernos, cuya actividad en este campo es aún bastante opaca– han sido empresas como Google, Amazon, Facebook y Microsoft. Sus millones de usuarios, facilitando millones de datos por segundo, les han permitido acumular unas bases de datos cuyo potencial aún está por descubrir. Además de beneficiarse de toda esa información para sus propios modelos de negocio –un ejemplo sería el uso que Google ha dado a las búsquedas para perfeccionar su traductor online–, esas grandes empresas acumulan riqueza con cada nuevo dato que añaden: otras corporaciones estarían dispuestas a pagar cifras considerables por tener acceso a esa información. Como declaraba Mayer-Schönberger en una entrevista reciente con un medio español: “Los datos masivos (o big data) son el nuevo oro”.

Privacidad en riesgo

La legislación sobre el derecho a la privacidad que rige a día de hoy en Internet no favorece precisamente su protección. Los autores comentan que en un futuro deberían cambiar algunas cosas, desde el punto de vista legal, si se quiere salvaguardar este derecho: “En la era de los datos masivos, las tres principales estrategias empleadas tradicionalmente para asegurar la privacidad –notificación y consentimiento individual, exclusión voluntaria y la anonimización– han perdido buena parte de su efectividad. Hoy son ya muchos quienes sienten su intimidad violada: que esperen a que se generalicen más las prácticas basadas en los datos masivos”.

Estas prácticas han permitido ofrecer soluciones para algunos problemas de gestión pública. En el libro se mencionan, entre otros, dos proyectos que, usando el análisis de datos masivos,  facilitaron una solución a dos problemas de la ciudad de Nueva York: detectar los edificios en los que había más riesgo de incendio y detectar las pesadas tapas metálicas que permitían acceder al sistema eléctrico de la ciudad y que esporádicamente podían saltar por los aires, con el riesgo que esto implicaba. También están ya funcionando páginas web que podrían evitar las manipulaciones de datos ofrecidos por los gobiernos: las cifras oficiales que se dan sobre la inflación, por ejemplo, o sobre la evolución del desempleo en un determinado país. Las oportunidades benéficas del análisis de datos masivos son potencialmente altísimas. Al igual que las amenazas. De hecho, tanto oportunidades como amenazas se presentan como las dos caras de la misma moneda: existen de modo simultáneo e indivisible.

Maxkabakov/ Fotolia

Control más barato y eficiente

Los autores mencionan a la Stasi, el organismo de seguridad de la República Democrática Alemana, para ejemplificar “uno de los estados policiales más exhaustivos jamás vistos”. La Stasi llegó a confeccionar unos archivos con aproximadamente 39 millones de fichas y unos 100 kilómetros de documentos. Obtener tal volumen de información implicó una gran cantidad de trabajo y recursos y la implicación de miles de agentes y de confidentes –en muchos casos, familiares o amigos de los propios ciudadanos –: “Veinte años después de la desaparición de Alemania Oriental, se están recogiendo y almacenando más datos sobre cada uno de nosotros que nunca antes. Estamos bajo vigilancia continua: cada vez que usamos nuestras tarjetas de crédito para pagar, nuestros teléfonos móviles para comunicarnos o nuestro número de la seguridad social para identificarnos”.

Todos esos datos, además, pasan a formar parte de unas bases de datoscon vocación de permanencia: lo que los autores llaman “memoria permanente”, opuesta frontalmente al “derecho al olvido” que los sujetos deberían poder reclamar en muchos casos. En otras palabras, una persona no podrá librarse de datos relativos a su pasado por más que así lo quiera. Sirva el ejemplo de una persona que se declara insolvente y que pasa a formar parte de bases de datos que le impedirán en un futuro acceder a créditos.

La dictadura de los datos

Los autores advierten de una gran amenaza consustancial a los datos masivos: que se imponga la “dictadura de los datos” y que creamos ciegamente en ellos aun cuando ello implique obviar la realidad. En los 60, durante la guerra de Vietnam, el Departamento de Estado estadounidense llegó a ufanarse de los buenos datos que estaban obteniéndose sobre al descenso de bajas militares estadounidenses y al aumento de las bajas del Vietcong. Los datos divergían de la realidad: Estados Unidos terminó perdiendo la guerra. Otro ejemplo podría ser la política de recursos humanos de Google, basada en análisis para evaluar la idoneidad de aspirantes a trabajar en la empresa: “De acuerdo con los estándares de Google –patrocinados por Larry Page y Sergey Brin– ni Bill Gates, ni Mark Zuckerberg, ni Steve Jobs habrían sido contratados nunca, al carecer de licenciaturas universitarias”. Los datos son menos importantes que los parámetros utilizados para analizarlos.

Los autores de Big Data tienen claro que el impacto de los datos en nuestra vida futura será considerable, y en algunos sentidos radical: “El cambio al que nos enfrentamos es, en ciertos sentidos, incluso mayor que el derivado de otras innovaciones que hicieron época, y que ampliaron acusadamente el alcance y la escala de la información en la sociedad. El suelo que pisamos está moviéndose. Las certezas anteriores se ven cuestionadas. Los datos masivos exigen una nueva discusión acerca de la naturaleza de la toma de decisiones, el destino o la justicia. Una visión del mundo que creíamos hecha de causas se enfrenta ahora a la primacía de las correlaciones. La posesión de conocimiento, que en tiempos significó comprender el pasado, está llegando a ser una capacidad de predecir el futuro”. De momento, el debate sobre el uso que se está haciendo hoy en día de los datos masivos debería centrarse en una de las características más inquietantes del uso de los big data: se trata aún de un mundo oculto creciendo sin control.

Artículos relacionados