Panama Papers: Mar Cabra, editora de datos del ICIJ, habla
del desafío de analizar 11 millones de documentos Por Natalia Mazotte/YR
Los Panama Papers, la mayor filtración de documentos en la
historia del periodismo, dio origen a un esfuerzo global de investigación que
contó con la participación de casi 100 periodistas latinoamericanos y que permitió
desentrañar el funcionamiento de los paraísos fiscales. Liderado por la
periodista española Mar Cabra, el equipo de periodismo de datos del Consorcio
Internacional de Periodistas de Investigación (ICIJ por sus siglas en inglés)
fue el cerebro de este trabajo, que requirió el análisis de 11,5 millones de
documentos y demostró que el manejo de grandes bases de datos es cada vez más
esencial en las investigaciones periodísticas.
Mar Cabra, editora de la unidad de datos del ICIJ (Foto:
Twitter)
En la primera etapa del proyecto, que se publicó a
principios de abril de este año, Mar Cabra y su equipo estructuraron 2,6
terabytes de información filtradas del bufete de abogados panameño Mossack
Fonseca y compartieron los datos con reporteros de diferentes países. El 9 de
mayo, el ICIJ hizo pública parte de la base de datos que les tomó casi un año
diseñar y analizar, lanzando de manera oficial la Offshore Leaks Database. En
los primeros seis días, la página tuvo casi 35 millones de visitas.
“Nosotros trabajamos los datos, determinamos nuestras
historias y expusimos los datos al público. Ahora la gente puede buscar sus
historias, sean o no parte de nuestros medios asociados. Comenzó una nueva
etapa de los Panama Papers, cuando el ciudadano se convierte en un
investigador”, resaltó Cabra.
En entrevista con el Centro Knight para el Periodismo en las
Américas, la periodista habló sobre el trabajo de su equipo en el ICIJ, las
posibilidades que se abren por la colaboración entre periodistas y programadores,
y la relevancia del periodismo de datos para volver a despertar el interés del
público en los grandes reportajes de investigación.
Centro Knight: ¿Cómo comenzó a trabajar con el periodismo de
datos?
Fui a estudiar periodismo de investigación en la Universidad
de Columbia con una beca Fulbright. Allí descubrí el trabajo del periodismo de
datos y me enamoré. Me ayudó a contar historias de una manera más potente, más
sistemática, que no dependía tanto de las declaraciones. Me gradué en 2010,
volví a España y me contrataron en el ICIJ para trabajar como periodista de
investigación y de datos. En España,
ayudé a crear el primer máster de periodismo de investigación, datos y
visualizaciones en El País, y continué desarrollando actividades para promover
este campo. Por eso, cuando el Consorcio pensó en crear en 2014 un equipo
específico de periodismo de datos, me llamaron para liderarlo.
CK: ¿Cómo funciona el
trabajo del periodismo de datos dentro del ICIJ?
El ICIJ siempre ha hecho investigaciones que requieren
trabajo con datos. Desde el año 2011, no ha habido ninguna investigación en la
que haya participado para el ICIJ que no involucre trabajo con datos, solo que
antes no había un equipo específico, este comenzó en 2014. Empezamos dos
programadores y yo. El equipo ha crecido y ahora tenemos siete personas -
cuatro programadores y tres periodistas - entre ellos cuatro mujeres.
Trabajamos en tres direcciones: hacer análisis de datos para profundizar y
descubrir nuevas historias, ayudar con productos interactivos de investigación
y el desarrollo de herramientas para fomentar la colaboración entre periodistas
de diferentes países, como la plataforma que creamos para buscar entre los más
de 11 millones de documentos de los Panama Papers.
CK: Teniendo en cuenta
la estructura del ICIJ, ¿es este un equipo grande?
El equipo de periodismo de datos es aproximadamente el 50
por ciento del personal y es fundamental para el ICIJ, es una de las
principales áreas de la organización. Hemos ido creciendo en los últimos dos
años porque la demanda fue aumentando. Recuerdo que mis jefes preguntaban ‘pero
vamos a contratar dos programadores, ¿será que tenemos trabajo para ellos?’, y
yo les decía que sí. En poco tiempo les avisé que teníamos que contratar un
programador más. Uno de los programadores llegó a trabajar sólo en los Panama
Papers, porque era un desafío muy grande lidiar con una cantidad masiva de
datos, así que era necesario procesarlos y necesitamos ayuda extra. El equipo
fue creciendo orgánicamente, por las necesidades que fueron surgiendo y el
importante papel que los datos y la tecnología tienen en nuestro día a día.
CK: ¿Cuál fue la
primera reacción que tuvo cuando vio los documentos filtrados?
Al recibir los documentos la primera reacción fue “Dios mío,
¿cómo vamos a lidiar con esto?”. Fue un reto interesante, ya habíamos aprendido
en las investigaciones anteriores hechas con documentos filtrados que
necesitábamos invertir tiempo analizando los datos antes de comenzar cualquier
reportería. En los Panama Papers aplicamos varias de las lecciones aprendidas
en los proyectos anteriores, que nos ayudó a no cometer los mismos errores.
CK: ¿Qué tiene de
diferente este proyecto en comparación con los anteriores?
La cantidad de datos. Para los Offshore Leaks, en 2013, trabajamos
con 260 gigabytes de información y los Panama Papers fueron de 2,6 terabytes,
¡muchísimo más! También formamos un equipo transnacional con más de 370
periodistas, lo que exigía un trabajo de coordinación y manejo de datos muy
grande. ¡Imagina tener casi 400 personas mandándote preguntas! Desde el punto
de vista del contenido, esta filtración nos permitió entender el funcionamiento
de los paraísos fiscales como nunca antes porque Mossack Fonseca es una de las
principales empresas en el mundo en la creación de sociedades en paraísos
fiscales y tenía clientes de muy alto nivel. Esto también hizo que
periodísticamente el contenido fuera más interesante.
CK: ¿Y cómo
trabajaron con esa cantidad de datos?
Ya habíamos creado una serie de herramientas utilizadas en
proyectos anteriores y este caso nos sirvió para que pudiésemos mejorarlas.
Creamos un foro de comunicación, una especie de Facebook para los periodistas,
y todo lo que nos encontrábamos, lo comunicábamos por allí, como una sala de
redacción virtual. También teníamos un motor de búsqueda que ayuda a encontrar
los diversos documentos, como un Google propio. Finalmente teníamos una
herramienta que muestra las conexiones entre las personas con las empresas en
paraísos fiscales, porque no siempre aparecen los dueños reales. Estas tres
herramientas se crearon en proyectos anteriores, especialmente en los Swiss
Leaks [filtraciones suizas], pero este fue el proyecto en el que se les dio su
máximo aprovechamiento. Logramos mejorarlas para que pudieran lidiar con tantos
datos. Por lo que el conocimiento que tiene el Consorcio para trabajar con las
herramientas en la nube y de cómo hacer periodismo colaborativo cruzando
fronteras es único. Todos los proyectos que tuvimos nos dejaron la experiencia
para manejar esta gran cantidad de datos de una manera más eficiente.
CK: ¿No es un poco
arriesgado para el periodista trabajar con datos sensibles en la nube?
Antes de comenzar cualquier proyecto, hacemos un análisis
sobre las posibles amenazas. En el caso de los Panama Papers se concluyó que
los Gobiernos no eran una amenaza. Que no se trataba de documentos de la NSA,
por ejemplo, como fue el caso de Snowden que exigía más cuidado al usar
herramientas en la nube. Después de determinar esto y ver que podíamos trabajar
de manera remota, lo que hicimos fue establecer diferentes medidas para
garantizar la seguridad de los reporteros. Por ejemplo, en la red social
interna que tenemos, establecimos una autenticación de dos pasos. Además del
usuario y la contraseña, el periodista también tenía que dar un código que
llegaba a su celular. Esta autenticación de dos pasos también se hizo para
acceder a nuestra búsqueda de documentos y a todas las herramientas hospedadas
en nuestros servidores con conexión cifrada. También solicitamos a los
reporteros el uso de sistema de encriptación PGP para intercambiar mensajes.
CK: ¿Cree que haya
redacciones capaces de hacer el trabajo de periodismo de datos que ustedes
hicieron con Panama Papers?
La verdad es que la capacidad técnica del equipo que trabajó
en los Panama Papers es muy superior al equipo técnico que trabajó en los Swiss
Leaks que publicamos el año pasado. En el último año, he visto crecer los
equipos de periodismo de datos de muchos medios de comunicación, pero lo que es
diferente es que dentro de las salas de redacción el principal trabajo es
cuidar las historias que serán publicadas. El valor del ICIJ es ser un
territorio neutral en donde podemos tomar decisiones a nivel internacional, en
donde podemos preocuparnos por la historia a nivel global y no tanto en el
interés de un medio en particular. Nuestra misión es ayudar en colaboración y
mejorar las herramientas que nos permiten esto, buscar historias globales,
ayudar a los reporteros a conseguir las mejores historias locales. Y creo que
eso es único en el mundo.
CK: ¿Cuáles son los
principales retos que enfrentó al trabajar con programadores en su equipo?
Son mundos diferentes, modos diferentes de trabajar y de
organizar. Los programadores son mucho más organizados, los periodistas somos
más caóticos. El mayor desafío es tratar de comprender la mejor manera de
trabajar juntos por lo que es necesario establecer procesos para que eso
funcione. Son más de cinco años trabajando con programadores y es fascinante,
porque te da superpoderes y te permite buscar periodísticamente cuestiones que
no conseguías antes. Sin el trabajo de los programadores de nuestro equipo de
datos no habría sido capaz de hacer frente a esos terabytes de información de
una forma tan eficiente. Los periodistas necesitan ser cada vez más técnicos y
no sólo saber cómo trabajar con Excel y bases de datos, sino comenzar a
aprender a programar, tratar de entender los diferentes lenguajes de
programación para poder hablar el mismo lenguaje de los programadores. Cuando
se trabaja en un equipo, es necesario conocer bien a tu compañero, en este caso
tu compañero tiene una profesión diferente, por lo que cuanto más sabes de esa
profesión, trabajarán mucho mejor.
CK: Inicialmente
ustedes decidieron no publicar los datos de esta investigación, pero
recientemente pusieron a disposición una base de datos con la información
obtenida de los documentos filtrados. ¿Cómo pensaron en la estrategia de divulgación de esos datos?,
¿la intención de publicarlos vino después?
Desde el principio, la idea era publicar la mayor cantidad
de datos posible, pero sabíamos que había un dilema ético y riesgos legales.
Eran 11,5 millones de documentos a los que tuvimos acceso. Optamos por no publicarlos
de forma bruta, al estilo Wikileaks, porque nos dimos cuenta de que había
muchos documentos personales, pasaportes, identidades, números de cuentas
bancarias, y publicar eso así, de una manera masiva, desde el punto de vista
ético, no tenía sentido para nosotros. Además de tener implicaciones legales.
Sin embargo, vimos que había una parte de los documentos que podíamos publicar,
con información de los accionistas de las empresas en paraísos fiscales, que es
considerada información secreta porque los paraísos fiscales venden
precisamente eso, secreto. Si no hay filtraciones, es muy difícil saber quién
está detrás de estas empresas. Tuvimos que reconstruir la base de datos de
Mossack Fonseca para publicar esas partes de los registros mercantiles y
aumentar la transparencia que se requiere en los paraísos fiscales.
CK: ¿Cómo ha
repercutido la publicación de la base de datos de los Panama Papers?
La Offshore Leaks Database que publicamos el 9 de mayo es un
éxito. En los primeros seis días de la publicación tuvimos casi 5 millones de
visitantes y más de 35 millones de páginas vistas. Esto solo en los primeros
seis días, para que tengas una idea del gran interés que existe en estos datos.
Y eso es lo que nos permite el periodismo de datos, nos da un mayor nivel de
interacción con los usuarios. Nosotros trabajamos los datos, determinamos
nuestras historias y expusimos los datos al público. Ahora la gente puede
buscar sus historias, sean o no parte de nuestros medios asociados. Esto es muy
interesante, porque ahora comenzó una nueva etapa de los Panama Papers, cuando
el ciudadano se convierte en un investigador. Pero no solo los ciudadanos,
también las autoridades. Las autoridades fiscales de Colombia accedieron a los
datos y encontraron que más del 60 por ciento de los colombianos tiene cuentas
offshore y no han declarado tenerlas. Antes, el periodista publicaba su
historia y el trabajo terminaba. Ahora, el periodismo de datos permite ese
mayor nivel de interacción con el usuario. Eso también se ve en los productos
interactivos. Hicimos un producto interactivo que se llama “The power players”
(Los actores del poder), con más de 60 historias de políticos y sus familiares
con empresas en paraísos fiscales. Esa fue una de nuestras páginas más vistas,
lo que demuestra también el interés del público en este tipo de productos más
interactivos que surge a partir del periodismo de datos, demostrando nuevamente
su importancia. TOMADO DE ENVIO DE PERIODISMO EN LAS AMERICAS

No hay comentarios:
Publicar un comentario