Estudio de caso:
Cuidados Intensivos

News apps o la noticia que nunca muere

El encuentro entre periodismo y tecnología ofrece un abanico escalable de posibilidades para exponer los hallazgos ante nuevas audiencias. Es una idea aceptada que mientras las visualizaciones permiten entender una historia a partir de un gráfico, las aplicaciones permiten entender varias historias en una misma pieza periodística y dar al usuario la posibilidad de encontrar vías alternativas para consumir contenido. Es un proceso muy distante del tradicional sentido unilateral de la información, la diferencia entre escuchar un discurso y tener una conversación. A través de las aplicaciones ofrecemos a los lectores acceso libre a datos específicos de su interés, una experiencia personal de navegación y, en consecuencia, la posibilidad de comprender un tema de la manera que le resulte más cómoda.

Un claro ejemplo es Cuidados Intensivos, una aplicación periodística creada por OjoPúblico para investigar el sector privado de la salud en el Perú. En un primer nivel periodístico, la herramienta revela la penetración de los grandes grupos financieros del país en el negocio de clínicas y centros médicos, que en los años previos se expandieron con escasa supervisión del Estado. Pero su valor para el lector-ciudadano-paciente es que se trata del primer registro de clínicas y médicos que acumulan sanciones administrativas y procesos penales por casos de negligencia médica y malas prácticas de atención a los usuarios.

El trabajo periodístico detrás de CI
En la investigación sobre el sistema privado de salud en el Perú y la construcción de la aplicación periodística Cuidados Intensivos participaron cinco periodistas y un desarrollador. El equipo de reporteros trabajó los datos en Excel y usó el programa Open Refine para limpiarlos y cruzar la información de las distintas bases.

Esta aplicación es el resultado de la construcción de bases de datos propias para comprender las dimensiones del sector. En una primera etapa se realizó 52 pedidos de acuerdo a la Ley de Transparencia y Acceso a la Información Pública. A eso se sumó la revisión de archivos documentales y descargas masivas de datos de los sitios web de 44 clínicas del país. Este volumen permitió diseñar una plataforma de búsqueda que muestra las fichas de 61.372 médicos colegiados, 9.920 establecimientos de salud y 21 empresas administradoras de fondos (entre Entidades Prestadoras de Salud, aseguradoras y las clínicas que ofrecen sus propios programas de atención médica). De este modo, la herramienta permite que cualquier usuario indague por su cuenta si el médico o la clínica a quienes confía su salud -e incluso su vida- están autorizados para prestar servicios, cuál es su especialidad, su nivel de eficacia y si ha recibido sanciones administrativas o demandas judiciales por malas prácticas.

Las envergadura del trabajo de recolección de datos y su procesamiento para obtener conclusiones relevantes permiten establecer algunas lecciones claras para cualquier periodista que desee afrontar un desafío de esta naturaleza:

1. La dimensión de la data se transforma

El punto de partida de Cuidados Intensivos fue el diseño de una estructura de bases de datos fundamentales para entender el sector y la identificación de todas las instituciones del Estado que tenían información necesaria. En esta primera fase, el equipo se propuso elaborar cuatro padrones: el primero, de los grupos corporativos con inversiones en el sector salud; el segundo, de todos los establecimientos médicos privados registrados en el país (desde ópticas y consultorios hasta clínicas especializadas); el tercero, de las compañías aseguradoras y administradoras de fondos de salud; y el cuarto, de los médicos colegiados en el Perú.

El principal reto fue comprobar las fechas de actualización de los datos. Cuando los reporteros de OjoPúblico solicitaron por primera vez el registro oficial de establecimientos médicos privados a la Superintendencia Nacional de Salud (Susalud), recibieron como respuesta que la información estaba publicada en el sitio web de la entidad. Allí, encontraron un listado de 2.500 servicios de salud particulares. Sin embargo, un mes después y mientras procesaban esa primera descarga, advirtieron que Susalud había creado un nuevo formulario para clasificar la información de los establecimientos privados. El nuevo padrón tenía más de 9.000 entidades registradas e incluía nuevos términos. El trabajo inicial quedó incompleto y desactualizado. El equipo tuvo que scrapear nuevamente todos los formularios en línea para convertirlos en un archivo Excel.

Las herramientas digitales del proyecto
El trabajo de programación se realizó con el lenguaje Python, escogido por su eficiencia y performance. La estructura se hizo con el framework Django, que tiene un potente sistema de administración de contenidos, además de ser un sistema modular que permite que la aplicación sea escalable. Para el sistema de gestión de base de datos se eligió PostgreSQL, por su capacidad de almacenamiento de grandes cantidades de datos. Y el sistema de búsqueda se realizó en Elasticsearch, que posee un potente motor.

Un problema similar se produjo con el padrón de 60 mil médicos colegiados. En determinado momento, al tomar muestras aleatorias de verificación, detectaron que el Colegio Médico no actualizaba de manera regular las especialidades acreditadas de sus afiliados. En varios casos, los datos estaban incompletos. Se tuvo que subsanar el problema a mano, con búsquedas específicas del historial de los especialistas.

2. La información oficial es contradictoria

El equipo realizó un segundo proceso de recolección de información de carácter más sensible para elaborar las fichas de los establecimientos de salud, médicos, compañías aseguradoras y administradoras de fondos de salud. Solicitamos todas las resoluciones sancionadoras impuestas por el Instituto Nacional de la Competencia y de la Protección de la Propiedad Intelectual (Indecopi) contra empresas privadas de servicios de salud disponibles desde 1992 hasta mediados de 2015. Durante ese período, Indecopi había sido el único organismo del Estado que se encargó de fiscalizar y sancionar las malas prácticas del sector privado en perjuicio de los pacientes. Sin embargo, solo tenía resoluciones archivadas desde el 2011.

La primera respuesta del Indecopi fue que descargaramos los documentos en PDF almacenados en su sitio web, pero insistimos en que nos entregaran los documentos en físico. Solo así pudimos comprobar que el organismo disponía de más información que no había procesado. Al hacer el contraste encontramos 30 resoluciones sancionadoras contra clínicas que no aparecían en su sitio web.

La aplicación Cuidados Intensivos procesó más resoluciones que el propio Indecopi para elaborar el ranking de clínicas con más sanciones administrativas. Además, con la lista completa, los periodistas pudieron verificar que la mayoría de clínicas no pagó las multas impuestas y las impugnó en el Poder Judicial.

3. Los términos técnicos esconden revelaciones

Durante la investigación, debimos empaparnos de los términos técnicos usados en el Estado para categorizar los establecimientos de salud. Sin el manejo de esta jerga especializada, hubiéramos perdido datos relevantes. Una muestra clara apareció al detectar un indicador que la Superintendencia Nacional de Salud (Susalud) denomina: nivel de riesgo operacional. El dato correspondiente era un porcentaje sin mayor explicación.

En la jerga oficial, este concepto se refiere al resultado de la supervisión realizada por Susalud a los servicios privados para medir su grado de cumplimiento de las normas de atención a los pacientes (condiciones y equipamiento de los servicios de emergencia, unidad de Cuidados Intensivos, farmacia, etc.). Los inspectores de Susalud consignaban como nivel de riesgo lo que en realidad correspondía al porcentaje de cumplimiento. De este modo, cuando en los reportes se decía que una clínica presentaba “Nivel de riesgo operacional: 6%”, lo que en realidad se revelaba era que el establecimiento no cumplía el 94% de las normas de atención. El impacto del dato cambiaba de manera radical.

Para comprender la terminología, los periodistas recurrieron a expertos que les ayudaron a explicarla en un lenguaje sencillo para los usuarios y que fue colocada en las fichas de los establecimientos de salud evaluados de una manera comprensible.

4. Si la base de datos no existe, siempre hay formas de construirla

Uno de los mayores retos fue resolver la falta de información. El Perú carece de un registro oficial sobre negligencias médicas sancionadas. La información fue solicitada al Ministerio de Salud, el Colegio Médico, la Asociación de Clínicas Particulares y el Poder Judicial. Ninguna de estas instituciones disponía archivo alguno sobre el tema. Resolvimos construir una primera base a partir de las denuncias aparecidas en los medios de comunicación, que luego hubieran sido formalizadas ante el sistema de justicia.

Para ello, parte del equipo se sumergió en los archivos de tres de los periódicos más grandes del país: El Comercio, La República y Ojo. Revisamos el periodo de 1991 hasta mediados del 2015 y luego volcamos la información a una tabla de Excel con los siguientes campos: nombre de la víctima, clínica u hospital donde ocurrió la negligencia, médico o profesional de salud denunciado, breve descripción de los hechos, y año de la ocurrencia. Con este panorama, contrastamos los nombres de los médicos y de los establecimientos involucrados en los registros del Ministerio Público y el Poder Judicial. Solo los casos formalizados (con sentencia o en proceso abierto) fueron incluidos.

5. Si la información cuesta, date el gusto de liberarla

Las fichas de las empresas que prestan servicios de salud tienen información que proviene de la Superintendencia Nacional de Registros Públicos (Sunarp) y del Poder Judicial. El pequeño detalle es que ambas entidades del Estado cobran una tasa por cada búsqueda. Para consultar cada partida registral de la Sunarp hay que abonar cuatro soles, y una sola empresa puede tener varias actas registrales. En el Poder Judicial, por cada reporte para conocer el estado de una demanda debe pagarse un sol. El equipo decidió asumir el costo para acceder a la información de unas 50 empresas en las que se concentró la investigación y liberó los datos en Cuidados Intensivos.