Un programa analizador de artículos define lo que realmente piensan los periódicos

La Ciencia se empieza a ocupar de analizar con sus herramientas un problema que aqueja a la Sociedad hoy: la influencia de los medios de comunicación y su tendencia a «disfrazarse» de independientes y neutrales. En Argentina conocemos muy bien el problema, y hoy en España mucha gente está observando los mismos vicios y intencionalidades en sus medios

«¡Aumentar los impuestos!», grita un titular. «¡Cortar el gasto!», grita otro. Con estos puntos de vista tan conflictivos, ¿cómo es que alguien puede comprender las noticias? Tal vez pueda ser de ayuda una nueva herramienta, un software que recorre los artículos de prensa e identifica a individuos u organizaciones que tienen puntos de vista opuestos sobre un tema en particular, y a continuación mapea las relaciones entre las partes en conflicto e identifica de qué lado está cada artículo.

«El proyecto tiene como objetivo ayudar a los lectores a darse cuenta de los diferentes puntos de vista y a tener una comprensión más amplia de las ediciones en la prensa», explica Souneil Park, un especialista en computación científica del Instituto Coreano de Ciencia y Tecnología, en Daejeon, Corea del Sur, quien dirigió la investigación.

El método de Park identifica las partes en contienda que se nombran en los artículos de prensa mediante la búsqueda de citas directas e indirectas. Las citas directas son, simplemente, aquellas frases que figuran entre comillas, mientras que las citas indirectas son identificadas mediante la búsqueda de ciertos verbos como «aclarado» o «criticado», como por ejemplo en «el gobierno aclaró su política fiscal, pero fue criticado por la oposición».

Los partidos de oposición

El software identifica al opinador y a las otras partes a las que él se refiere, y si las palabras utilizadas son positivas o negativas, para determinar su actitud hacia otras personas involucradas en el conflicto. A continuación, identifica a los dos rivales clave en un debate y clasifica a las otras partes de acuerdo a su relación con los dos principales.

Por ejemplo, un análisis de artículos sobre el incidente de Cheonan en el 2010, en el que al parecer un buque de la armada de Corea del Sur fue hundido por un submarino norcoreano, definió como oponentes principales a los gobiernos de Corea del Norte y Corea del Sur, con los gobiernos de otras naciones, en su mayoría, haciendo comentarios sobre estos dos.

Park y el equipo «mapean» estas relaciones con un algoritmo similar al PageRank de Google, que determina la importancia de los sitios web en base a los enlaces entrantes y salientes. En vez de estudiar los enlaces, sin embargo, el software busca qué nivel de crítica recibe y contesta uno de los participantes en particular. Los adversarios principales son las personas con los niveles más altos de crítica fluyendo en ambas direcciones.

A favor o en contra

Habiendo armado este mapa de relaciones, los investigadores clasifican los artículos en función de si apoyan o no a los dos oponentes principales. La clasificación depende del número de citas en el artículo, y los artículos son asignados a un lado si el porcentaje de menciones de apoyo a ese lado alcanzan un cierto umbral. Los artículos que no cumplen con este umbral se colocan en una tercera categoría, neutral.

El equipo probó su software en 250 artículos que cubren 14 temas polémicos y encontró que el programa podía clasificar correctamente las dos partes principales de la discusión en alrededor del 70 por ciento de los artículos. El software no pudo clasificar los artículos con pocas citas, o artículos que criticaban a alguien al mismo tiempo que los citaba con frecuencia. Park dice que los sitios agregadores de noticias como Google News podrían usar esta herramienta para ofrecer a los lectores una visión equilibrada sobre cuestiones controvertidas, aunque el software está diseñado para su uso con artículos de noticias de Corea, y tendría que ser modificado para las noticias en inglés u otros idiomas. La investigación fue presentada en la conferencia de la Asociación de Lingüística Computacional en Portland, Oregon, la semana pasada.

Fabrice Florin, director ejecutivo de NewsTrust, que busca definir un rango de exactitud e imparcialidad en las noticias, dice que el sistema podría ser útil, aunque las herramientas automatizadas tienen sus limitaciones. «Se necesita un poco de inteligencia humana allí», explica. «Nosotros utilizamos un método híbrido que implica profesionales, aficionados y computadoras.» También señala que para los ordenadores es difícil detectar el sarcasmo o la ironía, lo que hace que algunas citas sean difíciles de clasificar. «A veces podemos decir algo que suene negativo, pero si se lee con más detenimiento, en realidad es positivo», dijo.

Fuente: New Scientist. Aportado por Eduardo J. Carletti


Más información: