Un software que convierte datos en texto escrito podría ayuda a dar sentido a la avalancha de 'big data' que se nos avecina
POR TOM SIMONITE TRADUCIDO POR FRANCISCO REYES
Un software que se usó en un principio para escribir reportajes de noticias acaba de encontrar otra salida profesional: la redacción de informes para gigantes financieros y agencias de inteligencia de Estados Unidos.
El software de escritura, llamado Quill, fue desarrollado por Narrative Science, una compañía de Chicago (EEUU) creada en 2010 para comercializar una tecnología desarrollada en la Universidad Northwestern (EEUU) que convierte datos numéricos en una historia escrita. Poco después Quill empezó a utilizarse para informar sobre partidos de béisbol en televisión y medios de deportes en línea, así como para emitir informes de ingresos empresariales para clientes como Forbes.
El éxito inicial que tuvo Quill en su carrera no pasó desapercibido, y el software fue considerado por algunos como prueba de que el software inteligente podría desplazar a los trabajadores humanos. El director general de Narrative Science, Stuart Frankel, señala que la publicidad, aunque en parte fue negativa, les vino muy bien. "Mucha gente se sintió amenazada por lo que estábamos haciendo, y conseguimos mucha cobertura", asegura. "Eso hizo que nos llegaran peticiones desde todo tipo de sectores y que evolucionásemos hacia un tipo de empresa diferente".
Hoy día Narrative Science alquila las habilidades de escritura de Quills a clientes financieros como T. Rowe Price, Credit Suisse y USAA para escribir informes extensos y más detallados sobre el rendimiento de los fondos de inversión, que después son distribuidos a los inversores o reguladores.
"Pasamos de un trabajo que requeriría a un pequeño grupo de personas durante varias semanas a sólo unos pocos segundos", señala Frankel. "Hacemos documentos de entre 10 y 15 páginas para algunos clientes financieros".
Una inversión de In-Q-Tel, la división de inversiones de la CIA, llevó a la empresa a trabajar para varias agencias de inteligencia estadounidenses. Al preguntarle sobre ese trabajo, Frankel sólo dice que "los retos de comunicación de la comunidad de inteligencia de Estados Unidos son muy similares a los de nuestros otros clientes". En total, Quill produce actualmente varios millones de palabras al día.
El resultado del software puede ser impresionante si tenemos en cuenta que es un programa, pero no puede escribir sin inspirarse en ciertos datos numéricos. Analiza estadísticamente dichos datos en busca de acontecimientos o tendencias significativas, y utiliza conocimientos sobre conceptos clave como la quiebra, el beneficio y los ingresos, y cómo se relacionan estos conceptos.
El siguiente párrafo, de un informe de inversiones, muestra que Quill puede escribir un texto aceptable para un documento de ese tipo, pero aún así se nota que está escrito por un ordenador.
"El sector energético fue el principal contribuyente al rendimiento relativo, liderado por la selección de acciones dentro de las compañías de equipamiento y servicios energéticos. En cuanto a los contribuyentes individuales, una posición en la empresa de equipamiento y servicios energéticos Oceaneering International fue el mayor contribuyente a la rentabilidad. La selección de acciones también contribuyó a resultados relativos en el sector de la atención sanitaria. El posicionamiento en la industria de los equipamientos y suministros de atención médica es lo que fue de más ayuda".
Quill está programado con reglas de escritura que utiliza para estructurar frases, párrafos y páginas, asegura el profesor de ciencias informáticas de la Universidad Northwestern,Kristian Hammond, que además es director científico de Narrative Science. "Sabemos cómo presentar una idea, cómo no repetirnos, cómo hacerla más corta", afirma.
Las empresas también pueden ajustar el estilo y el uso del lenguaje de Quills en base a lo que necesiten que escriba. Por ejemplo puede acentuar lo positivo en textos de publicidad, o usar detalles exhaustivos en una presentación para reguladores.
Quill también puede seguir un "ángulo" a la hora de escribir. Por ejemplo, cuando escribe sobre deportes para un público propenso a favorecer a un equipo en particular, Quill puede escribir una noticia que suavice el impacto de haber perdido.
Narrative Science no publica detalles técnicos sobre cómo funciona Quills. Sin embargo, el profesor asociado de la Universidad Estatal de Ohio (EEUU), Michael White, señala que su capacidad para pulir el ángulo y el arco de una noticia es lo que lo diferencia de ejemplos anteriores de software similar.
Hace años que se investiga el software de "generación de lenguaje natural", pero recientemente ha empezado a ser más prometedor a nivel comercial, señala White. "Cada vez hay más conciencia de que las grandes cantidades de datos y visualizaciones no son realmente útiles si no se pueden explicar y hacer que sean relevantes", afirma White. "Yo diría que ha llegado la hora de que la generación de lenguaje natural tenga éxito comercial".
Entre las otras empresas que trabajan en la tecnología están Arria, una compañía con sede en Reino Unido nacida de una investigación de la Universidad de Aberdeen (Escocia). Una start-up de Pittsburgh (EEUU) llamada OnlyBoth, fundada el año pasado, planea lanzar sus primeros productos de software de escritura más adelante en 2015.
Por ahora, todas estas compañías se están centrado en dar servicio a empresas. No obstante, Hammond señala que al igual que los coches, los aparatos sanitarios y los electrodomésticos se han ido conectando a internet, las sencillas listas y símbolos que utilizan para comunicarse con los humanos podrían llegar a ser insuficientes. "La mayoría de los hogares no tienen capacidad para gestionar los datos de sus termostatos y coches y hacer que sean inteligibles", señala Hammond. "Esta tecnología se va a convertir en una voz descriptiva de todo lo que genere datos". (MIT)
No hay comentarios :
Publicar un comentario