TecnoXplora » CienciaXplora » Divulgación

PREDICIENDO 'BLOCKBUSTERS' DE AYER Y HOY

La fórmula del taquillazo: usando la ciencia para predecir qué películas triunfarán

Un grupo de investigadores cruza los datos de IMDB y el PageRank de Google para mapear cuáles son las cintas más importantes de la historia del cine, y crean un modelo científico para augurar taquilazos.

Fotograma de Casablanca

Fotograma de Casablanca IMDB

Publicidad

¿Cómo decidir qué películas son las mejores? Es complicado. Hay referencias del sector, como Leonardo di Caprio, que jamás han recibido un Oscar (por hablar de un caso reciente y sangrante, pero hay decenas), así que el tener más o menos Oscars no te convierte necesariamente en mejor ¿El dinero recaudado? Bueno, en 2014 'Transformers: La era de la extinción' lideró la recaudación con 1087,4 millones de dólares, seguida a mucha distancia de 'Guardianes de la Galaxia', con 772,6 millones. Dos peliculones donde los haya... que nadie recordará en unos años.

¿Entonces? Un equipo de investigaciones de la prestigiosa 'Proceedings of the National Academy of Sciences' de EEUU se puso manos a la obra a idear un sistema para cuantificar cuáles han sido las películas más importantes del imcine, de cara a crear un modelo que sirviera para anticipar qué otras creaciones podían ser importantes en el futuro. Y para hacerlo se miraron el ombligo: trabajaron de la misma forma que se suele trabajar a la hora de redactar artículos científicos.

Por 'artículos científicos' no hay que entender tratados matemáticos o químicos, sino los artículos elaborados por investigadores en publicaciones académicas y universitarias de cualquier área científica, desde la psicología o las ciencias sociales a la física cuántica. Dichos textos tienen una estructura siempre marcada, siendo una de las primeras partes un 'estado de la cuestión' en la que se buscan investigaciones previas similares o cercanas a las que referenciar y en las que basarse. Para profanos en la materia, la bibliografía de referencia.

Quizá alguna vez hayas escuchado la expresión "a hombros de gigantes", que suele usarse en el ámbito académico (hasta Google la usa en su buscador científico) para referirse a que ninguna investigación parte de cero porque se apoyan en textos previos, de referencia. Y, lógicamente, cuando un texto es citado hasta la saciedad es porque es tan bueno o tan importante que se convierte en indispensable en un área del conocimiento.

Y ahí es donde se basó el trabajo de los investigadores de PNAS con el cine.

En su investigación buscaron las interrelaciones entre películas, ya fueran en forma de referencias directas o veladas, plagios, homenajes y citas, y establecieron un 'ranking' con todos esos enlaces. Para hacerlo recurrieron a dos fuentes de referencia y bastante usadas en nuestros días: las interrelaciones las sacaron de la base de datos de IMDB y la clasificación la hicieron usando el algoritmo del PageRank de Google.

Ahora faltaba comprobar que el modelo funcionara. Descartaron para ello los dos criterios citados, las nominaciones a los Oscar y el dinero recaudado, y se centraron en las opiniones, tanto de profesionales como de espectadores.

Para lo primero se basaron en las críticas del que posiblemente haya sido el más importante y prolífico del gremio: Rogert Ebert, columnista de Chicago cuyos textos se publicaban en centenares de medios y cuyo trabajo le valió un Premio Pulitzer. Además, completaron los datos con la base de datos online de Metacritic y con las críticas de los espectadores en IMDB

El resultado fue demoledor: sólo los datos obtenidos de Metacritic fueron tan claros y significativos como los del modelo ideado por los investigadores.

Claro, no todo el éxito de algo se basa en ser referencia, porque de vez en cuando alguien innova con una nueva teoría que revoluciona todo. Y ese no es el único 'pero' de la investigación, aunque sus datos demuestran bastante solidez.

¿Y cuáles son los resultados? Sólo diremos una cosa: citan a Star Wars, lo demás se lo dejamos a los frikis del séptimo arte

Publicidad