Big Data y la Espada del Augurio

Imagen de León-O (Thundercats)

Se ha hablado mucho de Big Data en publicidad, pero la realidad es que casi todos los ejemplos que existen de su aplicación tienen que ver con la optimización de medios (Display y Search, básicamente). Lo que no hay son ejemplos de cómo usar Big Data para crear experiencias a través de historias que le aporten valor a los usuarios.

En Flock tuve la oportunidad de colaborar con el departamento de Big Data de la agencia, así que pensé que valdría la pena compartir un poco de lo que aprendí en vista de la escasez de referencias.

¿Qué es Big Data?
Para entender Big Data debemos primero hablar de la digitalización lo que nos rodea. La digitalización de algo sucede cuando logramos representar ese algo (objeto, imagen, sonido, documento o señal) en forma de unos y ceros. O sea, en un formato que puede leer una computadora. Los ejemplos clásicos de la digitalización son los documentos, la música, los libros y las imágenes, pero cada día se digitalizan más cosas menos obvias como la actividad física de una persona, las vibraciones de un motor y el estrés de un puente.

Gracias a la digitalización, estamos presenciando una explosión de datos. Estudios estiman que en el 2002 se generaron en el planeta 5 exobytes de información nueva (un exabyte es un billón de gigabytes). En el 2006 se generaron 161 exabytes; en el 2010, 988 exobytes y en el 2012, 2837.

El avance de la digitalización y la consecuente explosión de los datos han provocado un diluvio de información en muchas organizaciones. El concepto de Big Data se acuñó cuando el volumen de información/datos se volvió tan grande que no se podía examinar con las capacidades ni las herramientas de las computadoras, así que los ingenieros tuvieron que desarrollar nuevas herramientas para analizarla.

Aunque no existe una definición rigurosa, Big Data se refiere a los insights y nuevos tipos de valor que podemos generar a partir de examinar datos a gran escala. En muchos casos, estos insights y nuevas formas de valor son tan poderosos que pueden transformar industrias enteras.

Espada del Augurio

La Espada del Augurio
Me gusta pensar que Big Data es como la Espada del Augurio. Para aquellos que no la conocen, la Espada del Augurio es el arma de León-O, señor de los Thundercats y el héroe principal de la serie animada del mismo nombre. La Espada del Augurio era única porque tenía un ojo de cristal incrustado en su base capaz de verlo todo. A través de este ojo, León-O podía “ver más allá de lo evidente”: observar eventos y cosas lejanas u ocultas que le ayudaban a derrotar a sus enemigos y salvar a los habitantes del planeta. Por sí sola, la espada no servía de mucho, pero en manos de León-O, la espada se volvía un arma formidable difícil de superar.

Para entenderlo un poco mejor, pensemos en el dibujo de León-O hecho por un niño de 5 años. Los trazos son muy simples y burdos, pero alcanzamos a distinguir que se trata de un ser humano con melena roja y espada. Ahora pensemos en un dibujo también de Leon-O hecho por un ilustrador habilidoso. El nivel de detalle es mucho mayor y, ahora gracias a los colores y trazos expertos, estamos seguros que es León-O. Incluso sabemos que el dibujo representa un pasaje famoso de la historia de los Thundercats gracias a que reconocemos el lugar donde se desarrolla la acción, los enemigos que enfrenta y otras pistas en el fondo. Por último, tomemos cientos de ilustraciones de León-O como la anterior y reproduzcámoslas a 24 cuadros por segundo. De repente, León-O cobra vida. Vemos cómo se mueve y pelea. Con la frecuencia de sus pasos y la extensión de sus piernas podemos calcular su velocidad de desplazamiento y descubrir que León-O corre a más de 60 kms/hr (algo parecido a lo que hizo este estudiante de física chicos para calcular la velocidad a la que corren los Supercampeones).

Con Big Data sucede algo similar. De repente comenzamos a ver cosas y conexiones en los datos que no se pueden detectar a escalas más pequeñas.

De la Causalidad a la Correlación
Estas conexiones inesperadas de las que hablamos las vemos en forma de correlaciones. Una correlación cuantifica la relación estadística entre dos variables. Una correlación fuerte significa que cuando el valor de una variable cambia, es muy probable que el valor de la otra lo haga también. Por ejemplo, cuando la temperatura disminuye, observamos que el número de casos de gripe aumentan. O cuando el número de coches circulando en las calles aumenta, la contaminación del aire aumenta también.

Como ya lo mencioné, el poder de Big Data radica en que puede revelar conexiones ocultas que a veces desafían la lógica. Es obvio, o al menos así nos parece, que una baja en las temperaturas se relacione con un aumento de casos de gripe. “Si la temperatura baja y no me abrigo bien, me va a dar frío, se me bajarán las defensas y es muy probable que pesque un resfriado”, razonamos. ¿Pero qué tan lógico es que un buen historial crediticio indique el buen estado de salud de una persona? Una aseguradora estadounidense descubrió gracias a Big Data que podía calcular el nivel de riesgo de un cliente analizando su historial crediticio a la hora de otorgar seguros médicos.

¿Cuál es la relación causa-efecto entre ambas variables?
La respuesta es que no hay una relación de causa-efecto entre las variables. Simplemente existe una correlación entre ellas. Trabajar con Big Data no sólo es adoptar una nueva tecnología, sino un nuevo paradigma, una nueva forma de ver las cosas. A la mayoría de nosotros nos han educado para encontrar las causas de las cosas: nos han inculcado un pensamiento centrado en la causalidad. Big Data, en cambio, no se ocupa en encontrar causas, sólo revela correlaciones.

Las correlaciones no nos dicen por qué está sucediendo algo, sólo nos dicen que ese algo está sucediendo. Es decir, nos dicen el “qué”, no el “por qué”. Pero muchas veces es más que suficiente conocer el “qué” para impulsar las grandes ideas. Por ejemplo, gracias a mi historial de compras, Amazon sabe que me gustan los libros de ciencia ficción y me recomienda títulos como “Hyperion”. Amazon no sabe por qué me gustan: quizá es porque desde pequeño sentí fascinación por el espacio, o porque me gusta la forma en que los escritores construyen mundos fantásticos. Pueden ser estas y otras razones, pero Amazon no lo sabe ni necesita saberlo. Amazon sólo sabe que si compré “I, Robot”, es MUY PROBABLE que me interese comprar “Hyperion”, porque hay una correlación muy fuerte entre las ventas de ambos títulos.

Pero Amazon también podría recomendarme comprar una pulsera Up de Jawbone, una recomendación que al parecer no tiene mucha lógica, al menos desde el punto de vista de la causalidad. ¿Será que los fans de ciencia ficción son aficionados del “wearable tech”? Una vez más: Amazon no lo sabe ni le importa. Amazon hizo la recomendación gracias a una fuerte correlación que encontró entre las ventas de ambos ítems. Son éstas el tipo de conexiones ocultas que no pueden encontrarse empleando otros métodos y a las que Amazon les debe el 30% de sus ventas.

Haciendo predicciones
Algo muy útil de las correlaciones es que pueden ayudarnos a hacer predicciones. Después de todo, si A sucede a menudo junto con B, sólo debemos estar atentos a B para predecir que sucederá A. Usando B como proxy podemos conocer lo que posiblemente está sucediendo con A, aún cuando no podamos observar o medir A directamente. Y no sólo podemos predecirlo ahora, sino en el futuro.

Así es como Amazon sabe qué libros recomendarte, Facebook adivina a quién conoces y Google pudo predecir en tiempo real en qué ciudades se iba a propagar la epidemia de la influenza analizando únicamente las búsquedas de la gente.

Quizás el caso más famoso es el de Target, que analizando los patrones de compra de mujeres que se unieron a su programa de futuras madres, pudo predecir con alta certeza si una mujer estaba embarazada, sin necesidad de que la madre lo dijera explícitamente. El saber si una cliente está embarazada es muy importante para retailers como Target, ya que el embarazo es un período en que los hábitos de compra cambian. Las parejas comienzan a visitar nuevas tiendas, y a probar otros productos y desarrollar lealtades hacia nuevas marcas.

El equipo de Data Scientists de Target encontró 12 productos que, usados como proxies, permitían calcular un “score de predicción de embarazo”. Este score le permitía a su vez a Target enviar ofertas relevantes y cupones personalizados para cada fase del embarazo.

Construyendo la experiencia
Hasta aquí todo muy bien. La pregunta es: ¿cómo usamos Big Data para construir ideas que tengan que ver más con experiencias que con mailings, cupones y banners?

Esta pregunta también nos la hicimos Pablo y yo. Pablo es un data scientist con quien trabajé como dupla en varias propuestas de Big Data de la agencia. Como muchos de nuestros peloteos los hacíamos en una cafetería, se nos ocurrió que sería interesante imaginar la forma en que una marca como Starbucks podría construir una experiencia cimentada en Big Data.

Siempre que Pablo y yo pensábamos cómo aplicar Big Data en la creación de experiencias, partíamos de tres principios básicos. Primero, que nuestro trabajo consistía en crear ideas que generaran valor para las marcas a partir de ayudar a la gente. Es decir, el usuario siempre debía estar en el centro de todo lo que hiciéramos. Segundo, debemos tener claro que –como con cualquier tecnología– lo importante no era el Big Data en sí, sino cómo podía ayudarnos a darle forma a nuestras ideas, a volver posible algo que antes no se podía hacer o contar, y ayudarnos a llevar nuestra idea a más gente a un costo cada vez más accesible. Y tercero, que las ideas generadas debían alejarse de los clichés y lugares comunes para explorar territorios y ángulos nuevos que las volvieran únicas y memorables.

Volviendo al ejemplo de Starbucks, todo partió de una observación: la mayoría de la gente va a Starbucks acompañada. Casi siempre se trata de amigos, coworkers o la pareja. Visitar un Starbucks es más que ir a sorber café de un vaso, es ir a crear lazos con la gente. ¿Podríamos llevar este “coffee bonding” a otro nivel a través de Big Data? La respuesta de Pablo fue: “Fuck yeah”.

El primer paso sería conseguir un set de datos lo suficientemente grande para trabajar. ¿Qué tipo de datos? En este caso, los datos generados en todos los puntos de contacto de la marca con los usuarios: las cajas de las tiendas, tarjetas de lealtad e información pública de los fans de Starbucks en Facebook y Twitter. El volumen de datos que Starbucks genera en estos puntos de contacto es gigantesco, por lo que sí podemos clasificarlo como de Big Data. Recolectando y consolidando datos de estas fuentes nos ayuda a tener una visón más completa e integrada del consumidor, alrededor de quien deben girar todas nuestras acciones. Nótese que recolectar esta información sería relativamente sencillo ya que los puntos de contacto están digitalizados.

El segundo paso sería examinar la información. Según Pablo, analizando el grafo social y los patrones de compra de los usuarios de Starbucks encontraríamos correlaciones que permitirían saber si dos personas son compatibles. Por ejemplo: la gente que toma espresso doble, le dio like a Arcade Fire en Facebook, sigue a más de 300 usuarios en Twitter tiene una probabilidad de 75% de ser compatible con gente que toma té chai, le dio like a Los Ángeles Azules en Facebook y tiene más de 100 followers en Twitter.

Armados con esta información, Pablo y yo creemos que se puede crear una plataforma con la siguiente misión: ayudar a los usuarios de Starbucks a encontrar su alma gemela a través del café. Nosotros bautizamos la idea como “Coffee Soulmates”. ¿Cómo funcionaría? Podría ser un app en Facebook que te recomendara perfiles de personas del sexo opuesto compatibles contigo. A través de la app podrías conocer a esa persona invítandola a un Starbucks frecuentado por ambos y ofreciéndote un incentivo de un 2×1 en tu primera cita, por poner un ejemplo.

Sometimes people fall at love in a coffee shop
Foto: * Sometimes people fall in love at a coffee shop *

Es verdad, el “coffee bonding”/”match making” es algo que Starbucks nunca ha explorado y contrasta con el tipo de acciones que realizan regularmente. También es verdad que el ejemplo que pongo está muy simplificado, pero ese no es el punto. El punto es que Big Data nos da nuevas herramientas que nos ayudan a impulsar ideas que parten de ángulos distintos, poco explorados, alejados de los territorios que frecuentan las marcas. Claro, también es verdad que cualquier otra agencia podría proponer una idea como ésta y sin Big Data de por medio, pero la diferencia es que la nuestra haría predicciones mucho más certeras gracias al uso de los datos (generando más valor para los usuarios). Y no sólo eso, sino que nuestra idea se volvería más poderosa con cada nuevo usuario, ya que con cada participante crece la cantidad de datos disponible para el análisis y esto mejora la confiabilidad de las predicciones. Sería una “idea tortuga”, de esas que generan mayor tracción y valor con el tiempo, como una vez lo expuse aquí.

La creatividad consiste en conectar elementos dispares para crear ideas que solucionen problemas de forma novedosa. En ese sentido, Big Data es un gran aliado de la creatividad porque nos provee de esas conexiones inesperadas sobre las cuales podemos construir ideas diferentes y valiosas. Big Data es la Espada del Augurio que nos deja ver más allá de lo evidente para que luego nosotros, usando la creatividad, podamos crear ideas que también vayan más allá de lo evidente.

Published by

Montero

Chief Wizard Officer and Co-Founder @ Sparkjoy. Problem solver and trouble maker.

6 thoughts on “Big Data y la Espada del Augurio”

  1. Una cosa es correlacion simple como lo mencionas y otra cosa es Big Data, las recomendacion tipo Amazon que mencionas se han hecho desde hace anhos mediante mineria de datos. Lo que tu estas haciendo es lo que hace cualquier profesional de marketing, tomar decisiones empiricas en base a datos. Pero eso si ninguna de las dos son Big Data.

    Lo unico que me parece es que estas tirando demasiadas buzzwords por aqui y por alla, en primera no estan procesando ningun dato en absoluto… solo observando tendencias, y a partir de estas tendencias realizando inferencias. Lo que en realidad le quita todo lo de “Big Data”.

    En segunda, en Mexico un usuario no genera ni la mitad de los datos para decir que generamos datos para hablar a niveles de big data.

    Llegue a este post por casualidad y no esta mal, lo unico que puedo recomendar es que si esta es tu profesion… Investigues un poco mas para que no te enganhes a ti mismo, de lo que hacen no hay Big Data en absoluto y es extranho por que te pagan por esto pero ni siquiera haz investigado bien.

    Big Data no es el set de datos en si, es el PROCESO TECNOLOGICO (proceso compuesto por un set de herramientas bastante chidas) para procesar estos datos.

  2. Hey “Mein”.
    Mi nombre es Pablo; soy el data scientist referido en el post. Tengo estudios de posgrado en Estadística Aplicada y Minería de Datos. Soy afortunado, pues puedo comentar en blogs sin ocultar mi identidad.

    En principio, te agradezco que te hayas tomado la molestia de comentar acerca de nuestro trabajo, más aún sabiendo que lo haces desde una blackberry (no encuentro otra razón por la que alguien escribiría “anhos” en lugar de “años”, etc.).

    Felicidades por recordarnos el problema de la inferencia deductiva. Es algo con lo que trabajamos desde que Hume lo señaló en el… siglo XVIII! Ahora que lo pienso es irónico que, precisamente, generalices propuestas sin valor epistemológico. Vaya, siempre habrá quien confunda la Luna con el dedo que la señala.

    Podría explicarte los algoritmos, el hardware o los modelos que utilizamos para este y otros proyectos de big data. Pero vaya, sería como gritarle a la pared.

  3. @bajozocalo, me gustaria que explicaras que hardware utilizan para procesar Big Data y a cuantos datos procesados le llamas “Big Data” según tú.

    Saludos.

Leave a Reply

Your email address will not be published. Required fields are marked *