Como Data Scientist y ávido conversador, muchas veces recibo esta pregunta. No paramos de escuchar que el devenir diario de nuestras actividades está gestionado por algoritmos y que la inteligencia artificial está sustituyendo labores que previamente eran totalmente manuales y artesanas, pero es duramente imaginable el amplísimo alcance que puede llegar a tener esta disciplina.

Si alguna vez has usado Google Translate, el sistema de recomendación de productos de Amazon, el cálculo de rutas de Google Maps o has pagado satisfactoriamente con tu tarjeta bancaria, entonces te has beneficiado de los frutos de una de las áreas de la inteligencia artificial que últimamente está más en boga: el Machine Learning, también conocido como aprendizaje automático.

Las claves de la Inteligencia Artificial y cómo es el Machine Learning una rama del mismo

Pese a la falta de una definición estándar de Inteligencia Artificial, está comúnmente aceptado que es la disciplina que desarrolla métodos que permiten a las máquinas actuar como personas, y entre sus grandes áreas de conocimiento están la Robótica, el Razonamiento Lógico, los Sistemas MultiAgente o el Machine Learning.

El Machine Learning se aprovecha de la experiencia para poder proveer soluciones a problemas. Por ejemplo, el algoritmo de Amazon se basa en utilizar tu historial previo de compras, y el de millones de compradores con compras similares, para ofrecerte productos personalizados, que no son más que el resto de elementos que los demás han comprado de manera significativa, y tú aún no.

¿Cuál es la relación entre el Big Data y el Machine Learning?

Una vez aclarada la diferencia entre Machine Learning e Inteligencia Artificial, es necesario entender el rol del Big Data. Al igual que con la IA, el Big Data no tiene una definición fija, pero se ha consensuado que es la disciplina donde las características del conjunto de datos van más lejos que lo que un clásico Excel puede manejar, ya sea en tamaño, formato o velocidad de aprovisionamiento. Su principal relación con el Machine Learning es por los datos en sí mismos: Machine Learning necesita de ejemplos datificados para poder encontrar sus soluciones. Es decir, siguiendo con el ejemplo de Amazon, necesita poder acceder a tu historial de compras y al del resto de clientes. Tu historial de compra es muy fácil que pueda caber dentro de un Excel, pero el de todos los clientes de Amazon que hayan comprado productos parecidos a los tuyos, seguramente no.

El abaratamiento del precio de almacenamiento en los últimos años, ha llevado a todas las empresas a querer datificar todos sus procesos, ya que es el ingrediente principal para que un buen experto en Machine Learning sea capaz de trabajar: los datos son la gasolina que permite a los motores de Machine Learning encontrar mejores soluciones, y cuantos más datos, generalmente, mejor.

¿Para qué sirve el Data Science?

Cualquiera puede datificar procesos. Por ejemplo, cuando Adam Smith fue padre por primera vez, tomó nota de cada hora de sueño de su hija durante el primer año de vida para observar en qué momento surgió el ritmo circadiano del bebé (el momento en que se adapta al ciclo vigilia-sueño habitual). Adam Smith supo encontrar una buena oportunidad y utilizó los datos para alcanzar un objetivo. Sin embargo, no lo monetizó para sacarle provecho. Por lo tanto, podríamos decir que el Data Scientist es el experto en el manejo de datos y herramientas algorítmicas que aplica a problemas de negocio.