Los científicos de datos: Un valor en auge en el mundo empresarial
¿Por qué se afirma que estamos viviendo un cambio de paradigma?, ¿en qué consiste exactamente?, ¿cómo afecta esta situación a los científicos de datos, a las empresas y a las personas en general? Nos lo ha contado Macarena Estévez en la UEMC Business SchoolOpenClass de este mes. Ella es matemática, científica de datos, y ha trabajado gran parte de su trayectoria académica aplicando la matemática aplicada a las empresas. Actualmente trabaja en Deloitte.
La ponente de esta UEMC Business SchoolOpenClass empezó hablando de las diferentes dimensiones que existen en este cambio de paradigma. Ahora más que nunca, las empresas tienen acceso a millones de datos, y esto es algo que los humanos no somos capaces de asimilar en nuestra cabeza. Esta sería, por lo tanto, la primera dimensión del cambio de paradigma.
La segunda dimensión serían los datos de cualquier tipo, por ejemplo, la navegación web que hacemos cualquiera de nosotros, son millones de datos que, de nuevo, tenemos que delegar en una máquina porque nosotros no somos capaces de almacenar tal volumen de datos.
Y por último, y quizás la dimensión más importante de las tres, es el hecho de manejar la información y tomar las decisiones en tiempo real. No queda otra, «si queremos dar respuesta a la nueva realidad que ha llegado, que son muchísimos datos de cualquier tipo, debemos ser conscientes de que los humanos no somos capaces y por tanto, tenemos que aprender a delegar en las máquinas», indica Macarena Estévez.
Te puede interesar: Francisco Santos, Director de UEMC Business School, destaca la importancia de las habilidades directivas en el Startup Olé
Esta necesidad provoca que las empresas de toda la vida tengan que transformarse para poder dar respuesta a lo que acabamos de explicar. En este sentido, la Transformación Digital tiene tres pilares fundamentales:
- Arquitectura de Sistemas para almacenar y procesar grandes cantidades de datos.
- Capacidad de ejecución en tiempo real (Cloud Computing).
- Modelos y algoritmos para extraer información útil de los datos y tomar mejores decisiones.
Actualmente, lo que les está pasando a los científicos de datos, es que les está pillando todo esto en pleno cambio, es decir, viven en un momento de división. Por una parte, siguen teniendo que tomar muchas decisiones estratégicas, basadas muchas veces en Analítica Avanzada, con cierto nivel de automatización. Y por otra parte, muchos procesos se automatizan 100% con Machine Learning e Inteligencia Artificial (IA). Casos de tiempo real. Y en estos casos, el papel de los científicos de datos no está tan claro.
Macarena Estévez puso un ejemplo que ayudó muy bien a entender esta situación. Son 4 posibilidades diferentes para saber hacia dónde vamos:
- Humano – Humano: El director de Marketing de una empresa quiere entender qué variables afectan a las ventas de sus productos para poder hacer una predicción de las ventas. Le pide a un analista que haga los modelos y le explique cómo funcionan y, así, poder hacer juntos las predicciones. Este sería un caso de toda la vida.
- Humano – Máquina: El director de Marketing de una empresa quiere conocer las predicciones de ventas de sus productos. Lo hace a través de una herramienta que está programada para calcularlas.
- Máquina – Humano: Una herramienta ha sido programada para hacer de manera automática las predicciones de ventas y enviar notificaciones al director de Marketing en caso de que haya algo importante que tenga que saber.
- Máquina – Máquina: Una herramienta ha sido programada para hacer de manera automática las predicciones, que llegan a otra herramienta de toma de decisiones de pricing, recalculando los precios en tiempo real de manera automática. En este caso se produce una optimización de cada segundo y las cosas funcionan mucho mejor.
Machine Learning e Inteligencia Artificial
La Inteligencia Artificial se refiere a cualquier técnica, proceso o herramienta que permita a un ordenador imitar la inteligencia humana, utilizando lógica, reglas de decisión, modelos estadísticos y algoritmos matemáticos. Además, Macarena Estévez ha explicado que es muy difícil poner el límite entre lo que hace el científico de datos y lo que hace un ingeniero de Machine Learning.
Por un parte, los científicos de datos:
- Suelen tener una base de matemáticas y estadística y un poquito de programación.
- Entienden los problemas de la industria.
- Aplican el método científico para analizar datos y crear modelos.
- Tienen la necesidad de entender cómo se resuelve el problema.
- Son más creativos, más abstractos.
Y los ingenieros de Machine Learning:
- Suelen tener una base de programación y matemáticas y un poquito de estadística.
- Entienden la manera de actuar de la industria. Son quienes van a ayudar a implementar la solución.
- Ponen en producción los modelos que crean los científicos de datos.
- Lo que más les interesa es tener un modelo que haga bien la predicción.
- Son más funcionales, más prácticos.
Un científico de datos que trabaja en una empresa de distribución no va a hacer lo mismo que un científico de datos que trabaja en una empresa energética. Harán trabajos distintos. Por lo tanto, es muy importante conocer en qué industria te gustaría trabajar porque el científico de datos tiene que ser capaz de relacionarse con otras personas que saben del negocio para resolver bien su problema.
Perfiles senior de científicos de datos
- Tienes que mantenerte al día de las metodologías. Saber qué es lo nuevo que sale. Seguir también las innovaciones académicas.
- Tienes que tener contacto directo con el cliente. Conocer sus necesidades y ser capaz de comunicarte con él y ofrecerles nuevas oportunidades.
- Tienes que seguir el día a día del trabajo de los analistas y científicos de datos noveles. Solo estando cerca de los problemas reales te mantendrás al día. Esta es la mejor formación y es gratuita. Aprender de los demás.
Los científicos de datos, además, pueden evolucionar hacia la parte expertise o hacia la parte de dirección. Pero como van a ser necesarios tantos científicos de datos, y como todo avanza tan rápido, vamos a tener tres tipos de científicos de datos:
- Científico de datos con alto expertise: Se especializan en temas muy novedosos, donde todavía se sabe poco y donde se necesita mucha investigación y dedicación exclusiva.
- Científico de datos con expertise medio: No están tan especializados. Saben un poco de las diferentes etapas por las que pasa la ciencia de datos. Pueden hacer pequeños proyectos de principio a fin.
- Científico de datos con bajo expertise: No tiene demasiados conocimientos, pero se manejan muy bien con herramientas que existen para hacer modelos. Generalmente conocen bien la industria y esta es su fortaleza. Estos son los conocidos como Citizen Data Scientist. Son personas que hacen modelos sin tener formación específica de Analytics.
El enfoque ha cambiado
¿Cómo se resuelven los problemas en las empresas? Ante una predicción, los científicos de datos miraban los datos que tenían y dedicaban la mayor parte del tiempo a realizar modelos para intentar llegar al mejor modelo. Este era el trabajo de un científico de datos.
Ahora, con el nuevo cambio de paradigma, donde hay tantos datos y tan desestructurados, los científicos de datos dedican una gran parte a tratar los datos y mejorarlos, consiguiendo así que con tan solo una o dos pruebas de modelo, el resultado sea mucho mejor.
Un cambio de conceptualización en el que se ha pasado de invertir la mayor parte del tiempo en realizar y probar modelos a tratar, analizar y mejorar los datos que se tienen.
Machine Learning Operations (MLOps)
Macarena Estévez afirma que si tenemos científicos de datos y tenemos ingenieros de Machine Learning, tenemos un modelo. “Esto es el principio. Y al final de todo el proceso, tengo ese modelo usándose de manera habitual en una aplicación. Por lo tanto, en otras palabras, nos inventamos algo, cogemos unos datos, hacemos un primer proyecto, y eso que nos inventamos lo tenemos que llevar al mundo real”, aclara.
Todas las funciones que aparecen en la imagen (cambios en los datos, problemas de privacidad, escalabilidad…) son las que conforman el Machine Learning Operations. La gran pregunta es: ¿dónde está el científico de datos en el MLOps? Sobre todo tiene mucha cabida al principio, pero también hay cosas dentro del proceso en las que el científico de datos va a ser útil.
Existen dos puntos de vista de Machine Learning Operations:
- Visión centrada en los datos: Partimos de un primer modelo, y según van llegando nuevos datos, el modelo se tiene que ir re – entrenando.
- Visión centrada en software: El modelo se crea automáticamente según llegan los datos. No hay ciencia de datos. Es puro software.
Velocidad y automatización con Inteligencia Artificial
Aplicar la IA puede ayudar a las empresas a minimizar costes. Esto no significa que las máquinas sustituirán a los humanos, si no que el ser humano se tiene que ir recolocando. Por ejemplo, si tenemos un gasto importante en Call Center porque tenemos a 100 personas que están recepcionando llamadas, y además muchas de esas llamadas se hacen largas, se puede automatizar con un chatbot. Esta iniciativa ayudará además a minimizar riesgos, por lo puede merecer la pena aplicar la IA.
Te puede interesar: Carreras para mejorar tu futuro profesional
Otras empresas, lo que hacen, es medir la marca. ¿Qué piensa la gente de la marca? , ¿la conocen?, ¿cómo la valoran?… Estos estudios se hacen una vez al año. También, a partir de las redes sociales, se pueden sacar métricas en tiempo real midiendo lo que la gente va diciendo de la marca. Al ser en tiempo real, nos puede anticipar riesgos de marca evitando así que ese riesgo pueda seguir creciendo.
Pero, ¿cuál es el futuro de todo esto? A Macarena Estévez apuesta por la vertiente de la paradoja de Moravec, en la que las cosas que son fáciles para los humanos, son difíciles para las máquinas y viceversa, por lo tanto, el mundo nunca va a estar dominado por las máquinas.
Estamos en una era distinta donde vamos a trabajar con las máquinas y en ese sentido nuestra vida va a cambiar. Pero el humano va a seguir estando ahí. Los humanos van a seguir poniendo sentido común, defendiendo la cultura, cuidando la ética… y las máquinas van a ser las que automatizan, repiten, identifican patrones… y ambas partes van a poder convivir perfectamente.
Eso sí, los humanos pedimos a la Inteligencia Artificial tres aspectos fundamentales:
- Equidad: Asegurar que no existen sesgos.
- Responsabilidad: Asegurar la privacidad y la seguridad.
- Transparencia: Ofrecer información clara y precisa.
Como conclusión, Macarena Estévez destacó una idea bastante interesante: “Todos nosotros, en nuestra vida habitual, queremos tener el mejor smartphone, queremos tener todo lo mejor en tecnología, pero luego en nuestro trabajo tenemos miedo y no queremos que la tecnología se meta demasiado porque a lo mejor perdemos nuestro trabajo”.
En este sentido, en las empresas hay dos tipos de individuos:
- Los que se dejan transformar.
- Los que lideran la transformación.
Así que recuerda que las empresas necesitan personas que quieran ayudarlas a transformarse, por lo tanto, tengas la edad que tengas y el puesto que tengas:
- Debes estar atento a las novedades en temas de transformación.
- Proponer ideas.
- Debes sentir que el futuro ya está aquí y preocuparte por anticiparte.
- Interesarte por formarte, que no te asusten los cambios que puedan venir.
- Apuntarse a algún comité en la empresa que trate temas de transformación o incluso crearlo si no lo hay.
- Estar al día de las startups.
Y si quieres especializarte en la Ciencia de Datos, no dudes en estudiar nuestro Máster Oficial Online en Dirección y Gestión de Grandes Volúmenes de Datos: Big Data.