¿Cómo es un día en la vida de un científico de datos?

Todo trabajo de informática tiene un aire de misterio en sus funciones y responsabilidades. Si estás empezando una carrera en la ciencia de los datos, puede que te preguntes cómo es un día en la vida de un científico de datos. Hay varios factores que influyen en el día típico de un científico de datos. Descubre todo sobre este trabajo y las increíbles cosas que te esperan.

Un día en la vida de un científico de datos

De todas las disciplinas examinadas en una encuesta profesional de Habilidades Digitales, la ciencia de los datos puede abarcar la más amplia gama de aplicaciones. Pero, aunque la ciencia de los datos existe desde hace décadas, sólo recientemente ha alcanzado su máximo esplendor. «A medida que se ha ampliado la disponibilidad de datos, las empresas se han dado cuenta de lo importante que puede ser la ciencia de los datos», dice Briana Brownell, fundadora y directora general de Pure Strategy, y científica de datos desde hace 13 años. «Ahora todas las empresas deben centrarse parcialmente en la tecnología» Esta misma semana, por ejemplo, McDonald’s ha pagado unos 300 millones de dólares para adquirir su propia empresa de big data.

No es de extrañar, pues, que la competencia por los científicos de datos sea increíblemente alta. En sólo dos años, se espera que la demanda crezca un 28%, lo que equivale a unos 2,7 millones de nuevos puestos de trabajo. Esto supone más puestos de trabajo de los que podrán cubrir los recién licenciados, lo que significa que los trabajadores tecnológicos de otros campos tendrán que perfeccionar sus habilidades y hacer la transición a los datos para satisfacer esta demanda.

De hecho, esta encuesta sugiere que esto ya está ocurriendo. Aproximadamente cuatro de cada cinco profesionales de los datos empezaron su carrera haciendo otra cosa, y el 65% de todos los científicos de datos llevan trabajando en este campo cinco años o menos. Esta enorme afluencia de nuevas mentes tiene un efecto de doble filo, dice Brownell; por un lado, «hay muchas ideas nuevas que llegan», dice. «Cuando miro algunos de los contenidos que salen de la comunidad de la ciencia de los datos, me sorprende la cantidad de innovación que hay» Sin embargo, la otra cara de la moneda es la tendencia a reinventar la rueda.

La gran demanda de científicos de datos es estupenda si eres uno de ellos (o estás pensando en convertirte en uno), pero para los empleadores, la contratación puede ser un reto desalentador. En este caso, la recapacitación es una solución obvia; puede ser más rentable volver a formar a un empleado actual en ciencia de datos que contratar a uno nuevo.

Pero incluso si planeas contratar un nuevo equipo de ciencia de datos, tu organización en su conjunto puede necesitar repasar sus conocimientos de datos, advierte Brownell. «Todo el mundo quiere trabajar en algo que tenga un impacto en su lugar de trabajo, que mejore la vida de la gente», dice. «Si la cultura de tu empresa no es tal que [tus científicos de datos] puedan tener un impacto, es casi imposible contratarlos» La dirección debe ser capaz no sólo de comunicar a los posibles contratados cómo podrán contribuir, sino también de comprender las propuestas que su equipo de científicos de datos acabe presentando.

Desgraciadamente, dice Brownell, «la incómoda mayoría son las empresas que no han entendido nada» Dicha encuesta lo corrobora: la mayoría de los encuestados (52%) describieron el nivel de conocimiento de los datos en sus organizaciones como «básico», siendo «intermedio» la siguiente respuesta más común (31%). Esto sugiere que una formación básica en ciencia de datos podría ser útil para una gran mayoría de empresas, especialmente en la dirección.

Esta necesidad de mejorar la alfabetización en datos -y la comunicación- se ve acentuada por la forma en que se estructuran la mayoría de los equipos de ciencia de datos: como un equipo discreto, normalmente con 10 personas o menos (según el 71% de los encuestados), y a menudo con cinco o menos (38%). Estos equipos tan unidos no pueden permitirse el lujo de estar aislados. «Las personas que trabajan en empresas más grandes suelen estar dentro de un pequeño grupo específico de ciencia de datos, y sus clientes son internos -otras partes de la organización-«, explica Brownell, «así que es un equipo que tiene que operar en muchas áreas diferentes de la organización.»

¿Qué es exactamente la ciencia de los datos?

La percepción común (de que los científicos de datos hacen números) no está muy lejos de la realidad, dice Brownell. «Hay muchos conjuntos de datos de los que hay que sacar conclusiones, y eso implica muchos pasos, como la creación de modelos y la limpieza de datos, e incluso simplemente decidir qué datos necesitas» En última instancia, sin embargo, este esfuerzo está orientado a los objetivos: «En el fondo, tienes que hacer algo con los datos»

Por eso, los datos no siempre son números. Aunque la mayoría de los encuestados (el 73%) indicó que trabaja con datos numéricos, el 61% dijo que también trabaja con texto, el 44% con datos estructurados, el 13% con imágenes y el 12% con gráficos (y una pequeña minoría incluso trabaja con vídeo y audio, el 6% y el 4% respectivamente). Estos resultados de la encuesta indican que la ciencia de los datos se está expandiendo más allá de las tablas financieras, reclutando personas para proyectos tales como la maximización de la satisfacción del cliente o la obtención de valiosos conocimientos de la manguera de los medios sociales.

Como resultado, «hay una enorme variedad dentro del campo de la ciencia de los datos», dice Brownell. «Cada sector tiene su propia opinión sobre los tipos de datos en los que trabajan los científicos de datos, los tipos de resultados que esperan y cómo encajan en la estructura de liderazgo de su empresa»
Pero en todos los casos, el objetivo es aprovechar los datos para ayudar a la empresa a tomar mejores decisiones. «Eso podría ser mejorar los productos, entender el mercado en el que quieren entrar, retener más clientes, entender el uso de su mano de obra, entender cómo hacer buenas contrataciones: todo tipo de cosas diferentes»

Puestos de trabajo en la ciencia de los datos

En algunas áreas de la tecnología, ser un generalista puede ser tu mejor pie en la puerta, pero no es así con la ciencia de los datos. Los empleadores suelen buscar habilidades especializadas en su sector. Dado que la ciencia de los datos se presenta en tantos sabores diferentes, nuestra encuesta profundizó en el examen de cinco categorías laborales principales: Analista de datos, investigador, analista de negocios, gestor de datos y análisis, y científico de datos propiamente dicho.

En todos estos puestos de trabajo, la «manipulación y limpieza de datos» ocupa la mayor parte del tiempo, pero ¿con qué fin? La mayoría de las veces, el objetivo es optimizar una plataforma, producto o sistema existente (45%), o desarrollar otros nuevos (42%). Profundizando, descubrimos que la «optimización de las soluciones existentes» suele recaer en los Analistas de Negocio y los Analistas de Datos, mientras que el «desarrollo de nuevas soluciones» recae más a menudo en los Científicos de Datos y los Investigadores.

Las técnicas que utilizan los Científicos de Datos también varían según la especialización. La regresión lineal fue una herramienta común en todas las categorías, citada por el 54% de los encuestados, pero hubo algunas sorpresas cuando examinamos el software que utiliza la gente.

Excel -el caballo de batalla de la manipulación de conjuntos de datos- es prácticamente omnipresente, citado por el 81% de todos los encuestados, y la herramienta más popular en todas las categorías, excepto en la de los científicos de datos propiamente dichos (que recurren con mayor frecuencia a Python, y también citaron un conjunto de herramientas más amplio que otras categorías). ¿Qué hace que Excel sea tan ineludible, incluso hoy en día?

«Lo que me encanta de Excel es que te permite ver los datos y tener una sensación intuitiva de ellos», explicó Brownell. «También utilizamos mucho Python, y en ese caso, cuando haces análisis en un archivo de datos, está oculto; a menos que programes específicamente parte de tu código para hacer alguna visualización de los datos en bruto que estás analizando, no lo ves. Mientras que con Excel, está justo delante de ti. Eso tiene muchas ventajas. A veces puedes detectar problemas con el archivo de datos. No veo que Excel desaparezca nunca del análisis»

Dicho esto, sigue habiendo una larga lista de otros programas que se utilizan en este campo, lo que no sorprende dada su diversidad. SQL (43%) y Python (26%) lideran la popularidad, mientras que Tableau (23%), R (16%), Jupyter Notebooks (14%) y algunos otros alcanzan cifras significativas, por no mencionar el enorme 32% de los encuestados que citaron «otras» herramientas, incluso teniendo en cuenta esta larga lista.

¿Cuál es el futuro de la ciencia de datos?

Por último, preguntamos qué tendencias conformarán el panorama digital en los próximos cinco a diez años. El aprendizaje automático y la IA -ambos con aplicaciones dentro de la ciencia de los datos- fueron de forma abrumadora los desarrollos que los encuestados esperan que tengan el mayor impacto, con un 80% y un 79% respectivamente. Y ello a pesar de que menos de una cuarta parte (23%) trabaja actualmente con IA.

La inteligencia artificial puede transformar «absolutamente» la ciencia de los datos, confirma Brownell, cuya empresa desarrolla productos de IA. «Esa es realmente la gloria de los métodos de aprendizaje no supervisado. Sólo tenemos un tiempo determinado para mirar estos conjuntos de datos, y especialmente con los grandes, es muy difícil hacerlo todo. Las herramientas de IA pueden ayudar a revelar algo que tal vez no habrías pensado en buscar. Definitivamente, nos ha ocurrido eso»

Otras tendencias que los científicos de datos esperan que dominen en un futuro próximo: el Internet de las cosas (51 por ciento), el blockchain (50 por ciento) y el comercio electrónico (36 por ciento), la realidad aumentada y la realidad virtual (38 por ciento y 27 por ciento), e incluso las experiencias basadas en la voz (25 por ciento), todas ellas con resultados significativos, y todas las áreas en las que la ciencia de los datos puede tener un buen uso.