Data scientist

Data scientist

Los científicos de datos son una nueva raza de expertos en datos analíticos que tienen las habilidades técnicas para resolver problemas complejos, y la curiosidad para explorar qué problemas hay que resolver.

Son en parte matemáticos, en parte informáticos y en parte buscadores de tendencias. Y, como están a caballo entre el mundo empresarial y el informático, están muy solicitados y bien pagados. ¿Quién no querría ser uno de ellos?

¿Qué es un científico de datos?

Los científicos de datos reúnen, organizan y analizan grandes conjuntos de datos -datos estructurados y no estructurados- para crear soluciones y planes de negocio basados en datos para empresas y otras organizaciones. Combinando el sentido de las matemáticas, la informática y los negocios, los científicos de datos deben poseer tanto las habilidades técnicas para procesar y analizar los grandes datos como la perspicacia empresarial para desenterrar las ideas ocultas en esos datos.

Ciencia de los datos frente a minería de datos

Hay algunas diferencias entre la data science y la data mining (minería de datos). Veámoslas más de cerca:

Data science

  • Es un campo amplio que suele incluir el aprendizaje automático, la inteligencia artificial, la analítica causal predictiva y la analítica prescriptiva
  • Trata con todo tipo de datos, tanto estructurados como no estructurados
  • Tiene como objetivo crear productos centrados en los datos y tomar decisiones basadas en ellos
  • Se centra en el estudio científico de los datos y los patrones
    Minería de datos:
  • Es un subconjunto de la Ciencia de Datos que incluye la limpieza de datos, el análisis estadístico y el reconocimiento de patrones, y a veces incluye la visualización de datos, el aprendizaje automático y la transformación de datos
  • Trata principalmente con datos estructurados, no con datos no estructurados
  • Tiene como objetivo tomar datos de varias fuentes y hacerlos utilizables
  • Se centra en las prácticas empresariales

Lee más sobre las diferencias entre la ciencia de los datos y la minería de datos

¿Qué hace un científico de datos?

Un científico de datos analiza grandes conjuntos de datos para desenterrar patrones y tendencias que conduzcan a ideas de negocio procesables y ayuden a las organizaciones a resolver problemas complicados o a identificar oportunidades de ingresos y crecimiento.
Un científico de datos puede trabajar en prácticamente todos los campos y debe ser experto en el manejo de conjuntos de datos estructurados y no estructurados. Es un trabajo multidisciplinar y para convertirse en un Científico de Datos, debe poseer conocimientos de matemáticas, informática, negocios y comunicación para realizar su trabajo con eficacia.

Aunque las tareas y responsabilidades específicas de un Científico de Datos varían mucho según el sector, el puesto y la organización, la mayoría de los puestos de Científico de Datos incluyen las siguientes áreas de responsabilidad:

Investigación

Un Científico de Datos necesita comprender las oportunidades y los puntos de dolor específicos tanto de un sector como de una empresa individual.

Preparar los datos

Antes de poder encontrar ideas valiosas, un Científico de Datos debe definir qué conjuntos de datos son útiles y relevantes antes de recopilar, extraer, limpiar y aplicar datos estructurados y no estructurados de diversas fuentes.

Crear modelos y algoritmos

Utilizando los principios del aprendizaje automático y la inteligencia artificial, un Científico de Datos debe ser capaz de crear y aplicar los algoritmos necesarios para implementar herramientas de automatización.

Análisis de datos

Es importante que un Científico de Datos sea capaz de analizar rápidamente sus datos para identificar patrones, tendencias y oportunidades.

Visualización y comunicación

Un Científico de Datos debe ser capaz de contar las historias descubiertas a través de los datos mediante la creación y organización de cuadros de mando y visualizaciones estéticamente atractivas, al tiempo que posee la capacidad de comunicación para persuadir a las partes interesadas y a otros miembros del equipo de que merece la pena actuar sobre los hallazgos de los datos.

Una reciente encuesta descubrió que los profesionales de los datos dedicaban la mayor parte de su tiempo a la «manipulación y limpieza de datos» Los encuestados también concluyeron que el objetivo de su trabajo suele ser la optimización de una plataforma, producto o sistema existente (45%), o el desarrollo de otros nuevos (42%).

Tipos de Ciencia de Datos

El campo más amplio de la Ciencia de los Datos incorpora muchas disciplinas diferentes, entre ellas:

Ingeniería de datos

Diseñar, construir, optimizar, mantener y gestionar la infraestructura que soporta los datos, así como el flujo de datos en toda la organización.

Preparación de datos

Limpieza y transformación de datos.

Minería de datos

Extraer (y a veces limpiar y transformar) datos utilizables de un conjunto de datos mayor.

Análisis predictivo

Utilización de datos, algoritmos y técnicas de aprendizaje automático para analizar la probabilidad de varios resultados futuros posibles basados en el análisis de datos.

Aprendizaje automático

Automatización de la construcción de modelos analíticos en el proceso de análisis de datos para aprender de los datos, descubrir patrones y capacitar a los sistemas para tomar decisiones sin mucha intervención humana.

Visualización de datos

Utilización de elementos visuales (incluyendo gráficos, mapas y tablas) para ilustrar las ideas encontradas en los datos de forma accesible, de modo que el público pueda entender las tendencias, los valores atípicos y los patrones encontrados en los datos.

Beneficios de la ciencia de los datos

Las empresas de todos los sectores y de todas las partes del mundo dedican cada vez más dinero, tiempo y atención a la ciencia de los datos y buscan incorporar a un científico de datos a su equipo. Las investigaciones demuestran que las empresas que realmente adoptan la toma de decisiones basada en datos son más productivas, rentables y eficientes que la competencia.

La ciencia de los datos es crucial para ayudar a las organizaciones a identificar los problemas y las oportunidades adecuadas, al tiempo que ayuda a formarse una imagen clara del comportamiento y las necesidades de los clientes y los consumidores, el rendimiento de los empleados y los productos, y los posibles problemas futuros.

La ciencia de los datos puede ayudar a las empresas:

  • Tomar mejores decisiones
  • Aprender más sobre los clientes y los consumidores
  • Aprovechar las tendencias
  • Anticipa el futuro

¿Cómo puede la ciencia de los datos mejorar el valor de una empresa?

La ciencia de los datos es una inversión cada vez más popular para las empresas, porque el potencial retorno de la inversión al desbloquear el valor de los grandes datos es enorme.
La ciencia de los datos es una inversión que merece la pena porque:

  • Elimina las conjeturas y proporciona información procesable. Las empresas toman mejores decisiones basadas en datos y pruebas cuantificables.
  • Las empresas comprenden mejor su lugar en el mercado. La ciencia de los datos ayudará a las empresas a analizar la competencia, explorar ejemplos históricos y hacer recomendaciones basadas en números.
  • Puede aprovecharse para identificar a los mejores talentos. En los grandes datos se esconden muchas ideas sobre la productividad, la eficiencia de los empleados y el rendimiento general. Los datos también pueden utilizarse para reclutar y formar a los talentos.
  • Podrás saber todo sobre tu público objetivo, cliente o consumidor. Ahora todo el mundo genera y recoge datos, y las empresas que no invierten adecuadamente en ciencia de datos simplemente recogen más datos de los que saben qué hacer. Los conocimientos sobre el comportamiento, las prioridades y las preferencias de los clientes pasados o potenciales tienen un valor incalculable, y simplemente están esperando a que un científico de datos cualificado los descubra.

Los salarios de los científicos de datos

Aunque los salarios de los científicos de datos varían mucho según la región y el sector, el salario medio de un científico de datos en EE.UU. oscila entre 96.000 y 113.000 dólares, según la fuente. Un científico de datos sénior puede ganar unos 130.000 dólares de media.

Demanda de científicos de datos

Los científicos de datos tienen una gran demanda y escasean en prácticamente todos los sectores. Un informe de Deloitte Access Economics descubrió que el 76% de las empresas tenía previsto aumentar el gasto en los próximos años en capacidades de análisis de datos, mientras que IBM predijo un aumento del 28% en la demanda de científicos de datos a principios de la década.

La Oficina de Estadísticas Laborales de EE.UU. ha previsto un crecimiento del 31% en la ciencia de los datos durante los próximos 10 años. Mientras tanto, un informe de Markets and Markets descubrió que se prevé que el mercado mundial de big data crezca hasta los 229.400 millones de dólares en 2025, y que la plataforma de ciencia de datos crezca un 30 por ciento en 2024.

Al parecer, en todo el mundo se espera que aumenten las inversiones en ciencia de datos y, con ello, la demanda de científicos de datos.

Los científicos de datos utilizan una variedad de herramientas y programas diferentes para actividades como el análisis de datos, la limpieza de datos y la creación de visualizaciones.

Python es el principal lenguaje de programación para los Científicos de Datos encuestados en el Estudio de Habilidades Digitales de BrainStation. Python, un lenguaje de programación de uso general, es útil para aplicaciones de Procesamiento del Lenguaje Nacional y análisis de datos. R también se utiliza a menudo para el análisis de datos y la minería de datos. Para el análisis numérico más pesado, son populares las herramientas basadas en Hadoop, como Hive.
Para el aprendizaje automático, los científicos de datos pueden elegir entre una amplia gama de herramientas, como h2o.ai, TensorFlow, Apache Mahout y Accord.Net.
Las herramientas de visualización son también una parte importante del arsenal de un científico de datos. Programas como Tableau, PowerBI, Bokeh, Plotly e Infogram ayudan a los científicos de datos a crear diagramas visualmente atractivos, mapas de calor, gráficos, diagramas de dispersión y mucho más.

Los científicos de datos también deben sentirse muy cómodos con el lenguaje SQL (utilizado en diversas plataformas, como MySQL, Microsoft SQL y Oracle) y los programas de hojas de cálculo (normalmente Excel).

¿Qué habilidades necesitan los científicos de datos?

Hay una serie de habilidades que todos los aspirantes a Científicos de Datos deben desarrollar, entre ellas

  • Excel. La herramienta más utilizada por el 66% de los profesionales de los datos encuestados en un estudio de habilidades digitales, Excel sigue siendo crucial para los Científicos de Datos.
  • SQL. Este lenguaje de consulta es indispensable en la gestión de bases de datos y lo utilizan aproximadamente la mitad de los encuestados.
  • Programación estadística. Los Científicos de Datos utilizan habitualmente Python y R para ejecutar pruebas, crear modelos y realizar análisis de grandes conjuntos de datos.
  • Visualización de datos. Herramientas como Tableau, Plotly, Bokeh, PowerBl y Matplotlib ayudan a los científicos de datos a crear representaciones visuales atractivas y accesibles de sus hallazgos.

Trayectorias profesionales de los científicos de datos

Al ser una profesión relativamente nueva, las trayectorias profesionales de los científicos de datos no están escritas en piedra, y muchas personas encuentran su camino hacia la ciencia de los datos a partir de sus experiencias en informática, TI, matemáticas y negocios. Pero los cuatro ejes principales de la trayectoria profesional de un científico de datos suelen ser los datos, la ingeniería, el negocio y el producto. Muchas funciones multidisciplinares en la ciencia de los datos requieren el dominio de varias o todas esas áreas.

Las personas que trabajan en la ciencia de los datos están a la vanguardia de los cambios tecnológicos que más afectarán al futuro. Dado que la ciencia de los datos puede contribuir a los avances en prácticamente todos los demás campos, los científicos de datos están en condiciones de impulsar la investigación en todos los ámbitos, desde las finanzas y el comercio hasta la estadística actuarial, la energía verde, la epidemiología, la medicina y los productos farmacéuticos, las telecomunicaciones… la lista es prácticamente interminable. Cada industria trafica con sus propios tipos de datos, aprovechándolos de diferentes maneras para alcanzar diferentes objetivos. Dondequiera que esto ocurra, los científicos de datos pueden guiar una mejor toma de decisiones, ya sea en el desarrollo de productos, en el análisis de mercado, en la gestión de las relaciones con los clientes, en los recursos humanos o en algo totalmente distinto.

Las aplicaciones de la ciencia de datos no sólo son amplias, ya que abarcan muchos sectores diferentes, sino que también hay distintos tipos de ciencia de datos. Lo que todas estas actividades tienen en común es que todas ellas tratan de convertir los datos en conocimiento. Más concretamente, los científicos de datos utilizan un enfoque metódico para organizar y analizar los datos en bruto con el fin de identificar patrones a partir de los cuales se pueda identificar o inferir información útil.

Dado el alcance de su impacto, no es de extrañar que los Científicos de Datos ocupen puestos muy influyentes, y muy demandados. Aunque el camino para convertirse en Científico de Datos puede ser exigente, ahora hay más recursos para los aspirantes a Científicos de Datos que nunca, y más oportunidades para que construyan el tipo de carrera que desean.

Pero a pesar de todas las formas en que los científicos de datos pueden contribuir a las diferentes industrias, y todas las diferentes trayectorias profesionales que puede seguir un científico de datos, los tipos de trabajo que realizan pueden dividirse en unas pocas categorías principales. No toda la ciencia de los datos encaja perfectamente en estos grupos, especialmente en la vanguardia de la informática, donde se abren continuamente nuevos caminos, pero te darán una idea de las formas en que los científicos de datos convierten los datos en conocimiento.

Estadística

En el corazón de la ciencia de los datos, la estadística es el campo de las matemáticas que describe las diferentes características de un conjunto de datos, ya sean números, palabras, imágenes o cualquier otro tipo de información medible. Gran parte de la estadística se concentra en la simple identificación y descripción de lo que hay: especialmente con conjuntos de datos muy grandes, el mero hecho de saber qué incluye la información y qué no es una tarea en sí misma. Dentro del campo de la ciencia de los datos, esto suele denominarse análisis descriptivo.
Pero la estadística puede ir más allá, probando si tus suposiciones sobre lo que hay en los datos son correctas o, si son correctas, si son significativas o útiles. Esto puede implicar no sólo examinar los datos, sino también manipularlos para extraer sus características más destacadas. Hay muchas formas diferentes de hacerlo -regresión lineal, regresión logística y análisis discriminante, diferentes métodos de muestreo, etc.- pero, en última instancia, cada una de estas técnicas trata de comprender las características de un conjunto de datos, y la precisión con que estas características reflejan alguna verdad significativa sobre el mundo al que corresponden.

Análisis de datos

Aunque se basa en los fundamentos de la estadística, el análisis de datos va un poco más allá, en cuanto a la comprensión de la causalidad, la visualización y la comunicación de los resultados a los demás. Si la estadística se propone definir el «qué» y el «cuándo» de un conjunto de datos, el análisis de datos trata de identificar el «por qué» y el «cómo» Los analistas de datos lo hacen limpiando los datos, resumiéndolos, transformándolos, modelándolos y probándolos. Como ya se ha dicho, este análisis no se limita a los números. Aunque gran parte del análisis de datos utiliza datos numéricos, también es posible llevar a cabo un análisis de otros tipos de datos: comentarios escritos de los clientes, por ejemplo, o publicaciones en las redes sociales, o incluso imágenes, audio y vídeo.

Uno de los principales objetivos de los Analistas de Datos es comprender la causalidad, que luego puede utilizarse para entender y predecir tendencias en una amplia gama de aplicaciones. En el análisis de diagnóstico, los Analistas de Datos buscan correlaciones que sugieran una causa y un efecto, cuya visión puede utilizarse a su vez para ayudar a modificar los resultados. El análisis predictivo busca igualmente patrones, pero los amplía, extrapolando sus trayectorias más allá de los datos conocidos para ayudar a predecir cómo podrían desarrollarse los acontecimientos no medidos o hipotéticos, incluidos los futuros. Las formas más avanzadas de análisis de datos se proponen orientar sobre decisiones concretas, modelando y prediciendo los resultados de diversas opciones para identificar el curso de acción más adecuado.

Inteligencia artificial y aprendizaje automático

Uno de los grandes avances que se están produciendo actualmente en la ciencia de los datos -y que está preparado para ejercer una enorme influencia en el futuro- es la inteligencia artificial y, más concretamente, el aprendizaje automático. En pocas palabras, el aprendizaje automático consiste en entrenar a un ordenador para que realice tareas que normalmente consideramos que requieren algún tipo de inteligencia o juicio, como ser capaz de identificar los objetos de una foto. Esto se consigue normalmente proporcionándole abundantes ejemplos del tipo de determinación para el que estás entrenando a la red. Como puedes imaginar, esto requiere tanto montones de datos (normalmente estructurados) como la capacidad de conseguir que un ordenador dé sentido a esos datos. Son imprescindibles sólidos conocimientos de estadística y de programación.

Los efectos beneficiosos del aprendizaje automático son prácticamente ilimitados, pero lo primero y más importante es la capacidad de realizar tareas intrincadas o prolongadas más rápidamente de lo que podría hacerlo cualquier humano, como identificar una huella dactilar específica dentro de un repositorio de millones de imágenes, o cruzar referencias de docenas de variables en miles de archivos médicos para identificar asociaciones que puedan ofrecer pistas sobre las causas de las enfermedades. Con suficientes datos, los expertos en aprendizaje automático pueden incluso entrenar redes neuronales para producir imágenes originales, extraer ideas significativas de cuerpos masivos de texto escrito, hacer predicciones sobre futuras tendencias de gasto u otros acontecimientos del mercado, y asignar recursos que dependen de una distribución muy compleja, como la energía, con la máxima eficiencia. La ventaja de utilizar el aprendizaje automático para realizar estas tareas, a diferencia de otras formas de automatización, es que un sistema de Inteligencia Artificial no supervisado puede aprender automáticamente y mejorar con el tiempo, incluso sin necesidad de nueva programación.

Inteligencia empresarial

Como habrás adivinado por la referencia anterior a los acontecimientos del mercado, el mundo de los negocios y las finanzas es uno de los lugares donde el aprendizaje automático ha tenido uno de sus primeros y más profundos impactos. Gracias a la enorme cantidad de datos numéricos disponibles -bases de datos de marketing, encuestas, información bancaria, cifras de ventas, etc., la mayoría de los cuales están muy organizados y es relativamente fácil trabajar con ellos-, los científicos de datos pueden utilizar la estadística, el análisis de datos y el aprendizaje automático para extraer información sobre innumerables aspectos del mundo empresarial, orientando la toma de decisiones y optimizando los resultados, hasta el punto de que la inteligencia empresarial se ha convertido en un campo de la ciencia de datos en sí mismo.

A menudo, los Desarrolladores de Inteligencia Empresarial no se limitan a mirar cualquier dato disponible para ver qué pueden descubrir; buscan proactivamente la recopilación de datos y desarrollan técnicas y productos para responder a preguntas específicas y alcanzar objetivos concretos. En este sentido, los Desarrolladores y Analistas de Inteligencia Empresarial son cruciales para el desarrollo estratégico en el mundo de los negocios y las finanzas, ya que ayudan a la dirección a tomar mejores decisiones y a hacerlo más rápidamente, a comprender el mercado para identificar las oportunidades y los retos de una empresa, y a mejorar la eficiencia general de los sistemas y el funcionamiento de una empresa, todo ello con el objetivo general de lograr una ventaja competitiva y aumentar los beneficios.

Ingeniería de datos

El último gran campo de estudio en el que suelen trabajar los científicos de datos comprende toda una serie de títulos de trabajo diferentes: ingeniero de datos, arquitecto de sistemas, arquitecto de aplicaciones, arquitecto de datos, arquitecto de empresas o arquitecto de infraestructuras, por nombrar sólo algunos. Cada una de estas funciones tiene su propio conjunto de responsabilidades: algunos desarrollan software, otros diseñan sistemas informáticos y otros alinean la estructura y los procesos internos de una empresa con la tecnología que utiliza para llevar a cabo sus estrategias empresariales. Lo que los une a todos es que los científicos de datos que trabajan en este campo aplican los datos y la tecnología de la información para crear o mejorar los sistemas con una función específica en mente.

Un Arquitecto de Aplicaciones, por ejemplo, observa cómo un negocio u otra empresa utiliza soluciones tecnológicas específicas, y luego diseña y desarrolla aplicaciones (incluido el software o la infraestructura informática) para mejorar su rendimiento. Un Arquitecto de Datos desarrolla igualmente aplicaciones, en este caso, soluciones para el almacenamiento, la administración y el análisis de datos. Un Arquitecto de Infraestructura podría desarrollar las soluciones generales que una empresa utiliza para llevar a cabo su actividad diaria, para garantizar que esas soluciones cumplen los requisitos del sistema de la empresa, ya sea fuera de línea o en la nube. Los Ingenieros de Datos, por su parte, se centran en el procesamiento de datos, concibiendo e implementando los conductos de datos que recogen, organizan, almacenan, recuperan y procesan los datos de una organización. En otras palabras, la característica que define a esta amplia categoría de la ciencia de los datos es que implica el diseño y la construcción de cosas: los sistemas, las estructuras y los procesos mediante los cuales se lleva a cabo la ciencia de los datos.

¿Cuáles son los trabajos de ciencia de datos más demandados?

La ciencia de los datos en general es una habilidad muy demandada, por lo que se pueden encontrar muchas oportunidades en todas las áreas y especialidades del campo. De hecho, LinkedIn incluyó al Científico de Datos como el trabajo más prometedor del año, y QuantHub predijo una gran escasez de Científicos de Datos cualificados en el año que viene.

La palabra clave aquí es «cualificado» A menudo, los requisitos técnicos que debe cumplir un Científico de Datos son tan específicos que pueden hacer falta unos cuantos años de experiencia trabajando en el sector para acumular la gama de competencias necesaria, empezando como generalista, y luego añadiendo poco a poco más aptitudes y habilidades a su conjunto de competencias.

Éstas son sólo algunas de las formas más comunes en que los Científicos de Datos pueden hacerlo: hay tantas trayectorias profesionales potenciales como Científicos de Datos, pero en todos los casos, el avance de la carrera depende de la adquisición de nuevas aptitudes y experiencia a lo largo del tiempo.

Analista de datos

Como su nombre indica, los analistas de datos analizan los datos, pero ese breve título sólo capta una pequeña parte de lo que los analistas de datos pueden conseguir en realidad. Por un lado, los datos rara vez empiezan en una forma fácil de usar, y normalmente son los Analistas de Datos los que se encargan de identificar el tipo de datos que se necesitan, recopilarlos y reunirlos, y luego limpiarlos y organizarlos, convirtiéndolos en una forma más utilizable, determinando lo que el conjunto de datos contiene realmente, eliminando los datos corruptos y evaluando su exactitud. Luego está el análisis propiamente dicho: utilizar diferentes técnicas para examinar y modelar los datos, buscar patrones, extraer el significado de esos patrones y extrapolarlos o modelarlos. Por último, los analistas de datos ponen sus conocimientos a disposición de los demás presentando los datos en un tablero o base de datos al que otras personas pueden acceder, y comunicando sus conclusiones a los demás mediante presentaciones, documentos escritos y cuadros, gráficos y otras visualizaciones.

Trayectoria profesional de analista de datos

El Analista de Datos es un excelente punto de entrada en el mundo de la Ciencia de los Datos; puede ser un puesto de entrada, dependiendo del nivel de experiencia requerido. Los nuevos analistas de datos suelen entrar en este campo nada más salir de la escuela -con una licenciatura en estadística, matemáticas, informática o algo similar- o hacen la transición al análisis de datos desde un campo relacionado, como los negocios, la economía o incluso las ciencias sociales, normalmente actualizando sus habilidades a mitad de carrera a través de un campamento de arranque de análisis de datos o un programa de certificación similar.

Pero tanto si son recién licenciados como si son profesionales experimentados que hacen un cambio a mitad de carrera, los nuevos científicos de datos suelen empezar realizando tareas rutinarias como la adquisición y manipulación de datos con un lenguaje como R o SQL, la creación de bases de datos, la realización de análisis básicos y la generación de visualizaciones con programas como Tableau. No todos los Analistas de Datos tendrán que saber hacer todas estas cosas -puede haber especialización, incluso en un puesto junior-, pero deberías ser capaz de realizar todas estas tareas si esperas progresar en tu carrera. La flexibilidad es una gran baza en esta fase inicial.

La forma de progresar como analista de datos depende en cierta medida del sector en el que trabajes: marketing, por ejemplo, o finanzas. Dependiendo del sector y del tipo de trabajo que realices, puedes optar por especializarte en la programación en Python o R, convertirte en un profesional de la limpieza de datos, o concentrarte únicamente en la construcción de modelos estadísticos complejos o en la generación de bellas imágenes; por otra parte, también puedes optar por aprender un poco de todo, preparándote para asumir una posición de liderazgo a medida que vayas adquiriendo el título de Analista de Datos Senior.

Con una experiencia lo suficientemente amplia y profunda, un Analista de Datos Senior está preparado para asumir un papel de liderazgo supervisando un equipo de otros Analistas de Datos, llegando a convertirse en gerente o director de departamento. Con una formación adicional, los Analistas de Datos también están en una posición fuerte para pasar al puesto más avanzado de Científico de Datos.

Científico de datos

Los Científicos de Datos propiamente dichos pueden hacer todo lo que pueden hacer los Analistas de Datos, además de algunas cosas más; de hecho, con la formación y la experiencia adecuadas, un Analista de Datos puede llegar a ocupar el puesto de Científico de Datos. Así que sí, los científicos de datos deben ser capaces de adquirir, limpiar, manipular, almacenar y analizar datos, pero también de comprender y trabajar con diferentes métodos de aprendizaje automático, y ser capaces de programar en Python, R o un lenguaje de programación estadística similar para construir y evaluar modelos más avanzados.

Trayectoria profesional de los científicos de datos

Muchas personas entran en este campo como analistas de datos antes de adquirir la experiencia y las habilidades adicionales necesarias para llamarse científicos de datos. Entonces, de Científico de Datos Junior, el siguiente paso suele ser el de Científico de Datos Senior, aunque ese simple cambio de título oculta el trabajo que se necesita para hacer esa transición.

Un Científico de Datos Senior tendrá un conocimiento superior de prácticamente todos los aspectos de la ciencia de los datos -la Inteligencia Artificial, el almacenamiento de datos, la minería de datos, la computación en la nube, etc.-, además de su familiaridad con un campo específico de la industria, como la estrategia empresarial o la analítica de la sanidad, o se especializará en una de estas áreas con una experiencia de nivel gurú.

Merece la pena mencionar que, aunque algunos científicos de datos comienzan su carrera en el campo de la analítica y llegan a ocupar puestos más altos en campos especializados como la psicología, el marketing, la economía, etc., otros comienzan como profesionales en uno de esos campos diferentes antes de pasar a desempeñar un papel en la ciencia de los datos.

Para muchos, el científico de datos sénior es el objetivo final de la carrera; ya es un papel tan avanzado que, al menos dentro del campo de la ciencia de los datos, suele ser el puesto más alto que se puede alcanzar: simplemente te conviertes en un científico de datos sénior mejor y más capaz con mayores áreas de especialización.

Sin embargo, para algunos, especialmente los que adoptan un enfoque más generalista, es posible avanzar más hacia un puesto directivo como el de Científico de Datos Principal, dirigiendo un equipo o departamento, o incluso el de Director de Datos, dirigiendo la estrategia de datos de una institución al más alto nivel y respondiendo sólo ante el director general.

Ingeniero de datos

Lo que distingue a los Ingenieros de Datos de otros profesionales que trabajan en el campo de los datos es el hecho de que diseñan y construyen sistemas completos, incluida la infraestructura y los procesos que la empresa utiliza para sacar el máximo partido a esos datos. Es decir, los Ingenieros de Datos son las personas que determinan las formas en que otros Científicos de Datos pueden hacer su trabajo. ¿Qué formas de datos puede acomodar el sistema de la empresa? ¿Qué métodos se utilizan para recoger los datos de ventas y marketing, o los resultados de una encuesta sanitaria, y ponerlos a disposición del análisis?

Para ello, los ingenieros de datos deben estar muy familiarizados con los tipos de trabajo que realizan otros profesionales de la ciencia de los datos -administradores de bases de datos, analistas de datos, arquitectos de datos, etc.-, hasta el punto de que los ingenieros de datos a menudo pueden desempeñar también cada una de estas funciones.

Pero como son constructores, los ingenieros de datos suelen pasar más tiempo trabajando en el desarrollo que otros profesionales de la ciencia de los datos, escribiendo programas de software, construyendo bases de datos relacionales o desarrollando herramientas que permiten a las empresas compartir datos entre departamentos.

Trayectoria profesional de los ingenieros de datos

Al igual que otros trabajos relacionados con los datos, el primer paso para convertirse en Ingeniero de Datos suele ser un título universitario (normalmente una licenciatura o un máster en ingeniería, informática o matemáticas), pero no siempre. Alguien con mucha experiencia trabajando en TI o en el desarrollo de software puede descubrir que ya tiene todas las habilidades necesarias para convertirse en un Ingeniero de Datos, excepto las propias habilidades de datos, en cuyo caso un reciclaje de habilidades, como un campamento de arranque de datos, puede ayudar a ponerlo al día.

Muchas de las habilidades que requiere un Ingeniero de Datos (como SQL, UNIX y Linux, el desarrollo de ETL o la configuración de sistemas informáticos) pueden desarrollarse trabajando en un campo adyacente; otras (como el aprendizaje automático o la construcción de conductos de datos) requerirán un aprendizaje más centrado.

Dicho esto, la mayoría de los ingenieros de datos comienzan su carrera trabajando en algún subcampo de la informática antes de adquirir todas las habilidades necesarias para convertirse en un ingeniero de datos junior; de hecho, la mayoría de las ofertas de empleo para ingenieros de datos junior requieren entre uno y cinco años de experiencia laboral. A partir de ahí, el siguiente paso lógico es el de Ingeniero de Datos Senior e Ingeniero de Datos Principal.

Pero, con su dominio de tantos aspectos de la informática, la ingeniería de software y la ciencia de los datos, hay muchos otros puestos abiertos a los ingenieros de datos, como el de arquitecto de datos, arquitecto de soluciones o arquitecto de aplicaciones. Para alguien que busque hacer menos trabajo práctico y más gestión de empleados, otras opciones incluyen el de Director de Desarrollo de Productos – o, eventualmente, dadas las habilidades de la gente adecuadas, incluso el de Director de Datos o Director de Información.

¿Pueden los científicos de datos trabajar desde casa?

Al igual que muchos trabajos en el campo de la tecnología, las funciones de los científicos de datos a menudo pueden realizarse a distancia, pero esto depende en última instancia de la empresa para la que trabajes y del tipo de trabajo que realices.

¿Cuándo pueden trabajar a distancia los científicos de datos?

Los puestos de científicos de datos que trabajan con datos e información muy sensibles o confidenciales (lo que incluye un gran número de ellos, incluso fuera de los campos con mucha privacidad como la banca y la sanidad, ya que los datos confidenciales pueden ser uno de los activos más valiosos de una gran empresa) se encontrarán con muchas más restricciones en lo que respecta al trabajo a distancia. En estos casos, es probable que se te exija trabajar en la oficina durante el horario laboral.

Otros factores a tener en cuenta:

  • El grado de tradición de tu empresa. Las empresas más grandes y antiguas no suelen ser tan amigables con el trabajo a distancia, aunque el COVID puede haber traído grandes cambios en este ámbito.
  • La facilidad con la que puedes trabajar con otros compañeros y departamentos a distancia. Si tu trabajo es altamente colaborativo, es más probable que se te pida que te presentes en persona.
  • Los científicos de datos que trabajan con contrato -o incluso en régimen de consultoría- también pueden tener más flexibilidad para elegir su propia ubicación.