Cómo construir un portafolio de ciencia de datos

Saber suficiente estadística, aprendizaje automático, programación, etc. para poder conseguir un trabajo es difícil. Una cosa que se ve últimamente es que bastantes personas pueden tener las habilidades requeridas para conseguir un trabajo en ciencia de datos, pero no tienen un portafolio. Aunque el currículum es importante, tener un portafolio de pruebas públicas de tus habilidades en ciencia de datos puede hacer maravillas para tus perspectivas de trabajo.

¿Por qué es recomendable un portfolio para emplearse como data scientist?

Un portafolio online es clave para cualquiera que trabaje en el mundo de la ciencia de los datos, porque es la mejor manera de mostrar a los empleadores pruebas de tu conjunto de habilidades, ya sea tu destreza con Python o tu habilidad para el modelado de datos.

¿Cómo creo un portfolio?

Pero saber por dónde empezar puede ser complicado, y no querrás que tu portafolio de data science sea sólo… un vertedero de datos.
Los científicos de datos en ciernes deberían aspirar a lo contrario: Un escaparate curado y completo de tu mejor trabajo que sea capaz de captar la atención de un empleador.

Teniendo esto en cuenta, he aquí algunos consejos sobre cómo construir un portafolio de ciencia de datos.

No incluyas todo el trabajo en tu portafolio

Lo primero en tu agenda debe ser hacer un portafolio de todo el trabajo de ciencia de datos que has hecho hasta la fecha.

Y vale la pena pensar de forma diferente: considera todo, desde una llamativa visualización de datos producida para un cliente de renombre, hasta un proyecto de tesis en el que demostraste algunas potentes habilidades de codificación en Python.

A continuación, hay que averiguar qué proyectos son los adecuados para tu portafolio de data science. Quieres unas cuantas piezas que muestren mejor tu gama de habilidades y todo el proceso de la ciencia de los datos, desde empezar con un conjunto básico de datos, hasta definir un problema, hacer una limpieza, construir un modelo y, finalmente, encontrar una solución.

Demuestra tus habilidades de comunicación

Para los trabajos de ciencia de datos, los empleadores querrán ver tus habilidades de cálculo y codificación, pero eso no es lo único que buscan.

Una parte importante de la ciencia de los datos en el lugar de trabajo es la capacidad de comunicación.

En un portafolio de ciencia de datos, puedes mostrar tus habilidades de comunicación uniendo las muestras del portafolio con una narración adjunta, mostrando el trabajo que hiciste para encontrar una solución a cada problema. Podrías escribir una entrada de blog completa en torno a un trabajo que hayas realizado.

También vale la pena incluir un poco sobre ti mismo -como tus pasiones y tu experiencia laboral anterior- como parte de los elementos no relacionados con los datos de tu portafolio.

Considera GitHub en lugar de un sitio web

Por supuesto, puedes crear un portafolio básico en línea para mostrar tu trabajo en ciencia de datos. Pero, ¿por qué no utilizar una plataforma en la que ya se reúnen otros científicos de datos?

GitHub -una popular plataforma de desarrollo de software- es utilizada por millones de desarrolladores y científicos de datos de todo el mundo, lo que significa que tu trabajo estará alojado en un espacio frecuentado por posibles futuros compañeros de trabajo, mentores y directores de contratación.

Definitivamente, tener un portfolio de GitHub bien poblado llevará las cosas a otro nivel y ahí es donde muchos Científicos de Datos alojarán su portafolio… en lugar de LinkedIn o un sitio web personal.

Es un lugar en el que puedes publicar fácilmente no sólo la parte técnica de la ciencia de los datos, sino tener todos tus proyectos de ciencia de los datos construidos para mostrar tu código incrustado dentro de una pieza escrita más amplia que describa el problema y el proceso.

No te limites a mostrar el código de forma aislada

Los empleadores pueden ponerse un poco vidriosos al ver los portafolios de los solicitantes, y es importante destacar. Y, aunque parezca obvio, también es crucial demostrar que realmente sabes lo que estás haciendo, y no adoptar un enfoque de «fingir hasta conseguirlo» en la ciencia de los datos.

Por eso, publicar tu código de forma aislada no pone de manifiesto que sabes lo que haces.

Eso sólo pone de manifiesto que has escrito este código, que puede o no haber sido copiado y pegado de otro lugar.

Y no es exactamente la impresión que quieres dejar en la mente de un jefe de contratación. ¿Verdad?

Pero, por suerte, hay una solución: Incorporar la visualización de datos siempre que puedas, es una habilidad que buscan los empleadores. Es una de las mejores formas de comunicar los resultados de tus datos a un público no técnico.

También es útil mostrar una serie de técnicas diferentes, ya que la ciencia de los datos es un campo bastante amplio, lo que significa que hay muchas formas de abordar un problema y una variedad de enfoques que puedes poner sobre la mesa.

Si quieres construir un gran portafolio de ciencia de datos bien redondeado, encuentra algunos problemas bien redondeados que abordar y mostrar»