Ingeniero de aprendizaje automático frente a científico de datos: ¿qué hay en un nombre?

ciencia de datos y aprendizaje automático estas son industrias estrechamente relacionadas, por lo que existe cierta confusión sobre cómo nombrar especialistas en ellas. Como buscador de empleo, ¿busca un trabajo como científico de datos o ingeniero de aprendizaje automático? ¿En qué se diferencia un analista de datos? ¿Qué pasa con un científico de aprendizaje automático? o hacer ingeniero de aprendizaje automático ¿Las vacantes se incluyen en la categoría más general de ingeniero de software?

La industria es tan confusa como usted, y hay poco consenso entre los empleadores sobre cómo llaman a estos roles. Pero hay algunas tendencias nuevas que podemos intentar romper.

Científico de datos frente a científico de aprendizaje automático

Comencemos definiendo lo que los empleadores entienden por «investigador de datos». Una búsqueda de vacantes actuales en Amazon y Microsoft muestra que están buscando a la misma persona.

Científico de datos frente a científico de aprendizaje automático

Los investigadores de datos deben saber cómo escribir scripts en R o Python, pero no es necesario que sean ingenieros de software. Por el contrario, el papel de un científico de aprendizaje automático requiere habilidades de ingeniería de software mucho más sólidas.

Por ejemplo, estos son los requisitos de vacante para un puesto típico de científico de datos de Amazon:

Ingeniero de aprendizaje automático versus investigador de datos

Comparemos esto con un científico de aprendizaje automático publicado en la misma empresa:

Ingeniero de aprendizaje automático versus investigador de datos

Los requisitos en estos anuncios de vacantes son similares, pero también difieren en algunos aspectos importantes. Ambas vacantes buscan educación a nivel de doctorado; si quiere llamarse a sí mismo «científico», a menudo se espera esto. Ambos gerentes de contratación aquí buscan personas con un investigador académico. El papel del científico de ML es incluso buscar específicamente su registro de publicación. Me sorprendió ver que Amazon estaba buscando científicos; antes de que los campos de la ciencia de datos y el aprendizaje automático comenzaran a evolucionar en 2013, preferían la experiencia profesional en lugar de los títulos exquisitos de sus candidatos (entonces yo era gerente sénior en Amazon). Esto parece estar cambiando, al menos en algunos departamentos.

Ambas posiciones implican eliminar el significado de los datos sin procesar, pero la diferencia está en su enfoque.

Los investigadores de datos analizan los datos utilizando herramientas, bases de datos y scripts existentes. Utilizan SQL, R, SAS, Matlab, sistemas distribuidos de código abierto y lenguajes de programación como Spark, Elasticsearch, Hadoop, Pig y Hive. Se dedican al análisis de datos a gran escala; el conocimiento del aprendizaje automático es solo una cualidad «agradable». Los investigadores de datos deben saber cómo escribir scripts en R o Python, pero no es necesario que sean ingenieros de software.

Por el contrario, el papel de un científico de aprendizaje automático requiere habilidades de ingeniería de software mucho más sólidas. Les gustaría tener «habilidades sólidas de desarrollo de software», y la capacidad de escribir código en Java o C ++ es una calificación básica. Están buscando personas que puedan desarrollar nuevas herramientas y sistemas (en este caso, relacionados con el procesamiento del lenguaje natural y el reconocimiento de voz). No solo buscan personas que puedan usar las herramientas existentes para analizar datos y extraer significado de ellos.

Más desarrollo profesional para científicos de datos4 tipos de proyectos que necesita en su cartera de Data Science

Científico de aprendizaje automático versus ingeniero de aprendizaje automático

Por lo general, describimos a un «ingeniero de aprendizaje automático» como un ingeniero de software que se especializa en aprendizaje automático o inteligencia artificial. Un ingeniero de ML es primero un desarrollador de software y luego un experto en aprendizaje automático. Para ilustrar esto, veamos los requisitos para un ingeniero de aprendizaje automático que envía un mensaje de Microsoft:

Ingeniero de aprendizaje automático versus investigador de datos

De hecho, ¡hay muy poco sobre el aprendizaje automático en esta lista! Esto ni siquiera se menciona en la sección «cualificación deseada».

Lo que tampoco ves es un enfoque claro en la academia o la investigación. Este trabajo está dirigido a personas que tienen experiencia en la creación de grandes sistemas, no a quienes se centran en la teoría. Esta es la principal diferencia entre un «ingeniero» de aprendizaje automático y un científico o científico de datos de «aprendizaje automático».

¿Qué hacen los ingenieros de aprendizaje automático?

Por lo general, describimos a un «ingeniero de aprendizaje automático» como un ingeniero de software que se especializa en aprendizaje automático o inteligencia artificial. Un ingeniero de ML es primero un desarrollador de software y luego un experto en aprendizaje automático.

Los empleadores de tecnología más grandes tienen una larga historia de enfocarse en ingenieros de software talentosos. Creen que un buen ingeniero de software es lo suficientemente inteligente como para dominar habilidades adicionales por su cuenta. Quieren empleados que sean intercambiables y que puedan crear todo lo que una empresa necesita a largo plazo, incluso si no implica el aprendizaje automático.

A veces, el título del trabajo elegido por el gerente de contratación es solo una elección estratégica de su parte. En este caso, parece que realmente están buscando un ingeniero de software más general, pero es posible que el gerente de contratación simplemente esté tratando de evitar la competencia con otros gerentes de contratación que están contratando puestos de «ingeniero de software». Al llamar a este rol «ingeniero de aprendizaje automático», pueden diferenciar sus publicaciones y atraer a personas interesadas en ML.

Lo mismo puede ocurrir con algunos roles de «científico de aprendizaje automático». El título de «científico» es atractivo para algunos solicitantes y puede obligar a algunos candidatos a postularse para el puesto de «científico» y no para el de «ingeniero», incluso si son similares. Incluso en una economía compleja, es difícil encontrar ingenieros de software talentosos, y los gerentes de contratación usarán cualquier truco para contratarlos.

Inscríbete en cursos. Desarrolla tus habilidades. Explora una carrera.Laboratorio de formación integrado

Científico de datos frente a analista de datos

Históricamente, los analistas de datos han sido personas que han trabajado principalmente con bases de datos relacionales y hojas de cálculo. Su trabajo consistía en recopilar datos, visualizarlos y presentarlos a las personas que los utilizan para tomar decisiones comerciales.

Recientemente, los analistas de datos están tratando de cambiarse a una posición más lucrativa como científicos de datos. La diferencia es tan pequeña que algunos empleadores más pequeños pueden contratar a un analista de datos como especialista en datos, por lo que a veces funciona.

Pienso en el analista de datos como un científico de datos que estudia. Para el análisis de datos, los analistas trabajan principalmente con bases de datos, almacenes de datos, hojas de cálculo y herramientas de alto nivel como Tableau. Los investigadores de datos tienen más experiencia estadística y pueden usar herramientas más avanzadas, como R o Matlab, para escribir su análisis. Para los analistas de datos, este es un desarrollo natural de las habilidades de aprendizaje de datos, pero ahora son profesiones diferentes.

Como ejemplo, veamos la descripción del trabajo de Amazon como analista de datos:

Ingeniero de aprendizaje automático versus investigador de datos

Vale la pena señalar que pude encontrar un puesto como analista de datos solo en India. En otros lugares, Amazon está buscando científicos de datos. La principal diferencia entre esta publicación y las que hemos considerado para científicos de datos y aprendizaje automático es el nivel de educación requerido. Una licenciatura es el único requisito para un analista, no un doctor en filosofía. El enfoque en las herramientas también es diferente: un analista de datos debe saber cómo usar Microsoft Office y SQL, pero no se requiere conocimiento de R, Python o Matlab.

Analista de datos vs. Científico de datos

Para el análisis de datos, los analistas trabajan principalmente con bases de datos, almacenes de datos, hojas de cálculo y herramientas de alto nivel como Tableau. Los investigadores de datos tienen más experiencia estadística y pueden usar herramientas más avanzadas, como R o Matlab, para escribir su análisis. Para los analistas de datos, este es un desarrollo natural de las habilidades de aprendizaje de datos, pero ahora son profesiones diferentes.

Sin embargo, están buscando personas que puedan convertirse en científicos de datos. Prefieren a las personas que usan R y Python, y un título en informática o ingeniería es tan valioso para este puesto como un título en matemáticas. La diferencia entre un analista de datos y un analista de datos es que un profesional de datos puede escribir código y está buscando personas con el potencial para dar ese salto.

Más de expertos incorporados10 vacantes en ciencia de datos: ¿cuál es la adecuada para usted?

¿Son diferentes los salarios?

Dada la inconsistencia en la forma en que las personas usan estos nombres, es difícil tener en cuenta los datos sobre salarios promedio. Pero Glassdoor ofrece algunos datos salariales informados para estos diversos puestos.

Ingeniero de aprendizaje automático versus investigador de datos

Una cosa está clara: un analista de datos es ampliamente considerado un puesto menor que un científico de datos, un ingeniero de aprendizaje automático o un científico de ML. Los ingenieros de aprendizaje automático y los científicos de aprendizaje automático informaron los mismos salarios, por lo que Glassdoor parece considerar estos nombres intercambiables. El uso de estos nombres depende de la empresa; Amazon no contrata «ingenieros de aprendizaje automático», pero sí contrata «científicos de aprendizaje automático» e «ingenieros de software». A veces se trata de caprichos sobre cómo las empresas individuales clasifican su trabajo internamente.

A los ingenieros de software se les pagaba menos que a las personas que se especializaban en ciencia de datos o aprendizaje automático ($ 92,000 versus $ 114,000 en promedio). Esto puede estar sesgado, ya que es probable que las personas que se hacen llamar «ingenieros de aprendizaje automático» tengan más experiencia que los ingenieros de software de nivel de entrada. De hecho, muchas vacantes etiquetadas como «ingenieros de software» pueden incluir mucha investigación y aprendizaje automático si trabajan para una gran empresa que participa regularmente en estos campos.

Pero ya sea que se llame a sí mismo científico de datos, ingeniero de aprendizaje automático o científico de aprendizaje automático, su salario será comparable.

Bueno, ¿a qué vacantes debo postularme?

Puede simplificar mucho el asunto con el siguiente diagrama de Venn:

Ingeniero de aprendizaje automático versus investigador de datos

Si entiendes de estadística, análisis y visualización de datos, lenguajes de scripting como Python o R, y puedes utilizar algunas herramientas avanzadas como Matlab, pero no te consideras ingeniero de software, estás buscando trabajo como científico de datos .

Suponga que es esencialmente un ingeniero de software con experiencia en la creación de grandes sistemas distribuidos y que domina el aprendizaje automático y la ciencia de datos. En este caso, está buscando trabajo como científico de aprendizaje automático o ingeniero de aprendizaje automático.

Este gráfico oscurece las diferencias entre la ciencia de datos y el aprendizaje automático, pero los científicos de datos tienden a saber sobre el aprendizaje automático hoy en día, y viceversa.

Para encontrar el mejor trabajo, no limite su búsqueda a estos términos. Muchos trabajos de ingeniería emocionantes relacionados con el aprendizaje automático aún se denominan «ingeniero de software». Si solo está buscando el título de «Ingeniero de aprendizaje automático», se perderá muchos puestos de ingenieros de software que realmente incluyen ingeniería de aprendizaje automático. Y encontrar ese nombre en particular casi lo bloquearía de Amazon, donde los llaman «científicos de aprendizaje automático». Amplíe su búsqueda a cualquier trabajo con «aprendizaje automático» en el título: puede encontrar excelentes vacantes que otros candidatos no han notado.

¿Listo para saltar? ¡Solicite las vacantes de Data Scientist y Machine Learning en Built In!

* * *

Este artículo se publicó originalmente en el blog de Udemy: Ingeniero de aprendizaje automático frente a científico de datos: ¿qué hay en un nombre?

Dejar un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *