Ir a la barra de herramientas

¿Solo conozco Excel, soy o no un Data Scientist?

Un interesante hilo (ingles) a raíz de un pregunta sobre si una persona solamente sabe utilizar a excel, si puede ser considerado un Data Scientist / Científico de datos?

 

¿Solo conozco Excel, soy o no un Data Scientist?

Basado en el diagrama de Venn para el Científico de Datos.

Un Científico de Datos debe saber matemáticas/estadísticas/álgebra, debe ser un experto en el dominio (o tener acceso a expertos en el campo) y debe conocer habilidades de hacking/codificación (para permitirle explorar más allá de las características estándar en cualquier solución utilizada). Esto ya lo cubrimos en un articulo en este blog

En el día a día, solemos decir que un científico de datos busca responder a las preguntas de negocios basado en los datos y herramientas disponibles para él.

Así que si tomamos en consideración exclusivamente la definición estándar, podríamos decir que alguien que sólo trabaja con Excel no sería un científico de datos.

Pero desde mi punto de vista que Excel tiene un lenguaje de programación, Excel básico, que permite ampliar las posibilidades de la herramienta, podría decir que hay mucha gente que realiza análisis de negocios con Excel (y algunas veces otras herramientas conectadas a Excel). Uno de los principales problemas de Excel es la limitación del tamaño de las hojas de trabajo, que no permite aportar demasiados datos, y el tiempo que tarda en hacerlo.

Entonces, ¿podría alguien ser considerado un científico de datos sin Python? Creo que depende del tamaño de la empresa y de las necesidades de datos. Lo importante para un Data Scientist es RESPONDER A LAS PREGUNTAS DE LA EMPRESA CON LOS DATOS, las habilidades de hacking son para poder utilizar una amplia gama de herramientas, pero los datos encajan en un excel y hace el trabajo permitiendo a la empresa tomar las decisiones correctas? Entonces es un científico de datos.

Si los datos disponibles el proceso necesario para obtener respuestas para las preguntas de negocios es demasiado alto para Excel y la persona no es capaz de moverse de Excel, entonces no es un Data Scientist.

Un Científico de datos debe ser capaz de adaptarse a las diversas necesidades de la empresa o del proyecto donde debe aplicar sus conocimientos. Si para poder responder a preguntas, los datos que son necesarios procesar en información, son demasiados para una herramienta, entonces no es excusa solamente una herramienta. El Data Scientist debe ser capaz de encontrar la herramienta o programar el mismo las herramientas o algoritmos que necesite para ello.

Podríamos entonces entrar en el debate  que, no es realmente necesario saber, si no saber encontrar quien te lo puede hacer, y conseguir crear un equipo alrededor del Data Scientist para que pueda realizar el análisis requerido. pero el problema con esto es que muchas veces no tienes la seguridad de que es el camino correcto, y hay muchos pruebas e errores que debe el proprio analista realizar. Si cada vez que vás a hacer pruebas, hay que contratar un equipo de 3 personas, entonces hay un problema grave de presupuestos que acabarán por generar tensión en la empresa.

Es un tema difuso porque puedes mirarlo desde diferentes puntos de vistas, según la óptica de cada uno, y de las experiencias de trabajo de estas características, dado que muy probablemente un Data Scientist que solamente se hay movido en grandes proyectos con grandes cantidades de datos e de herramientas lo verá de una forma, mientras que el el que ha trabajado en pequeñas empresas donde por la cantidad de datos, excel, ha sido más que suficiente para solucionar los problemas, podrá verlo de otra forma.

Si has llegado al final de este artículo, es porque te ha interesado el tema, y me gustaria saber yo también cuál es tu opinión, para que si necesario pueda verlo desde diferentes angulos. Así porque no pones en los comentarios tu propia opinión para generarnos un hilo interesante de discusión?

 

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *