2022/07/23

S1 Ciencia de Datos

CIENCIAS DE DATOS

La ciencia de datos o conocida comúnmente como Data Science es una ciencia multidisciplinaria que involucra conocimientos de matemáticas, estadística y ciencias de la computación.

La persona que aplica la Data Science es conocida como científico de datos.

El científico de datos utiliza diversas herramientas a su alcance, así como análisis estadísticos de datos, modelos predictivos y visualización de datos, para poder encaminar de manera efectiva la toma de decisiones.

Para encontrar una definición más extensa de lo que es un científico de datos y su rol en la Era Digital Haz clic aquí.

'Ciencia de Datos' o conocida comúnmente como 'Data Science' es una ciencia multidisciplinaria que involucra conocimientos de diversas áreas, como la matemática, la estadística y las ciencias de la computación.

'Data Science' tiene sus orígenes en 'Knowledge Discovery in Databases' que hace referencia al proceso de descubrir información valiosa previamente desconocida, en un conjunto grande de datos.

Data Science ha evolucionado a partir de este concepto, a través de incorporar diferentes técnicas de la ciencia de la computación a nuestro manejo actual de la información.

Data Science busca obtener el mayor beneficio posible al utilizar efectivamente la información que una compañía o empresa genera.

El valor de la información puede apreciarse de diversas formas, puede ser conocimiento de tu empresa o de un proceso, puede ser un producto basado en la información o sistemas de recomendaciones.

La persona que aplica 'Data Science' es conocida como: "Científico de Datos" el cual utiliza diversas herramientas a su alcance, como lo son 'Modelos Predictivos', 'Visualización de Datos' para poder encaminar efectiva la toma de decisiones.

Un Científico de Datos tiene la tarea de resolver problemas específicos con la ayuda de la información, trata de comprender el problema de negocios al cual se enfrenta y hace preguntas relevantes a las personas indicadas para resolver el problema de negocios, no basta con hacer las preguntas, un Analista de Datos recolecta los datos a través de diversas fuentes que pueden ser: 'Servidores Web', 'Registros de Sistemas', 'Bases de Datos', 'Repositorios', 'Cuestionarios', entre otros ...

El trabajo de un Científico de Datos va más allá de recolectar información pues puede que ésta, contenga errores, valores masivos o información repetida.

Por lo tanto, un científico de datos necesita realizar una limpieza de datos para transformar la información a una colección de datos útiles.

Además la información debe ser analizada para comprender la naturaleza de la información y descartar todo lo que sea innecesario.

Recordemos que se trabaja con millones de registros, por lo tanto es más que recomendable reducir la información solamente a datos y características relevantes.

Entre las actividades de un Científico de Datos se encuentra: 'La Creación de Modelos Predictivos', que pueden aprender a partir de un conjunto de datos preparados, este es un proceso, mediante el cual, el Científico de Datos puede predecir eventos o posibles resultados a partir de un modelo.

Este modelo puede ser una Ecuación Lineal o hasta algo complejo como una Red Neuronal.
Mas adelante durante veremos los detalles del proceso de modelación predictivo y haremos nuestros propios modelos predictivos utilizando 'Python'.

Otro aspecto importante en la vida de un científico de datos es compartir el conocimiento adquirido hacia los demás, para ello es necesario poder contar la Historia de los Datos y establecer claramente lo que queremos comunicar y poder plasmarlo en gráficas de fácil lectura.

Resumiendo, las actividades de un Científico de Datos son las siguientes: 'Entender el Problema de Negocios', 'Recolectar la Información', 'Preparar los Datos', 'Hacer un Análisis Exploratorio de los Datos', 'Crear Modelos Predictivos', 'Generar Visualizaciones' y 'Comunicar los Resultados' y por último, 'Lanzar estos Modelos' para que puedan ser -Puestos en Acción- 

Todas esas actividades son las realizadas por un Científico de Datos, aunque es bueno conocerlas y dominarlas todas, se entiende que dominarlas todas presenta dificultades, muchas veces la 'Especialización' es mejor que la 'Generalización'.

Así que, si encuentras dificultades con alguna actividad, tranquilízate.

Concéntrate en especializarte en alguna área, pues, recuerda que un Científico de Datos que domine todo es muy raro de encontrar.

No hay comentarios:

Publicar un comentario

S4 Cierre

Cierre Semana 4 Muchos de los problemas actuales a los que se enfrenta un científico de datos involucran el manejo de grandes cantidades de ...