2022/07/26

S3 Importancia de las Gráficas en la Ciencia de Datos

IMPORTANCIA DE LAS GRÁFICAS EN LA CIENCIA DE DATOS

El poder representar grandes cantidades de información se ha convertido en uno de los principales retos a los que se enfrentan los Científicos de Datos pero ¿Qué ventajas obtiene de visualizar correctamente los datos de mi proceso?

Mejorar el Proceso de Toma de Decisiones, Reducir el Tiempo y el Costo que se utiliza para Analizar la Información, Identificar el Comportamiento de los Datos y su Tendencia, Predecir el Comportamiento Futuro de los Procesos, Entre Otras.

Para Procesos Estructurados como Ventas, Encuestas con Respuestas Numéricas o Procesos que Manejan Variables Cuantitativas, los Gráficos Tradicionales como 'Las Gráficas de Barras', 'Las Gráficas de Pastel, 'Los Histogramas', suelen ser un medio eficaz.

Desafortunadamente el crear un gráfico simple, no siempre es suficiente para poder representar correctamente toda la información, debido a que la información puede tener un tamaño enorme o que es posible que existan múltiples relaciones entre las variables o que los datos con los que se trabajan no están estructurados en esas situaciones.

Es necesario utilizar otro tipo de gráficos como Mapas de Calor, Diagramas de Dispersión, Gráficas de Relación, entre otras cosas.

Los 5 Principios Fundamentales para la correcta presentación de los datos son:
  1. Simplificar los Datos y presentar solamente la información y variables adecuadas.
  2. Intentar Resumir toda la Información en pocas imágenes con la finalidad de poder comprender fácilmente los datos y evitar errores, 
  3. Elegir la mejor manera de ¿Cómo puede representar la información para captar mejor la atención de los interesados?
  4. Presentar los mismos datos utilizando diversas representaciones con el fin de ayudar a los investigadores a generar nuevas conclusiones.
  5. La representación de los datos seleccionados debe ser siempre simple y debe tener una fácil interpretación.
Los datos que se involucran en los problemas actuales no solamente han crecido en tamaño y en complejidad con respecto a los problemas que antes se buscaban solucionar, sino que con la introducción del Internet y los sistemas computacionales complejos; los procesos suelen adquirir su información de múltiples fuentes lo cual tiene nuevas dificultades a la hora de estar analizando.

En nuestros siguientes temas se estará hablando de diferentes tipos de gráficas y cómo se utilizan en Python.

No hay comentarios:

Publicar un comentario

S4 Cierre

Cierre Semana 4 Muchos de los problemas actuales a los que se enfrenta un científico de datos involucran el manejo de grandes cantidades de ...