2022/07/26

S3 Histogramas

HISTOGRAMAS

Continuaremos con nuestro estudio de Visualización de Datos pero ahora va a conocer uno nuevo va a conocer el 'Histograma'.
va a abrirlo en una carpeta que la tengan y va a ver.
¿De qué trata, ok?
Un Histograma es una representación de la distribución de los datos a lo largo de un intervalo continuo de la variable que se esta analizando.
El histograma se compone por un conjunto de barras que representan cuantas veces apareció un dato dentro de diferentes sub intervalos de las variable.
Aquí tiene Un Ejemplo: Nuestro 1er Ejemplo habla del rango de alturas que tienen algún número de alumnos y cuántos alumnos tienen cada uno de esos rangos, Por Ejemplo nuestro 1er renglón de la tabla dice que en el rango de altura entre 1.45 m y 1.5 m hay 3 alumnos, entre 1.5 m y 1.55 m hay 33 alumnos y esto continúa.
Rápidamente se podra identificar de manera visual cuál es el rango donde existen mayores cantidades de alumnos que es entre 1.70 y 1.75 metros hay un número de 231 alumnos.
Esto lo se podra representar en nuestra gráfica, en nuestro histograma asignando barritas cada vez más grandes a medida que el número de aquí aumente, en este caso, tiene que nuestra gráfica más grande corresponde al intervalo que mencionamos y el más pequeño a este intervalo de 1.45 y 150
¿para que nos sirven los histogramas?
o
¿Por qué son importantes?
Bueno, en los histogramas se podra evidenciar que distribución tienen las estaturas.
En este ejemplo en particular nuestra distribución está muy cargada en medio y muy poquita en los laterales.
Esta distribución se parece mucho a una distribución que existe en los fenómenos naturales, en los fenómenos industriales, que se conoce como 'Distribución Normal' Para los que no saben, de Estadística la 'Distribución Normal' es una representación de los datos con una forma simétrica respecto a una medida central usualmente 'La Media' que se encuentra muy común en la naturaleza.
La 'Distribución Normal' se estudia por sus cualidades, en particular algo que se conoce como una regla empírica.
¿Qué es una regla empírica?

Algo que tiene sustentos basados en cuántas veces se ha repetido o basado en las observaciones.
Es muy común que esta regla se cumplan para cualquier fenómeno que tenga una 'Distribución Normal'.
El 68% de los datos se encuentran a menos de una Desviación Estándar de la Media, sí nosotros aquí encontramos nuestra Media.
Si yo aumento una media más la Desviación Estándar y una media menos la Desviación Estándar, es decir, esta sección de aquí en esta parte de aquí tengo el 68% de los datos a dos desviaciones estándar tengo el 95% de los datos entonces cualquier fenómeno que se encuentre representado por una Distribución Normal, la mayoría de sus datos va a estar cerca de la media y muy pocos datos en los extremos positivos y en los extremos negativos de esta curva pero, la Distribución Normal no es la única distribución que existe.
Hay diferentes distribuciones, hay una distribución cuando los valores se centran más hacia la derecha que se llama, 'Distribución Asimétrica Negativa'.
Hay una distribución cuando los valores se centran más hacia la izquierda la 'Distribución Asimétrica Positiva'.
Hay una Distribución que se llama Triangular que genera más o menos un triángulo de manera rápida.
Hay una 'Distribución Uniforme' donde casi todos los valores tienen la misma probabilidad de existir, cada conjunto de datos genera una Distribución Diferente y una de las principales Ventajas de analizarlos por medio de un histograma es que nos permite encontrar.
¿Qué Distribución tiene nuestro conjunto de datos?
Entonces en las prácticas que va a estar haciendo con esta libreta, va a Primero Importar un Data Frame, Después a Graficarlo en forma de histograma y Después Encontrar la Distribución que esos datos generan.

No hay comentarios:

Publicar un comentario

S4 Cierre

Cierre Semana 4 Muchos de los problemas actuales a los que se enfrenta un científico de datos involucran el manejo de grandes cantidades de ...