PRÁCTICA: GRÁFICAS DE LÍNEA: PARTE 1
Para este ejemplo decidimos ocupar 2 Bases de Datos diferentes tomadas de los datos históricos de CEMEX y de BIMBO.
Aquí están las ligas para que uno los descargue.
Si yo me voy a la liga de CEMEX me abre mi página y aquí está donde dice Datos Históricos.
Aquí se ven los Datos de
¿Cómo abre la bolsa, las acciones en la bolsa?,
¿Cuál fue el valor máximo que alcanzaron, el valor mínimo?
Y,
¿Cómo cerró?
Seguramente nuestra Base de Datos tiene más información pero, ahorita nos va a concentrar en esas 4 columnas.
Para poderlas ocupar le damos en donde dice: "descargar" y se nos descarga.
En ese momento es muy importante que nosotros copiemos esos archivos en esa misma carpeta, donde estamos copiando nuestros cuadernos, va a generar una carpeta que se llame Data.
Y dentro de Data, en lo personal, creamos una carpeta que siga el lineal y aquí pusimos ambos archivos.
Ya me vieron descargar el de CEMEX de la misma forma descarguen el de BIMBO y copienlo aquí.
¿Por qué les hago énfasis en esto?
Bueno, si nos regresamos a la libreta, ustedes pueden ver que nuestra libreta dice Data/CEMEX Data/BIMBO si ustedes deciden descargarla y guardarla en otra carpeta no pasa nada simplemente es necesario que se regresen a estas instrucciones y modifiquen con los valores donde ustedes hayan grabado el archivo.
Yo sé que hay gente que no es tan intuitiva y por eso se los platico y ahí si no te considerás con las habilidades necesarias, simplemente copiar en la carpeta de Data, luego crea una carpeta de lineal y ahora si sube tus archivos aquí.
Pero, bueno va a continuar ahora sí con la libreta.
Como va a ocupar un Data Frame que represente estos datos, va a ocupar pandas como lo hemos visto en otros vídeos, así que nuestra primera instrucción le damos a ejecutar.
Ya tengo cargado pandas en mi cuaderno va a grabar la Base de Datos de CEMEX en la variable 'cemexpd.read csv' 'cemexpd.read csv'.
CSV corresponde a las siglas Comas Separated Values.
Valores Separados por Comas que son archivos en los que generalmente se suele grabar este tipo de información.
Aquí tiene también la variable bimbo y la va a leer con la misma instrucción pero se graba en una diferente variable.
Para garantizar que hicimos esto bien va a imprimir los 5 primeros elementos de la tabla de CEMEX, para eso ocupamos la instrucción 'cemex.g' Si le damos run, se ve, aquí está, esta información viene del archivo CEMEX pero ya está siendo leído a través de Python y nos muestran las columnas que teníamos similares a las que estaban en la página web que vimos hace rato.
Está open, está high, low, close y unas variables adicionales que pare este ejercicio no va a ocupar.
Continuamos con el cuaderno y encontramos esta información cemex.index = day time Este daytime, si le damos run graba el valor con el que inicia la tabla de CEMEX para tener el intervalo inicial, tanto de CEMEX como de BIMBO ahora, todo esto fue para leer y poder trabajar en pandas esta información pero, el objetivo es hacer una gráfica.
Bueno, ya que tiene una información que va a graficar, va a ocupar la librería matplotlib y que se importa de la siguiente forma: 'import matplotlib.pyplot as plt' 'plt' es una convención en la que muchas personas que trabajan en esta área han llegado a acuerdos y es una variable muy común y utilizada.
va a incluir esta 2da instrucción, %matplotlib inline hay algunas versiones de Python en las que no es necesario.
Hay algunas versiones de Python en las que si se necesita pero lo que va a hacer es que todas las gráficas que estemos trabajando en este momento se van a imprimir aquí mismo en nuestra libreta y esta instrucción lo garantiza.
Como recomendación yo les sugiero que lo pongan, entonces va a darle run y ahora sí le va a decir con matplotlib graficame el Data Frame CEMEX pero no me interesa graficarlo todo.
Sólo voy a graficar los valores de Cierre
¿Cómo sé este nombre?
Este nombre corresponde al nombre de cualquier columna.
Yo puedo graficar cualquier columna simplemente escribiendo su título.
En este caso en particular voy a graficar la salida y aquí tiene nuestra gráfica.
se podra ver cómo se va desarrollando el tiempo, se podra ver cómo se van desarrollando los valores a través del tiempo y aquí está nuestra primera Gráfica del Linea.
Ya lo hace automáticamente, yo no tuve que ir asignando o buscando valores donde se intersectaran sino que Python lo hizo por mí.
Ahora estas gráficas son editables, uno las puede personalizar.
A esta instrucción en particular le voy a dar run pero, la voy a estar repitiendo varias veces simplemente para que ustedes vean modificaciones.
Esta instrucción plot, además de ponerle
¿Qué voy a graficar?
Puedo ponerle 2 parámetros diferentes.
Mi primer parámetro que se llama Estilo de Línea, que está separado de una coma después de los datos que yo voy a representar, y mi segundo parámetro que se llama 'Marker' o 'Marcador'.
Entonces en ese en particular fíjense como mi gráfica es un conjunto de una línea
¿Qué pasa si yo cambié este menos ( - ) por el signo de más ( + ) ?
Si lo vuelvo a ejecutar ahora mi gráfica está compuesta por una gráfica de línea pero, en lugar de estar unidos por líneas está unido por el signo más ( + ).
Si yo uso el link, el asterisco ( * ) y le doy run pasa exactamente lo mismo.
Lo más usual en este tipo de gráficas es ocupar líneas, por eso su nombre, pero bueno, también puedo jugar con este parámetro 'linewidth' que es el ancho de la línea.
Ahí está con un ancho de línea 21 pero si le puedo poner uno de ,3 por ejemplo, tengo una línea muchísimo más gruesa o de 4.
Hay más parámetros que se pueden personalizar.
Cuando uno está utilizando este tipo de instrucciones y no conoce los parámetros lo más usual es que lo busquemos en línea, entonces si uno quiere buscar en línea yo les recomiendo simplemente que pongan 'matplotlib plot' y busquen los parámetros en cuestión.
Más adelante van a ir saliendo nuevos parámetros y conforme vayan saliendo se los voy a ir comentando.
Voy a continuar, sigo graficando la misma información entonces CEMEX close pero ahora le voy a dar el color Verde por eso la letra 'g' a diferencia del anterior que era Azul por eso la letra 'b' de 'Blue' y 'g' de 'Green' de Verde en inglés.
Y ahora les voy a presentar este nuevo parámetro 'Alfa', aquí tiene 3 opciones de alfa ahorita va a ver qué hace cada una de ellas.
Y este nuevo parámetro, etiqueta.
Bueno, primero que nada voy a reproducir esta celda para ver
¿Qué hace?
en esta celda me aparecieron 3 gráficas porque matplotlib, si tú le dices que grafique muchas cosas dentro de una sola celda todas las va a gráficar dentro de la misma gráfica.
Entonces en lugar de mostrar las 3 gráficas nos va a una gráfica donde hay 3 cosas.
Nuestra primera cosa es la tabla Close en Verde, con líneas, con el parámetro alfa de 1 y con la etiqueta de 1.
Es esta, la original, la original que teníamos antes está en Verde y está con el 100% del color.
Nuestro segundo elemento que estamos graficando es el doble del valor de clausura.
Todos los valores que teníamos original los va a multiplicar por 2.
La va a mostrar en verde con el símbolo de línea pero, con el 50% del color.
Por eso nuestra línea de aquí arriba se ve muchísimo más tenue que la línea de acá abajo, y a esa le asignamos una etiqueta de a '0.5'.
Nuestro tercer elemento es los valores de salida pero multiplicados por la mitad es decir, el 50% de lo que valían, por eso esa línea está muchísimo más chica.
Tiene un color verde, el símbolo de línea y tiene un alfa de 0.1 es decir, el 10 por ciento de la intensidad del color, tiene una etiqueta de 0.1
¿Para que nos sirven esas etiquetas?
Si se dan cuenta, no hay una forma de que una persona a simple vista pueda decir que es cada una de estas gráficas.
Yo se los tuve que explicar pero, supongamos que queremos hacer que cualquier persona lea fácilmente esta tabla, de esta gráfica.
Para eso va a ocupar esta instrucción que está aquí, esta instrucción que tiene un signo de gatito (#) se llama comentario.
Los comentarios no son instrucciones hasta que se quita el símbolo de gatito (#), si yo lo quito y le vuelvo a dar ejecutar, fíjense del cambio que tuvo.
Se creó este cuadro y en este cuadro, el que se conoce como leyenda, nos dice la línea verde oscura es igual a 1.0, la línea verde un poco más clara es a 0.5, en la línea muy clara es a 0.1
¿De donde salieron estos tres valores?
Son los tres de las etiquetas que yo le di.
No hay comentarios:
Publicar un comentario