MINI CHECKPOINT
Uno de los principales retos a los que se enfrenta un científico de datos es el de manipular bases de datos con un tremendo volumen de información.
Debido a que muchas veces el exceso en la información puede deberse a que existen datos repetidos, datos incorrectos o datos anómalos, es necesario que el científico aprenda a identificar correctamente los datos verdaderamente importantes pues facilita el entrenamiento de modelos predictivos y la generación de conclusiones.
En esta subsección se ha aprendido a analizar los datos utilizando Python para facilitar el proceso de limpieza de datos.
No hay comentarios:
Publicar un comentario