Ejercicios de pandas para aprender

Ejercicios de pandas para aprender
El módulo "pandas" es la herramienta más importante disponible para los analistas de datos de Python e investigadores hoy en día. La biblioteca de análisis de datos de Python Pandas se centra principalmente en datos tabulares. Es una biblioteca gratuita y de código abierto distribuida bajo la licencia BSD. Los pandas tienen tantas aplicaciones que puede ser más fácil enumerar lo que no pueden lograr de lo que pueden.

Principalmente tiene dos formularios: series y DataFrame. La "serie" contiene datos sobre una sola variable y puede verse como un vector con información indexada, mientras que "DataFrame" es una estructura de datos tabular.

En este tutorial, caminaremos brevemente a través de algunos de los ejercicios de pandas más utilizados para principiantes. Se le proporcionará una instantánea del script de Python con la salida correspondiente para cada ejercicio.

Biblioteca de importación

Para comenzar a trabajar en ejercicios de pandas, primero debemos cargar la biblioteca "pandas" en nuestro archivo de proyecto. La herramienta que estamos utilizando para la implementación de los ejercicios de Pandas es "Spyder". Hemos lanzado la herramienta y cargamos la biblioteca Pandas en el archivo de Python escribiendo el script "Importar pandas como PD". Tenemos pandas alias como "PD". Ahora, se puede usar "PD" en lugar de "Pandas" durante todo el programa.

Ejercicio # 1: convertir una lista en la serie

El primer ejercicio que hemos elegido enseñar es generar la serie Pandas a partir de una lista.

Hemos creado una variable "ficticia" y le han asignado una lista de valores como "1", "2", "3", "4", "5", "6" y "7". Hemos invocado el "PD.Función de serie () "y pasó la lista" Dummy "como un parámetro para ella. La serie resultante se almacenará en la variable "Convertir". Para exhibir el contenido en la pantalla, los pandas nos proporcionan un método de "print ()". Hemos mostrado la serie "Convertir" utilizando la función "print ()".

La instantánea de salida correspondiente muestra que una serie se ha generado con índices predeterminados.

Ejercicio # 2: convertir una lista en una serie utilizando índices especificados

El primer ejercicio demostró con precisión la conversión de una lista en una serie de pandas. Hemos visto en la imagen de salida que la lista se ha presentado con la lista predeterminada de índices. Si no desea que su serie se muestre con estos índices, puede cambiarla proporcionando índices especificados.

Hemos usado la lista de la instancia anterior. Para convertir la lista para series y definir los índices, hemos llamado el "PD.Función Series () ". Se han transmitido dos parámetros a esta función: list_name e índice. Se suministra el nombre de la lista "Dummy". El argumento del "índice" se utiliza para cambiar la lista de índice predeterminado con la que el usuario ha dado. Hemos personalizado la lista de índices con los valores "A", "B", "C", "D", "E", "F" y "G". La serie con una lista de índices actualizada se almacena en la variable "Convertir" y luego se exhibe a través de la función "print ()".

En la imagen resultante, los índices predeterminados han sido reemplazados por la lista de índices proporcionados por el usuario.

Ejercicio # 3: Convertir listas en un marcado de datos

En el primer ejercicio, aprendimos a convertir una lista en una serie de pandas. Ahora, veremos cómo convertir las listas en un Pandas DataFrame.

Se han generado tres listas en el script. Estas listas tienen valores "['Harry', 25, 'Ingeniero']", "['Roma', 32, 'Doctor']" y "['Elizia', 22, 'Artista']" respectivamente. Hemos almacenado estas listas en un objeto de lista 2D "L1". Ahora, para convertir "L1" en un marco de datos de Pandas, tenemos una función de pandas "PD.Marco de datos()". Esta función ha sido invocada y la lista 2D se proporciona como un parámetro junto con otro parámetro "columnas". DataFrame muestra datos en forma de tablas que tienen filas y columnas, por lo que el parámetro "columnas" colocará las etiquetas en las columnas del marco de datos. Cada lista tiene 3 valores, lo que significa que tendremos 3 columnas en DataFrame. Hemos especificado las etiquetas como "nombre", "edad" y "profesión". DataFrame se almacena en el objeto DataFrame "Demo".

La ejecución del programa nos da un marco de datos con 3 columnas con las etiquetas y valores especificados que se han generado a partir de la lista 2D proporcionada.

Ejercicio # 4: Convertir un diccionario a DataFrame

Un diccionario de pandas es una colección de listas. Para aprender la conversión de un dict a un marco de datos, primero necesitamos crear un diccionario. Se ha creado un diccionario "sample_dict" con 3 listas de valores. La primera lista "Col1" tiene valores "Harry", "Roma" y "Elizia". La lista "Col2" almacena datos "25", "32" y "22". La lista "Col3" tiene entradas "Ingeniero", "Doctor" y "Artista". Para construir un marco de datos a partir del dict "sample_dict", hemos invocado el "PD.Método DataFrame () "y pasó el diccionario como parámetro. Cuando el "PD.El método DataFrame () "se ejecuta, tomará el contenido del diccionario y lo modificará a DataFrame. El cuadro de datos convertido se almacena en el objeto DataFrame "Cambiar" y se muestra en la consola utilizando el método "print ()".

Este programa cuando se ejecuta, nos produce la salida que se muestra en la siguiente instantánea.

Ejercicio # 5: Especificar el índice en DataFrame

Cuando exhibimos el DataFrame o una serie en el terminal, está principalmente equipado con la lista de índices predeterminada que comienza desde "0" hasta la longitud del conjunto de datos. Hemos aprendido a cambiarlo en la serie y también puede modificarlo en el marco de datos.

Hemos utilizado el marco de datos generado en el ejercicio anterior. Puede ver que DataFrame tiene un índice de "0", "1" y "2". Cambiaremos este comportamiento predeterminado proporcionando nuestra lista de índices. Entre los aparatos ortopédicos del "PD.Método DataFrame () ", el nombre del diccionario" sample_dict "e" índice "se proporciona. Los índices se han especificado como "x", "y" y "z".

El marco de datos con la lista de índice actualizado se muestra en la pantalla.

Ejercicio # 6: Extracción de la columna especificada en un marco de datos

Para seleccionar una columna en particular en un DataFrame, utilizaremos el DataFrame anterior con los índices predeterminados. Después de imprimir el marco de datos inicial, utilizamos el "DF.Loc [índice, columna] "método. Como queremos seleccionar una columna, dejamos el lugar de "índice" suministrando ":" en ella y hemos proporcionado el nombre de la columna "Col2" entre sus paréntesis. La columna seleccionada se conserva en la variable "Seleccionar" y se presenta con la ayuda de la función "print ()".

Este es el resultado del script anterior:

Ejercicio # 7: Extraer filas particulares en un marco de datos

Ciertas filas también se pueden seleccionar en un marco de datos siguiendo la misma técnica que lo hicimos para la selección de columnas con solo una excepción. Para la selección de filas necesitamos proporcionar el índice en el "PD.Método Loc [] "y colocar colon": "en el lugar de la columna. Las filas que seleccionamos son "1" y "2".

Las dos filas seleccionadas han sido exhibidas.

Ejercicio # 8: Completar los valores faltantes en un marcado de datos

Hemos creado un marco de datos con algunos valores faltantes y lo imprimimos en la pantalla. Para llenar estos valores, hemos invocado el "DF.método fillna () ". El valor que queremos ser reemplazado con las entradas nulas es "0". Entonces, lo colocamos en el "DF.frenajes de la función fillna () ". La variable "relleno" está almacenando el resultado y el método "print ()" lo mostrará.

Aquí puede ver que los valores nulos ahora se reemplazan con 0.

Conclusión

Los pandas nos proporcionan una gran variedad de opciones para resolver problemas de análisis de datos de la vida real. Funciona principalmente con marcos de datos y series. Algunos ejercicios más comunes se han discutido en este artículo sobre las funciones de la serie de los pandas, así como las funciones de marco de datos de los pandas. Hemos elaborado en 8 técnicas básicas de aprendizaje de pandas. Los conceptos se comprenden a través de la demostración práctica del guión de Python en la herramienta Spyder. Todos estos ejercicios son la mejor guía para principiantes para comenzar con Python Pandas Dataframes y series.