Pandas dataframe consulta

Pilar Melgar

El paquete Python lo convierte en un excelente idioma para realizar análisis de datos. Uno de los programas que permiten la adquisición y el análisis de datos considerablemente más simples es Pandas. Tenemos un marco de datos y filtramos los datos de acuerdo con nuestras necesidades de este marco de datos en pandas. El análisis de datos requiere numerosas técnicas de filtrado. Existen numerosas formas de filtrar los datos del marco de datos especificado utilizando los métodos PANDAS. Uno de ellos es el método "Query ()" que nos ayuda a filtrar algunos datos de DataFrame. Podemos consultar el DataFrame utilizando la función "Query ()" en Pandas. Se pasa una expresión de consulta a la función "Query ()" y devuelve el resultado por la declaración de consulta devuelta. Utilizaremos el método "Query ()" en esta guía y explicaremos cómo ayuda en los pandas a filtrar los datos deseados de DataFrame.

Sintaxis:

Marco de datos.consulta (expr, inplace = false, ** kwargs)

Aquí, ponemos la condición como el primer parámetro del método "Query ()". El inicio es opcional. Si no agregamos esto, su valor predeterminado es "falso" que se ajusta automáticamente. También podemos configurarlo en "verdadero" que actualiza el marco de datos.

Ahora, nos movemos para utilizar el método "Query ()" en Pandas en esta guía y lo explicaremos aquí.

Ejemplo 1:

Demonstarte el método "Query ()" en Pandas en esta guía. Usamos la aplicación "Spyder" para escribir el código Pandas. Somos conscientes de que debemos importar algunos métodos de pandas como "PD". Desarrollamos el "list_data" y colocamos el "p_name" y "p_age" en "list_data". El "P_name" contiene "Smith, Oscar, Mary, Theo, Teddy y John". El "p_age" contiene "50, 33, 56, 29, 45 y 30" en él. Cambiamos la lista anidada "list_data" en el marco de datos "my_df". Lo cambiamos en DataFrame porque tenemos que aplicar el método "Query ()" al marco de datos. Entonces, esta "my_df" se crea aquí que también se muestra desde que lo insertamos en la siguiente función "print ()".

Ahora, utilizamos el método "Query ()" para extraer algunos datos. Obtenemos los datos cuya edad es mayor de 30. Para esto, agregamos la condición en el método "Query ()" y usamos este método dentro de la impresión. El resultado también nos representa. Ahora, filtra esos datos cuya edad es mayor de 30 y los muestra en la salida.

Hay dos métodos para ejecutar el código deseado a medida que lo compilamos y ejecutarlo en "Spyder". Uno de ellos es presionar el "Shift+Enter". El otro método es usar el icono "Ejecutar" de la aplicación "Spyder" para llevar a cabo el código. Obtenemos la salida especificada en la ejecución. Primero, se representa el cuadro de datos completo. Luego, filtramos los datos de este marco de datos cuya edad es mayor que 30. Los datos filtrados también se muestran en lo siguiente. Filtramos estos datos simplemente utilizando el método "Query ()" en Pandas.

Ejemplo 2:

Creamos una lista anidada de "jugador_data" y agregamos una columna "jugador_name" donde tenemos "Emma, Samuel, Robert, Smith, Noah, Jessica y Harper". A continuación, agregamos la columna "Player_age" que tiene "22, 26, 21, 25, 29, 24 y 28" en ella. Luego, viene la columna "Score_1" que contiene "29, 28, 16, 17, 35, 20 y 15". La columna "Score_2" contiene "28, 45, 49, 62, 70, 55 y 40". El "Score_3" contiene "24, 13, 59, 62, 72, 64 y 66". Y lo último que tenemos es la columna "scATIG_4" que tiene "38, 44, 69, 72, 81, 71 y 79". Esta lista de "jugador_data" se transforma en el marco de datos utilizando el método pandas. Nombramos este marco de datos como "jugador_df".

A medida que agregamos la función "jugador_df" a la siguiente función "print ()" y la visualizan. Ahora, incluimos la condición en la función "Query ()" y utilizamos este método dentro del método print () para adquirir los datos cuyo "Score_1" es más de 20. Lo ponemos en "Imprimir" que también le convierte el resultado para nosotros. Los datos cuyos "score_1" son más de 20 ahora se filtran y se muestran en la consola.

Como puede ver, solo hay tres filas en las que el "Score_1" es mayor que 20. Entonces, este método "Query ()" representa estos datos en la pantalla después de mostrar el cuadro de datos completo.

Ejemplo 3:

Se crea el "fruit_data". Se agregan el "fruit_name" y la "fruit_quantity". Los "Apple, Orange, Mango, Apple, Banana, Apple, Lychee y Apple" se enumeran en "Fruits_Name". Sus cantidades que son "5 kg, 7 kg, 2 kg, 4 kg, 5 kg, 7 kg, 2 kg y 4 kg" se enumeran en "Fruits_Quantity". Transformamos la lista anidada "Fruits_data" en el DataFrame "Fruits_DF."Esta" fruits_df "se forma aquí y también se muestra desde que lo ingresamos en la siguiente función" print () ". Ahora, filtramos algunos datos utilizando la técnica "Query ()". Queremos filtrar el "Apple" de este marco de datos, por lo que colocamos la condición donde el "Fruits_Name" es igual a "Apple". También mostramos las "manzanas" en la terminal.

En este resultado, después de renderizar todo el marco de datos, las filas que contienen la "Apple" se filtran. Los datos filtrados también se muestran en la siguiente ilustración. Utilizamos el método Pandas Query () para filtrar estos datos.

Ejemplo 4:

Desarrollamos la lista anidada "result_9th" después de importar el método pandas. Agregamos una columna de "nombre" a nuestra lista anidada "result_9th" y la llenamos con "Samuel, George, James, Melissa, William, Farnham y Smith". La columna "SubJ1" contiene los valores "47, 30, 54, 71, 68, 16 y AB". El "SubJ2" se agrega con los siguientes valores: "81, 23, 48, 34, 21, 15 y AB". La columna "SubJ3" conatina los siguientes valores: "29, 14, 28, 55, 29, 27 y AB". La columna "Subj4" contiene los siguientes valores: "59, 27, 58, 75, 59, 17 y AB". El "SubJ5" contiene los siguientes valores: "90, 4, 82, 85, 95, 22 y AB". Luego, también agregamos la columna "pasar/fallar" que contiene el estado de "pasar" y "fallar" de los estudiantes.

Utilizamos la técnica PANDAS aquí para convertir esta lista "Result_9th" en un marco de datos que llamamos "result_9^th_df ". El "resultado_9^th_df "se representa como resultado de nuestra adición al siguiente método" print () ". Ahora, filtramos los datos del estudiante cuyo nombre es "James". Ponemos ese nombre como la condición del método "Query ()". Colocamos el nombre de la columna "Nombre" y lo igualamos a "James". Luego, almacenamos los datos del estudiante "James" en el "DF2". Luego, colocamos este "DF2" en la "impresión" para mostrar los datos de "James".

El primer DataFrame contiene el resultado de 7 estudiantes que agregamos a DataFrame. Extraemos los datos "James" de este marco de datos. De esta manera, podemos extraer o filtrar fácilmente los datos que queremos obtener de DataFrame en Pandas.

Conclusión

Esta guía está aquí para explorar el método "Query ()" en Pandas. Demostramos diferentes ejemplos en esta guía y explicamos cada uno de ellos en detalle para proporcionarle una comprensión adecuada del método "consulta ()". Discutimos la utilización del método "Query ()" para filtrar los datos específicos de DataFrame. Para su beneficio, cada ejemplo en esta guía y la sintaxis de este método "consulta ()" se presentan cuidadosamente aquí. Debería poder aprender este concepto "consulta ()" en pandas con la ayuda de esta guía.

Pitón

Python Chmod

El sistema operativo.La función chmod () del módulo OS se utiliza para cambiar la propiedad del arch...

Pilar Melgar

Pitón

Matplotlib 2d histograma

En Python, el PLT.Hist2d () La función del módulo Pyplot en la biblioteca matplotlib se usa para tra...

Beatriz Enríquez

Estibador

¿Cuál es la diferencia entre Docker y Podman??

Docker utiliza una arquitectura de cliente cliente, mientras que Podman es un motor de contenedores ...

Mariana Cotto