Pandas dataFrame seleccione filas por condición

Pandas dataFrame seleccione filas por condición
"En" Python ", tenemos una biblioteca Open_Source que es la biblioteca" Pandas ". En "Pandas", podemos hacer múltiples tareas de manera fácil y eficiente. Como sabemos, podemos crear marcos de datos en "pandas" utilizando los métodos "pandas". Entonces, después de crear los marcos de datos, podemos seleccionar filas aplicando condiciones. Podemos utilizar diferentes métodos que "pandas" proporcionan para seleccionar las filas del marco de datos dependiendo de la condición que hemos agregado en los métodos "pandas". Discutiremos todos los métodos que podemos usar para seleccionar las filas en el marco de datos en "Pandas", en esta guía."

Métodos para seleccionar filas de DataFrame por condición

El "pandas" proporciona cuatro métodos diferentes para seleccionar las filas del marco de datos por condición. Estos métodos están aquí:

  • Marco de datos.método de consulta ().
  • Marco de datos.Método loc ().
  • Marco de datos.método isin ().
  • Marco de datos.Método Filter ().
  • DataFarme.método ILOC ().
  • Marco de datos.Aplicar () método.

Todos estos métodos se utilizan en "Pandas" para seleccionar las filas del marco de datos "pandas". También colocamos la condición en estos métodos, y seleccionarán las filas dependiendo de esa condición. Utilizaremos estos métodos y seleccionaremos filas en esta guía y explicaremos cada código en detalle aquí.

Ejemplo # 01
La herramienta que utilizaremos en esta guía para desarrollar el código "Pandas" es la herramienta "Spyder". Generamos el código "pandas" importando los módulos de "pandas" y luego desarrollamos una lista llamada "matric_class" que tiene "nombre" que contiene nombres de estudiantes como "Peter, George, Bromley, Samuel, Leo, Leo , Farnham y Lily ".

Después de esto, estamos agregando algunas marcas de estos estudiantes en diferentes materias y estas materias son "inglés, computadora, física, química y biología". En "English", agregamos "46, 32, 54, 71, 68, 31 y 54", en "Computadora", agregamos "82, 23, 48, 34, 32, 15 y 33", luego Viene "Física", en la que hemos agregado "29, 31, 27, 55, 29, 20 y 32", luego "Química" está allí que contiene "59, 32, 57, 85, 59, 55 y 81 ", La" biología "es la siguiente en la que las marcas son" 90, 31, 84, 95, 98, 72 y 77 ". Esta es la lista anidada "matric_class".

Ahora, tenemos que convertir esta lista anidada en DataFrame, por lo que para este propósito, hemos utilizado el método "Pandas", que también se muestra a continuación "PD.Marco de datos". Este método cambia la lista "matric_class" en el marco de datos llamado "matric_class_df". Este "matric_class_df" se coloca en el método "print ()". Aquí, DataFrame se completa y también se representa.

Ahora necesitamos ejecutar este código. Entonces, mientras estamos trabajando en la herramienta "Spyder", es por eso que presionamos el icono "Ejecutar" de esta herramienta para su ejecución; Después de esto, se reproduce el siguiente resultado en el que se representa el marco de datos. Ahora, seleccionaremos algunas filas de este marco de datos utilizando el método "pandas" dependiendo de algunas condiciones, que agregaremos en el método "pandas".

Aquí, estamos filtrando algunas filas colocando el nombre del marco de datos, y la condición que hemos agregado en este método es que el "nombre" es igual a "Bromley", por lo que será la fila en la que el nombre del estudiante es "Bromley" y almacene la fila "Bromley" en "result_df". El resultado de "Bromley" ahora se presenta en la pantalla colocándolo en "print ()".

La fila completa se muestra aquí, que contiene los datos del "Bromley". Hemos filtrado esta fila desde el marco de datos colocando la condición en el método "pandas".

Ejemplo # 02
Estamos usando el "matric_class_df" nuevamente, y aquí estamos seleccionando filas que no sean "Bromley". Entonces, la condición que ponemos aquí es que el "nombre" del estudiante no es igual a "Bromley". Seleccionará o filtrará todas las filas en las que el nombre del estudiante no es "Bromley" y también hará todas las filas, excepto la fila que contiene el nombre "Bromley" en la columna "Nombre".

Aquí, selecciona todas las filas del marcador de datos original, excepto la fila de índice 2 porque, en esta fila, la columna "Nombre" contiene "Bromley". Entonces, ignora esa fila y selecciona todas las demás filas del marco de datos, y las hace aquí.

Ejemplo # 03
Ahora, estamos creando una nueva lista para el nuevo ejemplo aquí en el que la lista creada es el "ABC_LIST". En la columna "Nombre", agregamos "James, Milli, Farnham, Lily, Leo, Samuel y Fuller". A continuación, tenemos los "códigos", en los que insertamos "ABC19, ABC34, ABC39, ABC45, ABC59, ABC62 y ABC15". Luego viene el "mes", que contiene "julio, abril, julio, agosto, septiembre, julio y octubre". Las "unidades" tienen "19, 14, 9, 16, 15, 10 y 13". Esta lista se convierte en DataFrame, y luego se representa el marco de datos.

Después de esto, utilizamos el "marco de datos.Método Query () "para seleccionar algunas filas. Ponemos la condición que es "mes == julio", lo que significa que selecciona todas esas filas en las que el "mes" es "julio". Esas filas se guardan en "ABC_DF2", y luego mostramos esas filas que contienen el mes de "julio" usando "print ()"

El DataFrame original contiene 7 filas, y seleccionamos esas filas en las que el mes es "julio", por lo que solo tres filas están presentes en este cuadro de datos, que contiene "julio", y estas tres filas también se representan por separado después del marco de datos original.

Ejemplo # 04
DataFrame que se crea en este ejemplo se llama "paciente", que contiene "nombre, ciudad, sittings_no y tarifa/sentado" en él. Los nombres de los pacientes están en el "nombre", que son "James, Noah, Peter, Bromley y Samuel". Las ciudades de esos pacientes se insertan en "Ciudad", que son "Nueva York, Birmingham, Nueva York, Los Ángeles y Banglore". Luego ponemos el número de sesiones en "sittings_no", que son "2, 6, 4, 4 y 3". También insertamos la tarifa por sesión de esos pacientes, que son "6000, 6000, 6900, 7400 y 6300".

Después de esto, la lista de "paciente" también se cambia a la "paciente_df", que es el marco de datos aquí. Luego imprimimos "paciente_df", y después de la impresión, nos estamos moviendo para utilizar el método "loc" aquí, lo que nos ayuda a seleccionar las filas. La condición que hemos establecido aquí es que selecciona esas filas en las que el "stittings_no" del paciente es "4" y también muestra esas filas en el terminal.

Solo hay dos filas en el marco de datos en el que el "stittings_no" del paciente es "4", y también puede notar estas filas en la salida a continuación.

Ejemplo # 05
Ahora, proporcionamos otro ejemplo aquí, y creamos directamente el marco de datos "maestro_df" aquí en el que las columnas que hemos agregado son "Exam_code, Examiner_Name, Examiner_duty_num, Exam_room_No y Exam_Block". También insertamos datos en todas las columnas de la misma manera que hemos explicado en nuestros códigos anteriores. Luego también representamos "maestro_df", aquí estamos filtrando filas usando el método "isin ()". Inicializamos una variable de "datos" con "A y C" y luego colocamos los "datos" en el método "isin ()" y también colocamos el nombre de la columna en el que verifica estos valores de datos. El nombre de la columna es "Exam_block" aquí, por lo que verificará la columna "Exam_block" y selecciona esas filas en las que el "Exam_block" es "A" o "C" y luego imprimirá esas filas donde esta condición está satisfecha.

Este método "isin ()" selecciona todas las columnas donde el "examen_block" es "A" o "C". En este marco de datos, solo aparecen cinco filas que satisfacen esta condición, y estas también se muestran aquí.

Conclusión

Esta guía presenta el concepto de "seleccionar las filas de marco de datos por la condición en pandas". Hemos discutido diferentes métodos que se utilizan para seleccionar las filas en pandas dependiendo de algunas condiciones. Hemos utilizado cuatro métodos en nuestros códigos aquí y también explicamos cada uno de ellos en detalle. Hemos mostrado cómo colocamos la condición en esos métodos y cómo estos métodos devuelven o seleccionan las filas del marco de datos. Hemos discutido que cuando colocamos la condición en cualquier método que hemos explicado aquí para seleccionar las filas, luego verifica esa condición y selecciona esas filas de DataFrame, que satisface la condición dada. Hemos mostrado la salida junto con el script de código en esta guía.