Pandas select fila por valor

Pandas select fila por valor
Se pueden seleccionar filas de un marcador de datos de pandas en función de varios criterios o valores de columna. Este artículo proporciona explicaciones y ejemplos para los numerosos enfoques para lograr esto
Consulte los métodos adjuntos para este propósito:
  • Indexación booleana
  • Loc [] Propiedad
  • método de consulta ()
  • método isin ()

Explore la implementación práctica de estas técnicas.

Creación de un marco de datos

Para la implementación de los ejemplos, estamos utilizando la herramienta Spyder. Después de lanzar la herramienta, importamos la biblioteca requerida, que es "pandas" y la alias la "PD". Ahora, utilizando la función pandas, primero crearemos un ejemplo de datos de ejemplo que se utilizará en todas las ilustraciones de esta guía.

Hemos invocado el método Pandas "PD.DataFrame () "que inicia el proceso de creación de DataFrame. Lo hemos inicializado con 4 columnas "Marcas", "ST_NAME", "ST_ID" y "Puntos". Cada columna está almacenando una lista de valores definidos. La columna "Marcas" tiene los valores "100", "92", "79", "92", "73", "82" y "90". Para la columna "St_name", tenemos valores de cadena "Adam", "Albert", "Elsa", "Ronald", "Maya", "George" y "Jessica". La columna "ST_ID" está conteniendo valores que hemos definido como "10", "11", "12", "13", "14", "15" y "16". Los valores "14", "13", "14", "12", "11", "10" y "9" se han almacenado en la columna "Puntos".

La longitud de los valores para las columnas es 7 en este caso. El "PD.El método DataFrame () "generará un marco de datos con estas columnas y valores especificados. Ahora, para almacenar este marco de datos, hemos creado un objeto DataFrame "prueba" y lo asignamos el resultado producido al invocar el método del constructor Pandas DataFrame. De ahora en adelante, podemos acceder a este marco de datos utilizando el objeto "Prueba" como un nombre de marco de datos para todas las ilustraciones. Al final, el marco de datos se muestra en la pantalla utilizando el método de Python "print ()".

El comando "Ejecutar archivo" nos hará el resultado de datos resultante presentado en la consola Python.

Ejemplo 1: Seleccionar filas en un marcado de datos basado en los valores de la columna

El primer método, para seleccionar filas en un marco de datos, es la técnica de indexación booleana. En este método, verificamos cada fila como "verdadero o falso" en el marco de datos para una condición de columna definida en particular. Cualquier fila (s) coincide con la condición que produce "verdadero" y se seleccionará como salida.

La sintaxis para este método para ejecutar el programa es:

Para aprender su demostración práctica, veamos estos sencillos pasos. Tenemos que escribirlo como el nombre de DataFrame; operador de subíndice; y dentro de los soportes cuadrados, escriba el nombre y la condición de la columna. Nuestro marcado de datos, como mencionamos anteriormente, es "prueba" y la columna en la que hemos elegido aplicar la condición es "marcas". Hemos aplicado una condición para seleccionar filas donde el nombre de la columna es "marcas" y su valor es igual a "92". Por lo tanto, simplemente tenemos que extraer filas basadas en el valor de la columna "Marcas" "92". Para guardar el resultado, se ha generado una variable y se llama "Dummy". Pasaremos esta variable "Dummy" al método "print ()" para mostrar su contenido en el terminal cuando se invoca.

La salida nos muestra 2 filas que han sido seleccionadas del marco de datos después de verificar la condición. Puede ver que la condición que especificamos eran filas selectas donde las marcas son "92". Aquí, tenemos 2 registros con todos los datos que se muestran cuyas marcas son "92". El primero es "Albert" y el segundo es "Ronald".

Ejemplo 2: Seleccionar filas en un marcado de datos basado en los valores de la columna utilizando la propiedad LOC []

El segundo método que estamos utilizando para recuperar las filas utilizando los valores de la columna es el "DF.loc [] "con el" DF.Valores "Propiedad.

Hemos utilizado el "DF.Propiedad de valores "para verificar una condición. La columna que hemos seleccionado para verificar los valores es "ST_NAME" del marco de datos "Prueba". La condición que hemos establecido aquí es seleccionar la fila donde el valor de la columna "st_name" es igual al "ronald". Para almacenar el resultado, hemos creado una variable "copia". Por lo tanto, esta propiedad verificará la condición y detectará las filas que mantienen los datos requeridos.

Luego, empleamos la propiedad "Loc []" de DataFrame. Se suministra el nombre de DataFrame como "prueba" con la propiedad "loc []". Entre los soportes cuadrados de este atributo, hemos pasado la variable "copia" que tiene las filas que coinciden con la condición especificada. El "DF.Loc [] "La propiedad simplemente recuperará las filas que la variable de" copia "está manteniendo. Para preservar el resultado, tenemos una variable "datos". Para ver la salida final, el "imprimir()" El método se invoca con la variable "datos" como un parámetro para mostrar su contenido.

Obtenemos una fila como la salida que cumple con la condición definida. Como solo hay una entrada con el valor "Ronald" en la columna "ST_NAME" en el marco de datos.

Ejemplo 3: Seleccionar filas en un marcado de datos utilizando los valores de la columna utilizando el DF.función de consulta ()

Otra técnica para filtrar filas en un marcado de datos basado en valores de columna es mediante el uso de "consulta()" método. Este método toma la expresión que devolverá un valor booleano, verifica la condición en todas las filas en un marco de datos y devuelve un marco de datos con solo aquellas filas que cumplen con la condición.

Hemos invocado el "DF.función de consulta () ". Aquí "DF" está el DataFrame que se llama "Prueba". Entre los paréntesis del método, hemos especificado la condición. La expresión que hemos definido es de "ST_ID", donde ID es igual a "10". La función "Query ()" extraerá todas las filas en el marco de datos "Prueba" que coincida con esta condición. El resultado se guardará en la variable "Extracto". Finalmente, los datos almacenados en la variable "Extracto" se muestran llamando al método "print ()".

La pantalla de salida exhibe una sola fila porque solo hay un registro asociado con el "ST_ID" como "10". Puede ver que el registro se encuentra en el índice "0", que es la primera fila en DataFrame.

Ejemplo 4: Seleccionar filas en un marcado de datos utilizando los valores de columna utilizando el método ISIN ()

La última estrategia que estamos discutiendo aquí para seleccionar filas es el método "isin ()". Toma una serie o lista de valores y extrae filas en función de los valores de la lista.

Hemos definido una lista de valores como "iteración" que está teniendo estos valores: "Adán", "Elsa" y "George". El "DF.la función isin () "se invoca. El nombre de DataFrame y el nombre de la columna se suministran con el método "isin ()". Entre los aparatos ortopédicos, se proporciona la lista de "iteración". Por lo tanto, verificará la columna de Dataframe de "Test" "ST_NAME" para los valores almacenados en la lista. Si encuentra los valores, simplemente devolverá la fila seleccionada. Preservamos el resultado en la variable "almacenar" y la mostramos usando el método "print ()".

Esto nos produce tres filas que coinciden con los valores en la lista.

Conclusión

Seleccionar filas específicas por valores en un marco de datos es una técnica útil. Hemos demostrado una variedad de métodos para recuperar las filas en función de los valores de la columna. Primero le hicimos aprender la construcción de un marco de datos, luego elaboramos 4 ejemplos utilizando diferentes estrategias para extraer filas. Todas las ilustraciones han sido compiladas y ejecutadas en el Spyder.