Obtenga todas las filas en un marco de datos PANDAS que contiene subcadres dada

Obtenga todas las filas en un marco de datos PANDAS que contiene subcadres dada

Este artículo ilustrará cómo obtener todas las filas en un marco de datos Pandas que contenga una subcadena determinada.

Muestra de datos de datos

En este ejemplo, utilizaremos una muestra de datos de datos proporcionada en el enlace a continuación:

1
Conjunto de datos de películas.CSV

Una vez descargado, cargue el marco de datos como se muestra;

1
DF = PD.read_csv ('películas.CSV ')

Compruebe si la columna contiene

Identificar las filas que contienen una subcadena específica. Para esto, usaremos la función Contiene () en Pandas.

Por ejemplo, para verificar si algún título contiene la cadena 'Capitán' en el DataFrame proporcionado, podemos hacer lo siguiente:

1
Imprimir (DF ['Título'].stri.Contiene ('Capitán'))

El código anterior debe verificar si todas las filas contienen la subcadena especificada y devolver los valores booleanos correspondientes.

Para las filas coincidentes, la función debe devolver verdadero y falso si es lo contrario.

Obtener filas que coinciden.

Aunque el ejemplo anterior funciona, no devuelve la fila y sus valores. Podemos expandirlo utilizando sus valores como índices para DataFrame.

Un ejemplo es como se muestra:

1
Imprimir (DF [DF ['Título'].stri.Contiene ('Capitán')])

La función debe devolver las filas coincidentes y sus valores correspondientes en este caso.

Verifique múltiples condiciones.

Podemos filtrar más los resultados verificando si las filas contienen 'Capitán' y 'América.'

Tome el código de ejemplo que se muestra a continuación:

1
2
new_df = df [df ['title'].stri.Contiene ('Capitán') y DF ['Título'].stri.contiene ('América')]
new_df

Usamos el operador y para combinar dos condiciones booleanas en este ejemplo.

El marco de datos resultante es como se muestra:

También puede verificar si una fila contiene 'Capitán' o 'América'.

1
2
new_df = df [df ['title'].stri.Contiene ('Capitán') | DF ['Título'].stri.contiene ('América')]
new_df

Esto debería devolver un título que contenga la cadena 'Capitán' o 'América'. Los datos resultantes son como se muestra:

Conclusión

En este artículo, discutimos la verificación de si una fila contiene una subcadena dentro de un marco de datos de pandas. También cubrimos cómo obtener las filas que coinciden con una subcadena específica.