Columna de selección de pandas por nombre

Columna de selección de pandas por nombre
Una de las operaciones más comunes al procesar los datos es extraer una columna o columnas de un marco de datos PANDAS. Para recuperar las columnas y las filas, DataFrame le da al identificador de indexación "loc []". Este método solo selecciona columnas o filas por etiquetas/nombres.

La sintaxis para este método es la siguiente:

En este artículo, verá su implementación práctica a través de las diferentes técnicas para seleccionar las columnas por nombre.

Ejemplo 1: Utilización de la propiedad Pandas loc [] para seleccionar una sola columna por nombre

Para extraer la columna única de DataFrame, utilizamos la propiedad de pandas "loc []" en esta ilustración. Obtengamos una guía paso a paso para hacer esto.

De una amplia gama de herramientas alternativas, optamos por la herramienta "Spyder" para ejecutar nuestros códigos Python. Después de lanzar la herramienta, comenzamos a trabajar con el script. Al llegar al programa Python, primero registramos los requisitos previos para la ejecución indisrupción del script. Aquí, como declara el título, "Pandas" es la biblioteca necesaria para trabajar con sus funciones. Cargamos el kit de herramientas de pandas en nuestro entorno de Python secuestrando los "Pandas de importación como PD". El "PD" se hace de un alias para que los pandas se usen a lo largo de este programa en particular en lugar de "pandas".

Para trabajar en columnas, necesitamos un marco de datos que contenga las columnas. Pandas nos permite construir un marco de datos empleando su método muy fácil que es "PD.Marco de datos()". Este método tiene dos secciones: "PD" y "DataFrame". El "PD", como se describió anteriormente, es el alias de "Pandas", lo que significa que llamamos algo del módulo Pandas. La segunda porción "DataFrame" es la palabra clave que se utiliza para crear DataFrame. Invocamos el "PD.Función DataFrame () "para generar un DataFrame. Los nombres de la columna y sus valores se pueden definir entre los paréntesis de esta función.

Inicializamos nuestro marco de datos con 6 columnas con los nombres "Mercurio", "Venus", "Tierra", "Marte", "Júpiter" y "Saturno". A cada columna se asigna un conjunto particular de valores. Para "Mercurio", tenemos valores "13", "2", "24", "19", "9", "52" y "65". La columna "Venus" almacena los valores "32", "15", "3", "18", "39", "31" y "7". En la tercera columna, tenemos valores de "Tierra" "5", "7", "21", "15", "1", "3" y "13". Los valores para el "Marte" son "8", "21", "22", "34", "14", "21" y "2". El "Júpiter" contiene los valores que son "11", "1", "35", "62", "5", "15" y "12". La última columna en el marco de datos "Saturno" tiene los valores "21", "23", "45", "2", "11", "12" y "9". Cada columna en DataFrame conserva una longitud igual de valores. Ahora, hemos terminado con la definición de nuestra columna DataFrame y sus valores correspondientes.

Los pandas "PD.La función DataFrame () ”crea un marco de datos con los datos proporcionados. Pero no tiene espacio para preservarlo. Para guardar este marco de datos en algún lugar, para que podamos utilizarlo más tarde, creamos un objeto DataFrame. Este objeto DataFrame está etiquetado como "planetas". El "PD.El método DataFrame () ”, cuando se llama, crea un DataFrame y lo almacena en este objeto DataFrame. Para visualizar el marco de datos en la pantalla, tenemos la función de Python "print ()". Este método muestra el contenido de "planetas" en la consola de Python cuando se invoca.

Podemos ver el marco de datos de salida después de presionar la opción "Ejecutar archivo" en la herramienta "Spyder". Nuestro marcado de datos con 6 columnas y 7 filas se exhibe en la consola que se puede ver en la imagen de salida proporcionada a continuación:

Nuestra muestra de datos de datos para esta demostración está listo para trabajar y realizar cambios aplicando funciones. Se supone que debemos extraer una columna usando el nombre de la columna. Le instruiremos sobre el enfoque para realizar esto.

Para seleccionar una sola columna por nombre, el Pandas DataFrame nos proporciona el atributo "Loc []". Nos permite elegir las columnas o filas mencionando sus nombres. Utilizamos el "DF. Atributo Loc [] ". El nombre de DataFrame se suministra como "planetas". Entre los soportes cuadrados, presionamos en el nombre de la columna "Tierra" después de salir del lugar de la fila con ":" Colon. Esto significa que la selección se realiza en cuanto a columna. Para almacenar el resultado, inicializamos una variable "single" que almacena el contenido de la columna única mencionada en la propiedad "loc []". Exhibir la salida en la pantalla requiere llamar a la función "print ()". Pasamos la variable "única" a la función "print ()" para mostrar el resultado.

Aquí está nuestro marco de datos resultante con solo una columna seleccionada. La columna "Tierra" se presenta en la pantalla con su contenido. El nombre de la columna, así como el tipo de datos del valor, se menciona a continuación la columna extraída.

Ejemplo 2: Utilización del método Pandas loc [] para seleccionar las columnas múltiples por nombre

Se aprende la selección de una sola columna en un marco de datos PANDAS en la instancia anterior. Además, también podemos extraer más de una columna que utilice la propiedad de DataFrame "Loc []". Ponemos este concepto en práctica a través de esta ilustración.

Utilizamos el DataFrame creado en la instancia anterior. Este marco de datos tiene 6 columnas. Necesitamos seleccionar varias columnas de nuestra elección. El "DF.loc [] ”se invoca. Aquí, el nombre de nuestro DataFrame es "planetas" que proporcionamos con el ".loc [] ”propiedad. Especifica que queremos seleccionar las filas o columnas particulares del marco de datos proporcionado. Entre los soportes cuadrados de la propiedad "loc []", tenemos dos selecciones. El primer lugar es seleccionar las filas mientras que la otra es para la selección de las columnas. Nosotros, para esta guía, omitiremos el primer lugar y simplemente agregamos un colon ":" porque no necesitamos hacer una selección en filas.

En el lugar de la columna, presentamos un operador de subíndice "[]" que también llamamos los soportes cuadrados. En este operador de subíndice, escriba el nombre de las columnas. Seleccionamos 3 columnas que son "Mercurio", "Marte" y "Saturno". La salida de esta propiedad se guarda en la variable "Multi". Por último, empleamos el método "print ()" para mostrar el resultado en la pantalla.

El DataFrame resultante nos muestra 3 columnas que se seleccionan utilizando la propiedad "Loc []". Las columnas seleccionadas aparecen en la terminal mientras se ignoran el resto.

Ejemplo 3: Utilizando el método Pandas loc [] para seleccionar un rango de columnas por nombre

Seleccionar columnas presionando sus nombres uno por uno a veces se convierte en una tarea agitada cuando tiene que extraer una amplia cantidad de columnas. Si necesita extraer las columnas de una lista de columna especificada hasta un punto en particular, puede hacerlo proporcionando el rango de columnas en el atributo "Loc []". Veamos su ejercicio práctico.

Empleamos el "DF.loc [] ”propiedad. En el lugar de la columna, suministramos el rango de columnas que necesitamos para recuperar. El nombre de la primera columna de donde comienza el rango y el nombre de la segunda columna en el que termina el rango, están separados por un ":" Operador de colon. Aquí, seleccionamos la columna "Venus" para iniciar el rango de y la columna "Júpiter" en la que termina el rango. Entre este rango, las columnas existen, el método "loc []" los extrae a todas. Almacenamos el resultado en la variable "Nombre" y la mostramos utilizando el método "print ()".

En la instantánea de salida, podemos ver que todas las columnas de "Venus" a "Júpiter" se exhiben en la pantalla.

Conclusión

Esta guía se basa en seleccionar las columnas en un marco de datos Pandas. Pandas DataFrame nos proporciona un atributo que es "DF.loc [] ”para hacer una selección en filas o columnas o incluso ambas. Trabajamos en 3 ejemplos en este artículo. El primer ejemplo ofrece una explicación detallada de la selección de una sola columna en un marco de datos. El segundo ejemplo funcionó en la selección de múltiples columnas. Mientras que la tercera ilustración se basa en la idea de seleccionar un rango de columnas en un marco de datos.