Columnas de pandas

Columnas de pandas
Se utiliza una cuadrícula rectangular llamada Pandas DataFrame para almacenar datos. Los datos que se guardan en un marco de datos son fáciles de visualizar y manipular. DataFrame puede consistir en múltiples filas y columnas. Cada fila representa una medición de una sola instancia, mientras que cada columna es un vector que contiene los datos de un atributo o variable específica. Las filas de DataFrame pueden tener datos heterogéneos u homogéneos en cualquier fila dada, pero cada columna de DataFrame contiene datos homogéneos en cualquier columna dada. Los ejes de un marco de datos en pandas están etiquetados, a diferencia de los de una matriz bidimensional. En este artículo, discutimos los diversos métodos para agregar, modificar y eliminar las columnas o valores de pandas en las columnas de un marco de datos en pandas. Esto se puede hacer a través de varios métodos. Veamos algunos de esos métodos en detalle.

Cómo agregar columnas o valores a una columna en Pandas

Las columnas se pueden agregar a un marco de datos utilizando varios métodos. En el siguiente ejemplo, usamos las funciones Aplicar () e Insertar () para agregar columnas a nuestro DataFrame.

Ejemplo 1: Agregar columna a DataFrame usando la función Apply ()
Puede agregar varias columnas a un marco de datos utilizando los pandas.Marco de datos.Método asignar (). Primero, creamos una muestra de datos de muestra utilizando el PD.Función DataFrame () con algunas filas y columnas. La biblioteca "pandas" se importa primero para crear el marco de datos de pandas.

Creamos el marco de datos "DF" al pasar un diccionario con dos claves: "C1" y "C2" - con valores ["A", "B", "C"] y ["D", "E", "F "] Respectivamente. Al pasar el diccionario en PD.DataFrame, las claves se convierten en la etiqueta de columnas y los valores en la lista se convierten en los datos de cada celda en las columnas de DataFrame.

Como se puede ver, creamos un marco de datos con dos columnas ahora. Usando la función asignar (), agregamos más columnas o columnas a nuestro DataFrame de datos "DF".

La función ofrece una nueva estructura de datos "new_df" que contiene la columna adicional (recién agregada "C3") y todas las columnas antiguas ("C1" y "C2") como resultado. Tenga en cuenta que si alguna columna actual se reasigna, todas se sobrescribirán.

Ejemplo 2: Agregar columna a DataFrame usando la función insert ()
El "marco de datos.El método insert () "también se puede usar para agregar columnas a un marcado de datos. Primero creemos un marco de datos con algunas filas y columnas.

Para mostrar nuestro DataFrame de datos "DF", se utiliza la función print ().

Nuestro marco de datos tiene dos filas, A y B, con valores ["1", "2", "3"] y ["4", "5", "6"] respectivamente. Ahora, usamos el método Insert () para agregar otra columna en el marco de datos "DF".

Antes de usar la función Insert (), creamos una lista que tiene valores ["7", "8", "9"]. La indexación de columnas de DataFrame comienza en cero. Cuando aplicamos la función Insert () con el marco de datos "DF", especificamos el índice 1 para colocar la nueva columna "C". También pasamos la lista de "valores" en los parámetros de la función insert () para almacenar los valores de la columna "c".

Puede notar que nuestra nueva columna se agrega en el 2Dakota del Norte Ubicación de la columna entre "A" y "B" porque especificamos el índice "1" en los parámetros de la función Insert ().

Cómo seleccionar columnas en pandas

Las columnas se pueden seleccionar por sus posiciones de índice, etiquetas o tipos de datos. Veremos cómo seleccionar las columnas específicas y múltiples en los siguientes ejemplos.

Ejemplo 1: seleccione una columna específica utilizando los nombres/etiquetas de la columna
Creamos una muestra de datos de datos para mostrarle cómo puede seleccionar una columna específica del marco de datos.

Creamos DataFrame con columnas "COL1" y "COL2". La forma más sencilla de obtener una columna específica de DataFrame es escribir el nombre de la columna como una cadena con citas en los soportes [].

En el marco de datos dado, tenemos dos columnas numéricas: "Col1" y "Col2", que tienen los valores (3, 1, 5) y (7, 2, 6) respectivamente.

Al usar una lista con múltiples nombres de las columnas de DataFrame dentro de los soportes "[]", puede seleccionar varias columnas.

Como se puede ver, pasamos una lista que contiene ambos nombres de columnas "Col1" y "Col2" en los soportes.

Ejemplo 2: seleccione una columna específica por su tipo de datos
Creamos un marco de datos que tiene columnas con diferentes tipos de datos.

La columna "Nombre" almacena los nombres de las personas ("Tim", "Alex", "Joe", "Rick"). Mientras que la columna de "edad" almacena las edades de las personas (12, 11, 11, 13). Verifiquemos los tipos de datos de nuestras columnas de DataFrame utilizando el atributo "dtypes".

El tipo de datos de la columna "Nombre" es "Objeto" e "Int64" es el tipo de datos de la columna "Age". Ahora, seleccionamos las columnas por su tipo de datos utilizando la función "Loc []".

Dentro del DF.Loc [] función, especificamos el dtypes == 'int64'. Los valores se devuelven donde el tipo de datos es 'int64' utilizando el ".Atributo de valores "con DF.loc [:, (DF.DTYPES == 'int64') función.

Ejemplo 3: seleccione varias columnas por sus índices
Creamos una nueva muestra de datos de datos para mostrarle cómo seleccionar múltiples o todas las columnas del marco de datos utilizando el método "ILOC []".

Como creamos nuestro DataFrame, ahora usamos el método ILOC [] para seleccionar varias columnas de nuestro DataFrame. Cuando se selecciona una sola columna, el método ILOC [] devuelve un objeto en serie. Cuando se selecciona más de 1 columna, se devuelve un marco de datos de pandas.

Especificamos el rango de índice de columnas de 0 a 3. Tenga en cuenta que la columna en el índice 3 no es parte del grupo. Solo se seleccionan las columnas del índice 0 a 2.

Como se puede ver, las columnas "W", "X" y "Y" se seleccionan especificando el rango 0: 3.

Cómo alterar los nombres de la columna y los valores de la columna

En el siguiente ejemplo, cambiaremos los nombres de columna usando la función rename () y el cambio de los valores usando la función reemplazar ().

Ejemplo 1: Cambie la etiqueta de columna usando la función rename ()
Primero, creamos un marco de datos que tiene una o más columnas.

Una vez que se crea DataFrame, podemos cambiar el nombre de su columna utilizando la función Pandas rename (). Dentro de la función rename (), usamos un diccionario como original_label: new_label. Y especificamos la etiqueta actual y la nueva etiqueta (que queremos agregar).

Como puede observar, cambiamos el nombre de la columna "A" a "Nombre" y el nombre de la columna "B" a "Asunto".

Ejemplo 2: Cambie los valores de columna usando la función reemplazar ()
Creamos un marco de datos que tiene el número de valores de almacenamiento de columnas. Luego, modificamos los valores de las columnas utilizando la función reemplazar ().

Dado que creamos nuestro DataFrame, cambiemos ahora los valores de su columna usando la función Reemplazar (). El método reemplazar () intercambia el valor en la columna DataFrame con el nuevo valor especificado.

La función reemplazar () reemplazó el valor de la columna "x" desde la columna "5" a 9.

Cómo eliminar las columnas de pandas

Las columnas de DataFrame se pueden eliminar utilizando el método Drop () y Del en PANDAS.

Ejemplo: Eliminar una columna de un Pandas DataFrame
Creemos primero un marcado de datos a partir del cual eliminaremos las columnas específicas utilizando los métodos Drop () y del Del.

Tenemos un DataFrame "DF" con 4 columnas ("A", "B", "C", "D"). El método drop () de DataFrame elimina las filas o columnas en función de los ejes correspondientes y los nombres de columna especificada (etiqueta). Eliminemos la columna "A" usando la función Drop ().

El eje = 1 denota que estamos eliminando la columna, no la fila.

La función Drop () eliminó con éxito la columna "A". Ahora, usemos el método "del" en la columna "D".

La columna "D" se elimina del marco de datos utilizando el método "DEL".

Conclusión

En este tutorial, discutimos qué son columnas en el marco de datos de Pandas. Utilizamos las diferentes funciones para agregar, modificar y eliminar columnas de nuestro DataFrame. Este tutorial está diseñado para enseñar las diferentes operaciones que puede realizar en una columna de DataFrame en Pandas. Implementamos múltiples ejemplos para enseñarle cómo puede agregar columnas o valores en una columna, cómo seleccionar columnas, cómo cambiar los nombres de columnas y los valores de la columna, y cómo eliminar la columna de un Pandas DataFrame.