Renombrar columnas en un marco de datos de pandas

Renombrar columnas en un marco de datos de pandas

Todos los días, las personas manejan enormes datos que llamamos Big Data. En ese big data, a veces contiene nombres de columnas o a veces sin los nombres de la columna. Los nombres de la columna están ahí, pero contienen un nombre irrelevante o algunos caracteres no deseados como espacios, etc. Por lo tanto, primero debemos preprocesar esos enormes datos antes de comenzar el análisis. Entonces, en primer lugar, requerimos el nombre de los nombres de los nombres de la columna.

Marco de datos son datos tabulares orientados a la fila que tienen filas y columnas. También podemos decir que DataFrame es una colección de diferentes columnas y cada columna es de diferentes tipos como cadena, numérica, etc.

$ pandas.Marco de datos

Un pandas Marco de datos se puede crear utilizando el siguiente constructor

$ pandas.DataFrame (data = none, index = none, columns = none, dtype = none, copy = false)

Método 1: Uso de la función Rename ():

Sintaxis:

df.renombrar (columnas = d, inplace = false)

Creamos un Marco de datos (df), que usaremos para mostrar diferentes métodos de cambio ().

En lo anterior Marco de datos, Podemos ver que tenemos cuatro columnas ['Nombre', 'Age', 'favoritos_color', 'Grado'].

Los pandas tienen una función incorporada llamada rename () que puede cambiar el nombre de la columna instantánea. Para usar esto, tenemos que pasar un formulario clave (el nombre original de la columna) y el valor (el nuevo nombre de la columna) a la función de cambio de nombre en el atributo de columna. También podemos usar otra opción en el lugar a verdadero que realiza cambios directamente al existente Marco de datos Por defecto, el lugar es falso.

Del resultado anterior, podemos ver que los nombres de las columnas cambiaron.

Método 2: Uso del método de lista

Pandas Marco de datos También ha dado una columna de nombre de atributo que nos ayuda a acceder a todos los nombres de columnas de un Marco de datos. Entonces, al usar este atributo de columnas, también podemos cambiar el nombre del nombre de la columna. Tenemos que pasar una nueva lista de columnas y asignar al atributo de columnas como se muestra a continuación:

El principal inconveniente de usar el método de lista para cambiar el nombre del nombre de una columna es que tenemos que pasar todos los nombres de la columna, incluso si queremos cambiar solo unos pocos nombres de columna.

Método 3: cambie el nombre del nombre de la columna usando el archivo read_csv

También podemos cambiar el nombre de las columnas durante la propia Read_CSV. Para eso, tenemos que crear una lista de columnas y pasar esa lista como un parámetro para el atributo de nombres mientras lee el CSV.

Usamos el encabezado de atributo único = 0, lo que significa que anulamos las columnas anteriores del .Archivo CSV con las nuevas columnas que pasamos a través del atributo de nombres.

En lo anterior .Método CSV, cambiamos el nombre de las columnas mientras usamos la lista, y pasamos todas las columnas nuevas dentro de esa lista. Pero a veces, necesitamos cambiar el nombre de solo unas pocas columnas. Luego, tenemos que usar el atributo usecols y mencionar los valores de índice de esas columnas dentro de eso como se muestra a continuación:

En lo anterior, cambiamos solo el nombre de la primera y última columna del archivo CSV y para eso pasamos los valores de índice de las columnas (0 y 3) al atributo usecols.

Método 4: usando las columnas.stri.reemplazar()

Este método se usa básicamente cuando queremos cambiar algunas frases a otras frases y no queremos cambiar la columna completa de cambio de nombre como el espacio para subrayar, etc.

Del resultado anterior, podemos ver que ahora los espacios anulan con el bajo.

El método anterior también tiene la instalación del índice (DF.índice.stri.reemplazar()).

Método 5: renombres de columnas usando set_axis ()

Este método se utiliza para cambiar el nombre del índice junto con la columna como se muestra a continuación:

Conclusión

En este artículo, mostramos diferentes métodos sobre cómo cambiar el nombre de las columnas. El mejor método que considero es el método Rename () donde tenemos que pasar solo aquellas columnas que queremos cambiar el nombre en el formato de diccionario (clave, valor). El atributo de columnas es el método más fácil, pero el principal inconveniente de eso es que tenemos que pasar todas las columnas, incluso si queremos cambiar el nombre de unas pocas columnas. También podemos cambiar el nombre de las columnas mientras lee el archivo CSV en sí, que también es una buena opción. Las columnas.stri.reemplazar () es la mejor opción solo cuando queremos reemplazar algunos caracteres con otros personajes.