Columna de inserción de pandas

Columna de inserción de pandas

Los pandas simplifican muchas tareas tediosas y que requieren mucho tiempo asociadas con el trabajo con los datos. Las columnas en el marco de datos también se pueden ajustar, junto con la fuente de datos. Hay cuatro formas de agregar una columna a un marco de datos en pandas, pero en este artículo, usamos la función de columna Pandas "insert ()".

Marco de datos.insertar()

Al utilizar el método DataFrame "Insert ()", puede agregar columnas entre las columnas actuales en lugar de agregarlas en la parte inferior del Pandas DataFrame. Nos permite agregar una columna en cualquier lugar que elijamos en lugar de simplemente al conclusión. Además, ofrece muchas formas de agregar los valores para las columnas. Cuando agrega una columna en una posición o índice especificado, la función pandas "insert ()" es útil.

Sintaxis

pandas.Marco de datos.insertar (posición, 'columna', [valores ...])

Parámetros

  1. "Posición" es el primer parámetro que se refiere a la posición del índice de columna donde la columna debe insertarse.
  2. "Columna" es el nuevo nombre de la columna
  3. Los valores se colocan en una lista e se insertan en la columna.

Ejemplo 1

En este ejemplo, tenemos un marco de datos llamado "cosas" que contiene las columnas "Nombre" y "Estado comprado".

Agreguemos una nueva columna llamada "Costo" con valores.

importación de pandas
cosas = pandas.DataFrame ('nombre': ['plato solar', 'gafas', 'aceite'],
'Estado comprado': [1,0,0])
Imprimir (cosas)
# Insertar la columna 'Costo' en el cuadro de datos anterior en el índice-2
cosas.insertar (2, "costo", [890.0,98.0,67.91])
imprimir()
Imprimir (cosas)

Producción

Estado de nombre comprado
0 plato solar 1
1 gafas 0
2 aceite 0
Nombre Costo de estado comprado
0 plato solar 1 890.00
1 gafas 0 98.00
2 aceite 0 67.91

Explicación

Especificamos la posición como 2 en la función insert (). Entonces, la columna "costo" se inserta en la tercera posición (índice - 2). Finalmente, las columnas son ['nombre', 'estado comprado', 'costo'].

Ejemplo 2

Agreguemos una nueva columna llamada "Revisión" con valores de tipo de cadena en la posición-1.

importación de pandas
cosas = pandas.DataFrame ('nombre': ['plato solar', 'gafas', 'aceite'],
'Estado comprado': [1,0,0])
Imprimir (cosas)
# Insertar la columna 'Revisión' en el DataFrame anterior en Index-1
cosas.insertar (1, "revisión", ["bueno", "malo", "bueno"])
imprimir()
Imprimir (cosas)

Producción

Estado de nombre comprado
0 plato solar 1
1 gafas 0
2 aceite 0
Revisión de nombre Estado comprado
0 plato solar bueno 1
1 gafas malas 0
2 aceite bueno 0

Explicación

Especificamos la posición como 1 en la función insert (). Entonces, la columna "revisión" se inserta en la segunda posición (índice-1). Finalmente, las columnas son ['nombre', 'revisión', 'estado comprado'].

Ejemplo 3

Cree un marco de datos con nombre con 2 columnas e inserte 2 columnas en el índice-1 uno por uno.

importación de pandas
órdenes = pandas.DataFrame ('id': [1,2,3,4,5],
'Nombre': ['o1', 'o2', 'o3', 'o4', 'o5'])
Imprimir (pedidos)
# Insertar la columna 'Company' en el cuadro de datos anterior en Index-1.
pedidos.Insertar (1, "Compañía", ["Comp-1", "Comp-2", "Comp-3", "Comp-4", "Comp-5"]))
imprimir()
Imprimir (pedidos)
# Insertar la columna 'Sales' en el marcado de datos anterior en Index-1.
pedidos.insertar (1, "ventas", [10,20,30,56,78])
imprimir()
Imprimir (pedidos)

Producción

nombre de identificación
0 1 O1
1 2 O2
2 3 O3
3 4 O4
4 5 O5
ID Nombre de la empresa
0 1 Comp-1 O1
1 2 Comp-2 O2
2 3 Comp-3 O3
3 4 Comp-4 O4
4 5 Comp-5 O5
Nombre de la compañía de ventas de identificación
0 1 10 Comp-1 O1
1 2 20 Comp-2 O2
2 3 30 Comp-3 O3
3 4 56 Comp-4 O4
4 5 78 Comp-5 O5

Explicación

Primero, el orden de las columnas es [ID, nombre].

Después de agregar 'Compañía' en la posición 1, las columnas son [ID.Nombre de empresa].

Después de agregar 'ventas' en la posición 1, las columnas son [ID.Ventas, empresa, nombre].

Conclusión

Una operación de análisis de datos y actualización de uso común es agregar columnas a DataFrame. Pandas le ofrece numerosas opciones para completar la tarea ofreciendo cuatro métodos diferentes. Sin embargo, en nuestro artículo, solo utilizamos una técnica, que es la columna Pandas "Insert ()". Discutimos tres ejemplos diferentes de insertar la columna en un marco de datos existente.