Pandas se fusiona en múltiples columnas

Mayte Mesa

Pandas es esencialmente un paquete de Python que se usa con frecuencia para trabajar con colecciones de datos. Es un código abierto que podría utilizarse en tareas precisas de aprendizaje automático. Además, se admiten las matrices multidimensionales. Las características principales de los pandas son la alineación de datos y la remodelación del conjunto de datos. Podría construirse en la parte superior del lenguaje de programación de Python utilizado con código abierto.

Fusionar el método de columna múltiple ()

Hay varias técnicas para operar los conjuntos de datos. El método de fusión es uno de ellos. Se pueden fusionar múltiples columnas de dos o más de dos marcos de datos para mantener los datos de un buen sentido. Siempre que necesitemos fusionar dos marcos de datos de Pandas en varias columnas, usamos el "Pandas.método de fusión () ". Es una forma eficiente para el científico de datos, ya que podría ahorrarle tiempo para mantener la base de datos de una mejor manera. Para mejorar la fidelidad del código, necesitamos fusionar nuestros marcos de datos en pandas porque dos marcos de datos pueden tener diferentes tipos de información sobre el mismo elemento y pueden tener principales segmentos iguales.

En nuestro artículo, veremos cómo podemos fusionar las múltiples columnas de los marcos de datos utilizando los "Pandas.método de fusión () ". Si queremos fusionar los conjuntos de DataFrame sin ninguna columna clave, fusiona todas las columnas comunes en DataFrame. Pero reemplaza cada columna común con una sola columna de ambos conjuntos de datos.

Sintaxis:

Ejemplo 1: Mostrar el método de fusión () en múltiples columnas con una columna similar en pandas de dos marcos de datos

Aquí, observamos la fusión de múltiples columnas en Dataframes. Raramente usamos la técnica de "fusión" para combinar dos marcos de datos. Ahora, creamos nuestros dos marcos de datos. Primero, importamos los pandas de código abierto como "KD". Luego, creamos nuestro primer marco de datos utilizando el "KD.DataFrame "y lo llamó" CD1 "que declara las tres variables que son" M "," K "y" A ".

Básicamente "M", "K" y "A" son las tres columnas del marco de datos "CD1". Los valores asignados a la variable de columna "M" son "10", "10", "20", "20" y "30". Los valores asignados a "K" son "10", "10", "20", "20" y "20". Los valores asignados a la variable "A" son "130", "90", "120", "50" y "50". Aquí se crea nuestro primer DataFrame "CD1". Ahora, ven al segundo marco de datos que se llama "CD2", que tiene tres columnas al declarar tres variables "M", "K" y "N". Los valores asignados a "M" son "10", "20", "20", "20" y "30". Los valores asignados a la variable "K" son "10", "10", "10" "20" y "20". Y los valores asignados de "n" son "150", "160", "170", "180" y "130". Aquí se crea nuestro DataFrame "CD2".

Ahora, llegamos a nuestra función principal "KD.fusionar () "que aplicamos para fusionar las múltiples columnas de nuestro marco de datos. Aquí, aplicamos el parámetro "izquierda" a nuestras columnas "M" y "K", ya que son similares en ambos marcos de datos. Después de eso, simplemente aplicamos nuestra función "print ()" para mostrar la "fusión" de dos columnas. En este ejemplo, discutimos la "fusión" de dos columnas en "CD1" y "CD2" marcos de datos con columnas similares que son "M" y "K". Simplemente fusiona ambas columnas similares de los diferentes marcos de datos.

Ahora, discutimos el resultado de nuestro código. La primera columna que comienza de "0" a "4" son los números de índice. Como la columna "M" es similar en ambos marcos de datos, se fusiona y se muestra una vez con valores que son "10", "10", "20", "20" y "30". Después de eso, la siguiente columna que se muestra es "K", que también es una columna similar. También se fusiona y se muestra solo una vez junto con los datos de "10", "10", "20", "20" y "20". Las diferentes columnas de ambos marcos de datos son "A" y "N" que se muestran a lo largo de ellas. Los valores de esta columna similar "A" que se muestra son "130", "90", "120", "50" y "50". La última columna que se muestra en la salida es "n" junto con datos que son "150", "150", "180", "180" y "130".

Columnas similares se fusionan en el lado izquierdo debido a la aplicación del método "izquierda". El resto de las columnas no comunes se muestran a la derecha de forma predeterminada. Como las columnas "M" y "K" fueron similares en ambos marcos de datos, se pueden mostrar una vez en la salida después de la implementación de los "Pandas.Método de fusión () "junto con las columnas restantes" A "y" N ".

Ejemplo 2: Mostrar fusión () en múltiples columnas con nombres distintos en dos marcos de datos

Ahora, discutimos la fusión de múltiples columnas que tienen diferentes nombres de columnas en este ejemplo. En este caso, importamos la biblioteca de Panda como "FB". En primer lugar, creamos nuestros marcos de datos como "PK1" y "PK2". DataFrame "PK1" declara con tres nombres variables que son "sujetos", "cargos" y "Time_Period" que actúan como columnas. Los valores que se almacenan en "sujetos" son "web", "gramática", "social", "electrónica" y "TIC". Los valores de datos que se almacenan en la columna "cargos" son "10000", "20000", "30000", "40000" y "50000". La última columna del marco de datos "PK1" es "Time_Period" que almacena los valores de "4hrs", "5hrs", "6hrs", "5.5 horas "y" 5 horas ".

El segundo marco de datos llamado "PK2" tiene tres columnas que son "sujetos", "cargos" y "percentil". El valor que asignamos a "sujetos" son "TIC", "gramática", "social", "electrónica" y "base de datos". En la segunda columna "cargos" del marco de datos, asignamos los valores de "10000", "20000", "30000", "40000" y "50000". El "percentil" de la última columna almacena los valores que son "5%", "10%", "20%", "10%" y "5%". Después de crear Dataframes, simplemente los mostramos usando la función "print ()".

Cuando se crea nuestro Dataframes, aplicamos la implementación de los "Pandas.función de fusión () ". Fusionamos el primer marco de datos "PK1" junto con el segundo marco de datos "PK2". Aquí, queremos fusionar las diferentes columnas de los marcos de datos, por lo que usamos los parámetros de "Left_on" y "Right_on". Utilizamos estos parámetros en la columna de "sujetos" de ambos marcos de datos. Después de eso, ambos marcos de datos se fusionan y simplemente lo mostramos por la función "print ()".

Ahora, eche un vistazo a nuestra salida del código respectivo. Como podemos ver en nuestra pantalla de salida desde el primer índice de "0" a "4", muestra nuestro primer marco de datos de "PK1" de las primeras columnas "sujetos" que contienen "web", "gramática", "social" , "Electrónico" y "TIC". La segunda columna "Cargas" contiene los valores numéricos de "10000", "20000", "30000", "40000" y "50000. Tercera columna "Time_period" contiene los valores "4 horas", "5 horas", "6 horas", "5.5 horas "y" 5 horas ".

A continuación, muestra los datos del marco de datos "PK2" que también contiene tres columnas: "sujetos", "cargos" y "percentil". La columna "Sujeto" muestra "TIC", "Grammer", "Social", "Electrónica" y "Base de datos". La columna "Cargas" muestra sus valores de "10000", "20000", "30000", "40000" y "50000". El "percentil" de la tercera columna muestra datos de "5%", "10%", "20%", "10%" y "5%".

Por fin, después de aplicar los "Pandas.Función de fusión () ", combina los datos de ambos cuadros. Por defecto, fusiona la columna "sujeto" de ambos marcos de datos con valores similares y los muestra junto con las múltiples columnas diferentes de ambos marcos de datos. Después de la fusión de ambos marcos de datos, mostramos las cinco columnas diferentes fusionadas que son "sujetos", "CARGES_X", "TIME_PERIOD", "CARGES_Y" y "percentil" junto con todos los datos que asignamos.

Conclusión

Describimos cómo combinar las múltiples columnas en este artículo. Lo discutimos utilizando los ejemplos de fusionar dos marcos de datos que contienen columnas similares y diferentes. Para fusionar las columnas similares, solo usamos el simple "KD.función fusionar () "y fusiona la columna similar por defecto por la función. Para fusionar las diferentes columnas múltiples, usamos el "FB.fusion () "junto con los parámetros" Left_on "y" Right_on ".

golang

Introducción al lenguaje de programación de Golang

Golang es un lenguaje de programación de código abierto desarrollado por Google. Siga este artículo ...

Jacobo Piña

Fuerza de ventas

Cargador de datos de Salesforce

Tutorial sobre cómo insertar, eliminar y actualizar los datos de Salesforce, y cómo importar/exporta...

Homero Ontiveros

Comandos de Linux

Cómo instalar la versión de CUDA en Linux

Tutorial integral sobre cómo descubrir las versiones de CUDA que son compatibles con los controlador...

José Luis Villagómez