Pandas Cross Union

Hernán Delao

Python es un lenguaje bien construido para el análisis de datos, principalmente debido al fuerte ecosistema de las herramientas de Python centradas en los datos. Pandas tiene atributos para realizar una unión izquierda, derecha, interior o exterior y fusionarse en dos marcos o series de datos. Además, actualmente no existe una técnica para hacer una unión cruzada para fusionar o combinar dos operaciones con el argumento How = "Cross Cross". Lo haremos utilizando el método de pandas "fusionar ()" en este artículo con dos ejemplos.

Método Pandas Merge ()

El "PD.fusion () "se puede utilizar mediante la siguiente sintaxis dada:

Aquí, algunos parámetros necesarios son "a la izquierda", lo que significa el marco de datos izquierdo, el "derecho", que significa el marco de datos correcto, el "cómo" sobre cómo unir los marcos de datos, el "encendido" que se refiere a la columna que utilizamos para unir el Dos marcos de datos., y el "Left_on" y "Right_on" que ayudan a especificar la columna izquierda o derecha para unirse.

Realizaremos algunos ejemplos prácticos para implementar este método en este aprendizaje para encontrar una unión cruzada entre dos marcos de datos.

Ejemplo 1: Utilización de Pandas PD.Método de fusión () para obtener una unión cruzada entre dos marcos de datos con una sola columna

Comenzando con la primera ilustración para la implementación práctica del código Python para realizar una unión cruzada en Pandas Dataframes, tenemos que buscar una herramienta o software que pueda ejecutar nuestros códigos de Python. Muchas herramientas admiten el lenguaje de Python. Entre estas diferentes opciones, seleccionamos la herramienta "Spyder". Primero necesitamos instalar la configuración de la herramienta "Spyder". Una vez hecho, lanzamos la herramienta. Abra un nuevo archivo haciendo clic en el botón "Archivo", presionando el símbolo del archivo o presionando las teclas "Ctrl+N".

Nuestro nuevo archivo con el ".La extensión de Py "que se refiere a" Python "está lista para comenzar a trabajar. Centrémonos ahora en el código. Puede observar que la primera palabra del título de nuestro artículo es "pandas", lo que significa que se hará algo utilizando la biblioteca "pandas". Entendemos que nuestro requisito previo para implementar este código es importar la biblioteca Pandas al archivo de Python. Escribimos una línea de código "Importar pandas como PD". Esto importa todas las características de la Biblioteca Pandas. Además, utilizamos el "como PD", lo que significa que donde sea que necesitemos acceder a cualquier método de pandas en este código, tenemos que escribir "PD" en lugar de escribir el formulario completo "Pandas".

A medida que realizamos la unión cruzada, debemos tener dos marcos de datos de pandas donde ejercemos este método. Aprenderá aquí cómo construir un marco de datos definido por el usuario. Para crear un marco de datos, Pandas nos da un "PD.Función DataFrame () "donde" PD "es el" Pandas ". Entonces, accedemos a un método de pandas. El "DataFrame ()" es la palabra clave de esta función que, cuando se invoca, genera un DataFrame. Hacemos un marco de datos usando este "PD.Método DataFrame () "e inicializarlo con una sola columna" NUM ". Esta columna contiene dos valores que son "4" y "5". Llamando al "PD.El método DataFrame () ”genera un marco de datos con estos valores proporcionados.

Ahora, para almacenar este marco de datos, creamos un objeto DataFrame "V1". El marco de datos recién generado ahora es accesible por esta variable "V1". Para ver este marco de datos en el terminal, empleamos el método "print ()". Luego, creamos nuestro segundo marco de datos siguiendo los mismos pasos mencionados al crear el primer marcado de datos "V1". Invoca el "PD.DataFrame () "para crear un marco de datos que haya sido inicializado por una columna que tiene tres valores" r "," s "y" t ". Para almacenar este marco de datos, creamos una variable "V2". Para mostrar el marco de datos "v2", nuevamente utilizamos el método "print ()".

Si es nuevo en la herramienta "Spyder", es posible que se pregunte cómo ejecutará el código. Para ejecutar este archivo de Python, haga clic en el botón "Ejecutar archivo" o presione las teclas "Shift+Enter". Ahora, puede ver dos marcos de datos que acabamos de crear que se muestran en el terminal de la herramienta "Spyder".

La tarea principal comienza desde aquí. Ahora tenemos que aplicar la unión cruzada en estos dos marcos de datos. Para realizar una unión cruzada en dos marcos de datos, debe haber una columna de "clave" que esté presente en ambos marcos de datos para crear un enlace entre ellos para que podamos fusionarlos utilizándolo. Como podemos ver, no hay nada de eso, por lo que ahora agregamos uno en los marcos de datos "V1" y "V2", que es una columna común. Agregamos la misma columna de "clave" a ambos marcos de datos como "v1 ['key] = 0" y "v2 [' key '] = 0". Ahora, podemos fusionarlos en esta columna de "clave".

Para fusionarlos, utilizamos el "PD.método de fusión () ". Entre sus paréntesis, proporcionamos ambos marcos de datos "V1" y "V2". El parámetro "On" nos pide que damos el nombre de la columna común en función del cual podamos fusionarlos. Entonces, parece "en = 'Key'". Con esta función, usamos el ".método drop () "para soltar la columna" clave "una vez que se realiza la fusión. La función "drop ()" tiene dos parámetros: el nombre de la columna "clave" y la "axis = 1", lo que significa que la caída es en cuanto a columna. Creamos una variable "almacenar" para contener la salida del "PD.función de fusión () ". Llamamos al método "print ()" para ver la salida.

La ejecución del programa dado nos brinda un marco de datos que tiene todas las combinaciones de filas posibles del marco de datos dado.

Ejemplo 2: Utilización de Pandas PD.Método de fusión () para obtener una unión cruzada entre dos marcos de datos con múltiples columnas

Realizaremos otro ejemplo aquí sobre el mismo tema, el Pandas Cross se une. Para esto, lanzamos nuestra herramienta "Spyder" y abrimos un nuevo archivo presionando el "Ctrl+N". El requisito más importante del código es importar las bibliotecas necesarias. Utilizamos un método pandas, por lo que importamos la biblioteca de pandas como PD. Ahora, construimos nuestro primer marco de datos utilizando el "PD.Método DataFrame () ".

Inicializamos este marco de datos con dos columnas: "color" y "num". La columna de "color" contiene tres valores que son "rojos", "verdes" y "azul". Mientras que la columna "NUM" tiene la misma longitud de valores que son "101", "110" y "100". Creamos una variable "P1" para almacenar la salida de llamar al "PD.Método DataFrame () ". Ahora, podemos obtener el marco de datos utilizando esta variable. Empleamos la función "print ()" para mostrar el primer marco de datos en el terminal.

Nuestro primer DataFrame se crea correctamente. Generamos el segundo marco de datos ahora. De nuevo, utilizamos el "PD.Método dataFrame () "y crear una columna dentro de sus paréntesis. Esta columna "serial" almacena cuatro valores. Estos valores son "C1", "C2", "C3" y "C4". Para almacenar este marco de datos, creamos una variable "P2". Luego, invocamos la función "print ()" para mostrar el marco de datos "P2".

Ejecutar el código de Python anterior nos produce la siguiente salida que muestra 2 marcos de datos:

Generamos una columna de "clave" en cada marco de datos donde podamos fusionarlos. Aquí, usamos el valor "2" para las columnas "P1 ['Key']" y "P2 ['Key']" ". Finalmente, invocamos el "PD.Función de fusión () "para fusionar los marcos de datos en las bases de la columna" clave ". y el ".método drop () "para eliminar la columna" clave "después de fusionar ambos marcos de datos. Creamos una variable de "pintura" para almacenar el marco de datos fusionado. El "print ()" se utiliza para mostrar el final de datos de unión cruzado final almacenado en "Paint".

Esto nos lleva al siguiente marco de datos de unión cruzada que se muestra en la fusión de dos marcos de datos.

Conclusión

Fusionar dos marcos de datos en un solo marco de datos de unión cruzada es una técnica muy fácil e importante para aprender. Este artículo enfatizó y explicó el concepto de la unión cruzada en Pandas DataFrame. Elaboramos en cada detalle menor desde la descarga de la herramienta requerida hasta el logro de la producción deseada. A través de ejemplos prácticos de códigos de Python implementados y ejecutados en la herramienta "Spyder", hicimos un esfuerzo intencional para brindarle un aprendizaje fructífero y un concepto fácil de entender de Pandas de Python.

Pitón

Cómo usar XRange en Python

La función xRange () en Python 2.Función X o Range () en Python 3.X se usa para una iteración eficie...

Lorenzo Canales

Pitón

Python encuentra el índice de todos los sucesos en una lista

La función para bucle, enumerate (), el método index () o la función defaultDict () se puede usar pa...

Pilar Alemán

Pitón

Astype numpy

El método astype () del módulo Numpy se usa para cambiar el tipo de datos de una matriz Numpy en otr...

Daniela Villaseñor