Los pandas se unen a dos marcos de datos

Los pandas se unen a dos marcos de datos

“Pandas es uno de los paquetes del lenguaje de Python, lo que hace que el análisis de datos sea más fácil y flexible para trabajar y procesar mejor. Muchas veces, en la vida real, enfrentamos la situación en la que hemos realizado nuestro trabajo en múltiples archivos diferentes, y a veces necesitamos ver todos los datos juntos en un "marco de datos" para analizar datos en lugar de tener los datos en diferentes ubicaciones. Entonces, los pandas nos proporcionan esto posible facilitándonos. Hay varias formas de realizar este método; Implementaremos el método de "unir" de los pandas de diferentes maneras posibles. El método Join () se usa principalmente y se une a los marcos de datos basados ​​en "índice". Utilizaremos la herramienta "Spyder" para la implementación de los códigos; Es el software orientado a Python el que nos proporcionará beneficios para la implementación del código del método de unión PANDAS ()."

Sintaxis

"Marco de datos. unirse"

La sintaxis anterior se usa para unir los dos marcos de datos. Siempre funciona usando el otro índice para el propósito de unión. DataFrame se puede escribir como "DF '. La "unión de puntos" es para la llamada del método. Ya que usa el índice pero no hay daño ni cambios realizados en el real. El índice de datos real se conserva como el original.

Parámetro

Más adelante, utilizaremos un parámetro como un "otro" marco de datos. Eso ayuda a unir los dos marcos de datos; lo combinado se hace con este parámetro. Además, el índice de uno de los dos "DF" debería ser similar para unirse a ellos. Eso significa que los tipos similares de datos o datos utilizados para el mismo propósito pueden estar juntos para procesar.

Las siguientes son las diferentes formas en que haremos los ejemplos para la implementación del método unión () en un "DF".

  • Método de unión de panda utilizando los índices.
  • Método de unión de panda utilizando columnas (clave).
  • El método de unión de panda conserva el índice de marco de datos original.
  • Método de unión de panda utilizando no unique (clave).

Creación de DataFrame para la implementación del método de Join ()

Aquí, primero, tenemos que importar la biblioteca de Pandas como "PD", luego crearemos el marco de datos que consta de dos columnas, una es de la "clave" como "T0", "T1", "T2", "T3 "," T4 "y" T5 ", y el otro es de valores" n "como" n0 "," n1 "," n2 "," n3 "," n4 "y" n5 ". El "DF" representa el DataFrame en el código.

La salida muestra los datos ingresados ​​en DataFrame; Podemos ver las columnas "clave" y "n" que se imprimen.

Creación de otro marco de datos para el método Panda Join ()

Estamos creando otro marco de datos porque tendremos los marcos de datos separados, y luego los combinaremos utilizando el método Pandas Join (). DataFrame consta de dos columnas; A medida que creamos la última "DF", la columna "clave" tiene valores como "T0", "T1", "T2" y "T3"; Por otro lado, la otra columna tiene los valores de "M" como "M0", "M1", "M2", "M3".

Aquí está la salida que muestra la creación simple de DataFrame de acuerdo con el código.

Puede ver que hay dos marcos de datos, y queremos tener a ambos juntos en el mismo marco de datos, por lo que ahora haremos los ejemplos para ver cómo sucederá eso.

Ejemplo # 01: método Panda Join () utilizando los índices

Abra la herramienta "Spyder". Ahora, para unir los dos marcos de datos, primero debemos crear los dos marcos de datos para unirnos a ellos. Aquí los marcos de datos consisten en las variables "x" e "y" con valores asignados como "x" con "x0", "x1", "x2", "x3", "x4" y "x5" mientras que "y" tiene menos valores, que son "y0", "y1", "y2" y "y3". Los valores de "clave" son de "K0" a "K5", y en otros valores "DF", "clave" son de "K0" a "K2". Luego, el marco de datos con la llamada del método "DOT Join" combinará los dos "DF". El "sufijo" utilizado en el código es porque, en el marco de datos, hay dos columnas que tienen el mismo nombre, i.mi., "llave". Que no superpondrán los datos.

La salida muestra los dos "df" en uno. Como podemos ver que hay algunos valores como "nan", lo que significa que "no es un número". El "DF" tiene más valores que el segundo "DF", por lo que, donde no hay valor asignado, se muestra como "nan".

Ejemplo # 02: Método de unión de panda usando columnas (clave)

Como sabemos ahora cómo unir dos marcos de datos, aquí lo haremos ahora utilizando el método de columna "clave". El método de columna clave organiza los datos como columnas con respecto a su índice. Aquí el DataFrame consiste en las variables "N" y "W". El "N" tiene valores como "N0", "N1", "N2", "N3", "N4 y" N5 ". Mientras que "W" tiene los valores "W0", "W1" y "W2". El DF con ".Establecer el índice "muestra con la" clave "y con el método de unión de llamadas como".unirse ", con el otro índice" DF "adjunto. Este método de unión combinará tanto "DF" utilizando su índice. Este es un método muy eficiente de unión de pandas que ayudará a un entorno de big data.

La salida utilizando el método de columna de unión () de índice de pandas muestra las columnas con valores clave y las variables "n" y "w".

Ejemplo # 03: Método de unión de Panda Preservar el índice DataFrame original

En este ejemplo, veremos y demostraremos lo que escribimos anteriormente que los datos se conservan a su estado original. Aquí los marcos de datos tienen las variables "P" y "W". El "P" con los valores "P0", "P1", "P2", "P3", "P4" y "P5". "W" con los valores "Q0", "Q1" y "Q2". El ".Unirse "La implementación en el" DF "se establece con el" índice "(clave). Este método mostrará los datos mantenidos con el índice "los datos originales".

La pantalla representa los datos reales sin tomar la originalidad.

Ejemplo # 04: Método de unión de panda usando no unique (clave)

Ahora estaremos haciendo un ejemplo para comprender un método único. En el ejemplo anterior, aprendimos cómo se mantienen los datos originales. Eso se hizo mostrando los dos marcos de datos disponibles en el código. Ahora estaremos haciendo lo mismo para verificar el estado original y también unir al método con el otro "DF" que no esté allí. El "DF" aquí tiene "P" y la "clave". "P" tiene los valores de "P0" a "P5" continuos y los valores de "clave" de "K0" a "K5" respectivamente. La llamada del método de "unión de puntos" se realiza con el otro "Índice establecido" que induce "clave".

La salida es similar a la salida del último ejemplo. Los datos se capturan a partir de los datos mantenidos originales.

Conclusión

El método de unión de pandas de dos datos de datos es eficiente y conveniente. Este método utiliza el ".unir la función para operar los datos y unir los marcos de datos. Este método es una excelente manera de presentar los datos, especialmente cuando estamos trabajando en una gran cantidad de datos en el directorio en cualquier lugar donde se realiza el análisis de datos. Hemos discutido cómo se puede implementar el método de unión de panda para una mejor comprensión de la función. Hemos realizado la forma de "índice", la forma de "columna" y la forma de "clave" de llevar los dos marcos de datos diferentes a una sola.