Sindicato de pandas

La función del panda "índice.Union () ”se utiliza para obtener el índice en una orden de sindicato como en el capítulo establecido de Matemáticas, donde utilizamos la función de la Unión. También podemos encontrar la unión del índice utilizando la función "concat ()", que combina el marco de datos y establece el orden de índice de manera secuencia.

La sintaxis para el método concat ()

La sintaxis para el "índice.Método de la Unión ”

Ejemplo 1: la unión de dos índices de marco de datos utilizando el método concat ()

En este ejemplo, estamos utilizando la función "concat ()" para "unión" los índices de dos marcos de datos. Concatenar dos marcos de datos juntos es un proceso sencillo. Aunque la función de "unión" en pandas es similar a una unión, también elimina los duplicados. Concat y la función de duplicados de caída en pandas usan la unión. Esta función sindical opera de manera similar a cómo funciona la unión en el capítulo de matemáticas que funciona "conjuntos", combinando todos los números secuencialmente; Sin embargo, en los pandas, el número repetido se elimina.

Estamos utilizando la herramienta "Spyder" para implementar el código en el primer ejemplo del artículo. El paso inicial en cada código de pandas de Python es importar la biblioteca de Panda como "PD".

Ahora generaremos un marco de datos. Para concatenar los marcos de datos y aplicar la unión en sus índices, se crearán dos marcos de datos. El primer cuadro de datos que tenemos se llama "Tabla1". Contiene dos columnas, los "cursos" y "tarifa", cada uno tiene algunos valores establecidos en ellas. En la primera columna, enumeramos los nombres de algunos cursos de programación, incluidos "OOP", "Python", "Java" y "Android Studio". Mencionamos las tarifas del curso en la segunda columna, "tarifa", y son "30000", "35000", "32000" y "25000". Para generar nuestro primer DataFrame "Tabla1", ahora estamos utilizando "PD.DataFrame ”, como puede ver en la siguiente imagen:

La creación de la segunda marca de datos "Tabla2" es la siguiente etapa. Los nombres de la columna en este marco de datos son los mismos que los de DataFrame anteriores, pero sus valores difieren. Tenemos "diseño gráfico", "php", "sql" y "swift" en la columna "cursos", y tenemos "34000", "32000", "22000" y "24000" en la "tarifa" columna. Para la generación del segundo marco de datos, Tabla2, una vez más estamos usando "PD.DataFrame ”como se demostró.

Ahora, en esta sección, implementaremos la función principal de nuestros ejemplos, que combina dos marcos de datos utilizando la función "concat ()" y aplicar la función "unión" a sus índices. El método "concat ()" concatena los elementos de pandas en un eje determinado con lógica de conjunto opcional, que puede ser intersección o unión junto con los otros ejes. Aquí, hemos usado "PD.Concat (Tabla1, Tabla 2) "para combinar el marco de datos. También hemos pasado el parámetro "ignor_index = true" porque no queremos que se repita el índice. En cambio, queremos el índice en forma incremental al combinar los marcos de datos. Finalmente, guardamos el resultado en la variable de unión y la imprimimos utilizando la función "print ()". En consecuencia, el método "concat ()" utilizará esencialmente el índice para encontrar la unión del marco de datos.

Volvamos a su salida, que se muestra en la siguiente imagen. Como podemos ver, la combinación de nuestros marcos de datos funcionó con éxito utilizando la función "concat ()". Se muestran las dos columnas, los "cursos" y la "tarifa". Dado que nuestro índice no se repite, se muestra en la espuma de la unión, como se puede ver, porque hemos pasado el parámetro de la función "concat ()", que es "ignore_index = true". El tamaño del índice que tenemos actualmente es "8", lo que significa que abarca un rango de "0 a 7".

Ejemplo 2: Combinando el índice utilizando el índice.Método de unión ()

Este es un ejemplo simple y compacto. Antes de fusionar los dos índices en este ejemplo, utilizamos el "índice.Método de unión () ". Como siempre, debemos importar la biblioteca de Panda como "PD" antes de ejecutar este código. En este ejemplo, simplemente estamos construyendo un índice en lugar de un marco de datos. Entonces, para crear el "index1" inicial, utilizamos "PD.índice "con los números" 4 "," 5 "," 6 "y" 7 ", y seguimos el mismo procedimiento que puede ver para el" Index2 ". Los valores "index2" son "8", "9", "10" y "11".

Como puede ver, actualmente estamos utilizando "index1.Unión (índice2) ". Creará una orden sindical combinando ambos índices. Luego usamos el método "print ()" para mostrar el resultado generado.

El resultado de salida muestra que el índice combinado comienza en el número cuatro y concluye en el número once. Esta vez, se muestra una sola fila del índice. También indica que su tipo de datos es "int64".

Ejemplo 3: una unión de tres índices de marco de datos utilizando el método concat ()

Este ejemplo es similar al primer ejemplo, pero este combinará tres marcos de datos y ordenará sus índices secuencialmente. En general, el índice de Python devuelve la ubicación del elemento proporcionado en una lista o los caracteres en una cadena. El índice esencialmente define la posición del elemento, para ponerlo en pocas palabras.

Debemos importar la biblioteca Pandas como "PD" antes de poder comenzar a escribir el código para este ejemplo. En este escenario, se deben crear tres marcos de datos. El primer DataFrame que tenemos se llama "Data1", y tiene tres columnas "Student_Name", "Marcas" y "Observaciones". Se han agregado algunos valores a estas columnas. Tenemos "Noah", "Emma", "Enna" y "George" en la primera columna, "Student_Name" y en la segunda columna "Marcas", tenemos una lista de las marcas del estudiante "450", "490 "," 482 "y" 209 "y la columna final contiene los" comentarios "del alumno, ya sea un" pase "o un" fracaso ". Ahora, creamos este marco de datos como se muestra usando "PD.marco de datos".

Es hora de construir un segundo marco de datos con tres columnas, que será idéntico al primero, pero los valores de las columnas se cambian. DataFrame se llama "Data2". Tenemos tres columnas "Student_Name", "Marcas" y "Observaciones". En la primera columna, "Student_Name", tenemos "Watson", "Henry", "James" y "Oliver" los valores en la segunda columna, "Marcas", tenemos "499", "390", "290 "Y" 400 "y en la última columna, tenemos los comentarios" pasar "o" fallar ". Se completa este marco de datos "data2", por lo que utilizamos el mismo "PD.DataFrame ”para producir esto.

Es hora de crear el tercer DataFrame "Data3", que tiene tres columnas con los mismos nombres que el último DataFrame pero con diferentes valores. Los valores que tenemos en la primera columna son "Archie", "Ethan", "Michael" y "Samuel". Tenemos "230", "498", "290" y "403" en la segunda columna, y en la tercera, tenemos "fallas", "pasar", "fallar" y "pasar". Para generar el tercer marco de datos "data3", nuevamente estamos usando "PD.marco de datos".

Aquí, combinamos nuestros tres marcos de datos y asignamos a sus índices una secuencia en cuanto a unión utilizando la función "concat ()" con su parámetro. Aquí usamos "PD.Concat (DF1, DF2, DF3) "se usa para combinar los marcos de datos, que son los" data1 "," data2 "y" data3 ". Como puede ver, también utilizamos "ignorar_index = true", que omitirá el índice repetido y les proporcionará un nuevo índice que sea preciso y en el orden correcto porque deseamos un orden de sindicato para nuestro índice. Establezca la opción "ignorar_index = true" para instruir a la concatenación que ignore los índices utilizados actualmente. Luego establecerá el índice a partir de '0 ”para continuar en los resultados. Para almacenar el resultado producido por esta función, inicializamos la variable "unión". Posteriormente, invocamos la función "print ()" para mostrar el contenido que se almacena en esta "unión":

Los marcos de datos se combinan y se muestran como un solo marco de datos en la salida, como se puede ver. Los tres marcos de datos se combinan utilizando la función "concat ()" y su unión de sus índices utilizando el parámetro "ignorar_index = true". Debido al mismo número de columnas y los mismos nombres de columnas en cada uno de estos tres marcos de datos, no se mostraron columnas adicionales en el resultado. El "Student_Name", "Marcas" y "Observaciones" son las tres columnas que se muestran después de la concatenación. La representación de la Unión del índice es visible; Comienza desde "0" y termina en "11", lo que indica que el tamaño del índice es "12".

Conclusión

En este artículo, concatenamos el marco de datos para obtener el índice de la Unión utilizando la función "concat ()". Además, utilizamos el parámetro de la función concat "ignor_index = true" porque no queremos el índice repetido. En el segundo ejemplo del artículo, que es breve y simple, utilizamos el "índice.Función de unión () "para combinar los índices y mostrar el tipo de datos del índice. Creemos que estos métodos simplificarán su tarea.

Pitón

Astype numpy

El método astype () del módulo Numpy se usa para cambiar el tipo de datos de una matriz Numpy en otr...

Daniela Villaseñor

Pitón

Etiquetas del eje marino

Los hachas.Funciones de la biblioteca Set () , Matplotlib, o las funciones set_xlabel () y set_ylabe...

Andrés Barrientos

Pitón

Pandas read_csv multiprocesamiento

Para mejorar la velocidad de carga de datos, incluidos sus beneficios y limitaciones el PD.read_csv ...

Pilar Melgar