Pandas sort por columna

Pandas sort por columna
Una pitón es una excelente herramienta para el procesamiento de datos, gracias a una próspera comunidad de herramientas de Python centradas en datos. Pandas también es uno de esos programas, y simplifica enormemente la importación y análisis de datos. La clasificación de los datos en Python se puede hacer de diferentes maneras. Cuando un usuario desea ordenar un conjunto de datos en particular de acuerdo con una columna específica, surge la pregunta. Según la columna suministrada, el método sort_values ​​() en pandas organiza un conjunto de datos en dirección ascendente o descendente. Difiere del método de pitón ordenado en el sentido de que no puede ordenar un conjunto de datos y no puede elegir una columna específica. Por lo tanto, hemos decidido escribir este artículo para simplificar la clasificación con la función sort_values ​​(). Empecemos.

Ejemplo 01:

Comencemos con nuestro primer ejemplo del artículo de hoy sobre cómo clasificar los marcos de datos de los pandas a través de las columnas. Para esto, debe agregar el soporte del panda en el código con su objeto "PD" e importar los pandas. Después de esto, hemos comenzado el código con la inicialización de un diccionario DIC1 con tipos mixtos de pares de claves. La mayoría de ellas son cadenas, pero la última clave contiene la lista de tipos de enteros como su valor. Ahora, este diccionario DIC1 se ha convertido en Pandas DataFrame para mostrarlo en forma tabular de datos utilizando la función DataFrame (). El marco de datos resultante se guardará en la variable "D". La función de impresión está aquí para mostrar el marco de datos original en la consola Spyder 3 utilizando la variable "D" en ella. Ahora, hemos estado utilizando la función sort_values ​​() a través del marco de datos "D" para ordenarlo de acuerdo con el orden ascendente de la columna "C3" desde el marco de datos y guárdelo a la variable D1. Este marco de datos ordenados D1 se imprimirá en la consola Spyder 3 con la ayuda del botón Ejecutar.

importar pandas como PD
Dic1 = 'C1': ['John', 'William', 'Laila'], 'C2': ['Jack', 'Worth', 'Sky'], 'C3': [36, 50, 25]
d = PD.DataFrame (DIC1)
Imprimir ("\ n DataFrame original: \ n", d)
D1 = D.sort_values ​​('C3')
Imprimir ("\ n ordenado por la columna 3: \ n", d1)

Después de ejecutar este código, tenemos el marco de datos original y luego el marco de datos ordenado de acuerdo con el orden ascendente de la columna C3.

Supongamos que desea ordenar o ordenar el marco de datos en orden descendente; Puedes hacer eso con la función sort_values ​​(). Solo necesita agregar el ascendente = falso dentro de sus parámetros. Entonces, hemos probado el mismo código con esta nueva actualización. Además, esta vez, hemos estado clasificando el marco de datos de acuerdo con el orden descendente de la columna C2 y mostrándolo en la consola.

importar pandas como PD
Dic1 = 'C1': ['John', 'William', 'Laila'], 'C2': ['Jack', 'Worth', 'Sky'], 'C3': [36, 50, 25]
d = PD.DataFrame (DIC1)
Imprimir ("\ n DataFrame original: \ n", d)
D1 = D.sort_values ​​('c1', ascending = false)
Imprimir ("\ n ordenado en orden descendente de la columna 1: \ n", d1)

Después de ejecutar el código actualizado, se muestra el marco original en la consola. Después de eso, se ha mostrado el marco de datos ordenado de acuerdo con el orden descendente de la columna C3.

Ejemplo 02:

Comencemos con otro ejemplo para ver el funcionamiento de la función sort_values ​​() de los pandas. Pero, este ejemplo será un poco diferente del ejemplo anterior. Estaremos clasificando el marco de datos de acuerdo con las dos columnas. Entonces, comencemos este código con la biblioteca de Panda como importación "PD" en la primera línea. El Diccionario de tipo entero Dic1 se ha definido y tiene teclas de tipo de cadena. El diccionario se ha convertido nuevamente en un marco de datos utilizando la función Pandas Everlasting DataFrame () y guardado en la variable "D". El método de impresión mostrará el marco de datos "D" en la consola Spyder 3. Ahora, el marco de datos se ordenará utilizando la función "sort_values ​​()", tomando dos nombres de columnas, C1 y C2, I.mi. llaves. La orden de clasificación se ha decidido como ascendente = verdadero. La declaración de impresión mostrará el marco de datos actualizado y ordenado "D" en la pantalla de la herramienta de Python.

importar pandas como PD
Dic1 = 'C1': [3, 5, 7, 9], 'C2': [1, 3, 6, 8], 'C3': [23, 18, 14, 9]
d = PD.DataFrame (DIC1)
Imprimir ("\ n DataFrame original: \ n", d)
D1 = D.sort_values ​​(by = ['c1', 'c2'], ascending = true)
Imprimir ("\ n ordenado en orden descendente de la columna 1 y 2: \ n", d1)

Después de que se completó este código, lo ejecutamos en Spyder 3 y obtuvimos el siguiente resultado ordenado de acuerdo con el orden ascendente de las columnas C1 y C2.

Ejemplo 03:

Echemos un vistazo al último ejemplo de uso de la función sort_values ​​(). Esta vez, hemos inicializado un diccionario de dos listas de diferentes tipos, I.mi. cadenas y números. El diccionario se ha convertido en un conjunto de marcos de datos con la ayuda de la función Pandas "DataFrame ()". El marco de datos "D" se ha imprimido como está. Hemos utilizado la función "sort_values ​​()" dos veces para ordenar el marco de datos de acuerdo con la columna "edad" y la columna "nombre" por separado en dos líneas diferentes. Ambos marcos de datos ordenados se han imprimido con el método de impresión.

importar pandas como PD
Dic1 = 'Nombre': ['John', 'William', 'Laila', 'Bryan', 'Jees'], 'Age': [15, 10, 34, 19, 37]
d = PD.DataFrame (DIC1)
Imprimir ("\ n DataFrame original: \ n", d)
D1 = D.sort_values ​​(by = 'edad', na_position = 'primero')
Imprimir ("\ n ordenado en orden ascendente de columna 'edad': \ n", d1)
D1 = D.sort_values ​​(by = 'name', na_position = 'primero')
Imprimir ("\ n ordenado en orden ascendente de columna 'nombre': \ n", d1)

Después de ejecutar este código, se muestra primero el marco de datos original. Después de eso, se ha mostrado el marco de datos ordenado de acuerdo con la columna "edad". Por último, el marco de datos se ha ordenado de acuerdo con la columna "Nombre" y se muestra a continuación.

Conclusión:

Este artículo ha explicado bellamente el funcionamiento de la función "sort_values ​​()" de Panda para ordenar cualquier marco de datos de acuerdo con sus diferentes columnas. Hemos visto cómo ordenar con una sola columna para más de 1 columna en Python. Todos los ejemplos se pueden implementar en cualquier herramienta de Python.