Índice de clasificación de pandas

Índice de clasificación de pandas
"Pandas" es un gran lenguaje para realizar el análisis de datos debido a su gran ecosistema de paquetes de Python centrados en datos. El análisis e importación de ambos factores se facilita. Cualquiera que sea el proyecto en el que estemos trabajando en el campo de las ciencias de los datos, tenemos que administrar los datos y quererlos de manera ordenada para que las otras operaciones funcionen se vuelvan más fáciles y fluidas. Ordenar sus datos es una de las representaciones de gestión que es importante. La clasificación de datos es más fácil mediante el uso de un índice, ya que los pandas tienen una función "Índice de clasificación de pandas". Cubriremos todas las formas en que se realiza la clasificación de los pandas utilizando el índice. El índice de clasificación de pandas () no solo clasifica los datos por índice sino también los datos por las filas o por las columnas según el requisito. Para la implementación del código, utilizaremos el software "Spyder", que se construye en un entorno de Python.

Sintaxis

df.sort_index ()

La sintaxis anterior realiza la clasificación de DataFrame utilizando el índice. El "DF" es la abreviatura de "DataFrame". Es una función de pandas para ordenar los datos.

Parámetros

En el índice de clasificación de pandas, utilizaremos algunos parámetros como "eje", "nivel", "ascendente", "descendente" e "ignorar el índice = true".

Los siguientes son los métodos en los que se realiza el índice de clasificación PANDAS:

  • Pandas Sort por índice (orden ascendente).
  • Pandas ordenar por orden descendente.
  • Pandas restablece el índice en el marco de datos ordenado.
  • Índices de clasificación de pandas por nombres de columnas o por etiquetas.

Creación de DataFrame para el método de índice de clasificación PANDAS

Primero, tenemos que crear un marco de datos para comprender el índice de clasificación de Pandas a través de ejemplos. Después de abrir la herramienta "Spyder" para implementar el código, comience a escribir el código. Luego, importe la Biblioteca Pandas como "PD" y Numpy como "NP". Pandas es una plataforma de código abierto con la acumulación de Python. Al crear el marco de datos, tenemos el marco de datos "cursos de idiomas", en el que tenemos los cursos de "inglés", "np. nan "," español "," chino "y" japonés ".

Tenemos los datos de tarifas como "20000", "13000", "65500", "51000", "51000" y "96000". Tenemos el período para completar el curso como "35 días", "50 días", "60 días", "25 días" y 63 días ". Luego, tenemos datos para el descuento de los cursos como "1200", "2300", "4500", "2200" y "1500".

Aquí está la pantalla de salida del DataFrame que creamos. La pantalla muestra el marco de datos que se refiere al índice.

Ejemplo 01: Pandas Sort por índice (orden ascendente)

Hemos creado un marco de datos anterior para realizar todas las formas del índice de clasificación de pandas. Aquí, implementaremos el índice de clasificación PANDAS en orden ascendente utilizando el índice. Hay muchas veces cuando creamos un marco de datos sin darnos cuenta de la disposición de los índices. En algún momento, necesitamos resolverlo para realizar alguna operación y quererla en orden ascendente. Los pandas tienen una función "sort_index" que clasifica todos los datos dependiendo del índice. Aquí, por defecto, se realizará el orden ascendente.

La salida muestra el marco de datos establecido en orden ascendente utilizando el índice de clasificación PANDAS. El valor "121" es primero que los valores "223", "323", "423" y "565" correspondientemente.

Ejemplo 02: orden de pandas por orden descendente

Como hemos visto en el Ejemplo # 02, cómo clasificar un marcado de DataFrame por Pandas Sort Index en orden ascendente. Ahora, clasificaremos en orden descendente del "DF" utilizando el método de clasificación de índice de Pandas. DataFrame tiene los datos de los idiomas que tienen los cursos y otras necesidades como tarifa, duración y descuento ofrecidos a los cursos. Aquí, el orden descendente se realiza pasando el parámetro "falso" al ascendente en el mismo soporte. Esta especificación para establecer el nombre booleano "verdadero" o "falso" juega un papel importante en el método. Esta función del índice de clasificación Pandas ejecutará la clasificación del índice en orden descendente.

La siguiente salida muestra el "DF" ordenado en orden descendente, ya que podemos ver "565", "423", "323", "223" y "121" respectivamente.

Ejemplo 03: Pandas restablece el índice en el marcado de datos ordenado

En este ejemplo, aprenderemos cómo restablecer el índice de un "DF" que ya está ordenado. Deje en claro que este es solo otro método para clasificar el marco de datos con el valor, dependiendo del índice, o puede decir con la ayuda de usar un índice. Para restablecer el índice del "DF" con este método específico, debemos establecer el valor del parámetro "ignorar" como "verdadero".

La salida muestra que el índice predeterminado comienza en 0 y continúa con la clasificación en el orden correcto. Esto facilitará la exploración del marco de datos para lograr cualquier tarea de acuerdo con la demanda.

Ejemplo 04: índices de clasificación de pandas por columna (nombres o etiquetas)

Estaremos clasificando índices por etiquetas o columnas en este ejemplo. A menudo, necesitamos el marco de datos organizado por las columnas y también clasificados por los nombres para que podamos realizar los otros métodos de evaluación en los datos que queremos. Pandas ordene el índice por columna y reorganice los datos también. El DF.La función sort_index () clasifica los objetos por la etiqueta con su "eje" dado ". El "eje" es un parámetro que usamos.

El propósito de usar el parámetro "eje" es que estamos clasificando el índice por la columna. A veces, tenemos que ordenar el índice por fila. Entonces, en este tipo de situaciones, especificamos el parámetro como un eje. Este método funciona aplicando las etiquetas del eje al algoritmo de clasificación en lugar de aplicarlo a los datos reales en DataFrame. Así es como se realiza el reordenamiento de los datos y también la clasificación del índice, ambos van de la mano. Esta técnica se puede aplicar a varios algoritmos de clasificación.

Podemos ver que sobre la base del nombre/etiqueta de la columna, hay una columna de "cursos" en la primera. Luego, "descuento", "duración" y, por último, la columna "tarifa".

Conclusión

El índice de clasificación de pandas es un método tan útil y eficiente. Como clasifica los datos de acuerdo con la necesidad en la que queremos trabajar. En este artículo, hemos aprendido todos los métodos, como clasificar el índice en orden ascendente y descendente, clasificar el marco de datos por índice y clasificar el índice por el nombre de la columna. También hemos aprendido todos los parámetros utilizados en la función del Índice de clasificación PANDAS DE DATA DE DATA. Este método es un cambio de juego para las personas que trabajan en grandes cantidades de datos, ya que clasifica los datos según su necesidad para que podamos realizar el análisis y otro trabajo que queremos hacer.