Pandas nlar

Pandas nlar
El "pandas" es la biblioteca que nos ayuda a realizar múltiples tareas de manera fácil y eficiente. Podemos usar la biblioteca "pandas" siempre que necesitemos manipular y analizar los datos. "Pandas" también brinda la oportunidad de crear DataFrame. El marco de datos se genera utilizando el método "pandas". También podemos encontrar el mayor valor de las columnas de DataFrame. Cuando ingresamos algunos datos numéricos en la columna de DataFrame, también encontramos los valores más grandes presentes en esa columna con la ayuda del método "pandas". El método que podemos utilizar para encontrar los valores más grandes en las columnas de DataFrame es el método "nLargest ()". Usaremos este método "más grande" en los códigos "pandas" en esta guía y explicaremos su trabajo aquí.

Sintaxis:
Marco de datos.NLArgest (n, columnas, keep = "primero")

El "n" representa el número de los valores más grandes que queremos obtener de las columnas del marco de datos. Luego, en lugar del parámetro "columnas", colocamos el nombre de la columna de la que queremos obtener los valores más grandes. Luego, en el parámetro "Keep", podemos agregar "primero" o "último". El "primero" se usa para mostrar el primer valor de los valores duplicados y el "último" se usa para mostrar el último valor de los valores duplicados.

Ejemplo 1:

El código inicial de esta guía está aquí. Todos los scripts que cubrimos en esta guía se realizan utilizando la herramienta "Spyder". Importamos algunos módulos de "pandas" cada vez que deseamos escribir un nuevo código "pandas". Estos se pueden importar simplemente escribiendo el "Pandas como PD" después de la palabra clave "importar", que es lo que hacemos aquí. Ahora, al insertar el "PD" en este código, obtenemos acceso a las funciones de "Pandas". Ahora, diseñamos el marco de datos aquí colocando "PD.Marco de datos()".

Diseñamos el "num_df" DataFrame y colocamos tres columnas en él. La "cola" es la primera columna que creamos en este marco de datos. La "cola" tiene "10, 4, 6, 9 y 18". Después de "Cola", agregamos la segunda columna "Colb" en la que también agregamos algunos números que son "13, 28, 48, 12 y 11". Luego, la última columna que insertamos aquí es la columna "colc". En la columna "Colc", pusimos "21, 24, 31, 44 y 59". Todas las columnas junto con algunos datos se insertan en el marco de datos "num_df".

Ahora, utilizamos la "impresión ()" y pasamos "num_df" a esta función. Esto muestra el "num_df" en el terminal. Queremos obtener los tres valores más grandes de la columna "cola" de este marco de datos. Entonces, para este propósito, utilizamos el método "nLargest ()" y pasamos "3" como el primer parámetro que representa el número de valores más grandes que queremos obtener. Luego, escribimos "cola" porque queremos obtener los valores más grandes de la columna "cola" y almacenar estos valores más grandes en la variable "grande". Entonces, imprimimos estos valores. Entonces, usamos "imprime ()" nuevamente que contiene la variable "grande" en ella. Estos tres valores más grandes de "cola" se muestran en la terminal.

Después de presionar las teclas "Shift+Enter" o presionar el icono de ejecución, podemos obtener fácilmente el resultado de los códigos "Pandas" en el "Spyder". DataFrame está aquí en este resultado que contiene todos los datos que le agregamos. Luego, en el siguiente marco de datos, se muestran tres filas. Estos son los "3" valores más grandes de la "cola" que se representan aquí en orden descendente.

Ejemplo 2:

El "gym_df" está diseñado en este código donde agregamos el "weight_loser" y "pesas" como sus columnas. En la columna "Weight_loser", se agregan "Theo, Harper, Oscar, Sue, Grace, Jayden, Larry y Taylor". Luego, tenemos la columna "Peso" donde colocamos los pesos que son "99, 101, 119, 89, 102, 85, 86 y 120". Ahora, llamamos a la "impresión ()" y proporcionamos el argumento "gym_df". Esto hace que la terminal muestre el "gym_ df". Queremos obtener los "4" números más grandes de la columna "Peso" de este marco de datos.

Para lograr esto, utilizamos el método "nLargest ()" y pasamos el número "4" como el primer parámetro, que representa el número de los valores más grandes que queremos obtener. Luego, escribimos "pesos" para adquirir los valores más grandes de la columna "Peso". También guardamos estos valores más grandes en la variable "grande_weight". Los valores deben imprimirse entonces. Por lo tanto, usamos el "print ()" una vez más. Incluye la variable "grande_wisos". El terminal muestra los cuatro valores más grandes de "pesos".

Después de los datos originales, los cuatro valores más grandes de la columna "Peso" se muestran en forma de otro nuevo marco de datos. Obtenemos estos cuatro valores más grandes utilizando el método "nlargest ()" de "pandas" en el código.

Ejemplo 3:

En este ejemplo, leemos el archivo CSV con la ayuda del método "Read_csv" de "Pandas" y creamos el cuadro de datos desde el archivo CSV. Almacenamos este marco de datos en la variable "data_df". Ahora, usamos el método "dropna ()" donde ajustamos el parámetro "innace" a "verdadero". Esto elimina esas filas donde aparece el valor nulo. Después de esto, obtenemos el método "nLargest ()" y agregamos "5" porque queremos obtener los primeros cinco valores más grandes de la columna "Unidades". Estos cinco valores más grandes se almacenan en la variable "más grande 5". Este "más grande 5" se coloca en la "impresión ()" para mostrar.

Muestra todos los datos del archivo CSV aquí como el marco de datos después de leerlo. Luego, obtiene los primeros cinco valores más grandes de "unidades" y los desplaza en este resultado.

Ejemplo 4:

Este código crea el "Sales_DF" y agrega las columnas "Vendedor" y "Ventas/Día". "ABC, ABD, ABE, ABF, ABG, ABH, ABI, ABJ, ABK y ABL" ahora se enumeran en la columna "Vendedor". La columna "Ventas/Día" sigue donde enumeramos los siguientes precios de venta: "60000, 25000, 30000, 18000, 29000, 21000, 40000, 54000, 33000 y 41000". Ahora, colocamos la "impresión ()" con el argumento "Sales_DF". Este marco de datos "Sales_DF" aparece en el terminal como resultado. Los números más grandes "4" en la columna "Ventas/Día" de este marco de datos son lo que deseamos obtener de este marco de datos.

El método "nLargest ()" se utiliza para hacer esto. El primer parámetro que representa el número de los valores más grandes que deseamos recibir es "4", que se agrega aquí. Luego, agregamos el nombre de la columna desde la cual queremos acceder a los valores más grandes. El nombre de esa columna es la columna de "ventas/día". Agregamos este método "nLargest ()" en la "impresión ()", por lo que también se muestra en el terminal.

Este resultado contiene el marco de datos con todos los datos que contribuimos en el código. Luego, cuatro filas se muestran en el siguiente marco de datos. Estos son los "4" valores más grandes de la columna "Ventas/Día". Se muestran en orden descendente en la siguiente ilustración:

Conclusión

Esta guía describió completamente el método "nLargest ()" de "pandas" en detalle. Aprendimos la sintaxis de esta guía en detalle, así como el uso de este método. Discutimos los parámetros de este método en profundidad y también utilizamos este método "nLargest ()" en el código "pandas" para mostrar el funcionamiento de este método "nLargest ()". Explicamos cómo mencionar el número de valores más grandes que queremos obtener, así como el nombre de la columna para obtener los valores "n" más grandes de la columna del marco de datos. También explicamos cómo obtener los valores más grandes del archivo CSV después de leer los datos del archivo CSV en esta guía.