Una serie Pandas es una matriz unidimensional con etiquetas de eje (índices). Las etiquetas no necesitan ser únicas, pero deben ser con Hashable. El objeto de la serie permite al usuario almacenar una colección de tipos similares de variables. Puede almacenar cualquier tipo de datos: entero, flotación, objetos, etc. Un objeto en serie se puede ordenar de varias maneras utilizando diferentes parámetros en su llamada. Se puede inicializar una serie utilizando el comando pd.Serie. Por defecto, los pandas ordenan el objeto de la serie en orden ascendente.
>>> S = PD.Serie ([6, 3, 8, 2, 9])La clasificación de valores en orden descendente se puede lograr utilizando el parámetro ascendente. Configurando ascendente a FALSO, La serie se puede ordenar en orden descendente.
>>> S.sort_values (ascending = false)Por defecto, la llamada a sort_values Devuelve una copia del objeto de la serie. Para conjuntos de datos de gran tamaño, esto es inviable ya que resulta en generar una nueva copia de datos. Para evitar eso, la operación de clasificación se puede realizar en el lugar utilizando el en su lugar palabra clave. Asignando en su lugar como Verdadero, Hace que el objeto de la serie se clasifique en el lugar sin tomar espacio adicional.
>>> S.sort_values (ascending = false, inplace = true)En el caso anterior, tenga en cuenta que no se devuelve una copia adicional de los datos.
Los pandas permiten al usuario elegir el algoritmo de clasificación para realizar la operación de clasificación. Se puede configurar el algoritmo de clasificación utilizando el amable parámetro. El amable El parámetro toma uno de los siguientes valores como argumentos: Quicksort, Mergesort, Heapsort. Por defecto, el algoritmo QuickSort se usa para ordenar los valores.
>>> S.sort_values (kind = 'Quicksort')A veces, un objeto en serie contiene N / A valores. Los valores de NA son los valores que faltan en el objeto de la serie. Los valores de NA se pueden colocar al comienzo de la matriz o al último de la matriz. La posición se puede asignar utilizando el parámetro Na_Position.
>>> S = PD.Serie ([6, 3, 8, NP.nan, 2, 9])El N / A Los valores también podrían eliminarse antes de clasificar. Esto se puede lograr usando el comando dropna.
>>> S = PD.Serie ([6, 3, 8, NP.nan, 2, 9])Durante el tipo, observamos que el índice sigue siendo el mismo para la nueva matriz ordenada. El índice se puede ignorar usando el parámetro ignorar_index. Se necesita un valor de bool: Verdadero o FALSO. Si Verdadero, el índice se ignora en la salida. Por defecto, es FALSO.
>>> S.sort_values (ignore_index = true, na_position = 'primero')A veces es conveniente usar una función clave para ordenar los valores. En tales casos, se puede pasar explícitamente la función clave utilizando el llave parámetro. Para clasificar usando el llave función, la función clave se aplica a los valores de la serie antes de clasificar. Considere el siguiente ejemplo, que no usa llave parámetros.
>>> S = PD.Serie (data = ['a', 'b', 'c', 'd'])La serie anterior se puede ordenar usando llave Parámetro de la siguiente manera.
>>> S.sort_values (key = lambda x: x.stri.más bajo())En lugar de una función lambda, numpy Las funciones también podrían usarse como llave funciones. En la siguiente función, el orden ordenado se evalúa utilizando el NP.función de pecado que calcula el seno valor y lo usa como clave de clasificación.
>>> importar numpy como npUn objeto en serie también se puede ordenar por el valor del índice. Considere el siguiente ejemplo. Para ordenar por índice, llamamos sort_index.
>>> S = PD.Serie (datos = [1, 2, 3, 4], index = ['d', 'b', 'c', 'a'])La clasificación por un índice es la misma en todas las formas que la clasificación por valores, incluidos los parámetros, excepto que opera en el índice en lugar de los datos.