pandas astype

pandas astype
El objeto pandas generalmente se lanza a un dtype específico.función astype () usando el método Astype (). Esta herramienta también puede cambiar cualquier columna elegible a un tipo categórico. Lo usamos cuando deseamos convertir un tipo de datos de columna específico a otro tipo de datos. La entrada al diccionario de Python también se puede usar para cambiar múltiples tipos de columnas simultáneamente. El nombre de la columna y los nuevos tipos de datos que deseamos usar en las columnas están representados en el diccionario por las etiquetas de clave y valores, respectivamente. La técnica de pandas astype tiene varias aplicaciones.

Esta herramienta nos permite modificar el tipo de datos de:

  1. Una serie de pandas
  2. Cada columna en un marco de datos Pandas
  3. Varias columnas en un marco de datos

Cómo usar la función Astype () en Pandas

Para usar la función Astype (), primero debemos comprender su sintaxis. Ambos objetos de la serie y DataFrames se pueden usar con el método ASTTIPE. La sintaxis para ASTiPE en la serie y Astipe en las columnas del DataFrame son las siguientes:

Sintaxis de la función Astype () en la serie

Simplemente escriba el nombre de la serie seguido de la "sintaxis DOT" de la función Astype () para invocar el método para una serie.

Sintaxis:

Sintaxis de la función Astype () en las columnas de DataFrame

Primero debemos escribir el nombre del marco de datos antes de llamar al método Astype () "sintaxis de puntos".

Sintaxis:

Marco de datos.ASTYPE (DTYPE, COPY = True, Errors = "Raise", ** Kwargs)

dtype: El objeto pandas se lanza al mismo tipo usando el tipo de python o numpy.dtype. Una o más columnas de DataFrame se pueden emitir a tipos específicos de columna. También es posible usar col: dtype,? Como alternativa, donde el col representa el nombre de la columna y dtype es un numpy.

Copiar: Proporciona una copia si copia = verdadero. Cuando copia = falso, debemos tener cuidado ya que los cambios en los valores pueden extenderse a otros objetos de pandas.

error: Si intenta aplicar un tipo de datos incorrecto o inválido en el objeto, la técnica aumentará una excepción o no, dependiendo del valor del parámetro de error. Las dos respuestas a esto son las siguientes:

aumentar(Si hay un problema, planteará una excepción)

ignorar (Si hay un problema, suprimirá las excepciones. devolverá el objeto original si hay un error)

En la función astype () raise = true por defecto.

kwargs: El constructor recibe un argumento de palabras clave (kwargs) como entrada.

Ahora hemos visto la sintaxis. Enseñaremos el uso de la función Astype () en los siguientes ejemplos.

Ejemplo 1: Cambiar el tipo de datos de la serie de pandas

En primer lugar, importaremos módulos PANDAS, luego usaremos la función DataFrame () para crear el conjunto de datos, pasando un diccionario de nombres de columnas y algunas listas que contienen la información que queremos que las variables mantengan:

Además, crearemos una serie que solo mantenga la variable de gastos de DataFrame:

Para ilustrar nuestro DataFrame, usaremos la función print ().

Hay cuatro variables: nombre, país, ventas y gastos. Como resultado, el marco de datos incluye información de muestras o ficticias y gastos para algunos individuos de diferentes países.

Verifiquemos el tipo de datos de nuestra serie llamada e_variable usando dtype.

Esto indica que nuestra serie e_variable tiene el tipo de datos "objeto". Ahora cambiaremos el tipo de datos de la serie a int64 usando pandas astype.

El tipo de datos de la salida es dtype: int64, como puede ver si presta mucha atención al fondo de la salida. Recuerde que la variable E no ha sido modificada directamente por esto. Debido a que la salida de Astype () se imprimió en la consola, la serie E_Variable todavía tiene el tipo de datos de "Objeto". Tendríamos que reasignar la salida al nombre de la variable real con el siguiente código si quisiéramos alterar los datos de forma permanente directamente:

Ahora, el tipo de datos de nuestra serie se altera permanentemente.

Ejemplo 2: Cambiar el tipo de datos de la columna de DataFrame

Ahora operaremos en una columna de DataFrame. Comparar esto con el Ejemplo 1, donde trabajamos con una serie Pandas, será ligeramente diferente. En este caso, vamos a trabajar con un marco de datos. Por lo tanto, la sintaxis diferirá un poco. Primero, verificaremos el tipo de datos actual de nuestro DataFrame S_DATA. Para verificar el tipo de datos del DataFrame, usaremos dtype.

Para examinar los tipos de datos de la salida, también utilizaremos el .atributo dtypes.

Verá que el tipo de datos de Sale se ha modificado a INT64 en la salida. Para lograr esto, utilizamos la función de astipo, pasando un argumento de un diccionario. El nombre de la columna aparece en el lado izquierdo del diccionario, y el nuevo tipo de datos aparece a la derecha. Cambiemos el tipo de datos de otra columna de nuestro marco de datos.

El tipo de datos de la columna de la nación se ha transformado completamente en "cadena", como puede ver.

Ejemplo 3: Cambiar el tipo de datos de columna múltiple en un marcado de datos

Cambiemos ahora el tipo de datos de varias columnas de DataFrame. Esto se puede hacer de una manera que es bastante similar a la forma en que cambiamos la columna en el Ejemplo 2. Emplearemos un diccionario diferente en este ejemplo.

Una vez más, examinemos los tipos de datos originales con el uso de la .atributo dtype antes de hacer la operación:

Una vez más, tenga en cuenta que el objeto es el tipo de datos de cada columna en DataFrame.

Ahora modificaremos el tipo de datos de varias columnas. Para lograr esto, crearemos un diccionario con el nombre y el tipo de datos de la variable como sus pares de "clave" y "valor". Después del atributo Astype, también llamaremos al .atributo dtypes para que podamos observar los nuevos tipos de datos.

Verá que los tipos de datos de tres columnas han cambiado en la salida. El tipo de datos de la columna del país se cambia a cadena, el tipo de datos de ventas se cambia a int64 y el tipo de datos de gastos se cambia a int32.

En el paréntesis, agregamos un diccionario e invocamos el método Astype. Algunos pares de clave/valor con el formato "columna": "tipo de datos" estaban en el diccionario. Los nuevos tipos de datos y los nombres de la columna solo deben proporcionarse en un diccionario.

Ejemplo 4: Tipos de datos de fundición de todas las columnas en un marco de datos

El método PANDAS ASTTYPE () predeterminado intenta colocar cada columna DataFrame a los tipos de Python (int, texto, flotación, fecha y fecha de fecha) o numpy.dtype que se suministran. La operación falla, y el error "ValueError: no válido literal" se plantea si ninguna columna no se puede lanzar debido a datos no válidos o NAN. Para este ejemplo, creemos un nuevo marco de datos a partir de diccionarios.

Todos los nombres de la columna DataFrame y los dtypes son devueltos por DataFrame.función dtypes. Recuerde que cada columna tiene un tipo de objeto en el cuadro de datos que se muestra arriba. Ahora, lanzaremos el tipo de datos a la cadena.

Como se vio anteriormente, el DTYPE se actualiza para todas las columnas del DF DataFrame.

Conclusión

En este tutorial, tratamos de enseñarle cómo usar el marco de datos Python Pandas.método astype (). Cambiamos el tipo de datos de la columna de DataFrame a un tipo de datos diferente y luego examinamos DataFrame. Implementamos algunos ejemplos en este artículo, por lo que es posible que pueda cambiar el tipo de datos de la serie y el tipo de datos de la columna de marco de datos utilizando el método PANDAS ASTIPE en Python.