Pandas Convertir columna a int

Pandas Convertir columna a int
“El procesamiento de datos y la evaluación están disponibles por el paquete de software de Python conocido como Pandas. Un tipo de datos es un bloque de construcción subyacente que usan los lenguajes de computadora para comprender cómo guardar y modificar datos. Cuando se crea un marco de datos de pandas con datos exteriores, las columnas numéricas generalmente se designan como objetos de tipo de datos en lugar de int o flotación, lo que hace que sea difícil realizar cálculos numéricos en ellos.

Le mostraremos cómo convertir una columna de pandas a un int en esta pieza y discutiremos diferentes métodos para lograr la salida deseada en este escrito."

Ejemplo 1: Convertir la columna Pandas a int utilizando la función pandas astype ()

El primer enfoque que vamos a emplear aquí para convertir Pandas DataFrame a INT es usar el método Astype () de la Biblioteca Pandas de Python. Podríamos suministrar cualquier tipo de datos de Python, Numpy o Pandas para cambiar el tipo de todas las columnas en un marco de datos, o podríamos pasar un diccionario con nombres de columnas como teclas y tipo de datos como valores para cambiar el tipo de columnas seleccionadas.

Aquí, el método Astype () nos permite especificar el tipo de datos que requerimos. Es bastante adaptable en el que puede intentar cambiar de un tipo a otro.

La sintaxis de la función astype (), que permite convertir el tipo de columna en int, es la siguiente.

Entendamos los parámetros de esta función uno por uno.

El primer parámetro aquí es "dtype" que se refiere al tipo de datos. Todo el objeto pandas podría convertirse al tipo apropiado usando dtype o tipo de python. Por el contrario, puede convertir una sola o múltiple de las columnas en un marco de datos a un tipo particular para esa columna utilizando la sintaxis "[colmn: dtype, ...]" en el que la columna es el nombre de la columna, mientras que dtype es un np un np.dtype o incluso tipo de pitón. El segundo parámetro es "copia". Se necesitan valores booleanos como entrada. Como predeterminado, se usa verdadero. El valor de la copia debe ser verdadero para devolver una copia. El último parámetro del método Astype () es "error". Tanto "Raise" como "Ignorar" son posibles. Sin embargo, "Raise" es la configuración predeterminada para este parámetro.

Conversión de una sola columna de un marco de datos PANDAS en un método INT utilizando Astype ()

En esta ilustración, cambiaremos el tipo de datos de una sola columna de DataFrame en int. Veamos cómo funciona.

Primero, importe la biblioteca Pandas en el archivo Python y luego asigne el alias a PD para aprovechar las características de Pandas. Cuando se terminó con él, ahora hemos creado un objeto DataFrame y lo llamamos un "marco", y le asignamos la salida de llamar a la función DataFrame, que se utiliza para generar un Pandas DataFrame. El PD.DataFrame Función inicializada con tres columnas, "Estudiante", "Marcas" y "Puntos" se invoca. Hemos asignado la misma longitud de valores para cada columna del marco de datos. La función print () se utiliza para imprimir el Pandas DataFrame.

Puede ver el DataFrame con tres columnas en la imagen a continuación:

Una vez que DataFrame se haya creado correctamente, verificaremos los tipos de datos para todas las columnas.

El tipo de datos de Pandas DataFrame se puede mostrar utilizando la propiedad "dtypes". Para invocar esta propiedad, escriba el nombre del objeto DataFrame que hemos creado anteriormente con el ".propiedad Dtype ”; En nuestro ejemplo, es "marco.dtypes ". Por lo tanto, verificará los tipos de datos para el marco de datos especificado. Como queremos ver los tipos de datos, tenemos que escribir "Frame.dtypes ”dentro de los aparatos ortopédicos de la función impreso ().

La función print () con la propiedad dtypes obtendrá los tipos de datos de los Estados Unidos de todas las columnas del marco de datos "marco".

Puede ver la imagen de salida que muestra tres columnas, todas con el tipo de datos "Objeto".

Ahora aprenderemos a cambiar el tipo de datos del marcado de datos al convertir el tipo de datos predefinido a int. Para lograr el tipo de datos deseado, tenemos que emplear el método "astype ()". Entre sus paréntesis, proporcionamos el tipo de datos al que queremos convertir el tipo de datos anterior. Aquí realizaremos la conversión del tipo de datos para una sola columna.

La sintaxis para utilizar este método es escribir el nombre del objeto DataFrame con el nombre de la columna dentro de los longitudes longitudes "[]". Coloque el operador de asignación "=", luego el objeto DataFrame tiene el mismo nombre de columna con el ".La función de astype () "y dentro de sus aparatos ortopédicos proporcionan el tipo de datos requerido. Como en el caso anterior, tenemos "marco ['Marks'].astype (int) ". Eso significa que queremos convertir el tipo de datos de la columna "Marcas" de "Objeto" a "INT". Por último, mostraremos el tipo de datos actualizado para el marco de datos "Frame" empleando la propiedad "dtype" dentro de los aparatos ortopédicos de la función print ().

Esto nos produce la siguiente salida:

Conversión de más de una columna de un marco de datos PANDAS en un método INT utilizando Astype ()

Como hemos aprendido a convertir la columna única de pandas de un marco de datos en un int, ahora llegaremos a aprender a convertir la conversión de tipo de datos de múltiples columnas a int.

Usaremos el mismo marco de datos que preparamos en el primer ejemplo para esta instancia. Con el fin de verificar el tipo de datos del DataFrame, se utiliza la propiedad DTYPES. En el ejemplo anterior, proporcionamos una columna que queríamos convertir en un int; Sin embargo, donde necesitábamos cambiar el tipo de datos de más de una columna. Las columnas que hemos elegido para cambiar el tipo de datos de son "marcas" y "puntos".

Con el objeto DataFrame, hemos dado el nombre de ambas columnas. Y le asignó la salida de invocar la función "astype ()". Hemos establecido el tipo de datos en INT en el método Astype (). Puede elegir incluso 3 o más columnas según su requisito para cambiar el tipo de datos. Cuando ejecutamos el método print (), hemos proporcionado el nombre del objeto DataFrame con la propiedad dtype para que muestre el nuevo tipo de datos de las columnas del "cuadro" de DataFrame ".

El terminal muestra una salida que contiene un marco de datos, el tipo de datos inicial y real de cada columna de DataFrame, y luego muestra el tipo de datos actualizado de las columnas "Marcas" y las columnas "Puntos".

Ejemplo 2: Convertir la columna Pandas a int utilizando la función pandas to_numeric ()

Utilizar la función PANDAS TO_NUMERIC es una de las mejores técnicas para convertir una sola o más columnas en un marco de datos a valores numéricos. Este método intentará convertir cadenas u otros ítems no numéricos en enteros o valores de punto flotante aceptables.

Veamos su implementación práctica.

Para la demostración de este método, primero creamos un diccionario "datos" que contiene tres cuerdas, "nombre", "puntaje" e "intento". Hemos empleado los pandas.Método DataFrame () para convertir este dict en un marco de datos y almacenar este DataFrame en un objeto DataFrame "demostración". Luego verificamos el tipo de datos de DataFrame por la propiedad DTYPE en la función print (). Hemos elegido la columna "puntaje" cuyo tipo de datos queremos cambiar a int. Luego utilizamos la función pandas to_numeric (), y dentro de sus aparatos ortopédicos, proporcionamos el objeto DataFrame con el nombre de la columna. Finalmente, la declaración de impresión con la propiedad DTYPE mostrará el tipo de datos actualizado del DataFrame.

Esta es la imagen de salida:

Conclusión

En este artículo, hemos tratado de familiarizarlo con el concepto de convertir el tipo de datos de DataFrame a int. Utilizamos dos funciones de pandas para dicho propósito. Para el primer enfoque, hemos implementado dos códigos prácticos en la herramienta Spyder, así como para la segunda ilustración. La práctica hará que sus conceptos fueran fuertes, y su conocimiento mejorará.