Copia de pandas

Copia de pandas
Python es un lenguaje fuerte para el análisis de datos, principalmente debido al fuerte ecosistema de las herramientas de Python centradas en los datos. Pandas es una de esas herramientas que facilita la importación y el análisis de datos más simples.

Las estructuras de datos más considerables de la Biblioteca Pandas son Dataframes y Series. Internamente, estas estructuras de datos se definen mediante matrices de índice que etiquetan los datos y las matrices de datos que almacenan los datos originales. Podemos hacerlo utilizando los pandas "DataFrame.método copy () ".

Método de copia de pandas

Se emplea el método de copia para copiar el DataFrame especificado. Se puede copiar un marco de datos de dos maneras: "copia profunda" y "copia superficial". La función de "copia profunda" construye un marco de datos que contiene una copia del contenido e índices de DataFrame especificados. El método de "copia poco profunda" genera un nuevo marco de datos sin copiar el contenido o los índices del objeto de la persona que llama, solo se copian punteros al contenido y el índice.

La sintaxis para el método de copia es la siguiente:

"Profundo" es un argumento booleano que determina si se debe hacer una copia profunda o superficial. "Copia profunda" es la configuración predeterminada del método. Establezca el valor "profundo" del parámetro en "falso" para permitir la copia superficial.

Veamos la demostración práctica de este método.

Ejemplo: Uso de Pandas DataFrame.método copy ()

Para la implementación, hemos utilizado la herramienta "Spyder". Abra un nuevo archivo de Python en la herramienta "Spyder". El requisito más importante al comenzar a escribir el script es importar bibliotecas relevantes. Como tenemos que implementar un método "pandas", usamos "importar pandas como pd" para acceder a las características de "pandas". Luego, comenzamos nuestro código principal de Python.

Hemos creado un marco de datos utilizando el "PD.Método DataFrame () ". DataFrame se inicializa mediante dos columnas "nombre" y la "edad". Ambas columnas de DataFrame almacenan la misma longitud de valores. La primera columna "Nombre" tiene cinco valores de cadena que son "Charlie", "Bush", "Harry", "Robert" y "Albert". La segunda columna "Age" también almacena cinco valores que tienen un tipo de datos int que son "25", "33", "18", "29" y "20". Creamos una variable "demostración" para almacenar el marco de datos recientemente construido en él.

Ahora, podemos acceder a nuestro marco de datos utilizando esta variable "demostración". Utilizamos el método "print ()" para mostrar el texto "DataFrame real". Luego, invoca otro método "print ()" para mostrar el marco de datos.

Presione el botón "Ejecutar archivo" en la herramienta "Spyder" para ver la salida en el terminal. La pantalla resultante nos muestra un marco de datos recién creado con 2 columnas y un encabezado encima.

Después de lograr esto, comenzaremos nuestra tarea principal en el código de Python. Para esto, utilizamos los pandas "DataFrame.método copy () ". Invocamos el ".Copy () "Método con el nombre de nuestra" demostración "de DataFrame. Como queremos crear una "copia profunda" del DataFrame, por ellas usamos la función con su valor predeterminado que es "profundo = verdadero". Se crea una variable "demo_dcopy" para almacenar la salida de llamar al ".método copy () ". Ahora podemos acceder a esta "copia profunda" del marco de datos real por la variable "Demo_dCopy". Empleamos la función "print ()" para mostrar un texto "Copia profunda de DataFrame real:" y para exhibir contenido de la variable "Demo_dCopy".

Si ejecutamos el código anterior, se muestran dos marcos de datos en la consola. El primero es el marco de datos real, mientras que la otra es la "copia profunda" del marco de datos real. Podemos ver que todo el contenido y los índices del marco de datos real se copian en la "copia profunda" de la misma.

Ahora, verifiquemos qué sucede en la "copia profunda" si realizamos algunos cambios en el marco de datos real. Para hacer algunas modificaciones, utilizamos la propiedad "ILOC", que se utiliza para ubicar el índice especificado. Escriba el nombre de la "demostración" de DataFrame real con el ".ILOC "y especifique la ubicación del índice" [0, 1] = 3 "que ubicará el primer valor de la columna" Age "en el marcado de datos real y lo cambiará a" 3 ". Nuevamente invocamos el método "print ()" para mostrar la "demostración" de DataFrame real con cambios y la "copia profunda" de la "demo_dcopy" de datos real para ver si los cambios se reflejan o no.

La salida en el terminal nos muestra dos marcos de datos después de modificar un valor en el marco de datos real. Puede observar que la columna de DataFrame real "Age" tiene su primer valor cambiado de "25" a "3". Mientras que la "copia profunda" del marco de datos real con modificación no refleja cambios, lo que significa que los cambios realizados en el marco de datos real no alteran la "copia profunda" de ese marco de datos.

Ahora examinaremos qué sucede si construimos una "copia superficial" del marco de datos inicial.

Para esta ilustración, utilizamos el marcado de datos creado anteriormente. Ahora debemos hacer una copia superficial del marco de datos real después de imprimirlo. Utilizamos los pandas "DataFrame.Método de copy () "nuevamente de la misma manera que lo usamos en el ejemplo de" copia profunda "anterior con una excepción. Aquí, cambiamos el valor de la propiedad "profunda" a "falso" para crear una "copia superficial" del marco de datos real. Entonces, lo escribiremos "Demo.copia (profundo = falso) " . Hemos creado una variable "demo_scopy" para almacenar el resultado de llamar al ".Método de copy () "que será una" copia superficial "del marcado de datos real. Luego, utilizamos el método "print ()" para mostrar el texto "Copia superficial de DataFrame real:" y para exhibir el contenido almacenado en la variable "Demo_Scopy".

La salida muestra 2 marcos de datos. El primero es el marco de datos real, mientras que el otro es su "copia superficial". Podemos ver que todo, desde el marco de datos real, se copia hasta la "copia superficial" de la misma.

Ahora exploramos lo que sucedería con la "copia superficial" si hacemos algunas modificaciones en el marco de datos real. Para esto, utilizamos el "marco de datos.propiedad de ILOC ". Aquí queremos que la propiedad "ILOC" acceda al índice "3" de la columna "Age" en el marco de datos real y lo cambie a "-5". Luego, la función "print ()" se invoca para mostrar el texto "marco de datos real después de la modificación:" y también para mostrar la "demostración" de DataFrame real real. Nuevamente, se llama al método "print ()" para mostrar el texto "Copia superficial de DataFrame después de la modificación:" y el contenido de la variable "Demo_Scopy".

La salida muestra el marco de datos real con un valor cambiado "-5" donde el número de índice fue "3". Una vez que hayamos realizado los cambios en la "demostración" real de DataFrame, mostramos su "copia superficial" que muestra los mismos cambios que hemos realizado en el DataFrame real. Esto significa que cualquier cambio realizado en el marco de datos real también se reflejará en su "copia superficial".

Conclusión

Este tutorial es una guía para que comprenda el concepto y la idea de hacer una copia de un marco de datos. Te hemos presentado a los pandas "DataFrame.método copy () ". También le explicamos los dos enfoques diferentes para copiar un marco de datos: copia profunda y copia superficial.