Pandas dataframe loc

Pandas dataframe loc
Un formato de datos tabulares bidimensionales y potencialmente mixtos con ejes etiquetados se denomina "marco de datos de pandas". Las etiquetas de fila y campo se alinean con las operaciones aritméticas. La principal estructura de datos de los pandas está representada por esto. Para acceder a un conjunto de filas y columnas por índices o una matriz booleana, utilizamos el marco de datos de Pandas.propiedad loc. Siempre que deseemos acceder a cualquier fila o cualquier columna o múltiples filas y columnas, utilizamos el "DataFrame.PROPIEDAD LOC () ". También podemos acceder solo a un valor de la celda determinando la etiqueta o índice de la fila y la columna en este "marco de datos.método loc () ". Esta guía utiliza el "marco de datos.Método loc () "y accederá a la fila, cualquier columna o cualquier valor de celda con este método.

Sintaxis:

# Marco de datos.loc

Ejemplo 1:

A medida que realizamos el código PANDAS, primero importamos la función Pandas como "PD" en la aplicación "Spyder". Obtenemos la función o los métodos de pandas que necesitamos utilizando "PD" en lugar de "Pandas". Creamos un marco de datos aquí, que es el "boys_df". El "PD" se utiliza aquí porque el marco de datos es el método de "Pandas". Ponemos el nombre de la columna como el encabezado de esa columna y colocamos los valores dentro de todas las columnas.

Aquí, la primera columna de "Boys_DF" es "B_Height" donde insertamos la altura de los chicos. Estas alturas son "5.5, 6.0, 5.7, 5.8, 5.4, 6 y 5.9 ". La segunda columna del "boys_df" es "b_name" que contiene los nombres de los niños. Los nombres de los niños que insertamos aquí son "Sam, Rishi, Alexander, Robin, Thomas, Samuel y Taylor". La siguiente columna que tenemos en el "boys_df" es "b_age" que contiene las edades de los niños: "19, 25, 27, 18, 21, 22 y 28". Agregamos tres columnas en el marco de datos "boys_df".

También establecemos los valores de índice de las filas de los "boys_df". Esos valores de índice son "R#1, R#2, R#3, R#4, R#5, R#6 y R#7". Estos valores aparecen como el índice de cada fila porque establecemos esos valores como "boys_df.índice". Ahora, mostramos este "boys_df" en la consola. Usamos la función "print ()" aquí. No aplicamos el marco de datos.Método LOC todavía, por lo que todo el marco de datos se muestra en la consola Sypder.


Cuando presionamos el botón "Shift+ Enter", la salida que obtenemos se muestra aquí. Todas las columnas y filas del marco de datos aparecen en la salida mientras imprimimos todo el marco de datos "boys_df" aquí. Ahora, aplicamos el marco de datos.Método LOC para este "Boys_DF" que sigue:


Acabamos de poner el nombre del DataFrame y el método LOC como "Boys_DF.loc ". Accedemos solo a un valor de los boys_df. Mencionamos el valor de índice de la fila y el nombre de la columna cuyo valor queremos obtener. Colocamos el "R#2", que es el valor de índice de la fila y "b_name" como el nombre de la columna. Entonces, se accede al valor que aparece en esta celda. Almacenamos este valor en "Boy" e imprimimos este valor en la consola.


El valor aparece en la celda cuyo índice de fila es "R#2". El nombre de la columna "b_name" se muestra en la pantalla de la consola. Obtenemos este valor "rishi" con la ayuda del "marco de datos.Método LOC ".

Ejemplo 2:

En nuestro segundo ejemplo, después de importar los métodos "Pandas" como "PD", hacemos un marco de datos mientras ponemos el "PD.Marco de datos". Este marco de datos se llama "customer_df". Contiene las columnas distintas que son "cust_name, cust_location, product_id y dic_per". Todos estos son los nombres de cada columna que creamos en este marco de datos. Ponemos los nombres de los clientes en la columna "Cust_name" que son "Joseph, Jacob, Edward, Ronica, Ryan, Simon, Nick, Patrick y John". Agregamos la ubicación de cada cliente que son "Delhi, Banglore, Pune, Delhi, Baljiam, Birmingham, México, Canadá y Nueva York" en la columna "Cust_location".

Luego viene la columna "Product_ID" que contiene la ID de los productos como "B112, B1213, B2214, B1255, B1116, B797, B7620, B3490 y B2912". La última columna que tenemos en el "customer_df" es "dis_per", donde insertamos el porcentaje del precio de descuento que son "2%, 3%, 10%, 5%, 4%, 1%, 7%, 8%, y 2%". DataFrame se completa. Establecemos el índice de fila inicializando la variable "index_" con los valores de índice. Estos valores varían de "R1 a R9" como se muestra.

Ahora, agregue esos índices a DataFrame colocando el "Customer_DF.Índice ”a continuación. Después de esto, muestre el "Customer_DF". Estos índices se insertan en ese marco de datos. Ahora, necesitamos acceder solo a dos columnas de este marco de datos. Para esto, utilizamos el método "Loc" y colocamos los nombres de ambas columnas a las que queremos acceder desde este "Customer_DF". Las columnas a las que accedemos aquí son "cust_name y dis_per". Almacene esas dos columnas en la variable "Cliente". Mostrar solo las columnas que obtenemos aplicando el método "LOC".


Hay cuatro columnas en el marco de datos como se muestra en la siguiente ilustración. Accedemos a dos columnas de este marcado de datos que también se muestra a continuación este marcado de datos. Accedemos a esas columnas con la ayuda del método "loc".

Ejemplo 3:

Aquí, hacemos la lista anidada llamada "Account_holder_List". Contiene el "ah_country" que tiene el nombre del país. El "Account_holder" contiene los nombres de los titulares de la cuenta que son "Callahan, Finchley, Farnham, Fuller, Bromley, Coghill y Fuller". El "Account_No" contiene el número de cuenta de los titulares de la cuenta que son "253448, 120849, 272450, 234525, 294439 y 201501".

Luego, agregamos el "miembro desde" donde agregamos el mes y el año de los miembros como "junio de 2020, julio de 2021, mayo de 2022, agosto de 2022, enero de 2022, mayo de 2022, diciembre de 2021". Después de esto, creamos la columna "New_amount" e insertamos las cantidades que son "$ 180, $ 260, $ 190, $ 550, $ 450, $ 320 y $ 500". También agregamos el índice como "R_1, R_2, R_3, R_4, R_5, R_6 y R_7". Ahora, convertimos el "Account_holder_List" en "Account_holder_DF" utilizando el método Pandas. Ajuste los índices de fila a este "Account_holder_DF".

Renderizamos el "Account_holder_DF". Después de esto, accedemos a las filas mencionando el rango de las filas. Queremos obtener cuatro filas que van desde "R_2: R_5". Colocamos este rango en el método "loc". Accede a las filas "R_2, R_3, R_4 y R_5". Renderizarlos en la consola mientras ponemos este método en la declaración de impresión.


Todo el marco de datos contiene las filas de "R_1" a "R_7". Como puede ver, accede solo a cuatro filas debajo de este marco de datos cuyo rango se mencionan en el método "LOC". También hace que esas filas aquí en la consola. Igual que esto, también podemos acceder a las columnas mencionando el rango de las columnas en el método "LOC".

Conclusión

Esta guía está escrita para usted para que aprenda cómo funciona este método "loc" y cómo utilizar este método "loc" en pandas. Explicamos este método "loc" en detalle y proporcionamos una demostración práctica del método "loc" utilizando este método en nuestro código pandas. Mostramos la salida junto con el script de código. Discutimos que el método "loc" nos ayuda a acceder a la fila o columna o cualquier valor. Esperamos que esta guía sea fácil de aprender y comprender ya que todos los conceptos y códigos se explican aquí detalle.