En este breve artículo, discutiremos cómo calcular la diferencia entre dos fechas en Pandas.
Diferencia entre dos fechas en días
Podemos usar el objeto Timedelta para calcular la diferencia entre dos fechas en Pandas.
A continuación se muestra un ejemplo:
1 2 3 | importar pandas como PD date_1 = PD.to_datetime ('2022-01-01') date_2 = PD.to_datetime ('1990-01-01') |
En el ejemplo anterior, tenemos dos objetos de fecha y hora. Para calcular la diferencia entre los dos días en los días, podemos hacer lo siguiente:
1 2 | diff = PD.Timedelta (date_1 - date_2).días print (f "diff días") |
El código anterior calcula la diferencia entre las dos fechas y devuelve el resultado en días como se muestra:
1 | 11688 días |
Diferencia en meses
Para obtener la diferencia en meses, simplemente podemos dividir el resultado en 12 como se muestra:
1 2 | diff = PD.Timedelta (date_1 - date_2).días / 12 print (f "diff meses") |
Esto debería volver:
1 | 974.0 meses |
Otro método que podemos usar para determinar la diferencia entre dos fechas es la función TimedETLA64 en Numpy.
A continuación se muestra un ejemplo:
1 2 3 4 5 | importar numpy como np date_1 = PD.to_datetime ('2022-01-01 13:00:22') date_2 = PD.to_datetime ('1990-01-01 00:00:00') diff = date_1 - date_2 diff/np.Timedelta64 (1, 'd') |
En el ejemplo anterior, comenzamos importando Numpy. A continuación, tenemos dos objetos de la marca de tiempo Pandas.
Restamos las variables y usamos la función Timedelta64 para convertir el valor en días para calcular la diferencia.
El código anterior debería devolver:
1 | 11688.541921296297 |
Para convertir el valor en años, cambie el segundo parámetro de 'd' a 'y' como se muestra:
1 | 32.00214082779604 |
Conclusión
Este artículo ofrece dos ejemplos de cómo puede calcular la diferencia entre dos fechas usando pandas y numpy.