PostgreSQL Crear histograma utilizando datos

PostgreSQL Crear histograma utilizando datos

A lo largo del procesamiento y el análisis de datos, los histogramas lo admiten para representar la distribución de frecuencia y obtener información fácilmente. Veremos algunos métodos varios para obtener la distribución de frecuencia en PostgreSQL. Para construir un histograma en PostgreSQL, puede usar una variedad de comandos de histograma PostgreSQL. Explicaremos cada uno por separado.

Inicialmente, asegúrese de tener shell de línea de comandos PostgreSQL y PGADmin4 instalados en su sistema informático. Ahora, abra el shell de línea de comandos PostgreSQL para comenzar a trabajar en histogramas. Inmediatamente le pedirá que ingrese el nombre del servidor en el que desea trabajar. Por defecto, se ha seleccionado el servidor 'localhost'. Si no ingresa uno mientras salta a la siguiente opción, continuará con el valor predeterminado. Después de eso, le pedirá que ingrese el nombre de la base de datos, el número de puerto y el nombre de usuario para que funcione. Si no proporciona uno, continuará con el predeterminado. Como puede ver desde la imagen que se adjunta a continuación, trabajaremos en la base de datos 'Test'. Por fin, ingrese su contraseña para el usuario en particular y prepárese.

Ejemplo 01:

Debemos tener algunas tablas y datos en nuestra base de datos para trabajar. Por lo tanto, hemos estado creando una tabla 'producto' en la base de datos 'prueba' para guardar los registros de diferentes ventas de productos. Esta tabla ocupa dos columnas. Uno es 'Order_Date' para guardar la fecha en que se ha realizado el pedido, y el otro es 'P_Sold' para guardar el número total de ventas en una fecha en particular. Pruebe la consulta a continuación en su cáscara de comando para crear esta tabla.

>> Crear producto de tabla (fecha de orden_date, p_sold int);

En este momento, la mesa está vacía, por lo que tenemos que agregarle algunos registros. Entonces, intente el siguiente comando insertar en el shell para hacerlo.

>> Insertar en los valores de productos ('2021-03-01', 1250), ('2021-04-02', 555), ('2021-06-03', 500), ('2021-05-04' , 1000), ('2021-10-05', 890), ('2021-12-10', 1000), ('2021-01-06', 345), ('2021-11-07', 467 ), ('2021-02-08', 1250), ('2021-07-09', 789);

Ahora puede verificar que la tabla tiene datos utilizando el comando SELECT como se cita a continuación.

>> seleccionar * del producto;

Uso de piso y contenedor:

Si le gusta los contenedores de histograma PostgreSQL para proporcionar períodos similares (10-20, 20-30, 30-40, etc.), ejecute el comando sql a continuación. Estimamos el número de contenedor de la declaración siguiente dividiendo el valor de venta por un tamaño de contenedor de histograma, 10.

Este enfoque tiene el beneficio de cambiar dinámicamente los contenedores a medida que los datos se agregan, eliminan o modifican. También agrega contenedores adicionales para nuevos datos y/o eliminación de contenedores si su recuento alcanza cero. Como resultado, puede generar histogramas de manera eficiente en PostgreSQL.

Piso de cambio (P_Sold/10)*10 con piso (P_Sold/100)*100 para aumentar el tamaño del contenedor hasta 100.

Usando la cláusula Where:

Construirá una distribución de frecuencia utilizando la declaración de casos mientras comprende los contenedores de histograma que se generarán o cómo varían los tamaños de contenedor de histograma. Para PostgreSQL, a continuación hay otra declaración de histograma:

>> seleccione '100-300' como Price_Between, Count (P_Sold) como recuento desde el producto donde p_sold entre 100 y 300 unión (seleccione '300-600' como precio_between, cuenta (p_sold) como cuente desde el producto donde p_sold entre 300 y 600 ) Unión (seleccione '600-900' como Price_Between, Count (P_Sold) como recuento desde el producto donde p_sold entre 600 y 900) Union (seleccione '900-1300' como Price_Between, Count (p_sold) como recuento desde el producto donde p_sold entre 900 entre 900 Y 1300);

Y la salida muestra la distribución de frecuencia de histograma para los valores de rango total de la columna 'p_sold' y el número de conteo. Los precios varían de 300-600 y 900-1300 tienen un recuento total de 4 por separado. El rango de venta de 600-900 obtuvo 2 recuentos, mientras que el rango 100-300 obtuvo 0 recuentos de ventas.

Ejemplo 02:

Consideremos otro ejemplo para ilustrar histogramas en PostgreSQL. Hemos creado una tabla 'estudiante' utilizando el comando citado a continuación en el shell. Esta tabla almacenará la información sobre los estudiantes y el recuento de números de fallas que tienen.

>> Crear estudiante de tabla (std_id int, fail_count int);

La tabla debe tener algunos datos. Por lo tanto, hemos ejecutado el comando Insertar en el comando para agregar datos en la tabla 'estudiante' como:

>> Insertar en los valores del estudiante (111, 30), (112, 60), (113, 90), (114, 3), (115, 120), (116, 150), (117, 180), (118 , 210), (119, 5), (120, 300), (121, 380), (122, 470), (123, 530), (124, 9), (125, 550), (126, 50 ), (127, 40), (128, 8);

Ahora, la tabla se ha llenado con una enorme cantidad de datos según la salida que se muestra. Tiene valores aleatorios para std_id y el fail_count de los estudiantes.

>> seleccionar * del estudiante;

Cuando intente ejecutar una consulta simple para recolectar los recuentos totales de fallas que tiene un estudiante, entonces tendrá la salida de abajo establecida. La salida solo muestra el número separado de recuentos de fallas de cada estudiante una vez del método 'Count' utilizado en la columna 'STD_ID'. Esto no parece muy satisfactorio.

>> seleccione Fail_Count, Count (STD_ID) del grupo de estudiantes por 1 orden por 1;

Usaremos el método del piso nuevamente en este caso durante períodos o rangos similares. Entonces, ejecute la consulta establecida en el shell de comando. La consulta divide los estudiantes 'Fail_Count' por 100.00 y luego aplica la función del piso para crear un contenedor de tamaño 100. Luego resume el número total de estudiantes que residen en este rango particular.

Conclusión:

Podemos generar un histograma con PostgreSQL utilizando cualquiera de las técnicas mencionadas anteriormente, dependiendo de los requisitos. Puede alterar los cubos de histograma a cada rango que desee; No se requieren intervalos uniformes. A lo largo de este tutorial, tratamos de explicar los mejores ejemplos para borrar su concepto con respecto a la creación de histogramas en PostgreSQL. Espero que, al seguir cualquiera de estos ejemplos, puede crear convenientemente un histograma para sus datos en PostgreSQL.