MongoDB encontrar duplicados

MongoDB encontrar duplicados
“¿Alguna vez ha oído hablar del concepto de duplicación de datos mientras trabaja en bases de datos?? Cuando un registro, cosa, persona o lugar tiene su copia exacta, se dice que esa copia es el duplicado del original. Mientras trabajamos en bases de datos tradicionales, utilizamos la cláusula WHERE para encontrar los duplicados dentro de los registros de la tabla, yo.mi., SQL, PostgreSQL. Por otro lado, MongoDB no le permite usar la cláusula Where para averiguar los duplicados insertados dentro de las colecciones de una base de datos específica.

Se le ocurrió la función agregada para descubrir los valores duplicados de la colección. Dentro de este artículo de hoy, discutiremos la inserción de registros duplicados dentro de las colecciones de Mongo DB y los mostraremos en el shell MongoDB utilizando el comando agregado de las colecciones. Comencemos con nuestro artículo de hoy mediante el uso de las actualizaciones de APT y las instrucciones de actualización dentro del shell terminal del Ubuntu 20.04 sistema. Para eso, debe iniciar sesión primero y abrir el shell mediante el uso de "Ctrl+Alt+T."Después de eso, puede probar las instrucciones de Below Shows en su shell y agregar la contraseña para que el usuario continúe el proceso de actualización."

Puede requerir su confirmación para continuar este proceso. Toque "Y" al preguntar: "¿Quieres continuar??". Después de eso, presione la tecla ENTER.

Puede tomar más o menos tiempo procesarse de acuerdo con la situación de su sistema.

Después de la actualización completa, obtendrá las últimas líneas de procesamiento de Below de Below.

Después de la actualización y la actualización exitosa del sistema, tenemos que abrir el shell MongoDB para insertar algunas colecciones y registros dentro de la base de datos. Entonces, hemos estado usando la consulta "Mongo" para hacerlo, como se muestra en la imagen. El caparazón se ha preparado con éxito.

Al usar la instrucción "DB" en el shell de MongoDB, hemos descubierto que la base de datos de "prueba" está disponible para nuestro uso.

Por lo tanto, hemos estado utilizando la base de datos de "prueba" para consultas adicionales y creando una recopilación dentro de ella. Para eso, intente la instrucción de "usar" seguida del nombre de una base de datos, yo.mi., "prueba."

Para agregar registros, necesitamos una colección en la base de datos de prueba. Por lo tanto, necesitamos crear una nueva colección. Para eso, tenemos que probar la instrucción "DB" junto con la función "CreateCollection ()" de MongoDB, seguida del nombre de una nueva colección dentro de su paréntesis, I.mi., Datos. La consulta fue exitosa y la colección se creó con éxito según el estado "OK: 1". Además, MongoDB, tendemos a utilizar la función find () precedida por el nombre de la colección para mostrar los registros de una colección específica. Por lo tanto, hemos probado la instrucción "db" seguida del nombre de la colección, yo.mi., Datos, y la función busca () para hacerlo. La colección "datos" está vacía en este momento. Por lo tanto, necesitamos agregar algunos registros a la colección.

Para insertar los registros dentro de la recopilación de datos de MongoDB, necesitamos probar la función Insert () dentro de la instrucción "DB" junto con los datos en forma de documentos, I.mi., formato de lista. Hemos estado utilizando un total de 4 columnas para los datos del documento de las colecciones, I.mi., _id, título, edad y precio. Hemos agregado un total de 5 registros para todas estas 4 columnas de recopilación de datos.

El registro se agregó con éxito según la salida anterior muestra el número de registros 5 para la opción "Ninserted". Después de esto, utilizaremos la función find () con la colección "datos" para buscar y mostrar todos los registros de esta colección. No estamos pasando ningún argumento a la paréntesis de una función find () para no restringir los registros de la recopilación. Todos los 5 registros para la recopilación de datos se han presentado en el shell de Mongo DB.

Como hemos estado tratando con el tema de encontrar los duplicados en las colecciones de MongoDB, debemos tener algunos registros duplicados en las colecciones. Por lo tanto, hemos estado insertando tres registros más dentro de la recopilación de datos para ser utilizados como duplicados de algunos de los registros ya insertados. Necesitamos actualizar la columna "_id" solo ya que la identificación de cualquier columna debe ser única en MongoDB como solíamos hacer en las bases de datos tradicionales. La misma función de inserción se ha utilizado hasta ahora con el nombre de la recopilación de "datos". Se han agregado los tres registros.

Ahora, cuando ejecuta la instrucción "DB" con el nombre de recopilación "Datos" seguido de la función Find () una vez más en el shell MongoDB, el total de 8 registros se mostrará en su pantalla. Podemos ver los valores duplicados para columnas distintas de "_id" en estos datos de recopilación.

Es hora de probar el método agregado () para que la recopilación de "datos" enumere los valores de columna específicos que se duplican en él. Debe usar la sintaxis de Below Shows de un comando agregado en MongoDB. La opción "$ Group" se usa para agregar todos los valores duplicados de una columna específica en una, mientras que la opción $ coincidencia se utilizará para descubrir que los grupos tienen más de 1 documento. Por otro lado, la opción "$ proyecto" se utilizará para especificar el formato de mostrar los registros duplicados. El primer campo de la opción "$ grupo" especificará el nombre de la columna en el que buscaremos duplicados. Se han encontrado un total de 3 registros duplicados para la columna "título" de una recopilación de datos. Después de esto, se probó la misma consulta para la columna de "edad" y obtuvo los 3 resultados nuevamente.

Conclusión

La explicación de los registros duplicados se ha dado en el párrafo introductorio, y hemos discutido la diferencia entre descubrir los duplicados de las bases de datos tradicionales y MongoDB. Para este propósito, hemos tratado de dar una ilustración sobre hacer una nueva colección dentro de MongoDB e insertar registros dentro de él. Además, hemos discutido el uso de la función agregada para descubrir la columna específica que contiene el valor duplicado dentro de las colecciones. Este artículo ha mostrado la clara diferencia para descubrir los duplicados para MongoDB como una comparación con cualquier otra base de datos.