Comando Linux Uniq

Comando Linux Uniq
Una aplicación de texto de Linux llamada UNIQ busca las líneas duplicadas en un archivo. En los términos más simples, Uniq es una herramienta que ayuda tanto a identificar como a eliminar todas las líneas duplicadas de un archivo. El comando UNIQ nos da acceso a varias banderas distintas que incluyen "-c", "-u", "-d", "-d" y "-i", entre otras, para realizar varias operaciones. Al emplear estas opciones de comando uniq, podemos mostrar el número de palabras en cualquier línea, imprimir solo las líneas que se repiten o mostrar el contenido único del archivo. Hablaremos de algunas de las banderas de comando uniq en este artículo.

Ejemplo: utilizando el comando Linux Uniq

En este ejemplo, usamos el comando "UNIQ" del sistema operativo Linux. Este comando se utiliza para condensar o resumir la información. El comando "uniq" se usa para localizar las líneas repetitivas que se siguen entre sí. Comencemos la ejecución del comando uniq. Sin embargo, antes de hacerlo en la terminal, primero debemos crear un archivo de texto. Dado que el archivo de texto ya existe en nuestro escritorio, lo usaremos. El "archivo de texto.txt "es el nombre del archivo que ya está en nuestro escritorio. La extensión del archivo de texto debe ser ".TXT".

El comando "CAT", que a menudo se usa en Linux, se usa para abrir este archivo de texto en el terminal que contiene algunos datos. Se extraen los datos del archivo y su contenido se emite. Facilita la fusión, la lectura y la creación de los archivos. Por lo tanto, escribimos "CAT" primero, seguido del nombre del archivo que es "TEXT -FILE.TXT".

Omar@Omar-VirtualBox: ~/Desktop $ Cat TextFile.TXT

Ahora, como puede ver, cuando ejecutamos este comando, los datos del archivo existente actualmente en el archivo de texto llamado "archivo de texto.txt "se muestra en la ventana del terminal. Este archivo tiene nueve líneas. Los dos primeros de los cuales son idénticos y llevan la información de "Alex le gusta codificar con varias tecnologías". La siguiente línea está vacía, y las líneas cuarta y quinta incluyen la misma información que incluye "trabajar con lenguajes de secuencias de comandos es mi interés". Las dos últimas líneas tienen dos líneas separadas que son "algunos de los lenguajes de programación son" Java "," OOP "," PHP "," C ++ "," Python ", etc. y “El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación."Ahora, es evidente que las dos primeras líneas son idénticas y repetidas, como las dos siguientes. Mientras que las dos últimas líneas tienen contenido diferente, usamos el comando "UNIQ" para eliminar las líneas duplicadas del archivo.

Alex le gusta codificar con varias tecnologías.
Alex le gusta codificar con varias tecnologías.
Trabajar con idiomas de secuencias de comandos es mi interés.
Trabajar con idiomas de secuencias de comandos es mi interés.
Algunos de los lenguajes de programación son Java, OOP, PHP, C ++, Python, etc.
El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Ahora, usemos solo el comando uniq para eliminar la línea duplicada del archivo. Para hacer esto, ejecute el siguiente comando en el terminal. Luego, ingrese la palabra clave "uniq" seguida del "archivo de texto.Nombre del archivo "TXT".

Omar@Omar-VirtualBox: ~/Desktop $ UNIQ TextFile.TXT

Como se ve en lo siguiente, cuando ejecutamos este comando, no muestra las líneas duplicadas en la salida en la ventana del terminal. Hay nueve líneas en el archivo original. Pero después de aplicar el comando uniq, solo hay seis. Esto se debe a que la primera línea, "Alex le gusta codificar con varias tecnologías", aparece dos veces en el archivo original, pero solo una vez después de aplicar el comando uniq. La segunda línea aparece dos veces en el archivo original, pero solo una vez después de aplicar el comando uniq. Las dos últimas líneas se presentan exactamente como son porque no se repiten en el archivo.

Alex le gusta codificar con varias tecnologías.
Trabajar con idiomas de secuencias de comandos es mi interés.
Algunos de los lenguajes de programación son Java, OOP, PHP, C ++, Python, etc.
El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Usando las opciones del comando uniq

El comando uniq nos ofrece algunas opciones diferentes como "-c", "-d", "-u", etc. para llevar a cabo las diversas tareas. Podemos contar el número de líneas repetidas que están contenidas en los archivos utilizando las opciones del comando uniq. Solo podemos mostrar las líneas repetidas de los archivos en la salida, etc. Utilicemos algunas de las siguientes banderas del comando uniq:

Contando el número de líneas con la bandera "-c"

El número de líneas en el archivo se cuenta utilizando el indicador "-c" de la función UNIQ. Cuenta las líneas repetidas, así como las líneas individuales y muestra la aparición de cada línea mostrando un número como prefijo con la línea. Para lograr esto, usamos el comando en el que primero ingresamos la palabra "uniq", luego la opción "-c" y luego el nombre del archivo, "Textfile.TXT".

Omar@Omar -VirtualBox: ~/Desktop $ uniq -c TextFile.TXT

La salida de este comando muestra la repetición de líneas mostrando el número como su prefijo. Por ejemplo, la línea "Alex le gusta codificar con varias tecnologías" aparece dos veces en el archivo. Entonces, el número "2" se muestra frente a él. Del mismo modo, la línea "trabajar con lenguajes de secuencia de comandos es mi interés" también aparece dos veces en el archivo. Las líneas restantes solo se usan una vez, y "1" se muestra como el prefijo.

2 Alex le gusta codificar con varias tecnologías.
1
2 Trabajar con idiomas de secuencias de comandos es mi interés.
1
1 Algunos de los lenguajes de programación son Java, OOP, PHP, C ++, Python, etc.
1
1 El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Usando el indicador "-d" para imprimir las líneas repetidas

En esta parte, las líneas de repetición en el archivo se muestran utilizando la opción "-d" del comando uniq. Para esto, usamos el comando en el que primero ingresamos la palabra "uniq", luego la opción "-d" y luego el "archivo de texto.nombre de archivo "txt".

Omar@Omar -VirtualBox: ~/Desktop $ Uniq -d TextFile.TXT

Solo las líneas que se repiten se presentan en la salida que sigue la ejecución de este comando. Las otras líneas, que solo se usan una vez, no se muestran.

Alex le gusta codificar con varias tecnologías.
Alex le gusta codificar con varias tecnologías.
Trabajar con idiomas de secuencias de comandos es mi interés.
Trabajar con idiomas de secuencias de comandos es mi interés.

Usando la bandera del comando uniq -u

La opción "-u" del comando uniq ahora se usa para imprimir el contenido único del archivo directamente utilizando esta opción. Muestra las líneas o contenido del archivo en la salida que solo se usa una vez. El texto repetido en el archivo no se muestra en la salida; se elimina. Solo se usa la bandera "-u" en lugar de la siguiente opción. De lo contrario, el comando es el mismo que se usa en el ejemplo anterior.

Omar@Omar -VirtualBox: ~/Desktop $ uniq -u TextFile.TXT

Cuando realizamos este comando, la salida es la siguiente. Se eliminan las líneas repetidas de los archivos y se revela el contenido único del archivo. Esta salida incluye las dos líneas que se muestran en la siguiente demostración; Ambas líneas se usan solo una vez en el archivo, por lo que aparecen.

Algunos de los lenguajes de programación son Java, OOP, PHP, C ++, Python, etc.
El lenguaje utilizado para crear programas de computadora se llama lenguaje de programación.

Conclusión

El comando Linux Uniq que se utiliza para eliminar el contenido duplicado de los archivos y solo lo muestra una vez en la salida utilizando la palabra clave "UNIQ" con el archivo de texto dado se cubre en este artículo. En los ejemplos dados, utilizamos las banderas de comando uniq que son "-c", "-u" y "-d". Estas banderas nos permitieron llevar a cabo las diversas operaciones con el comando uniq. En este artículo, demostramos repetidamente que una línea se repite prefijando la línea con un número. Además, examinamos cómo utilizar estos marcadores para imprimir solo las líneas repetidas y el contenido único.