Unicode en C

Unicode es un conjunto de personajes no ingleses que pueden ser personajes de un lenguaje diferente como el árabe, el hebreo, etc., o pueden ser personajes especiales como emojis y caras sonrientes. La codificación del personaje fue para un lanzamiento cuando diferentes personas de diferentes regiones del mundo comenzaron a codificar en sus idiomas locales. Debido a eso, todo el proceso de comunicación por medio de las computadoras se vio afectado. Entonces, para manejar este problema, el consorcio Unicode entró en la imagen que era un grupo de personas diferentes de diferentes regiones y diferentes compañías cuya tarea principal era codificar a todos los personajes que existen en el mundo de tal manera que no quedan disputas.

Unicode comenzó con un conjunto de caracteres de dos bytes fijo, pero más tarde, se cambió. Unicode consta de más de cien mil caracteres y más de cien idiomas para manejar la gran multitud de idiomas diferentes, incluidos personajes complejos como emojis, modificadores y otros personajes desconocidos.

Si intentamos imprimir un personaje especial como un emoji en el lenguaje C, el compilador no dará el resultado de la impresión de ese emoji. Más bien, devuelve un código para ese emoji que no será útil para el usuario. Para resolver este asunto, practicaremos el proceso unicode en c.

Sintaxis:

Para imprimir un unicode en el lenguaje C, utilizamos una función nombrada_setMode en la que definimos los bits de carácter. En la siguiente figura, estamos dando U16 como parámetro, por lo que imprime solo los caracteres con límite de 16 bits. Por defecto, el lenguaje C solo imprime caracteres de 8 bits.

Usamos el wPrintf en lugar de la función printf para imprimir la línea. Y pondremos a L al comienzo de la declaración que queremos imprimir. Además de la siguiente sintaxis, también tenemos que agregar dos incluye que son:

#incluir
#incluir

Nota: Unicode no es una función o método en C, por lo que no hay una sintaxis específica para él. La sintaxis adjunta aquí es solo como referencia.

Ejemplo 1:

Conseguiremos una mejor comprensión del tema siguiendo este ejemplo. En la figura, puede entender que importamos dos bibliotecas adicionales en nuestro código. Uno es y el otro es . Nos permite crear los nuevos tipos de datos para almacenar los caracteres especiales en ellos. En el lenguaje C, el encabezado se utiliza para definir la configuración basada en la ubicación, por ejemplo, símbolos como monedas y diferentes formatos de fecha.

En el bloque de código de función principal, llamamos a una función setLocale (). Esta es la función del encabezado. En la función setLocale (), pasamos un parámetro de lc_ctype. Esta función tiene muchos parámetros como lc_all que establece todo. Lc_ctype afecta todas las funciones de los personajes. Define los atributos del personaje como la conversión de casos y las clasificaciones de caracteres.

Después de eso, declaramos dos variables del tipo de datos wchar_t: Star1 y Star2. Pasamos el unicode para ese emoji a nuestras variables. Después de eso, escribimos los valores de nuestras variables. Discutimos anteriormente que usamos el WPRINTF para la impresión Unicode. También podemos ver en el siguiente código que utilizamos WPRINTF en lugar de printf.

#incluir
#incluir
#incluir
int main ()

setLocale (lc_ctype, "");
wchar_t star1 = 0x2606;
wchar_t star2 = 0x2605;
wprintf (L "Black Star: %lc \ n", Star1);
wprintf (L "White Star: %lc \ n", Star2);

Después de la ejecución exitosa de nuestro código C, obtenemos la siguiente salida. Podemos ver que en lugar de imprimir los valores que pasamos a nuestras constantes, el sistema imprimió dos estrellas. Esto se debe a que pasamos el Unicode para estas estrellas a nuestras variables. Luego, debido a la función setLocale () y su parámetro LC_CType, el sistema marcó el carácter con ese código específico y encontró una estrella en blanco y negro con ese valor. También utilizamos el WPRINTF, por lo que el sistema imprimió el personaje contra el valor aprobado de Black Star y White Star.

Ejemplo 2:

En el ejemplo anterior, utilizamos un método complejo para permitirle comprender cómo funciona la unicodificación. En este ejemplo, realizaremos una tarea para imprimir un unicode con la ayuda de la menor cantidad de código posible. Dependiendo del sistema operativo de su computadora o máquina, también puede imprimir los caracteres Unicode simplemente utilizando la función printf. Pero para ese propósito, tendrá que pasar un valor para hacerle saber al compilador que tiene que imprimir un carácter unicode.

En este ejemplo, intentamos imprimir una cara sonriente que es un personaje no inglés. Pasamos el valor unicode de ese emoji a nuestro código. En el siguiente código, simplemente imprimimos un mensaje "Hola" con un Smiley al final de la declaración. El código para Happy Smiley es "0001f600". Entonces, lo pasamos comenzando con \ u como cómo se pasa la impresión de una cadena para que el sistema comprenda que tiene que imprimir una cadena.

Una cosa que podría haber notado es que no hemos usado los encabezados que usamos en el ejemplo anterior. Esto se debe a que no estamos utilizando esas funciones y técnicas para dejar que el sistema lea los caracteres Unicode.

#incluir
int main ()

printf ("Hola: \ u0001f600 \ n");
regresar 0;

La salida de nuestro código después de la compilación es la siguiente. El sistema imprime el mensaje de caracteres tal como está, pero primero lee el signo \ u y comprende que el siguiente valor que se le pasa es un unicode. Entonces, el sistema comprenderá que tiene que convertir el siguiente código en su respectivo emoji. Después de convertir el valor en los caracteres unicode, el sistema mostrará la cara sonriente como una salida.

Conclusión

Discutimos sobre la unicodificación en este artículo. Explicamos qué es un personaje unicode, por qué se usa y cuáles fueron las razones por las que se introdujo el estándar de unicodificación. Discutimos cómo operar con los caracteres Unicode en el lenguaje C, ya que el lenguaje C proporciona soporte para solo unos 256 caracteres. En los ejemplos dados, explicamos cómo podemos codificar un conjunto de valores en un emoji o carácter unicode. Por toda la explicación que se dieron anteriormente, podemos decir que la unicodificación es un enfoque muy útil para abordar el puente de comunicación. Con la ayuda de desarrolladores y programadores de Unicode de todos los rincones del mundo, podemos codificar y escribir los programas en sus idiomas. Además de eso, todas las aplicaciones se pueden desarrollar en diferentes idiomas, lo que les ayuda a ser más comprensibles y legibles para los usuarios. La unicodificación ayuda a cambiar los idiomas de la interfaz de usuario no solo de las aplicaciones sino también de todo el sistema operativo. Entonces, la unicodificación no es una función o biblioteca específica en el idioma C. Es un estándar de codificación internacional que se puede aplicar en cualquier lenguaje de programación.

Pitón

Pandas read_csv multiprocesamiento

Para mejorar la velocidad de carga de datos, incluidos sus beneficios y limitaciones el PD.read_csv ...

Pilar Melgar

Pitón

Matplotlib 2d histograma

En Python, el PLT.Hist2d () La función del módulo Pyplot en la biblioteca matplotlib se usa para tra...

Beatriz Enríquez

Comandos de Linux

Cómo instalar y habilitar la autenticación multifactor SSH para sistemas Linux

Tutorial sobre cómo instalar y habilitar MFA para el acceso SSH en los sistemas Linux configurando u...

Homero Ontiveros