Personaje establecido en HTML

Personaje establecido en HTML
Siempre que un usuario de una computadora llega a una tecla en el teclado, se genera un código de caracteres relevante para representar esa tecla de tecla. Estos códigos de caracteres forman un conjunto de caracteres que debe poder comunicarse con la computadora. El conjunto de caracteres HTML le permite cargar las páginas correctamente utilizando códigos de caracteres de símbolos/caracteres. En esta publicación, obtendrías los diversos conjuntos de personajes que se usan en HTML.

Personaje establecido en HTML

Hay numerosos conjuntos de personajes que se usaron en versiones anteriores de HTML. Aquí, discutiremos todo el conjunto de caracteres previamente y compatible actualmente compatible.

Conjunto de caracteres ASCII

El ASCII es un conjunto de caracteres de 7 bits que permite que 128 caracteres representen los términos del idioma inglés en formato de computadora comprensible. Algunas características de ASCII se describen a continuación:

- Los dígitos (0-9) y todas las 26 letras alfabéticas se pueden representar usando ASCII

- Todos los conjuntos de caracteres utilizados en HTML se basan en ASCII

La limitación principal del conjunto de caracteres ASCII es que admitió solo 128 caracteres que podrían soportar solo términos del idioma inglés (alfabetos), dígitos (0-9) y signos de puntuación. dependiente del idioma y limitado.

Set de caracteres ISO 8859-1

De las versiones recientes, HTML 4.0 se le ocurrió el ISO-8859-1 como su conjunto de caracteres predeterminado. El ISO 8859-1 es una extensión del conjunto de caracteres ASCII y representa los caracteres en código de 8 bits. Puede representar 256 caracteres que también lo convierten en un esquema de codificación dependiente del lenguaje. Un conjunto de caracteres se define en la metaetiqueta del documento HTML y el siguiente código ayudará a usar el ISO 8859-1 en su documento HTML:

Nota: Aunque HTML5 contiene un conjunto de caracteres UTF-8, también se puede usar con ISO-8859-1 usando la siguiente línea en la etiqueta de su cabeza.

Conjunto de caracteres UTF-8

El conjunto de caracteres Unicode comprende los valores decimales que representan los caracteres, símbolos y signos de puntuación. Estos valores decimales basados ​​en Unicode se convierten en formato comprensible de computadora utilizando UTF-8, UTF-16 o UTF-32. Sin embargo, se recomienda el UTF-8 para las páginas web, ya que cubre todos los caracteres/símbolos/signos de puntuación que se pueden usar en un documento HTML.

Las siguientes son las características sobresalientes de UTF-8

- El último conjunto de caracteres fue un valor predeterminado para HTML5.

- También se puede agregar a la versión html4.

- El UTF-8 funciona sobre la base de ASCII y los primeros 128 caracteres en UTF-8 son los mismos que a ASCII.

- Admite todos los símbolos, caracteres y signos de puntuación utilizados en todo el mundo

- Convierte los números/caracteres/símbolos/marcas de puntuación en uno a cuatro bytes

De la discusión anterior, la importancia de UTF-8 hizo un terreno sólido para los conjuntos de ASCII e ISO-8859-1-Character.

Nota: El unicode.Org proporciona todos los unicodos de los personajes, símbolos, emojis, signos de puntuación.

Cómo usar UTF-8 en HTML4

El HTML4 vino con ISO-889-1 como el conjunto de caracteres predeterminado. Sin embargo, puede agregar el conjunto UTF-8-Character en HTML4 usando la siguiente metaetaje.

Cómo usar ISO-8859-1 en HTML5

Como el conjunto de caracteres predeterminado de HTML5 es UTF-8 que supera a los conjuntos de caracteres más antiguos. Sin embargo, puede agregar el personaje ISO-8859-1 establecido en su documento HTML utilizando la siguiente línea en nuestra cabeza.

Conclusión

El conjunto de caracteres convierte los símbolos, los caracteres o cualquier corte de teclas en un formato legible por computadora. Este artículo proporciona una descripción general de los conjuntos de caracteres utilizados en HTML a partir de versiones anteriores hasta el último HTML5. El ASCII es el conjunto de personajes más antiguo con soporte limitado para personajes e idioma (solo idioma inglés). Más tarde, ASCII se extendió a 256 caracteres con soporte de 8 bits para construir un nuevo conjunto de caracteres llamado ISO-8859-1. El ISO-8859-1 es el conjunto de caracteres predeterminado para HTML4, pero ofrece un soporte limitado de caracteres (256). El UTF-8 cubre todas las deficiencias del ISO-8859-1 y, por lo tanto, UTF-8 fue un personaje predeterminado establecido en HTML5.