Caracteres de Dos Bytes
Caracteres de Dos Bytes
Caracteres de Dos Bytes
335
F. EL FORMATO DE STRINGS UTF-8.
El formato utilizado por la máquina virtual Java (JVM Java Virtual Machine)
internamente para representar cadenas de caracteres (Strings) es una pequeña
variación de la codificación UTF-8. Ésta permite la codificación de los caracteres
coincidentes con el código ASCII mediante un solo byte, y a la vez, permitir la
codificación de caracteres utilizando hasta 16 bits.
F.1 Caracteres de un solo byte.
0 bits 0-6
Este tipo de carácter del String se detecta porque tiene el bit de mayor orden del
byte a cero. Los 7 bits menos significativos codifican el carácter representado.
Los caracteres representados por un solo byte son los comprendidos en el rango
‘\u0001’ … ‘\u007f’, que se corresponden con los pertenecientes al código
ASCII de 7 bits:
ı"#$%&'()*+,-
./0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`ab
cdefghijklmnopqrstuvwxyz{|}~•