Cuando se pulsa un carácter: una letra, un número o un símbolo especial (como &, %) en su teclado, se almacena en la memoria principal de una computadora una secuencia de bits que es diferente en cada caso. El código o es- quema más utilizado es el código ASCII (American Standard Code for Information Interchange). El código ASCII (apén- dice B) consta de 128 caracteres (27 = 128, 0 a 127), de modo que la posición del primer carácter es 0, la posición del segundo carácter es 1 y así sucesivamente. Por ejemplo, el carácter A es el carácter 66 y de posición 65; el carác- ter B es el carácter 67 y de posición 66 (tabla 1.3). En el interior de las computadoras cada carácter se representa por una secuencia de ocho bits, es decir un byte. La representación binaria del código A es 01000001 y el carácter 4 es 00110100.
Otro conjunto de caracteres muy utilizado en computadoras es el código Unicode que consta de 65.536 caracteres, en lugar de los 128 caracteres del código ASCII básico. Java utiliza el código Unicode en el que cada carácter se representa por 2 bytes, 16 bits, en lugar de 1 byte en el código ASCII. La gran ventaja de Unicode es que permite representar caracteres de numerosos idiomas internacionales como el chino, indio, ruso, etcétera.
QR de este contenido
Descarga esta imagen en: Aquí
