UTF-8 (UCS Transformation Format 8) é a codificação de caracteres mais comum da World Wide Web. Cada caractere é representado por um a quatro bytes. UTF-8 é compatível com versões anteriores do ASCII e pode representar qualquer caractere Unicode padrão.
Por que existem tabelas de representação de caracteres como o ASCII e o UTF-8? Porque somente a placa de vídeo identifica e trata caracteres, as tabelas são utilizadas diretamente pelo teclado, monitor e impressora. Explicação: É preciso entender o conceito de representação de caracteres em um computador.
Clique no menu Arquivo e escolha a opção Salvar como... . Na janela de diálogo que surge na tela, observe, lá no final dela, um campo com o título "Codificação". Clique no botão ao lado desse título para abrir uma lista de opções, e escolha "UTF-8". Depois disso, clique no botão Salvar.
ASCII define 128 caracteres, que são mapeados para os números de 0 a 127. O Unicode define (menos que) 2 21 caracteres, que, da mesma forma, são mapeados para os números de 0 a 21 21 (embora nem todos os números estejam atribuídos no momento e alguns sejam reservados).
Cada caractere é codificado em um byte, mas ocupa somente 7 bits; o oitavo bit de cada byte era antigamente usado para verificação de paridade.
Se estiver no NetBeans:
Porque o ANSI usa apenas um byte (ou 8 bits), ele só consegue representar um máximo de 256 caracteres, o que não chega nem perto dos 1.
Existem três formas de declararmos o encode do arquivo: