quinta-feira, 27 de janeiro de 2011

codificação de caracteres no Linux

recentemente mudei de Slackware 13.0 para Ubuntu (XUbuntu, na verdade) versão 10.10; acontece que alguns arquivos viraram uma bagunça, os acentuados ficaram todos esquisitos, substituidos por caracteres estranhos.

acho que pesquisei umas 150 páginas na 'net, até que consegui achar a resposta que resolveu:

é PARTE deste tutorial aqui, que é pro Fedora, mas o básico é:

a) descubra QUAL a codificação do arquivo texto que está zoneado:

$ file arquivo.txt
$file /tmp/signatures.sig
/tmp/signatures.sig: ISO-8859 English text, with very long lines

(na verdade é ISO-8859-1)

depois, altere a codificação com o "iconv":

iconv -f ISO-8859-1 -t UTF-8 /tmp/signatures.sig >
Downloads/signatures.sig


(tudo em uma linha só)
no meu caso, estranhamente a codificação aparecia como ISO-8859,
embora eu sempre tenha utilizado EXCLUSIVAMENTE O UTF-8
mas.. o melhor mesmo é o que vi aqui, um trabalho completinho pra fazer isso sem dor.