[Linux] Question d'encodage

jmt jmt@::1
Dim 27 Mai 16:15:27 CEST 2007


On Sunday 27 May 2007 15:31, Thomas Linard wrote:
> Bonjour,
> 
> Le 2007-05-27 14:52, jmt a écrit :
> > J'ai un fichier html, avec l'indication :
> > <meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
> > mais rien à faire pour le convertir en UTF-8 avec iconv.
> > 
> > Quand je le visualise avec un éditeur binaire, les caractères supérieurs à 
> > ascii-7 sont représentés par trois octets, ce qui explique mes tentatives 
> > infructueuses de conversion :
> > iconv --from CP --to UTF-8 <fichier> 
> > qui me retourne par exemple un mot dont je m'attends à ce qu'il 
> > s'écrive "général" par g�n�ral
> > 
> > Des pistes ?
> 
> 3 octets ? Déjà ce n'est pas le CP 1252 qui a été utilisé (codage à un 
> octet). Il ne serait pas déjà en UTF-8 par hasard ?

J'y ai pensé, mais mon éditeur de texte m'ouvre les fichiers en UTF-8 par 
défaut, et là, il me met des petits carrés.

Je m'arrache les cheveux ...

jmt

-- 

--------------------------------------
Informatique technique et scientifique
       http://www.dxdydz.net

         Jean-Marie Thomas


        mailto:jmt@::1

        +33 (0)3 88 32 93 64
	+33 (0)6 37 18 86 63


Plus d'informations sur la liste de diffusion linux