[Linux] Question d'encodage
Thomas Linard
thomas@::1
Dim 27 Mai 15:31:43 CEST 2007
Bonjour,
Le 2007-05-27 14:52, jmt a écrit :
> J'ai un fichier html, avec l'indication :
> <meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
> mais rien à faire pour le convertir en UTF-8 avec iconv.
>
> Quand je le visualise avec un éditeur binaire, les caractères supérieurs à
> ascii-7 sont représentés par trois octets, ce qui explique mes tentatives
> infructueuses de conversion :
> iconv --from CP --to UTF-8 <fichier>
> qui me retourne par exemple un mot dont je m'attends à ce qu'il
> s'écrive "général" par g�n�ral
>
> Des pistes ?
3 octets ? Déjà ce n'est pas le CP 1252 qui a été utilisé (codage à un
octet). Il ne serait pas déjà en UTF-8 par hasard ?
--
Thomas Linard
http://www.linard.name/
Plus d'informations sur la liste de diffusion linux