[Linux] Question d'encodage

Thomas Linard thomas@::1
Dim 27 Mai 15:31:43 CEST 2007


Bonjour,

Le 2007-05-27 14:52, jmt a écrit :
> J'ai un fichier html, avec l'indication :
> <meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
> mais rien à faire pour le convertir en UTF-8 avec iconv.
> 
> Quand je le visualise avec un éditeur binaire, les caractères supérieurs à 
> ascii-7 sont représentés par trois octets, ce qui explique mes tentatives 
> infructueuses de conversion :
> iconv --from CP --to UTF-8 <fichier> 
> qui me retourne par exemple un mot dont je m'attends à ce qu'il 
> s'écrive "général" par g�n�ral
> 
> Des pistes ?

3 octets ? Déjà ce n'est pas le CP 1252 qui a été utilisé (codage à un 
octet). Il ne serait pas déjà en UTF-8 par hasard ?

-- 
Thomas Linard
http://www.linard.name/


Plus d'informations sur la liste de diffusion linux