[Linux] Question d'encodage

Éric Bischoff ebischoff@::1
Mar 29 Mai 15:59:56 CEST 2007


Le Dimanche 27 Mai 2007 14:52, jmt a écrit :
> J'ai un fichier html, avec l'indication :
> <meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
> mais rien à faire pour le convertir en UTF-8 avec iconv.
>
> Quand je le visualise avec un éditeur binaire, les caractères supérieurs à
> ascii-7 sont représentés par trois octets,

C'est surprenant. winodws 1252 est un jeu de caractères sur un octet.

> ce qui explique mes tentatives 
> infructueuses de conversion :
> iconv --from CP --to UTF-8 <fichier>
> qui me retourne par exemple un mot dont je m'attends à ce qu'il
> s'écrive "général" par g�n�ral

Dand utf-8 les caractères accentués peuvent se retrouver sur 3 octets, donc 
c'est pas franchement surprenant.

File un extrait de ton fichier. Il y a de grandes chances qu'il soit mal 
déclaré dans la balise <meta>.


-- 
Invasion of Irak, death penalty, Guantanamo concentration camp, no ban on 
weapons: the USA have the violent state that matches their violent society.


Plus d'informations sur la liste de diffusion linux