[Linux] Question d'encodage
Éric Bischoff
ebischoff@::1
Mar 29 Mai 15:59:56 CEST 2007
Le Dimanche 27 Mai 2007 14:52, jmt a écrit :
> J'ai un fichier html, avec l'indication :
> <meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
> mais rien à faire pour le convertir en UTF-8 avec iconv.
>
> Quand je le visualise avec un éditeur binaire, les caractères supérieurs à
> ascii-7 sont représentés par trois octets,
C'est surprenant. winodws 1252 est un jeu de caractères sur un octet.
> ce qui explique mes tentatives
> infructueuses de conversion :
> iconv --from CP --to UTF-8 <fichier>
> qui me retourne par exemple un mot dont je m'attends à ce qu'il
> s'écrive "général" par g�n�ral
Dand utf-8 les caractères accentués peuvent se retrouver sur 3 octets, donc
c'est pas franchement surprenant.
File un extrait de ton fichier. Il y a de grandes chances qu'il soit mal
déclaré dans la balise <meta>.
--
Invasion of Irak, death penalty, Guantanamo concentration camp, no ban on
weapons: the USA have the violent state that matches their violent society.
Plus d'informations sur la liste de diffusion linux