Je hais l'UTF-8 !
Par Petaramesh le samedi 18 février 2006, 10:14 - Râleries dualistes - Lien permanent
Je découvre à mon grand dam que les trackbacks réalisés entre des blogs dotclear encodés en UTF-8 et ce blog-ci (dotclear 1.2.3 en ISO-8859-1) voient leurs caractères accentués tout destroy...
Mais pourquoi donc mettre en UTF-8 un blog francophone dont tous les caractères peuvent être facilement encodés sur un seul octet en ISO-8859-1, ou en ISO-8859-15 si on veut en plus disposer du symbole Euro ?
Je m'interroge, pourquoi faire simple quand on peut faire compliqué ?
Le seul intérêt que je vois à passer son blog en UTF-8, c'est de pouvoir afficher correctement les spams de commentaires que l'on recevrait dans des langues asiatiques diverses... Ah c'est sûr, afficher correctement les spams, c'est capital !
Il existe un fil qui parle du problème d'encodage des trackbacks sur les forums de dotclear et qui pointe vers un autre fil et parle d'un fichier inc/libs/lib.util.php de la branche dev qui permettrait (peut-être) de corriger cette sombre histoire d'encodage et que les développeurs auraient oublié de passer dans la branche stable.
Malheureusement, si je tente d'accéder à ce fichier, j'obtiens un beau Permission Denied - This action requires FILE_VIEW permission.
. Grrr !!
Décidément, l'UTF-8, c'est que des emmerdes.
Quand j'ai mis à jour mon brave Totor de la Mandriva 2005LE à la Mandriva 2006.0, la mise-à-jour m'a remplacé le vieil outil d'envoi de mail mailx par le nouveau nail, qui fait la même chose mais, supposément, en UTF-8-aware.
Résultat des courses, à partir de ce jour-là, la moitié des mails envoyés par mes scripts de maintenance nocturne finissaient en /dead.letter, envoyés à personne, avec un cryptique message d'erreur indiquant que le mail était passé aux chiottes car il contenait un caractère UTF-8 incomplet ou corrompu. Sainte Merdre !
Bon, j'ai vite downgradé nail en mailx bête et méchant, et mes problèmes ont disparu.
Je hais UTF-8. C'est rien que des emmerdes. Aller coder les caractères accentués sur 2 octets quand les jeux de caractère ISO le font sur un seul octet, faut quand même être torturé...
Post Scriptum : J'ajoute encore ceci pour répondre plus complètement à une question qui m'a été posée mais pourquoi haissez-vous l'UTF-8
:
- Quand on copie-colle un bout de page web en UTF-8 vers un document non-UTF-8 (un e-mail en cours de rédaction par exemple), selon l'outil utilisé, soit cela provoque la perte de caractères (notamment, très souvent, les apostrophes), soit cela force l'encodage de tout l'e-mail en UTF-8, ce qui est absolument inutile.
- De nombreux outils mail fonctionnent très mal avec UTF-8. Je citerai par exemple le gestionnaire de listes de diffusion Sympa et le système de webmail Squirrelmail. Il se trouve que j'utilise les deux, et que l'UTF-8 les constipe, au moins dans les versions que j'utilise...
- Avoir une console ou un éditeur qui est par défaut en UTF-8, quand on saisit du code et qu'on met des commentaires en français dedans, avec des accents, ça nous fait du code avec des commentaires en UTF-8. Hideux, peu pratique, potentiellement problématique.
Je disais donc que je hais l'UTF-8, et je le confirme ;-)








Commentaires
Je ne suis donc pas le seul ! Ouf ! :-)
J'ai rompu avec l'UTF-8 le jour ou j'ai installé une RH9.0 ... Le perl etait tout vert et impossible d'installer la moindre appli sans me chopper des erreur d'encodage.
Le maniaque inventeur de l'UTF-8 serais t'il un proche collaborateur de Zdziarski ou alors un simple admirateur de Bernstein ?
Entièrement d'accord!
Je me fais ch... depuis 5 jours à cause de notre messagerie d'entreprise (Novell - Groupwise)
qui selon les admin, exige cel pour pouvoir traiter correctement les messages envoyés
vers l'extérieur. :-(
Beh, quand j'ai upgradé ce blog à DotClear 2 courant décembre, il m'a converti le tout en UTF-8 de force... Même plus le choix de rester en ISO-8859-15, dans la nouvelle version...
Cela dit, il a fait la conversion nickel tout seul, alors je ne me plains pas...
Mais l'UTF-8 me fait encore suer à chaque fois que je fais des SSH d'une Ubuntu sur une Mandriva, par exemple...