Mais pourquoi donc mettre en UTF-8 un blog francophone dont tous les caractères peuvent être facilement encodés sur un seul octet en ISO-8859-1, ou en ISO-8859-15 si on veut en plus disposer du symbole Euro ?

Je m'interroge, pourquoi faire simple quand on peut faire compliqué ?

Le seul intérêt que je vois à passer son blog en UTF-8, c'est de pouvoir afficher correctement les spams de commentaires que l'on recevrait dans des langues asiatiques diverses... Ah c'est sûr, afficher correctement les spams, c'est capital !

Il existe un fil qui parle du problème d'encodage des trackbacks sur les forums de dotclear et qui pointe vers un autre fil et parle d'un fichier inc/libs/lib.util.php de la branche dev qui permettrait (peut-être) de corriger cette sombre histoire d'encodage et que les développeurs auraient oublié de passer dans la branche stable.
Malheureusement, si je tente d'accéder à ce fichier, j'obtiens un beau Permission Denied - This action requires FILE_VIEW permission.. Grrr !!

Décidément, l'UTF-8, c'est que des emmerdes.

Quand j'ai mis à jour mon brave Totor de la Mandriva 2005LE à la Mandriva 2006.0, la mise-à-jour m'a remplacé le vieil outil d'envoi de mail mailx par le nouveau nail, qui fait la même chose mais, supposément, en UTF-8-aware.
Résultat des courses, à partir de ce jour-là, la moitié des mails envoyés par mes scripts de maintenance nocturne finissaient en /dead.letter, envoyés à personne, avec un cryptique message d'erreur indiquant que le mail était passé aux chiottes car il contenait un caractère UTF-8 incomplet ou corrompu. Sainte Merdre !
Bon, j'ai vite downgradé nail en mailx bête et méchant, et mes problèmes ont disparu.

Je hais UTF-8. C'est rien que des emmerdes. Aller coder les caractères accentués sur 2 octets quand les jeux de caractère ISO le font sur un seul octet, faut quand même être torturé...

Post Scriptum : J'ajoute encore ceci pour répondre plus complètement à une question qui m'a été posée mais pourquoi haissez-vous l'UTF-8 :

  • Quand on copie-colle un bout de page web en UTF-8 vers un document non-UTF-8 (un e-mail en cours de rédaction par exemple), selon l'outil utilisé, soit cela provoque la perte de caractères (notamment, très souvent, les apostrophes), soit cela force l'encodage de tout l'e-mail en UTF-8, ce qui est absolument inutile.
  • De nombreux outils mail fonctionnent très mal avec UTF-8. Je citerai par exemple le gestionnaire de listes de diffusion Sympa et le système de webmail Squirrelmail. Il se trouve que j'utilise les deux, et que l'UTF-8 les constipe, au moins dans les versions que j'utilise...
  • Avoir une console ou un éditeur qui est par défaut en UTF-8, quand on saisit du code et qu'on met des commentaires en français dedans, avec des accents, ça nous fait du code avec des commentaires en UTF-8. Hideux, peu pratique, potentiellement problématique.

Je disais donc que je hais l'UTF-8, et je le confirme ;-)