public marks

PUBLIC MARKS with tag utf-8

2011

2010

UTF-8 Setup Mini HOWTO

by sylvainulg (via)
evaluating (require 'un-define) (set-coding-priority-list '(utf-8)) (set-coding-category-system 'utf-8 'utf-8) in the scratch buffer before opening the UTF-8 document was sufficient. RAW documents remained RAW, afaik.

Detecting UTF BOM - byte order mark

by dzc (via)
simplified example (php) on how to detect and remove the three bytes (UTF BOM)

Internationalisation Gotchas — Internationalisation Tips

by Spone
The amount of work required to internationalise a website is woefully underestimated, and sometimes, the codebase is compromised to the extent that many features or capabilities are impossible to deliver with the existing code. In many cases, complete ground-up rewrites are needed to separate cleanly the business logic from the localisation requirements of countries. Mostly this requires developers and engineers of platforms to be aware of the internationalisation implications of their implementation choices. What may seem like an engineering best practice could very well be a massive barrier for localising sites to various countries.

jEdit - Programmer's Text Editor -- présentation

by decembre & 15 others
Editeur de texte, un programmeur d'âge mûr... Bat de nombreux outils de développement coûteux pour les fonctionnalités et la facilité d'utilisation, logiciel libre, avec une large collection de plugins . Quelques caractéristiques de jEdit: * Ecrit en Java, il fonctionne sur Mac OS X, OS / 2, Unix, VMS et Windows. * Intégre le langage de macro, l'architecture de plugin extensible. Des dizaines de macros et les plugins disponibles. * Gestionnaire de "plugin" . * Auto-indentation, et la coloration syntaxique pour plus de 130 langues. * Supporte un grand nombre de codages de caractères UTF8 et dont l'Unicode. * Cacher de manière sélective les régions du texte. * Word Wrap. * Hautement configurable et personnalisable. * Tout autre élément, à la fois de base et avancée, vous pouvez vous attendre à trouver dans un éditeur de texte. Voir la Fonctions Page Pour une liste complète.

Official Google Blog: Unicode nearing 50% of the web

by srcmax (via)

About 18 months ago, we published a graph showing that Unicode on the web had just exceeded all other encodings of text on the web. The growth since then has been even more dramatic.

2009

Unicode code converter [ishida >> utilities]

by ycc2106
Type or paste text in any of the green or grey shaded boxes and click on the button Convert button above it. Alternative representations will appear in all the other boxes. You can then cut

Comment convertir une DB de latin1 à UTF8 | MySQL

by dzc & 1 other (via)
J’ai utilisé cette technique pour convertir une base de données de 115Go et tout c’est bien déroulé. L’astuce consiste à transformer les chaines de caractères à un format binaire, pour ensuite les reconvertir en UTF8. Il faut cependant ne pas négliger un aspect lors de cette conversion. Les caractères Latin1 utilise 1 byte par caractère alors qu’un caractère UTF8 utilisent 3 bytes par caractère. Si l’espace disque est une de vos contraintes, il ne faut pas prendre cette conversion à la légère!

Entretien d'Embauche

by kemar
Marrant le blog BD "Entretien d'embauche" de Nathaniel Ferguson http://bit.ly/MflZg [from http://twitter.com/kemar/statuses/1647123552]

Changer de jeu de caractères pour UTF-8 - Openweb.eu.org

by srcmax & 1 other (via)
Préparer l’internationalisation d’un site n’est pas une opération triviale, car dans la plupart des cas, elle nécessite de passer d’un jeu de caractères à un autre. Or, un site Web résulte d’un assemblage de plusieurs logiciels, où les questions de jeux de caractères apparaissent à chaque niveau. Cet article résume les différents points de la configuration d’un site « classique » dans le cadre de l’utilisation d’UTF-8.

2008

utf-8 Growth On The Web - W3C Q&A Weblog

by julie & 2 others

On Google's blog, Mark Davis is explaining that Google is moving to Unicode 5.1. The article unfortunately mixes unicode and utf-8 as it has been noticed by David Goodger in Unicode misinformation. But the really interesting bit is the growth of utf-8 on the Web. These data should be interesting for the development of http, html 5 and validators.

Active users

simo
last mark : 11/11/2011 22:49

julie
last mark : 05/11/2011 13:22

eledo34
last mark : 15/06/2011 09:16

clochix
last mark : 27/02/2011 10:42

sylvainulg
last mark : 27/10/2010 09:28

ghis
last mark : 10/09/2010 07:58

dzc
last mark : 29/04/2010 05:19

Spone
last mark : 06/04/2010 10:11

decembre
last mark : 20/03/2010 13:36

srcmax
last mark : 29/01/2010 10:57

ycc2106
last mark : 30/10/2009 14:37

RETFU
last mark : 16/06/2009 08:07

kemar
last mark : 29/04/2009 19:37

Nissone
last mark : 18/02/2009 12:41

piouPiouM
last mark : 07/02/2009 18:22

jmfontaine
last mark : 04/07/2008 17:37

CharlesNepote
last mark : 07/05/2008 13:50

camel
last mark : 16/02/2008 20:35