exportation unicode
exportation unicode
J'ai une base mysql pouvant contenir des caractères dans différentes langues. Je voudrais récupérer à l'exportation (format xml par exemple) la correspondance 'html'. Cependant phpadmin reprend systématiquement la longue du poste de travail et me fournit pour le caractère é, le caractère é au lieu du caractère &jenesaisquoi correspondant.
-
- Site Admin
- Messages : 855
- Enregistré le : sam. sept. 14, 2002 10:41 pm
- Localisation : Igny (Essonne)
Une piste peut-être : regarde les fonctions décrites ici
http://fr2.php.net/manual/en/function.htmlentities.php
http://fr2.php.net/manual/en/function.htmlentities.php
-
- Messages : 405
- Enregistré le : mer. oct. 30, 2002 11:20 pm
- Localisation : Voie Lactée
- Contact :
Bonsoir !
Quelques pistes :
- un dump en XML, c'est bien, mais il faut préciser l'encodage Unicode souhaité. Cependant, la norme veut que, en l'absence d'indication, c'est UTF-8 qui est réputé être utilisé.
- si, la base, chez le provider, autorise l'accès distant, tu pourrais remplacer le dump par des requêtes.
- pour encoder les caractères unicode en HTML, je te rappelle les fonctions unihtml( et unipdxhtml( ; associées à la fonction convcodec( tu as toutes les possibilités de conversion entre UTF-8, UTF-16, iso-8859-1, latin-1, HTML, etc, depuis Paradox. Pour plus de détails, relire les présentations de la convention 2004
- si tu as le choix, je te conseille UTF-8, qui présente deux avantages : un contrôle des octets, et la possibilité de les stocker dans des champs mémo de Paradox, sans perte.
Et une petite question, pour finir : quelles seront les plages de caractères utilisées ?
Quelques pistes :
- un dump en XML, c'est bien, mais il faut préciser l'encodage Unicode souhaité. Cependant, la norme veut que, en l'absence d'indication, c'est UTF-8 qui est réputé être utilisé.
- si, la base, chez le provider, autorise l'accès distant, tu pourrais remplacer le dump par des requêtes.
- pour encoder les caractères unicode en HTML, je te rappelle les fonctions unihtml( et unipdxhtml( ; associées à la fonction convcodec( tu as toutes les possibilités de conversion entre UTF-8, UTF-16, iso-8859-1, latin-1, HTML, etc, depuis Paradox. Pour plus de détails, relire les présentations de la convention 2004

- si tu as le choix, je te conseille UTF-8, qui présente deux avantages : un contrôle des octets, et la possibilité de les stocker dans des champs mémo de Paradox, sans perte.
Et une petite question, pour finir : quelles seront les plages de caractères utilisées ?
Michel Claveau Informatique
La base sera chez un provider, avec une page d'administration permettant de lancer un dump en XML. C'est bien UTF-8 qu'on compte utiliser. En fait, pour les tests, on a utilisé le dump de php admin qui permet de choisir la langue d'export . En fait j'aurais voulu qu'il n'y ait pas de langue d'export (que tout soit mis en UTF-8). Je pense qu'en effet ce doit être possible par programmation, mais que ce n'est pas prévu dans phpadmin.