SME7 - UTF8, ISO8859-1, Samba et € : le défi

Forum dédié à la distribution du même nom et que vous pourrez télécharger sur http://www.contribs.org. La nouvelle version de cette distribution se nomme SME Server

Modérateur: modos Ixus

SME7 - UTF8, ISO8859-1, Samba et € : le défi

Messagepar fraedhrim » 22 Sep 2006 15:28

Salut,

J'ai migré vers SME7 et j'ai des soucis de charset sur les documents transférés depuis l'ancienne version.
En gros sous Windows via Samba les fichiers ont bien les accents, vu via puTTY et mon serveur de streaming ils ne l'ont pas alors que les message du type "rm : détruire fichier régulier..." avec puTTY ont bien leurs accents.

C'est quoi ce $%#&! ? Je pige que dalle au jeu des charset.
Si quelqu'un a une explication adaptée à SME je suis preneur.

Quel charset choisir UTF8, ISO ? Comment le modifier ? Est-il possible de récupérer mes noms de fichiers ?

Merci sincèrement d'avance.

Fred

[EDIT]
Mon problème principal venait, je pense, du fait que samba est en charset UTF-8 côté Unix et ISO côté Smbfs du coup en copiant mes fichiers via samba il se sont retrouvé avec une accentuation de l'espace sur mon FS Unix qui est en ISO. En changeant le paramètre dans Samba de UTF8 à ISOblabla et en recopiant mes données je retrouve bien les accents quel que soit le moyen que j'utilise pour les voir.
Par contre mes questions sur UTF8 restent valables. Quelle est la bonne manière de gérer ces charsets ? Lequel priviliégier ?
[/EDIT]
Dernière édition par fraedhrim le 23 Sep 2006 14:32, édité 1 fois au total.
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar fraedhrim » 22 Sep 2006 18:21

Et est-ce qu'il ne fallait pas faire l'inverse ?

Mettre tout en UTF-8 ?
Parce que du coup c'est phpmyadmin qui fait la couenne avec les accents.... Et mysql est toujours en UTF-8.
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar jibe » 22 Sep 2006 19:04

Salut,

Ces questions d'accents ne sont pas simples, et je ne suis pas sûr non plus d'avoir trouvé la bonne solution... Pour tenter d'éclairer un peu ta lanterne, je dirais en gros que :
- UTF8 se veut une solution universelle, est assez bien foutu, mais pose parfois des problèmes de compatibilité avec d'autres systèmes,
- Les ISO 8859 (et particulièrement pour nous français l'ISO 8859-1 ou ISO 8859-15 - ce dernier incluant le caractère "euro" € ) sont souvent une bonne solution, mais sont moins universels qu'UTF8.

Pour ma part, j'utilise toujours, sans en être pleinement satisfait ni vraiment mécontent ( :lol: on va croire que j'ai des origines normandes !) :
- UTF8 pour tout ce qui est développement XML/HTML,
- ISO 8859-1 ou 15 pour toutes mes install d'OS.

Mais si quelqu'un a de meilleurs conseils, je suis preneur aussi :wink:

PS : quelques liens que tu connais probablement déjà
http://developpeur.journaldunet.com/tut ... ages.shtml
http://forum.alsacreations.com/topic.ph ... 7&tid=1201
http://www.gnunux.info/dotclear/index.p ... so-en-utf8

Le second est assez intéressant dans la mesure où il s'agit d'un débat argumenté par des liens sur d'autres pages instructives...
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Messagepar fraedhrim » 23 Sep 2006 12:13

Merci pour ces infos.

Comme lien intéressant j'avais aussi trouvé : http://www.siteduzero.com/tuto-3-6276-1 ... ments.html

Je crois que je vais faire des tests...

A+
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar fraedhrim » 23 Sep 2006 14:38

Bon alors le défi du jour.

Configurer votre SME pour pouvoir créer sous Samba depuis un Windows XP (home) un fichier nommé "€.txt" (euro.txt), que le nom reste tel quel via Samba sous Windows et que le nom soit lisible aussi via la console et via un puTTY.
Vous avez 5 minutes....

:D

Sans blague si quelqu'un connait la bonne combinaison de UnixCharSet/DisplayCharSet / i18n / keyboard / ... je suis preneur !
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar jibe » 23 Sep 2006 22:43

Salut,

Exactement... Et ton défi est encore assez simple : j'aurais demandé de pouvoir relire sous linux un fichier créé sous W98 sous le nom de
Code: Tout sélectionner
Comptabilité en €.xls

:P
Je n'ai pas cherché la solution pour la bonne raison que j'ai bien du mal à croire qu'elle existe... Et c'est pour ça qu'il est bien difficile de dire quel est le meilleur choix : en fait, le meilleur dans un cas est parfois le pire dans un autre...

Et au final, je ne sais pas si la solution la plus simple n'est pas la meilleure : renommer le fichier en évitant accents, espaces et caractères spéciaux, puis si besoin en faire une conversion...
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Messagepar fraedhrim » 24 Sep 2006 13:39

Mouais c'est bien ce que je craignais....

C'est impossib' ce truc là.
Pas que ça soit un gros problème le coup de faire un fichier avec € dans le titre. Mais bon tant qu'à faire de refaire mon serveur je voulais mettre ZE charset. Et bien quel que soit mon choix j'ai un problème.

Tout UTF-8 : c'est le démon kissd ou la platine KISS qui ne sait pas afficher les titres avec accents.
Tout ISO : c'est le bazar avec mySQL et des applis qui tournent mal en autrechose que UTF-8
Mixé : moins pire mais pas parfait. Manque encore les €...

Pffff..
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar sibsib » 24 Sep 2006 22:53

Hello,

Pas sûr du tout (mais alors pas du tout du tout !) Mais il me semble que le jeu de caractère ISO-8859.15 diffère du classique ISO-8859.1 justement par rapport au sigle € .
Il srait plus proche du jeu de caractère MicroMou, aussi.

A+,
Pascal
Sibsib, admin heureux d'un petit SME !!!
- SME 8.0 beta 6 dans une VM :-)
- ESXI 4.1 sur hardware noname
Ma petite page sur SME
Avatar de l’utilisateur
sibsib
Amiral
Amiral
 
Messages: 2368
Inscrit le: 11 Mai 2002 00:00
Localisation: France - région parisienne

Messagepar fraedhrim » 25 Sep 2006 10:52

J'ai testé mais plouf.
Ca coince à l'export M$ vers Samba mais je ne sais pas où. Pas de €. Ca fait la même chose qu'avec le ISO-1...

Ou alors j'ai mal fait un truc. C'est carrément possib'. Dans le i18n il faut mettre quoi pour le ISO-15 ? Dans le keyboard c'est fr-latin9 mais dans le i18n je sais pô....
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar jibe » 25 Sep 2006 21:53

Salut,

sibsib a écrit:il me semble que le jeu de caractère ISO-8859.15 diffère du classique ISO-8859.1 justement par rapport au sigle €

Exact !

Je ne connais pas en détails les différences entre ces deux-là, mais ce qui est sûr, c'est que ISO 8859-15 a été pondu pour pallier à certains manques dans ISO 8859-1, en particulier le signe €. Partout où c'est possible, à mon avis, il faut donc préférer ISO 8859-15 à ISO 8859-1. Je ne pense pas qu'il y ait de problèmes et n'en ai jamais constaté, sauf incompatibilités avec certaines bidouilles de haut vol pour tenter d'ajouter l'€ à ISO-8859-1...

Donc, fraedhrim, ton problème me surprend un peu. Probablement effectivement un problème de config, mais je ne me suis jamais penché sur la question et ne sais pas plus que toi quoi mettre dans i18n...
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Messagepar fraedhrim » 26 Sep 2006 12:56

Hu hu...

Ben en fait moi je vois trois endroits où jouer avec le charset :

- /etc/sysconfig/i18n
LANG="fr_FR"
SUPPORTED="fr_FR:fr"
SYSFONT="lat0-sun16"
SYSFONTACM="iso15"

- /etc/sysconfig/keyboard
KEYBOARDTYPE="pc"
KEYTABLE="fr-latin1"

- /etc/samba/smb.conf
display charset = ISO8859-1
unix charset = ISO8859-1

Après plusieurs essais le meilleur résultat que j'ai obtenu c'est en mettant :

- /etc/sysconfig/i18n :
LANG="fr_FR@euro"
SUPPORTED="fr_Fr@euro:fr_FR:fr"
SYSFONT="lat0-sun16"
SYSFONTACM="iso15"

- /etc/sysconfig/keyboard :
KEYBOARDTYPE="pc"
KEYTABLE="fr-latin9"

- /etc/samba/smb.conf :
display charset = ISO8859-15
unix charset = ISO8859-15

De cette manière je retrouve bien les accents et le € via Samba et via la console.
Par contre j'ai toujours des soucis avec mon soft de streaming et/ou ma platine homeciné qui m'affiche des ¤¤ à la place du €...

Donc c'est faisable mais comme pour UTF-8 il faut que tout soit compatible. Dans mon cas avec les contraintes que je me suis fixé ce n'est pas possible pour l'instant.

A noter un truc bizarre : la DB "sysconfig" de SME7 semble remplie à partir du fichier i18n et pas l'inverse. (?)

Merci pour les infos.

Fred
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar jibe » 26 Sep 2006 18:33

Salut,

fraedhrim a écrit:De cette manière je retrouve bien les accents et le € via Samba et via la console.
Par contre j'ai toujours des soucis avec mon soft de streaming et/ou ma platine homeciné qui m'affiche des ¤¤ à la place du €...

Si c'est tout ce qui te manque, chapeau ! Et merci pour les infos :wink:
Pas de problèmes avec les noms de fichiers comportant des espaces ?

fraedhrim a écrit:Ben en fait moi je vois trois endroits où jouer avec le charset :

Attention : il peut y avoir des charset et codepage spécifiés dans /etc/fstab... C'est rare et suite à des mount un peu spéciaux, mais ça peut arriver...
"Le monde ne sera pas détruit par ceux qui font le mal, mais par ceux qui les regardent sans rien faire" (Albert Einstein)

Autrefois, l'Etat défendait des valeurs. Maintenant, il défend des profits... (Anne Haunnime)
Avatar de l’utilisateur
jibe
Amiral
Amiral
 
Messages: 4366
Inscrit le: 17 Oct 2003 00:00
Localisation: Haute Savoie

Messagepar fraedhrim » 26 Sep 2006 18:46

Hop !

Non a priori pas de soucis avec les espaces dans les noms de fichiers.
Et dans mon cas pas de montage zarbi.

A+
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes

Messagepar fraedhrim » 27 Oct 2006 14:50

Salut,

Je relance ce topic parce que je n'arrive pas à configurer mon système en UTF-8.
Si je mets les paramètres dans la DB ou directement dans le fichier dans les deux cas un "signal-event post-upgrade" enlève la partie ".UTF-8" des fr_FR.
Et en effet en regarde les templates du i18n on voit bien que c'est leur rôle :
Code: Tout sélectionner
/etc/e-smith/templates/etc/sysconfig/i18n/LANG
::::::::::::::
{
    $OUT = "";
    my $lang = $settings{LANG};
    return unless defined $lang;
    if ($lang =~ /"(.*)\.UTF-8"/)
    {
        $settings{LANG} = '"' . $1 . '"';
    }
}


Comment fait-on pour se mettre en full UTF-8 ?!

A+

Fred
Avatar de l’utilisateur
fraedhrim
Amiral
Amiral
 
Messages: 1264
Inscrit le: 27 Jan 2004 01:00
Localisation: Nantes


Retour vers E-Smith / SME Server

Qui est en ligne ?

Utilisateur(s) parcourant actuellement ce forum : Aucun utilisateur inscrit et 1 invité