H12 - Gedcom UTF-8

Modérateurs : Animateurs, Heredis

Avatar de l’utilisateur
mike
Messages : 22046
Inscription : dimanche 29 mai 2011 07:11
Localisation : Région parisienne

H12 - Gedcom UTF-8

Message par mike »

A l'ouverture d'un fichier Gedcom, exporté par Heredis 12 avec jeu de caractères utf-8, révision 3674M, les CHAR UTF-8 ne sont pas reconnus !
Impossible d'utiliser des fichiers Gedcom utilisant ce jeu de caractères, même si générés par Heredis 12 lui-même ...
Et il n'est même plus possible de forcer un choix de jeu de caractères !

Solution de secours (mais est-ce une solution ?) :
- exploiter le fichier Gedcom avec Heredis 11 malgré quelques rejets
- puis convertir avec Heredis 12
Cordialement.
Mike

AuroraR8 : Intel Core i9-9900K 3,60 à 5 GHz - RAM 16 Go - NVME 1 To + RAID1 2 DD 2 To + 1 DD 2 To
1980x1200 x 2 - onduleur 510 W
W10 Pro - Firefox - McAfee LiveSafe
Heredis EN + FR
christinebsd
Messages : 2815
Inscription : lundi 6 juin 2011 16:59

Re: H12 - Gedcom UTF-8

Message par christinebsd »

Bonjour,

Vous parlez d'un fichier exporté par Heredis 12 au format Gedcom, avec le choix de caractères UTF8, je voudrais cerner le dysfonctionnement mais je ne parviens pas à le reproduire.

Le problème de reconnaissance des caractères se trouve-t-il partout dans votre fichier ou uniquement dans les notes ?

S'il ne se trouve que dans les notes, avez-vous les mêmes problèmes par l'export au format "RTF" et "texte brut" ?

Dernière question subsidiaire, merci de me confirmer que vous avez bien "la mention "UTF-8" dans l'entête du ged
Cordialement,

Christine
Avatar de l’utilisateur
mike
Messages : 22046
Inscription : dimanche 29 mai 2011 07:11
Localisation : Région parisienne

Re: H12 - Gedcom UTF-8

Message par mike »

Christine a écrit :Dernière question subsidiaire, merci de me confirmer que vous avez bien "la mention "UTF-8" dans l'entête du ged
En vérifiant avant de répondre, je m'aperçois que c'est un peu moins simple que je ne le pensais.

Le détail est parti en courrier privé ...
Cordialement.
Mike

AuroraR8 : Intel Core i9-9900K 3,60 à 5 GHz - RAM 16 Go - NVME 1 To + RAID1 2 DD 2 To + 1 DD 2 To
1980x1200 x 2 - onduleur 510 W
W10 Pro - Firefox - McAfee LiveSafe
Heredis EN + FR
Avatar de l’utilisateur
mike
Messages : 22046
Inscription : dimanche 29 mai 2011 07:11
Localisation : Région parisienne

Re: H12 - Gedcom UTF-8

Message par mike »

Au cas où quelqu'un serait intéressé par le détail ... ci-joint en 2 messages ...
Cordialement.
Mike

AuroraR8 : Intel Core i9-9900K 3,60 à 5 GHz - RAM 16 Go - NVME 1 To + RAID1 2 DD 2 To + 1 DD 2 To
1980x1200 x 2 - onduleur 510 W
W10 Pro - Firefox - McAfee LiveSafe
Heredis EN + FR
Avatar de l’utilisateur
mike
Messages : 22046
Inscription : dimanche 29 mai 2011 07:11
Localisation : Région parisienne

Re: H12 - Gedcom UTF-8

Message par mike »

Suite ...
Cordialement.
Mike

AuroraR8 : Intel Core i9-9900K 3,60 à 5 GHz - RAM 16 Go - NVME 1 To + RAID1 2 DD 2 To + 1 DD 2 To
1980x1200 x 2 - onduleur 510 W
W10 Pro - Firefox - McAfee LiveSafe
Heredis EN + FR
Avatar de l’utilisateur
tahiti
Animateur
Messages : 9751
Inscription : vendredi 27 mai 2011 16:09
Localisation : Pontvallain (72) - Sarthe - France
Contact :

Re: H12 - Gedcom UTF-8

Message par tahiti »

C'est une sacré explication !... merci de l'avoir partagé avec nous ;)
Amicalement et Heredisement vôtre.... Christophe MENU dit Tahiti
(Animateur bénévole du Forum)
Créations et impressions d'arbres : http://empreinte.genea.free.fr/
Avatar de l’utilisateur
mike
Messages : 22046
Inscription : dimanche 29 mai 2011 07:11
Localisation : Région parisienne

Re: H12 - Gedcom UTF-8

Message par mike »

Tahiti a écrit :C'est une sacré explication !... merci de l'avoir partagé avec nous ;)
Vous aurez remarqué que, aussi bien le Bloc-notes que WordPad ou un quelconque autre éditeur de texte (Word ou autre) ne permettent pas de voir s'il y a ou non codage UTF-8 dans le fichier Gedcom : ils convertissent tous les caractères en caractères qu'ils savent afficher (Bloc-notes ne détecte pas l'UTF-8). Il faut donc passer par un éditeur hexa/octal pour s'en rendre compte.
Cordialement.
Mike

AuroraR8 : Intel Core i9-9900K 3,60 à 5 GHz - RAM 16 Go - NVME 1 To + RAID1 2 DD 2 To + 1 DD 2 To
1980x1200 x 2 - onduleur 510 W
W10 Pro - Firefox - McAfee LiveSafe
Heredis EN + FR
Avatar de l’utilisateur
mike
Messages : 22046
Inscription : dimanche 29 mai 2011 07:11
Localisation : Région parisienne

Re: H12 - Gedcom UTF-8

Message par mike »

La séquence "EF BB BF", insérée automatiquement par Word en tête de fichier utilisant le jeu de caractères UTF-8, est le caractère BOM (Byte Order Mark) "U+FEFF", caractère qui indique l'ordre (big endian) dans lequel les caractères codés sont représentés.
La présence de ce caractère, non reconnu pour ce qu'il est par Heredis, pourrait-il faire que la section "0 HEAD" d'un fichier Gedcom ne soit pas pris en compte (et donc pas le tag "1 CHAR") ? Par contre Heredis 'bleu' ne semblerait pas avoir ce problème !
Cordialement.
Mike

AuroraR8 : Intel Core i9-9900K 3,60 à 5 GHz - RAM 16 Go - NVME 1 To + RAID1 2 DD 2 To + 1 DD 2 To
1980x1200 x 2 - onduleur 510 W
W10 Pro - Firefox - McAfee LiveSafe
Heredis EN + FR
Répondre

Revenir à « Heredis versions antérieures »