ホーム 並行コーパス 読み物 データー 情報 ヘルプ
français English

Mode d'emploi des corrections sur les données

1 Texte

Cette partie décrit les corrections à apporter au texte de manière générale.

1.1 Texte en romaji

Le romaji utilisé est le hepburn moderne. Il faut donc utiliser les lettres avec macron (ā, ē, ī, ō, ū) pour encoder les voyelles longues. Le romaji d'origine du dictionnaire Cesselin est un hepburn traditionnel variante romajikwa. Celui-ci utilisait les lettres « kwa » et « gwa » pour retranscrire certaines syllabes qui sont maintenant simplifiées en « ka » et « ga ». Exemple : kwaikwan ⇒ kaikan. Le « m » était également utilisé pour retranscrire la lettre hiragana « ん » devant les consonnes « m,b,p » car elle se prononce effectivement « m ». Actuellement, le « n » est utilisé partout. Exemple : jimbōchō ⇒ jinbōchō ; gumma ⇒ gunma.

Il peut subsister quelques traces qu'il faut remplacer par la variante hepburn moderne. (voir https://en.wikipedia.org/wiki/Hepburn_romanization pour plus d'informations).

Dans le Raguet-Martin, un programme a été utilisé pour détecter les parties qui ne sont pas du romaji. Deux cas sont présents :

1.2 Texte en japonais

Simplification des kanji

À l'époque de la rédaction du dictionnaire, il n'existait pas de table de codage pour les kanji. Le premier codage japonais, le JIS (Japanese Industrial Standard) 208 est apparu en 1978. Il contient environ 7000 caractères. Ce codage a été largement utilisé lors de l'informatisation du japonais. ui bien que, les kanji qui n'étaient pas inclus dans ce codage ont petit à petit disparu. Pour corriger la situation d'autres codage sont apparus comme le JIS 212 en 1990 qui spécifie 6 067 caractères de plus puis ensuite le JIS 213 qui en spécifie 11 233 en tout. Mais le mal était fait et la plupart des mots de la langue japonaise actuels n'utilise que les kanji du standard JIS 208. Nous avons donc remplacé tous les kanji qui n'étaient pas inclus dans le JIS 208 par leur variante JIS 208. De la même manière, nous avons remplacé les variantes JIS 208 par celles de grade le plus bas.

Certains sinogrammes n'étaient inclus dans aucun JIS. Il font partie de l'ensemble des caractères chinois Han. Une partie de ces caractères est effectivement utilisée dans le dictionnaire original Cesselin mais l'autre partie provient en fait d'erreurs de reconnaissance de caractères. Pour ces deux séries, il a fallu trouver un équivalent JIS 208 à la main.

Modernisation du hiragana

Le japonais a également évolué depuis 1950, notamment les terminaisons verbales. L'évolution était déjà indiquée dans le romaji mais le hiragana utilisé pour les terminaisons verbales en japonais gardait trace des anciennes prononciations. Exemples : la terminaison « ふ » (fu) se prononce « u » ; la terminaison « へる » (heru) se prononce « eru ». Cela engendrait de ce fait un problème de correspondance entre le romaji et le kana. Nous avons donc modifié le hiragana pour qu'il corresponde au romaji et ainsi à la prononciation moderne : kokitsukau 扱使ふ ⇒ 扱使う ; kikikaeru 切替へる ⇒ 切替える. Certains hiragana ont également été remplacés : ゐ⇒い (i);ゑ⇒え(e). Exemple : 光ってゐる ⇒ 光っている.

Si vous constatez encore des erreurs restantes, il faut les corriger. Exemple : 大體 ⇒ 大体

Okurigana

Le dictionnaire Cesselin ne contient pratiquement pas d'okurigana. Il faut donc les corriger en vous basant sur la manière usuelle de noter les okurigana, en vous référant si besoin à un dictionnaire monolingue japonais type Kôjien. Exemple : 蓋 ⇒ 蓋し

Variantes de kanji

Le dictionnaire Cesselin utilise des kanji qui ont été remplacés de nos jours par des variantes plus simples (en nombre de traits généralement). Des remplacements automatiques ont été effectués de naière automatique mais il reste encore certains kanji à remplacer.

Redoublement de caractères

Le redoublement de caractères peut être noté soit avec un 々, soit en redoublant le caractère : 種々 ou 種種. Ce choix doit faire l'objet d'une discussion.

Sokuon (petit tsu っ)

Dans le dictionnaire Cesselin, les petits tsu "っ" n'étaient pas distingués du tsu standard "つ". Il faut donc remplacer les "つ" par les "っ" lorsque l'équivalent en romaji double la consonne correspondante.

Coquilles du Cesselin

Les coquilles du dictionnaire Cesselin doivent être corrigées dans la nouvelle version. Ex :
ruidō同類【るいどう】ruidō類同【るいどう】

1.3 Texte en français

Pour aider à la détection d'erreurs provenant de la lecture optique des textes français, nous avons utilisé un analyseur morphologique. Si celui-ci n'a pas reconnu un mot, il est surligné en jaune et encadré par une balise <pb>. Ex : Os fronial.

Trois cas d'erreurs sont présents :

2 Champs d'édition du volume japonais→français (Cesselin)

Cette partie détaille chaque partie d'information (et donc chaque champ du formulaire d'édition complète) et explique les corrections qu'il est possible d'apporter.

[EC] : Les instructions spécifiques à l'édition complète sont notées [EC].

[ER] : Les instructions spécifiques à l'édition rapide sont notées [ER].

2.0 Liste des vedettes

Il est possible d'ajouter un bloc de vedettes (romaji, hiragana et japonais) en cliquant sur le bouton "+". Cela doit se faire pour les variantes en japonais (kanji différent) ou en hiragana (prononciation différente). que celles déjà décrites. Il est possible d'ajouter un bloc de vedettes avant un autre bloc existant si cette orthographe est plus fréquente. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Il est également possible de supprimer un bloc de vedettes en cliquant sur le bouton "-".

2.1 Vedette en romaji

Les mots-vedette en romaji sont notés de deux manières différentes :

  1. romaji /^[a-zāēīōū]+$/. Cette notation ne contient ni espaces ni majuscules ni point. Elle est utilisée pour la recherche.
  2. romaji pour affichage :. Cette notation peut contenir des espaces, des majuscules, des tirets ou des points. Elle est utilisée pour l'affichage. Les points sont utilisés pour séparer la consonne 'n' d'une voyelle suivante pour éviter la confusion avec les hiragana 'na, ni, nu, ne, no' (ex : 'kan.yō' est le romaji de 'かんよう'). Le tiret est employé parfois pour séparer des mots qui s'apparentent à des mots composés (ex 'ane-nyōbo').

La transcription de la consonne « n » est ambigüe en japonais car cela peut être la lettre « ん » finale de syllabe ou un début de syllabe (na, ni, nu, ne, no). Il est donc d'usage de noter dans le romaji lorsque c'est une finale de syllabe. Dans le Cesselin, un tiret est ajouté après le « n ». Mais le tiret est aussi parfois utilisé pour séparer des syllabes. D'autre part, le romaji actuel utilise d'autres caractères. Le Hepburn moderne utilise une apostrophe '. Les francophones utilisent quant à eux un point. Dans le Cesselin, nous avons donc remplacé le tiret marquant un « ん » par un point. Exemple : ran-i ⇒ ran.i. Dans le Raguet-Martin, c'est encore le tiret qui est utilisé.

Si le romaji ne comporte pas de majuscules, ni d'espaces ni de caractères spéciaux (point, tiret), la notation pour l'affichage reste vide et c'est la première notation qui sera affichée.

2.2 Vedette en hiragana

Les mots-vedette en hiragana ne contiennent que du hiragana. La notation de voyelle longue du katakana (ー) doit être remplacée par une petite voyelle (テーブル => てぇぶる)

2.3 Vedette en japonais

Les mots-vedettes en japonais sont les formes attestées dans les textes. Ils contiennent souvent des kanji. Ils ont été vérifiés à l'aide d'autres dictionnaires. S'ils n'ont pas été trouvés ailleurs, ils sont alors surlignés en orange. Ex :
yaku 摩牛【やく】

[ER] : Lorsque le mot-vedette en japonais est surligné en orange, celui-ci est modifiable directement en édition rapide ainsi que les mots-vedette en romaji et en hiragana.

[EC] : Lorsque vous avez corrigé le mot-vedette en japonais dans le formulaire d'édition complète, si vous êtes sûr de vous, sélectionnez alors la valeur "Manuel" dans le menu déroulant "vérif" à droite du mot-vedette japonais. Cela supprimera le surlignage orange.

Certains mots-vedettes en japonais contiennent des sinogrammes (kanji) qui ne sont plus dans les listes officielles japonaises (standard JIS). Il est parfois possible de les trouver en cherchant dans une liste de sinogrammes chinois. Pour cela, vous pouvez utiliser la méthode de saisie par écriture sur le trackpad incluse dans celle du chinois traditionnel. Voir celle de MacOs X et celle de Windows.

2.4 Alternative, Google api, Jmdict, Wisdom

Ces champs affichent des données calculées de manière automatique. Ils ne sont affichés que dans le formulaire d'édition complète à titre informatif. Il est inutile de les modifier.

2.5 Liste des blocs grammaticaux

Il est possible d'ajouter un bloc grammatical en cliquant sur le bouton "+". Cela ne doit se faire que si le mot-vedette est employé avec une autre catégorie grammaticale que celles déjà décrites. Il est possible d'ajouter un bloc grammatical avant un autre bloc existant. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Il est également possible de supprimer un bloc grammatical en cliquant sur le bouton "-".

2.6 Étymologie

Les informations d'étymologie du Cesselin proviennent des langues suivantes :

2.7 Domaine

Les domaines du Cesselin sont les suivants :

2.8 Catégorie grammaticale (Gram)

Les catégories grammaticales ont été reconstituées à partir des listes du Cesselin et d'autres dictionnaires. Un travail plus rigoureux serait nécessaire à moyen terme.

2.9 Registre

La liste des registres du Cesselin est la suivante :

2.10 Non reconnu

Ce champ contient des informations qui n'ont pas été correctement reconnues lors de l'analyse du Cesselin. Il doit être effacé après corrections.

2.11 Liste de sens

Il est possible d'ajouter un sens en cliquant sur le bouton "+". Il est possible d'ajouter un sens avant un autre bloc de sens existant. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Lorsque vous ajoutez un nouveau sens, il est inutile d'ajouter un numéro de sens en début de champ. Certains numéros de sens qui apparaissaient à l'origine dans le Cesselin sont affichés dans la vue finale des articles dans un but de repérage uniquement. Cette numérotation sera supprimée par la suite.

Il est également possible de supprimer un bloc de sens en cliquant sur le bouton "-".

2.12 sens (traductions françaises)

Le texte entré dans le champ sens est du français. Il commence par une majuscule et se termine par un point.

[EC] : Si vous corrigez une erreur marquée par la balise <pb>, vous devez également la supprimer. Si vous supprimez une balise ouvrante (p.ex : <pb>), n'oubliez pas de supprimer la balise fermante correspondante </pb>)

[ER] : Le sens est modifiable directement en édition rapide. Dans ce cas, la balise <pb> est automatiquement supprimée.

Sens fusionnés
Il se peut qu'un sens n'ait pas été reconnu. Dans ce cas, le champ sens contient deux sens. Ex : Venue, Arrivée 2-m Avenir, {m.pl:} âges futurs,. Dans ce cas, il faut ajouter un nouveau sens (voir plus haut) et couper le sens en deux : Sens 1 : Venue, Arrivée et sens 2 : {m.} Avenir, {m.pl:} âges futurs.

Genre et nombre

Le genre et le nombre des traductions est indiqué entre accolades. Ex : {m.}, {f.}, {m.pl:}, {f.pl:}. Il se peut que certains genres n'aient pas été correctement détectés. Ex : -f.pl. Amours. Dans ce cas, il faut ajouter des accolades et éventuellement un ":" à la fin : {f.pl:} Amours

Autres informations non détectées

Il se peut que d'autres informations telles que le domaine ou le registre n'aient las été détectées. Celles-ci se situent en début de sens ou, lorque les sens sont fusionnés, en début de deuxième sens. Dans ce cas, il faut les supprimer dans le texte et les ajouter dans le champ correspondant (voir plus haut).

2.13 Renvois

Ce champ n'est pas encore traité actuellement.

2.14 Liste d'exemples

Il est possible d'ajouter un exemple en cliquant sur le bouton "+". Cela ne doit se faire que s'il faut restructurer une entrée avec un exemple mal détecté par la lecture optique. N'ajoutez pas encore d'exemples, surtout si vous les avez inventés pour l'occasion.

Il est possible d'ajouter un bloc d'exemple avant un autre bloc d'exemple existant. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Il est également possible de supprimer un exemple en cliquant sur le bouton "-".

2.15 Romaji (exemple)

Le texte en romaji a été comparé automatiquement avec le texte précédent en japonais. Les endroits qui ne correspondent pas ont été marqués dans le texte en romaji. Ce sont souvent des erreurs provenant du texte japonais (ex : petit tsu "っ" ou erreurs de lecture optique. Dans ce cas, si vous corrigez l'erreur dans le texte japonais, il faut également supprimer la balise <pb> dans le romaji.

Les mots-vedettes en romaji apparaissant dans les exemples (affichés en gras) ont été balisés automatiquement avec l'élément <vr>. Il n'est pas nécessaire de rajouter les balises <vr> lors de vos corrections.

[EC] : Si vous corrigez une erreur marquée par la balise <pb>, vous devez également la supprimer. Si vous supprimez une balise ouvrante (p.ex : <pb>), n'oubliez pas de supprimer la balise fermante correspondante </pb>)

[ER] : Le romaji est modifiable directement en édition rapide. Dans ce cas, les balises <pb> et <vr> sont automatiquement supprimées. Il ne faut pas les rajouter.

2.16 Japonais (exemple)

Pour le texte japonais, le furigana a été ajouté au dessus des kanji. Pour cela, l'élément <ruby> a été ajouté autour des kanji puis l'élément <rt> a été ajouté à l'intérieur des éléments <ruby>. Celui-ci sert à marquer le furigana.

Les mots-vedettes en japonais apparaissant dans les exemples (affichés en gras) ont été balisés avec l'élément <vj>. Il n'est pas nécessaire de rajouter les balises <vr> lors de vos corrections.

[EC] : Si vous corrigez une erreur marquée par la balise <pb>, vous devez également la supprimer. Si vous supprimez une balise ouvrante (p.ex : <pb>), n'oubliez pas de supprimer la balise fermante correspondante </pb>). (ex : remplacer --質の)上 par --質の). Attention, si vous modifiez une partie contenant du furigana, les balises ouvrantes et fermantes <ruby> et <rt> doivent être correctement placées. Si vous avez un doute, il faut supprimer toutes les balises (<ruby> et <rt>) ainsi que le furigana contenu dans les balises <rt>.

[ER] : Les exemples en japonais sont modifiables directement en édition rapide.

2.17 Liste de sous-sens

Il est possible d'ajouter un sous-sens en cliquant sur le bouton "+". Cela doit se faire s'il faut restructurer une entrée avec un sous-sens mal détecté par la lecture optique.

Il est possible d'ajouter un bloc de sous-sens avant un autre bloc de sous-sens existant. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Il est également possible de supprimer un bloc de sous-sens en cliquant sur le bouton "-".

2.18 Sous-sens

Voir la partie sens ci-dessus.

2.19 Relecture

Le champ de relecture sert à indiquer à d'autres relecteurs le travail qui a été réalisé et celui qui reste à faire. vous pouvez indiquer si vous avez relu le texte français ou japonais depuis la page originale scannée du Cesselin. S'il reste des erreurs de structuration, vous pouvez l'indiquer également ("à fusionner avec l'article voisin", "à séparer en deux entrées" ou "à restructurer"). Si vous voulez supprimer une entrée, indiquez-le également dans ce champ.

2.20 Notes

Ce champ contient du texte libre. Si vous ajoutez du texte, celui-ci sera également affiché dans la version finale lors de la consultation.

3 Champs d'édition du volume français→japonais (Raguet-Martin)

Cette partie détaille chaque partie d'information (et donc chaque champ du formulaire d'édition complète) et explique les corrections qu'il est possible d'apporter.

[EC] : Les instructions spécifiques à l'édition complète sont notées [EC].

[ER] : Les instructions spécifiques à l'édition rapide sont notées [ER].

3.1 Vedette

Il est possible d'ajouter une seule variante pour la vedette ainsi qu'une forme au féminin pour les noms et adjectifs.

3.2 Catégorie grammaticale (Gram)

Les catégories grammaticales sont celles d'origine du Raguet-Martin.

3.3 Liste de sens

Les sens sont constitués d'un domaine (éventuellement vide), d'un registre (éventuellement vide) et d'une liste de segments.

Il est possible d'ajouter un sens en cliquant sur le bouton "+". Il est possible d'ajouter un sens avant un autre bloc de sens existant. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Lorsque vous ajoutez un nouveau sens, vous pouvez ajouter un numéro de sens en début de champ si celui-ci se situe à la fin des sens déjà existants. Sinon, le numéro sera noté "+". Certains numéros de sens qui apparaissaient à l'origine dans le Raguet-Martin sont affichés dans la vue finale des articles dans un but de repérage uniquement. Cette numérotation sera supprimée par la suite.

Il est également possible de supprimer un bloc de sens en cliquant sur le bouton "-".

3.4 Domaine

Les domaines du Raguet-Martin sont pratiquement les mêmes que ceux du Cesselin :

3.5 Registre

La liste des registres du Raguet-Martin est la suivante :

3.6 Autres abréviations

3.7 Liste de segments

Un segment est composé d'une partie en français et d'une partie en japonais. La partie en français est parfois une glose ou parfois une expression traduite dans la partie en japonais.

Il est possible d'ajouter un segment en cliquant sur le bouton "+". Cela ne doit se faire que s'il faut restructurer une entrée avec un exemple mal détecté par la lecture optique. N'ajoutez pas encore d'exemples, surtout si vous les avez inventés pour l'occasion.

Il est possible d'ajouter un bloc d'exemple avant un autre bloc d'exemple existant. Pour cela, il faut sélectionner le bloc suivant avant de cliquer sur le bouton "+".

Il est également possible de supprimer un exemple en cliquant sur le bouton "-".

3.8 Le segment français

Le texte en français a été vérifié avec un analyseur morphologique. Les erreurs sont notées avec la balise <pb>.

Les mots-vedettes en français apparaissant dans les segments (affichés en gras) ont été balisés automatiquement avec l'élément <mv>. Il n'est pas nécessaire de rajouter les balises <mv> lors de vos corrections.

3.9 Le segment japonais (romaji)

Le texte en romaji a été vérifié automatiquement. Les erreurs sont notées avec la balise <pb>.

Les mots-vedettes en romaji apparaissant dans les segments (affichés en gras) ont été balisés automatiquement avec l'élément <tv>. Il n'est pas nécessaire de rajouter les balises <tv> lors de vos corrections.

[EC] : Si vous corrigez une erreur marquée par la balise <pb>, vous devez également la supprimer. Si vous supprimez une balise ouvrante (p.ex : <pb>), n'oubliez pas de supprimer la balise fermante correspondante </pb>)

[ER] : Le romaji est modifiable directement en édition rapide. Dans ce cas, les balises <pb> et <tv> sont automatiquement supprimées. Il ne faut pas les rajouter.
Pour le Raguet-Martin, le furigana est utilisé pour afficher les kanjis. Pendant l'édition, ils sont convertis de la façon suivante : {romaji|kanji}. NE supprimez pas ces codes. Ils sont ensuite reconvertis en balises ruby pour afficher le furigana. Vous pouvez ajouter des kanji avec ce système de codage. Ils seront également convertis ensuite.

3.10 Relecture

Le champ de relecture sert à indiquer à d'autres relecteurs le travail qui a été réalisé et celui qui reste à faire. vous pouvez indiquer si vous avez relu le texte français ou japonais depuis la page originale scannée du Raguet-Martin. S'il reste des erreurs de structuration, vous pouvez l'indiquer également ("à fusionner avec l'article voisin", "à séparer en deux entrées" ou "à restructurer"). Si vous voulez supprimer une entrée, indiquez-le également dans ce champ.

3.11 Notes

Ce champ contient du texte libre. Si vous ajoutez du texte, celui-ci sera également affiché dans la version finale lors de la consultation.

4. Boutons de bas de formulaire

4.1 Mettre à jour

Si vous voulez sauvegarder temporairement vos modifications (en cours de session), cliquez sur le bouton "mettre à jour". Le formulaire sera mis à jour avec vos modifications.

4.2 Enregistrer comme brouillon

Si vous voulez sauvegarder de manière permanente vos modifications pour y revenir ensuite une prochaine fois, cliquez sur le bouton "enregistrer comme brouillon". L'article sera enregistré avec le statut de "brouillon". Vous pourrez ensuite le rechercher à l'aide du formulaire de consultation avancée et du critère "statut de la contribution".

4.3 Prévisualiser

Une fois que votre travail est terminé, cliquez sur "Prévisualiser" pour voir la version finale de l'Article tel qu'il sera affiché lors de la consultation. Si vous êtes safistait, cliquez ensuite sur "Enregistrer" puis "Fermer la fenêtre".