Clarification des okurigana

Si vous consultez régulièrement le dictionnaire, vous aurez remarqué que le Cesselin est assez radin sur les okurigana. Par exemple, pour l’entrée tabemono, on trouve 食物 alors que de nos jours, tout le monde écrit 食べ物.

Il fallait donc trouver une solution pour corriger automatiquement ces entrées. C’est chose faite depuis ce soir grâce à un script de ma spécialité qui consulte le dictionnaire SuperDaijirin installé par défaut sur MacOsX et affiche les variantes okurigana pour une entrée donnée. C’est environ 6500 entrées qui ont été corrigées.

Vous pouvez donc chercher 食物 et vous tomberez sur l’entrée 食べ物. Les anciennes variantes du Cesselin sans okurigana peuvent être utilisées pour la recherche mais ne sont pas affichées dans un soucis de simplification pour ne pas perturber le lecteur.

Bonne lecture !

Vedettes non reconnues : sous la barre des 10%

Petit à petit, la liste des articles dont les vedettes n’ont pas été reconnues par la lecture optique se réduit. nous sommes passés sous la barre psychologique des 10% avec 8 257 articles non reconnus. Cela fait un peu plus de 2 000 articles corrigés manuellement, soit 1/5ème de tous les articles non reconnus. Tout cela a été réalisé par 3 personnes. Il est donc tout à fait possible de finir cette liste des articles non reconnus rapidement si d’autres contributeurs nous rejoignent. À vos claviers !

Bon anniversaire !

Et oui, c’était déjà il y a 1 an jour pour jour que nous lancions officiellement ce site Web lors d’une conférence à l’Université Hosei à Tokyo.
Et pour fêter comme il se doit cet anniversaire, rien de tel qu’un petit cadeau pour nos fidèles utilisateurs. Thibaut et moi avons développé une application android cliente pour pouvoir consulter tranquillement le dictionnaire sur son smartphone et même corriger les dernières erreurs croisées sur le chemin.
downloadAndroid-app
Si vous souhaitez beta-tester l’application, contactez-moi par mel (voir au bas de la page d’informations).

La meilleure contributrice du mois

couronne_laurier_0

Ce mois-ci, nous remettons notre couronne de lauriers à la meilleure contributrice du mois qui est Constance (Mutsuko) avec un nombre impressionnant de 1168 contributions !
Ce sont environ 600 articles dont les mots-vedettes ont été corrigés par Mutsuko !
La barre a été mise très haut. Le record sera à mon avis bien difficile à battre.

Je voyais l’objectif des 10 000 mots-vedettes à corriger comme très lointain, voire inatteignable. En un mois, Mutsuko a elle seule en a corrigé 6%. C’est donc possible si on trouve une équipe motivée un peu plus étoffée de boucler l’objectif en un an, voire 6 mois !

Merci beaucoup Mustuko 🙂

Vous pouvez en savoir plus en vous rendant sur la page des statistiques.

Améliorations d’octobre

Ce mois-ci, quelques petites améliorations ont été effectuées :

  • Tout d’abord, la structure du dictionnaire a été corrigée de façon à ce que son intégralité soit conforme à sa définition (schéma XML). Cela évitera à l’avenir les problèmes d’informations manquantes dans l’éditeur.
  • Autre nouveauté : des listes d’articles à traiter en priorité sont maintenant proposées en haut de la page d’accueil. Les listes sont calculées avec une fréquence d’apparition de mots dans un corpus de textes japonais.

ニュース:簡単な書き方と新しい語彙

今月はいいニュースがあります:

  • ウェッブサイトをフランスの研究所のサーバーに移しました。さらに、ドメインの名前を買いました:jibiki.fr
  • 辞書を大きくするために、JMdictから4万7811簡単とWikipediaから2万3456簡単を辞書に入れました。今は全部で15万3929簡単があります。statistiques.php のページを見て下さい。
  • 簡単な書き方を作りました。直接に項目を直せます。 ヘルプのページを見て下さい。