Bisame
Connexion Inscription

BISAME ? Wàs ìsch dàs ?


BISAME est un projet de recherche qui vise à recueillir des informations linguistiques sur des mots en alsacien. Nous invitons tout dialectophone, passioné (ou non !) de grammaire, à participer à ce projet collaboratif.

En pratique, il s'agit d'associer des catégories grammaticales à des mots alsaciens :

Mais la grammaire, c'est loin... !

Pas de panique ! Une phase de formation permet de se remettre les idées au clair sur les 18 catégories possibles. De plus un aide mémoire sous forme d'exemples est à votre disposition.

Wurum mìtmàcha ? - Pourquoi participer ?

  1. Les ressources linguistique en ligne sont rares et l'annotation manuelle par des linguistes est (très) coûteuse.
  2. Ces ressources sont nécessaires pour développer de nouveaux outils qui contribuent à faire exister les langues sur Internet (par exemple : outils d'aide à la traduction, d'extraction d'information, moteurs de recherche, outils pédagogiques etc.).
  3. Les résultats d'ores et déjà obtenus sont encourageants !

Aujourd'hui BISAME c'est :

219 inscrits

80 participants ayant finalisé la phase d'entraînement

52 participants ayant produit des annotations

116 jours d'annotation

soit :

25943 annotations produites

Un corpus de 8246 mots distincts annotés collaborativement : Télécharger (CONLL)

Un outil d'annotation automatique entraîné grâce à cette nouvelle ressource : Télécharger le modèle (MElt)

Pour plus de détails, vous pouvez consulter la publication à laquelle ce projet a donné lieu : Article

Ìch mecht garn mìtmàcha... àwer wia màcht ma ? - Comment participer ?

Rien de plus simple, il suffit de choisir un pseudonyme et de créer un compte en cliquant sur le bouton
INSCRIPTION.
Une fois la phase de formation complétée, vous pourrez commencer à annoter un des textes présents sur la plate-forme (en ce moment E Hochzit in de 50er Johre de Raymond Weissenburger, texte à retrouver dans son intégralité ici).
Connexion Inscription



L'alsacien fait partie de la grande majorité des "langues peu dotées" au sens des technologies du langage.

Aucun des outils des nouvelles technologies de la langue - par exemple : correction orthographique, aide à la traduction, extraction d'information - qui contribuent à faire exister les langues sur Internet n'est développé pour l'alsacien.

La raison ? Il existe très peu de données "annotées", c'est-à-dire enrichies d'informations linguistiques, à partir desquelles développer de tels outils. C'est pourquoi nous faisons appel à vous : locuteurs de l'alsacien, passionnés ou non de grammaire, désireux dans tous les cas de contribuer au déploiement de votre langue, participez grâce à BISAME à la création d'un corpus de l'alsacien annoté en catégories grammaticales !

Pour tout complément d'information sur ce projet de recherche réalisé dans le cadre d'un doctorat en Traitement Automatique des Langues à la Sorbonne en collaboration avec l'équipe du projet RESTAURE du LiLPa de Strasbourg, Me contacter par mail .
Ce projet étant en cours d'amélioration n'hésitez pas à me transmettre vos remarques ou suggestions !

Alice

Lien vers la chronique de Pierre Nuss (France Bleu Elsass)