Un corpus en arabe annot\'e manuellement avec des sens WordNet (Arabic Manually Sense Annotated Corpus with WordNet Senses)
OntoNotes comprend le seul corpus manuellement annot{\'e} en sens librement disponible pour l{'}arabe. Elle reste peu connue et utilis{\'e}e certainement parce que le projet s{'}est achev{\'e} sans lier cet inventaire au Princeton WordNet qui lui aurait ouvert l{'}acc{\`e}s {\`a} son riche {\'e}cosyst{\`e}me. Dans cet article, nous pr{\'e}sentons une version {\'e}tendue de OntoNotes Release 5.0 que nous avons cr{\'e}{\'e}e en suivant une m{\'e}thodologie de construction semi-automatique. Il s{'}agit d{'}une mise {\`a} jour de la partie arabe annot{\'e}e en sens du corpus en ajoutant l{'}alignement vers le Princeton WordNet 3.0. Cette ressource qui comprend plus de 12 500 mots annot{\'e}s est librement disponible pour la communaut{\'e}. Nous esp{\'e}rons qu{'}elle deviendra un standard pour l{'}{\'e}valuation de la d{\'e}sambigu{\"\i}sation lexicale de l{'}arabe.
PDF Abstract