DIINAR

DIINAR.1 ( DI ctionnaire IN sformatowany z AR abe, wersja 1), arabski akronim Ma'âlî („Mu'jam al-'Arabiyya l - '? L?” - „مـعـالــي” مختصر ”معجم العربية الآلي”) bardzo kompletne źródło językowe dla języka arabskiego, zbudowane jak baza danych i działające na poziomie formy słownej - lub graficznej - tj. na tak zwanym poziomie morfologicznym. Przeprowadzono go wspólnie, w Tunisie na IRSIT (Abdelfattah Braham i Salem Ghazali) oraz we Francji na ENSSIB (Mohamed Hassoun) i na Uniwersytecie Lumière-Lyon 2 (Joseph Dichy).

• Specyfikatory morfosyntaktyczne są powiązane z każdym wpisem. Analiza morfologiczna może zatem przetwarzać dane wejściowe w nieokreślonym prostym alfabecie arabskim, a generacja morfologiczna może w razie potrzeby tworzyć pełne, częściowe lub niezawokowane formy pisma. Te specyfikatory należą do skończonych zbiorów, ale pozwalają na wyczerpujące traktowanie danych, zgodnie z całkowicie oryginalnym podejściem.

• Całkowita liczba wpisów dla zasobu językowego DIINAR.1 wynosi obecnie 121 522, z czego 6 546 korzeni.

• Liczba haseł obejmuje 445 słów narzędziowych należących do różnych kategorii gramatycznych (przyimki, spójniki itp.) Oraz prototyp bazy danych nazw własnych 1384 haseł. Oba te typy danych wejściowych mają własne zestawy specyfikatorów morfosyntaktycznych (na poziomie słowa). Główne części bazy danych obejmują ponadto:


Liczba głównych haseł należących do głównych kategorii leksykalnych

Noms, y compris adjectifs 29.534 Pluriels brisés –جموع التكسير 9.565 Noms propres (prototype) (أسماء الأعلام) 1.384 Verbes 19.457 Dérivés nominaux (مشتقات اسمية) * formes infinitives (مصادر) 23.274 * participes actifs (أسماء الفاعل ) 17.904 * participes passifs (أسماء المفعول ) 13.373 * adjectifs analogues’ (صفات مشبهة) 5.781 * noms de temps et lieu’ (أسماء المكان والزمان) 10.370 Total des dérivés nominaux 70.702 Sous total d’entrées principales 121.077

Liczba głównych haseł należących do głównych kategorii leksykalnych


• Dystrybucja: za pośrednictwem ELDA, European Evaluation and Language Resources Distribution Agency - Europejska Agencja ds. Oceny i Dystrybucji Zasobów Lingwistycznych, 55, rue Brillat-Savarin, 75013-Paris - www.elda.org.

Aktualna wersja (DIINAR1) została wycofana z katalogu, zostanie zastąpiona wersją DIINAR2 w ciągu miesiąca Maj 2010.


• Artykuły i dokumenty, które można pobrać ze strony internetowej DIINAR http://diinar.univ-lyon2.fr/


• Zobacz także na stronie http://diinar.univ-lyon2.fr/ raport z europejskiego projektu DIINAR-MBC

Źródła