Kolekcja Pangloss

Kolekcja Pangloss jest biblioteka cyfrowa opracowana przez LACITO laboratorium z CNRS w Paryżu . Jego celem jest zebranie nagrań dźwiękowych w różnych językach świata - w większości zagrożonych wyginięciem - i udostępnienie ich szerokiemu audytorium.

Kolekcja oferuje bezpłatny dostęp online do różnego rodzaju dokumentów (opowieści i legendy, życiorysy, świadectwa rzemieślników, przeglądy leksykalne lub fonologiczne  itp. ) W językach ze wszystkich kontynentów. Zawiera również słowniki.

W lutym 2018 roku kolekcja Pangloss zawierała 3559 nagrań w 170 językach.

Zasady

Archiwum dźwiękowe ze zsynchronizowanymi transkrypcjami

Kolekcja Pangloss zapewnia dostęp do oryginalnych nagrań. Część z nich posiada transkrypcje (w zależności od przypadku fonetyczne, fonologiczne i / lub ortograficzne) oraz tłumaczenia. Każdy dokument jest zapisywany w swoim kontekście kulturowym i przepisywany we współpracy z native speakerami , zgodnie z metodami badania i opisu języków z tradycją ustną.

Słowniki

Oprócz nagrań dźwiękowych w Pangloss Collection od 2002 r. Znajdują się również słowniki. W 2017 r. Kolekcja słowników Pangloss Collection przyjęła nazwę „Lexica”.

Architektura otwartego archiwum

Zarchiwizowane dane mają strukturę otwartego formatu i można je pobrać (niektóre na licencji Creative Commons ). Oprogramowanie wykorzystywane do przygotowania i dystrybucji zasobów ma otwarty dostęp (kod open source ). „Kolekcja Pangloss bardzo wcześnie opierała się na technologiach - takich jak ekosystem XML - które są obecnie w centrum cyfrowej humanistyki”.

Kolekcja Pangloss jest członkiem OLAC sieci archiwów językowych i sieci DELAMAN archiwów zagrożonych języków.

Kolekcja Pangloss jest zdefiniowana jako jedna z kolekcji CoCoON (dla „COrpus Oraux Numériques”), platforma techniczna, która wspiera producentów materiałów ustnych w tworzeniu, strukturyzowaniu i archiwizowaniu ich korpusów. Dane są archiwizowane w archiwum Bardzo Dużej Infrastruktury Badawczej Huma-Num .

Historyczny

W 2001 r. „Program archiwizacji LACITO” obejmował około 100 dokumentów w około 20 językach. W 2011 roku kolekcja Pangloss składała się z około 1000 nagrań w 67 językach , w tym 350 transkrybowanych i opatrzonych adnotacjami dokumentów. W 2014 roku miał 1400 rekordów, z których około 400 zostało przepisanych i opatrzonych adnotacjami. Od października 2016 r. Miała 132 języki. W lutym 2018 roku kolekcja Pangloss osiągnęła 3559 rekordów w 170 językach, na koniec 2020 roku ponad 3600.

W 2021 roku oprogramowanie do automatycznego przetwarzania języków powinno ułatwić zadanie transkrypcji i archiwizacji, teraz powinna wystarczyć godzina zamiast stu wcześniej.

Bibliografia

  1. Prezentacja kolekcji Pangloss ( strona internetowa LACITO ) .
  2. Michailovsky, Boyd, Martine Mazaudon, Alexis Michaud, Séverine Guillaume, Alexandre François & Evangelia Adamou. 2014. Dokumentowanie i badanie zagrożonych języków: kolekcja Pangloss. Dokumentacja językowa i konserwacja 8. 119–135. http://hdl.handle.net/10125/4621
  3. Zobacz listę wszystkich zasobów Pangloss na stronie hosta „CoCoON” (dostęp 25 lutego 2018) .
  4. Liczba wpisów na liście języków reprezentowanych w Pangloss (dostęp 25 lutego 2018) .
  5. (en) Michel Jacobson , Boyd Michailovsky i John B. Lowe , „  Dokumenty językowe synchronizujące dźwięk i tekst  ” , Komunikacja mowy , t.  33, n kość  1-2,2001, s.  79–96 ( DOI  10.1016 / s0167-6393 (00) 00070-4 , czytaj online , dostęp: 28 sierpnia 2017 )
  6. Bouquiaux, Luc i Jacqueline Thomas. 1971. Przegląd i opis języków z tradycją ustną . Wydanie drugie, 1976. Paryż: Towarzystwo Studiów Lingwistycznych i Antropologicznych Francji.
  7. Jacobson, Michel i Boyd Michailovsky. 2002. Łączenie zasobów lingwistycznych: korpus i słownik w czasie. Międzynarodowe warsztaty na temat zasobów i narzędzi w językoznawstwie polowym . Las Palmas.
  8. Bonnet, Rémy, Céline Buret, Alexandre François, Benjamin Galliot, Séverine Guillaume, Guillaume Jacques, Aimée Lahaussois, Boyd Michailovsky i Alexis Michaud. 2017. W stronę połączonych zasobów elektronicznych: Lexica, słowniki z kolekcji Pangloss. Materiały z 9. Międzynarodowych Dni Lingwistyki Korpusowej, 48–51. Grenoble: Uniwersytet Grenoble Alpes.
  9. Sylvain Loiseau, „  The Pangloss Collection: an archive of the languages ​​of the world  ” , na http://www.inalco.fr/ , Itinerary (s) - The letter of research and the international (INALCO) ,6 stycznia 2020 r(dostęp 15 stycznia 2020 )
  10. (w) „  Digital Musics and Endangered Languages ​​Archive Network  ” (dostęp: 5 kwietnia 2020 r. )
  11. „  Collections de Corpus Orraux Numériques  ” (dostęp 11 września 2017 r. )
  12. Michailovsky, Boyd, Alexis Michaud i Séverine Guillaume. 2011. Prosta architektura szczegółowej dokumentacji zagrożonych języków: multimedialne archiwum LACITO. Przemówienie na konferencji Oriental-COCOSDA 2011, 26-28 października 2011 . Hsinchu, Tajwan.
  13. „  Pangloss Collection - FAQ  ” (dostęp 10 listopada 2016 r. )
  14. Ile języków jest reprezentowanych w Pangloss?
  15. Laure Cailloce, „  Pangloss, słuchając rzadkich języków  ” , w Journal du CNRS ,14 stycznia 2021 r(dostęp 29 stycznia 2021 ) .

Linki zewnętrzne