Język naturalny

Języka naturalnego lub zwykły język , jest to „normalny” język używany przez człowieka. Przeciwstawia się językowi formalnemu , jak język komputerowy , a także językowi twórczemu Języków konstruowanych .

Historia

Za pomocą języka naturalnego określamy język używany przez ludzi, który pojawił się między 200 000 a 50 000 lat przed naszą erą. Jest to szczegółowo opisane w historii języków . Po 2 milionach lat ciąży przez Homo erectus , który przejął od Homo habilis , współczesny człowiek, zwany Homo sapiens , pojawił się w wyniku splotu wielu czynników:

Istnieją dwa scenariusze pojawienia się Homo sapiens :  scenariusz „  Poza Afryką ” i scenariusz wieloprzyrodkowy (poligena). Najnowsze badania w wczesnochrześcijańskiej lingwistyki zidentyfikowanych na początku XXI E  wieku bazowego z 27 słów, wspólne u podstaw wszystkich pisanych języków ziemskich, która popycha do faworyzowania scenariusza „  Out of Africa  ” (monogenesis). Rzeczywiście, kilka źródeł nie miałoby powodu, aby przyjąć ten sam początkowy protolangu.

Następnie Homo sapiens narzucił się w obrębie gatunku ludzkiego, albo z powodu hipotezy produktywistycznej, albo z powodu hipotezy socjologicznej.

Przez około 7000 lat język ten przybierał formę pisemną w wielu językach, które następnie stały się językami dominującymi. Głównie z tego powodu 6000 języków jest dziś zagrożonych wyginięciem.

Języki komputerowe

W informatyce język naturalny przeciwstawia się językowi komputerowemu  :

Wyzwaniem dla wydawców wyszukiwarek jest zapewnienie odpowiednich wyników zapytań sformułowanych w języku naturalnym.

Alan Turing , brytyjski matematyk z pierwszej połowy XX th  century też przypuszczał, że sztuczna inteligencja mogłaby tak dobrze dają wrażenie „mówienia” trudno byłoby dostrzec człowieka. Testy sztucznej inteligencji, które mają zdolność naśladowania ludzkiej rozmowy, nazywane są testami Turinga .

Spójność języka naturalnego

Jeśli spójność tekstu jest właściwością tekstu, który nie wymaga dedukcji, aby przejść z jednego elementu dokumentu do drugiego, posłużymy się przykładem Floriana Wolfa i in. aby zilustrować tę właściwość:

Wnioski, jakie należy wyciągnąć, aby zrozumieć tekst, są tutaj trywialne, z poszanowaniem zasady znaczenia przy przekazywaniu informacji. Są postępowe. Wystrzelenie rakiety wymaga dobrej pogody, a wyrzutnia Ariane może wystrzelić dwa satelity. Nadal musimy scharakteryzować te wnioski: „pogoda była dobra i dlatego” pierwszy wniosek daje jednoznaczny wniosek, a „wyrzutnia Ariane […] umieścił dwa satelity na orbicie” czyni drugi wniosek wyraźnym. Nie wiadomo, czy wyrzutnia może wystrzelić cztery satelity, ale nie o to chodzi. Musimy mieć świadomość, że wszystkie słowa w tym tekście są potrzebne.

Ponadto postęp jest szanowany: rozmawiamy o pogodzie, potem o wystrzeleniu rakiety i wreszcie o tym, co jest odpalane.

Usuń z tego tekstu przymiotnik spacji związany ze środkiem rzeczownika i nie wiemy już, jak uzasadnić jego spójność. Musimy zatem wyciągnąć mniej wyraźny wniosek: centrum Kourou jest centrum przestrzennym. Aby to zrobić, musimy przyjrzeć się teorii pragmatyki, aby ocenić koszt tego wnioskowania. Należy zauważyć, że zasada trafności ewoluuje silnie, niezależnie od tego, czy posługujemy się językiem pisanym, w którym z góry ustalone są słabe, czy też językiem ustnym, w którym to, co z góry ustalone, jest ważne, wiedząc, że autor zna część wiedzy swojego słuchacza.

Należy zauważyć, że wiele tekstów nie spełnia tej właściwości: dlatego Michel Charolles poświęca wiele dokumentów na inwentaryzację tych sytuacji niejednoznaczności w tekstach:

Te przykłady podkreślają pojęcie głębi ukrytego traktowania, którego wymagają te teksty, aby osiągnąć spójność.

Aspekty leksykalne

Zgodność typograficzna zostanie zdefiniowana jako właściwość tekstów polegająca na poszanowaniu pisowni i typografii w piśmie. Jeśli można uznać, że „brama windy” stanowi nazwaną jednostkę, a „brama windy” jest nazwą pospolitą, dosłowne tłumaczenie słowa „brama windy” na jednostkę nazwaną wprowadza niepotrzebny szum w przetwarzaniu semantycznym . Pożądane jest filtrowanie tych objawów podczas leczenia morfologicznego.

Zgodność leksykalna polega na wyborze właściwego terminu dla pojęcia: w ten sposób „tylna klapa” jest wyrazem złożonym, a „tylna klapa” jest tłumaczona w języku francuskim jako „tylna klapa”, nawet jeśli w języku francuskim ten termin jest zbędny, ponieważ dość.

Korzystanie ze słownika jest zadowalające, o ile przeszukuje się nie tylko napotkane słowa, ale także części słów (leksemy), które mogą stanowić słowa.

W związku z tym w pierwszych dwóch dokumentach korpusu narzucono wybór zastąpienia „dekla” przez „pokrywę bagażnika”, co oznacza „pokrywę bagażnika”. Ten typ błędu będziemy oznaczać błędem leksykalnym związanym z analizą słów złożonych.

Poza tym musimy zająć się rozwiązywaniem niejednoznaczności wyrażeń. Nie powinniśmy zatrzymywać się na rdzeniach lematów słów złożonych.

Ogólne aspekty

Cechy stylistyczne, które przyczyniają się do większej spójności. Dokumenty ogólne zyskują na tym, że są pisane w obecnym typie, poprzez jak największe ujednolicenie formularzy negatywnych. Zatem wymaganie przyjmuje formę aktywną i jest zapisane w obecnym rodzaju, a przekształcenie form pasywnych w formy aktywne jest wystarczające, aby zaspokoić tę potrzebę. Przydatne może być również użycie transformacji do przetwarzania negatywnych tekstów.

Dyskursywne aspekty

Jakość dokumentów jest określona głównie ze względu na elementy składowe rdzenia spójności:

Uwagi i odniesienia

Uwagi

  1. Zobacz na ten temat badania genetyków w Instytucie Maxa Plancka . W lipcu 2006 roku Instytut i 454 Life Sciences ogłosiły, że podejmują się sekwencjonowania genomu neandertalczyków. Zbudowany z trzech miliardów par zasad genom neandertalczyka jest mniej więcej wielkości genomu ludzkiego i prawdopodobnie ma wiele identycznych genów. Uważa się, że porównanie genomu neandertalczyków i ludzkiego genomu zapewni wgląd w ten wymarły gatunek, a także ewolucję człowieka i ludzkiego mózgu. Instytut Antropologii Ewolucyjnej im . Maxa-Plancka .
  2. Obszary te zostały zidentyfikowane w końcu XIX th  wieku i brak dowodów na aktywację tych dziedzinach daje się innymi gatunkami Homo że Homo sapiens
  3. http://www.tlfq.ulaval.ca/axl/monde/ origin- langes.htm
  4. Zwiększenie spójności dokumentów specyfikacji z przemysłu motoryzacyjnego, Jean Noël Martin 2012, Braga Portugal slate 2012 - czerwiec 2012 http://drops.dagstuhl.de/portals/oasics/index.php?semnr=12004

Bibliografia

  1. Cécile Lestienne, Ghislain Dehanne, Laurent Sagart, Pascal Picq, Najpiękniejsza historia języka , Seuil, 2008.
  2. (w) Alec MacAndrew, FOXP2 i ewolucja języka .
  3. Jean-Pierre Changeux, L'Homme neuronal , Fayard, Paryż, 1983.
  4. Jean-Pierre Changeux, Własność zbiorów neuronowych w teoriach języka i teoriach uczenia się , Edycja progu, Paryż, 1979.
  5. Joseph Donato, Wariacja językowa w językoznawstwie pod kierunkiem Fréderic François, PUF, 1980.
  6. Fabien Wolf i Edward Gibson, Koherencja w języku naturalnym , Massachusetts Institute of Technology , 2006.
  7. Michel Charolles, Spójność, trafność i integracja pojęciowa , Uniwersytet Paris III, 2002.

Bibliografia

Odniesienia pochodzą między innymi z książki Aux Origines des Langues et du Langue, wydanej przez Jean-Marie Homberta, Fayard , 2005

  1. Jean-Jacques Hubelin, Język pierwszych ludzi .
  2. Philippe Vernier, Ewolucja mózgu i pojawienie się języka .
  3. Christophe Coupé, W poszukiwaniu wskazówek dotyczących języka artykułowanego .
  4. Christophe Coupé, Niemożliwe poszukiwanie języka ojczystego .
  5. Bernard Victorri, Tajemnice pojawienia się języka .

Zobacz też

Powiązane artykuły