Hałas i cisza

Hałas

W bibliotekoznawstwie i informatyce mówimy o szumie, gdy system zapytań bazy danych dostarcza nieistotnych odpowiedzi. Odpowiedzi te są mieszane z odpowiednimi odpowiedziami, co powoduje ryzyko, że użytkownik ich nie zobaczy. Może się to zdarzyć zwłaszcza w przypadku katalogów bibliotecznych. Przyczyn hałasu może być wiele:

Niech N będzie zbiorem dokumentów, A jest podzbiorem N i zawiera odpowiedzi istotne dla wyszukiwania użytkownika, B jest podzbiorem N utworzonym z uzyskanych odpowiedzi. Im niższe A niż B, tym większy szum i niższy współczynnik dokładności.

Cisza

W bibliotekoznawstwie mówimy o milczeniu, gdy istotne odpowiedzi nie są oferowane przez system przesłuchań bazy danych , a więc one istnieją. Może się to zdarzyć zwłaszcza w przypadku katalogów bibliotecznych . Przyczyn milczenia może być wiele:

Niech N będzie zbiorem dokumentów, A jest podzbiorem N i zawiera odpowiedzi istotne dla wyszukiwania użytkownika, B jest podzbiorem N utworzonym z uzyskanych odpowiedzi. Im więcej A jest większe niż B, tym większa cisza i niższy współczynnik przypominania .

Hałas i cisza

Na tę samą prośbę możemy spotkać hałas i ciszę. Ciekawe dokumenty są słabo indeksowane (cisza), a niepotrzebne dokumenty spełniają równanie wyszukiwania. Na przykład, jeśli użytkownik wpisze Viking, dokumenty zindeksowane słowem Normans mogą się nie pojawić (cisza), a niektóre z sond kosmicznych mogą się pojawić (szum).

Hałas i cisza w kontekście wyszukiwania w sieci

Sieć jest szczególnie podatnym gruntem dla hałasu i ciszy. Véronique Mesguich identyfikuje czynniki złożoności sieci, które wpływają na skuteczność wyszukiwań:

Bibliografia

  1. Hudon, Michèle. , Analiza i przedstawienie dokumentacji: wprowadzenie do indeksowania, klasyfikacji i kondensacji dokumentów ( ISBN  978-2-7605-3744-6 , 2-7605-3744-7 i 978-2-7605-3746-0 , OCLC  873807457 , czytaj online )
  2. Mesguich, Véronique. , Wyszukiwanie strategicznych informacji w sieci: pozyskiwanie, monitorowanie i analiza w dobie rewolucji cyfrowej ( ISBN  978-2-8073-1578-5 i 2-8073-1578-X , OCLC  1045636776 , czytaj online )
  3. „  Wyszukiwarka Google ma ponad 130 bilionów stron  ” w Search Engine Land ,14 listopada 2016 r(dostęp 21 listopada 2019 )