Skrobanie stron internetowych

Skrobanie internetowych (czasami nazywane zbioru ) jest technika ekstrakcji zawartości stron internetowych za pośrednictwem skryptu lub programu , w celu przekształcenia go w celu umożliwienia jego stosowania w innym kontekście, na przykład SEO .

Legalność

W USA

W Stanach Zjednoczonych hiQ Labs wykorzystuje do celów rekrutacyjnych technikę web scrapingu na danych LinkedIn . Po pozwie Sąd Apelacyjny Stanów Zjednoczonych dla Dziewiątego Okręgu orzekł na korzyść hiQ inwrzesień 2019 : sąd uważa w szczególności, że użytkownicy zachowują własność swoich profili, a dane swobodnie rozpowszechniane w Internecie mogą być gromadzone. Sprawa trafia następnie do Sądu Najwyższego .

W Europie

W wyroku z 2013 r. Trybunał Sprawiedliwości Unii Europejskiej potępił metawyszukiwarkę Innoweb, która ponownie wykorzystywała dane firmy sprzedającej samochody Wegener bez ich modyfikacji.

30 kwietnia 2020 r., CNIL opublikował nowe dyrektywy dotyczące web scrapingu. Wytyczne CNIL określają, że dane dostępne publicznie są zawsze danymi osobowymi i nie mogą być ponownie wykorzystywane bez wiedzy osoby, do której te dane należą.

Aplikacje wykorzystujące web scraping

Wykorzystanie w zarządzaniu danymi multimedialnymi

Web scraping może być używany do pobierania metadanych . W ten sposób biblioteka multimedialna XBMC pozyskuje informacje o mediach, którymi zarządza (plakaty i streszczenia filmów i seriali, okładki albumów itp.) w różnych serwisach, takich jak IMDb czy AlloCiné, za pomocą dedykowanych skrobaków.

Uwagi i referencje

  1. Régis Micheli i Jean-Noël Anderruthy, Le Référencement Reklama z Google AdWords: Wskazówki, porady: wszystkie techniki certyfikowanych ekspertów. ,29 października 2012 r.( przeczytaj online )
  2. Clément Bohic, „  LinkedIn nie ogranicza gromadzenia danych online  ” , na stronie silicon.fr ,10 września 2019 r.(dostęp 5 czerwca 2020 r . ) .
  3. (w) Wendy Davis, „  Sąd Najwyższy prosi hiQ o odpowiedź w bitwie o pozyskiwanie danych  ” ,27 kwietnia 2020 r.(dostęp 5 czerwca 2020 r . ) .
  4. Arnaud Touati i Christina Salassidis, „  Skanowanie stron internetowych, legalna technika ekstrakcji?  » , O obowiązującym prawie ,11 października 2017 r.(dostęp 5 czerwca 2020 r . ) .
  5. "  Ponowne wykorzystanie danych publicznie dostępnych w Internecie do celów akwizycji komercyjnej  " , w sprawie Krajowej Komisji Informatyki i Wolności ,30 kwietnia 2020 r.
  6. (w) "  Legalne wycinanie stron internetowych do celów prawnych  " na finddatalab.com ,5 lipca 2020 r.
  7. „  Scrapers – Official Kodi Wiki  ” , na stronie kodi.wiki (dostęp 26 kwietnia 2020 r. )

Zobacz również

Powiązane artykuły