Skrobanie internetowych (czasami nazywane zbioru ) jest technika ekstrakcji zawartości stron internetowych za pośrednictwem skryptu lub programu , w celu przekształcenia go w celu umożliwienia jego stosowania w innym kontekście, na przykład SEO .
W Stanach Zjednoczonych hiQ Labs wykorzystuje do celów rekrutacyjnych technikę web scrapingu na danych LinkedIn . Po pozwie Sąd Apelacyjny Stanów Zjednoczonych dla Dziewiątego Okręgu orzekł na korzyść hiQ inwrzesień 2019 : sąd uważa w szczególności, że użytkownicy zachowują własność swoich profili, a dane swobodnie rozpowszechniane w Internecie mogą być gromadzone. Sprawa trafia następnie do Sądu Najwyższego .
W wyroku z 2013 r. Trybunał Sprawiedliwości Unii Europejskiej potępił metawyszukiwarkę Innoweb, która ponownie wykorzystywała dane firmy sprzedającej samochody Wegener bez ich modyfikacji.
30 kwietnia 2020 r., CNIL opublikował nowe dyrektywy dotyczące web scrapingu. Wytyczne CNIL określają, że dane dostępne publicznie są zawsze danymi osobowymi i nie mogą być ponownie wykorzystywane bez wiedzy osoby, do której te dane należą.
Web scraping może być używany do pobierania metadanych . W ten sposób biblioteka multimedialna XBMC pozyskuje informacje o mediach, którymi zarządza (plakaty i streszczenia filmów i seriali, okładki albumów itp.) w różnych serwisach, takich jak IMDb czy AlloCiné, za pomocą dedykowanych skrobaków.