Opracowany przez | OutWit Technologie |
---|---|
Ostatnia wersja | 9,0 |
System operacyjny | Microsoft Windows , macOS i Linux |
Rodzaj | oprogramowanie do skrobania stron internetowych , menedżer pobierania |
Licencja | licencja właściciela |
Stronie internetowej | www.outwit.com |
OutWit Hub to oprogramowanie do skrobania stron internetowych , zaprojektowane do automatycznego wyodrębniania i zbierania informacji z zasobów internetowych lub lokalnych.
Program rozpoznaje i zbiera linki, obrazy, dokumenty, kontakty, powtarzające się słowa i grupy słów, kanały rss i konwertuje dane strukturalne lub niestrukturalne na sformatowane tabele, które można wyeksportować do arkuszy kalkulacyjnych lub baz danych . Pierwsza wersja oprogramowania została wydana pod koniec 2010 roku. Od tego czasu została wydana wersja 9.0styczeń 2020.
Program zawiera przeglądarkę internetową oraz panel boczny, który zapewnia dostęp do szeregu widoków zawierających dane z predefiniowanych ekstraktorów. Strony internetowe i dokumenty tekstowe są podzielone na różne części składowe i prezentowane w tych widokach jako tabele. Aplikacja może automatycznie przechodzić przez serie linków lub sekwencje stron wyników wyszukiwania, aby wyodrębnić poszukiwane informacje, uporządkować je w tabele i wyeksportować w różnych formatach. Wstępnie zdefiniowane ekstraktory umożliwiają gromadzenie ustrukturyzowanych tabel, list i przepływów. Jeśli te automatyczne wyodrębniania nie wystarczą, użytkownik może również utworzyć specjalne skrobaki, aby wyodrębnić elementy ze stron o mniejszej strukturze. Wyrażenia regularne mogą być używane w skrobakach, a także w innych częściach aplikacji do definiowania zmiennych markerów do rozpoznawania i ekstrakcji danych.
Program występuje w dwóch wersjach: aplikacja wykonywalnego i Mozilla Firefox add-on , z identyczną funkcjonalność. Bezpłatną i limitowaną wersję można pobrać ze strony wydawcy oraz z witryn pobierania.