W danych surowych (znane również jako pierwotnych danych) są dane nie interpretowane z głównego źródła , o właściwościach związanych z nią i która nie została poddana żadnej obróbce lub jakiejkolwiek innej manipulacji.
Surowe dane można wprowadzić do programu komputerowego lub wykorzystać w procedurach ręcznych, takich jak analiza statystyczna ankiety.
Mogą to być dane binarne z elektronicznych urządzeń magazynujących, takich jak dyski twarde .
Surowe dane zawierają mniej lub bardziej faktyczne informacje . Często mają one charakter ilościowy , zakładając, że są wiarygodne, jeśli instrument, który je wyprodukował, został odpowiednio skalibrowany i jeśli proces zbierania danych nie jest stronniczy i jeśli są prawidłowo kontekstualizowane.
W dziedzinie badań naukowych (gdzie konieczne jest powtórzenie eksperymentu w celu jego kontroli lub walidacji) przedstawione lub potwierdzone fakty bez udostępniania surowych danych są coraz bardziej ostrożne. Nieprzechowywanie ich staje się podejrzane, ponieważ w ostatnich latach spadły koszty przechowywania i wzrosła liczba skandali związanych z błędami wiedzy wynikającymi z surowych danych.
Jednak według Geoffrey C. Bowker (2005), „Musimy otworzyć debatę - chociaż istnieje obecnie żaden poważny - o różnych temporalities , spatialities i materialities że jesteśmy prawdopodobnie reprezentują dzięki naszym . Baz danych , z, w view, projekt zapewniający maksymalną elastyczność i pozwalający, w miarę możliwości, na pojawienie się polifonii i polichronii . Wyrażenie „surowe dane” jest w równym stopniu oksymoronem, co złym pomysłem; wręcz przeciwnie, dane należy przygotowywać ostrożnie. ” .