W otwartych danych i otwarte dane są dane cyfrowe w tym dostęp i użytkowanie są wolne do użytkowników, którzy mogą być ze źródeł prywatnych, ale przede wszystkim publicznych, w szczególności produkowane przez społeczność lub instytucji publicznej. Są one dystrybuowane w ustrukturyzowany sposób, zgodnie z metodą i otwartą licencją, gwarantującą ich swobodny dostęp i ponowne wykorzystanie przez wszystkich, bez ograniczeń technicznych, prawnych lub finansowych.
Dostęp do danych ma na celu z jednej strony umożliwienie obywatelom lepszej kontroli administracji, z drugiej strony korzystanie z tych danych, co oznacza, że temu prawu dostępu towarzyszy prawo do ponownego wykorzystania.
Te prawa dostępu i ponownego wykorzystania są częścią myślenia, które traktuje informację publiczną jako dobro wspólne (zgodnie z definicją Elinor Ostrom ), którego rozpowszechnianie leży w interesie publicznym i ogólnym .
Otwartość danych jest zatem zarówno filozofią dostępu do informacji, ruchem na rzecz obrony wolności, jak i polityką publiczną .
Niektóre kraje były pionierami, w tym Stany Zjednoczone , Wielka Brytania , Australia i Kanada, a następnie Francja . Ruch rozprzestrzenił się w szczególności dzięki impetowi organizacji pozarządowych, takich jak Fundacja Otwartej Wiedzy (OKFN) i Partnerstwo Otwartego Rządu (PGO).
Dane są otwarte, jeśli każdy ma do nich swobodny dostęp, może je wykorzystywać, modyfikować i rozpowszechniać, niezależnie od ich przeznaczenia.
Open Data jest ruchem aktorów działających na rzecz otwartych danych. To także polityka publiczna polegająca na otwarciu danych publicznych, aby promować otwarte innowacje w sektorze publicznym, być odpowiedzialnym przed obywatelami i poprawiać przejrzystość działań publicznych, czy wreszcie udostępniać zasoby sektorowi prywatnemu. .
Artykuł 15 Deklaracji Praw Człowieka i Obywatela z 1789 r. mówi, że społeczeństwo ma prawo pociągać do odpowiedzialności każdego funkcjonariusza publicznego w swojej administracji. Niniejszy artykuł stanowi podstawę prawną prawa dostępu do informacji publicznej.
Freedom of Information Act , realizowany w 1967 roku, tworzy prawo do informacji dla obywateli. Została ona znowelizowana w szczególności w 2007 roku ustawą OPEN Government Act .
FrancjaOtwarte dane są rozwinięciem podejścia przyjętego w ustawie z 17 lipca 1978 r. dotyczącej dostępu do dokumentów administracyjnych, nawet jeśli nie wymaga to publikacji danych cyfrowych ani proaktywnej publikacji informacji. Uznaje po prostu prawo do zakomunikowania dokumentów będących w posiadaniu administracji, niezależnie od ich formy lub nośnika.
W Unii Europejskiej dyrektywa 2003/98/WE („ Informacje sektora publicznego ” (PSI )) Rady Unii Europejskiej z dnia 17 listopada 2003 r. w sprawie ponownego wykorzystywania danych publicznych oraz dyrektywa INSPIRE z 2008 r. zachęcają do otwartych danych .
Dyrektywa 2019/1024 „Dyrektywa w sprawie otwartych danych” z 2019 r. zastępuje dyrektywę z 2003 r.
Stany ZjednoczoneWraz z wyborem Baracka Obamy otwieranie danych publicznych staje się centralną osią amerykańskiego rządu z Inicjatywą Otwartego Rządu, która wymienia kryteria publikacji otwartych danych.
W swoim przemówieniu inauguracyjnym Barack Obama ogłosił zamiar „stworzenia bezprecedensowego poziomu otwartości w rządzie ” , w celu „wzmocnienia demokracji oraz promowania jej wydajności i skuteczności w rządzie” .
W Marzec 2009rząd USA uruchamia federalny portal otwartych danych data.gov . W grudniu tego samego roku dyrektywa otwartego rządu określa trzy filary współpracy państwa z obywatelami, którymi są: przejrzystość rządowa, uczestnictwo i współpraca. Vivek Kundra , czołowy federalny specjalista ds. systemów informacyjnych ( Chief Information Officer ) w administracji Obamy , zauważa , że " ujawnienie tych danych doprowadziło do zapisania aplikacji [...] nastąpiła eksplozja twórców tych społeczności " .
Wielka BrytaniaW Wielkiej Brytanii artykuł opublikowany przez The Guardian w 2006 roku „Oddaj nam klejnoty koronne” wzywa do liberalizacji danych publicznych i służy jako „moment inicjacji ruchu otwartych danych ” .
Gordon Brown uruchomił portal otwartych danych Data.gov.uk w styczniu 2010 roku pod kierownictwem Tima Bernersa-Lee .
FrancjaWe Francji niektóre władze lokalne, takie jak Rennes czy Paryż , zainicjowały w 2010 r. podejście do otwartych danych . Na szczeblu krajowym w lutym 2011 r. rząd utworzył misję Etalab , służbę premiera odpowiedzialną za koordynację polityki otwartych danych publicznych. i uruchomił specjalny portal data.gouv.fr w grudniu tego samego roku.
Na szczycie G8 w 2013 r. szefowie państw G8 podpisali „ Kartę G8 dotyczącą otwierania danych publicznych ”.
We Francji ustawa o Republice Cyfrowej z października 2016 r. we Francji, która ustanawia zasadę domyślnie otwartych publicznie dostępnych danych publicznych i tworzy pojęcie usługi danych publicznych , nadaje otwartym danym podstawę prawną.
To otwarte dane Ministerstwa Zdrowia Publicznego Francji dotyczące pandemii Covid-19 umożliwiły społeczności analityków publikowanie wykresów i map po pandemii na poziomie krajowym, w tym Guillaume Rozier .
Otwarcie danych o finansach publicznych było od samego początku sednem ruchu otwartych danych . W 2007 r. w Wielkiej Brytanii Jonathan Gray zaprojektował projekt „ Gdzie idą moje pieniądze ”, wizualizację danych o wydatkach rządu Wielkiej Brytanii, która umożliwia obywatelom łatwy dostęp do nich.
Otwarte dane naukowe i otwarty dostęp to dwa powiązane, ale odrębne tematy. Otwarty dostęp dotyczy publikacji naukowych, często recenzowanych. Otwarcie danych naukowych może dotyczyć danych, na których opierają się te artykuły, lub jakiejkolwiek bazy danych o charakterze naukowym (na przykład danych meteorologicznych lub innych), w celu umożliwienia odtworzenia przeprowadzonych eksperymentów w celu ich potwierdzenia lub unieważnić je.
Mogą to być również dane pochodzące z publicznych instytutów naukowo-badawczych (lub prywatnych korzystających ze środków publicznych lub dobrowolnie chcących otworzyć i udostępnić swoje dane), często równocześnie z bezpłatnym rozpowszechnianiem wyników badań; następnie mówi się w tym kontekście o „wolnym dostępie” lub „swobodnym rozpowszechnianiu” , których pierwsza definicja została podana w Międzynarodowej Deklaracji w sprawie otwartego dostępu z Budapesztu, która odbyła się w dniu14 lutego 2002 r., znany pod akronimem BOAI (od angielskiej Budapest Open Access Initiative ) .
Stamtąd pojawiło się wiele innych inicjatyw w innych częściach świata, na przykład Deklaracja Berlińska z 2003 r. w sprawie swobodnego dostępu do wiedzy w naukach ścisłych i humanistycznych ; następnie w marcu 2005 r. z Southampton powstała nowa Deklaracja pod nazwą Berlin III w celu wzmocnienia środków przyjętych w ramach Berlin I .
Projekt sekwencjonowania ludzkiego genomu był możliwy dzięki konsorcjum Open Data Consortium utworzonemu na wniosek Jima Kenta (en) w 2003 roku, którego beneficjentami będą m.in. kraje rozwijające się, w których uczelnie i ośrodki badawcze nie zawsze mają dostęp do czasopism naukowych.
W 2010 r. Unia Europejska uruchomiła projekt legislacyjny w sprawie otwierania danych transportowych poprzez dyrektywę w sprawie inteligentnych systemów transportowych (ITS) i wyjaśniła jego stosowanie w 2017 r. za pomocą rozporządzenia delegowanego (UE) 2017/1926.
We Francji otwarcie danych dotyczących transportu reguluje kilka ustaw. Po pierwsze, ustawa Macron z 2015 r. nakłada na organizatorów transportu obowiązek dostarczania regularnych danych o przewozach pasażerskich. Następnie ustawa Lemaire z 2016 r. poprzez obowiązek otwierania danych użyteczności publicznej, takich jak te wytwarzane w ramach delegacji służb publicznych (DSP) , poszerza zakres danych do otwarcia. Dotyczy to w szczególności danych transportowych, ponieważ DSP jest najczęściej używanym sposobem zarządzania miejskim transportem pasażerskim we Francji.
Ustawa o orientacji na mobilność (LOM) z 2019 r. określa te obowiązki w zakresie otwierania danych i je rozszerza. Określa, że to organ organizujący mobilność (AOM) odpowiada za koordynację dostarczania danych. Celem otwarcia tych danych jest ułatwienie rozwoju aplikacji i usług MaaS (Mobility as a service) , które łączą kilka rozwiązań turystycznych.
Dane te to zarówno statyczne, jak i dynamiczne dane dotyczące podróży i ruchu, a także historyczne dane o ruchu. Rzeczywiście LOM wyjaśnia, w art. L1115-1 kodeksu transportowego , że dane, które mają zostać otwarte, to dane określone w załączniku do rozporządzenia delegowanego (UE) 2017/1926, oto kilka przykładów:
LOM idzie dalej niż regulacji europejskiej, która jedynie zobowiązuje publikację danych statycznych i rozciąga otwartości danych do danych dynamicznych do punktów dla ładowania elektrycznych lub hybrydowych pojazdów i carpooling usług , które muszą stanowić punkt dostępu do swojej oferty usług .
Ład otwartych danych jest również określona przez LOM . Artykuł L1115-2 wspomina, że AOM lub operatorzy transportu muszą zapewnić „dostarczanie danych zgodnie ze standardami i aktualizacjami za pośrednictwem krajowego punktu dostępu (NAP)”. We Francji krajowym punktem dostępu jest witryna transport.data.gouv, która w kwietniu 2021 r. zebrała 441 zbiorów danych.
Publikacja licencja nie narzuca LOM ale to ramy z ustawą Lemaire 2016, która ma zastosowanie i pozwala otworzyć dane pod licencją Etalab lub w ramach licencji ODbL (Open Database License) .
Wreszcie, jeśli chodzi o format danych , rozporządzenie europejskie narzuca standardy ułatwiające interoperacyjność : wybór standardów lub specyfikacji NeTEx lub TAP PSI i SIRI dla czasu rzeczywistego . Jednak większość danych publikowanych przez operatorów prywatnych i władze publiczne jest w formacie GTFS . Docelowo NAP zapewni konwerter danych gfts do formatu NETEX, aby umożliwić AOM zgodność z przepisami.
Ekosystem otwartych danych obejmuje aktorów ze społeczeństwa obywatelskiego, takich jak Open Data Institute czy Open Knowledge Foundation czy OpenStreetMap , administracje publiczne, firmy prywatne, aktorów ze świata badań, aktorów ze świata dziennikarstwa, sponsorów i organizacji międzynarodowych.
W 2010 roku Sunlight Foundation ustanowiła listę dziesięciu kryteriów charakteryzujących otwarte dane. Aby dane można było uznać za „otwarte”, muszą być:
W 2010 roku Tim Berners-Lee zaproponował otwartą skalę jakości danych (od 1 do 5 gwiazdek).
★ | Dane niefiltrowane (prawdopodobnie zdegradowane), np. przesłane w dowolnym formacie |
★ ★ | Dane dostępne w ustrukturyzowany sposób (np. dane tabelaryczne w CSV , XML , Excel , RDF ) |
★ ★ ★ | Dane do swobodnego wykorzystania - legalnie (patrz licencje), - technicznie (w formatach niezastrzeżonych, nie w szczególności w Excelu) |
★ ★ ★ ★ | Dane identyfikowane przez adresy URL (z datą aktualizacji) , abyśmy mogli „wskazać” do nich link (i ewentualnie znaleźć je zaktualizowane) |
★ ★ ★ ★ ★ | Dane powiązane z innymi danymi w celu ich kontekstualizacji i wzbogacenia |
Skala ta dotyczy podstawowych danych cyfrowych, ale jej kryteria można dostosować do danych zagregowanych lub bardziej złożonych informacji publicznych (zdjęć, filmów, raportów, opracowań itp., które również trzeba będzie umieścić w Internecie, najlepiej z wysokiej jakości metadanymi). hipertekst w przypadku raportów i opracowań, a nawet niektórych filmów)
Podstawowym celem było umieszczenie danych wyprodukowanych przez państwo lub inne osoby w sieci bez oczekiwania na realizację wspólnoty prywatnych interesów ( por . prezentowana poniżej debata na temat paradoksu kurczaka lub kurczaka. jajko ), co mogłoby spowolnić dostępność danych w sieci, a tym samym pośrednio spowalniają pojawianie się przełomów technologicznych w ruchu Semantic Web , którego jednym z promotorów jest Tim Berners-Lee .
W kilku dziedzinach badań, pomimo nawoływań do dobrych praktyk w zakresie przejrzystości i udostępniania danych, surowe dane nie są przekazywane przez autorów, nawet recenzentom.
Wiele nadużyć naukowych w badaniach nie zostało wcześnie wykrytych przez komisje rewizyjne, ponieważ autorzy odmówili udostępnienia swoich danych (czasami nawet ze współautorami), zwłaszcza w dziedzinie psychologii, gdzie 50% eksperymentów daje nieodtwarzalne wyniki, co stwarza poważne problemy z zaufaniem do wyników i zapoczątkowała inicjatywę o nazwie Peer Reviewers' Openness Initiative , zgodnie z którą gdy nie ma powodów etycznych, by tego nie robić, przejrzystość i otwartość danych powinna być fundamentalnymi wartościami nauki, w w szczególności w celu umożliwienia pracy korektorom.
Istnieją różne nowoczesne sposoby udostępniania danych naukowych, w tym przed publikacją i po publikacji. Ponadto autorzy, którzy udostępniają swoje dane, widzą wzrost swoich szans na cytowanie.
W Wielkiej Brytanii skrzyżowanie otwartych danych umożliwiło zmniejszenie o 30% rachunków za zużycie energii w budynkach użyteczności publicznej w ciągu zaledwie dwóch miesięcy.
Otwarte dane idealnie pozwalają na uczciwą konkurencję między wszystkimi firmami. Jednak badania socjologiczne w Indiach i Kanadzie wykazały, że dostęp i korzystanie z otwartych danych jest uwarunkowane kryteriami materialnymi (elektryczność, posiadanie sprzętu komputerowego) i społecznymi (edukacja).
Ponadto, według niektórych badań, udostępnienie tych danych publicznych podzieliłoby przez pięć kapitału niezbędnego do wykonywania działalności zawodowej w sektorze telefonii komórkowej . Raport MEPSIR z 2006 roku, finansowany przez Komisję Europejską, szacuje, że europejski rynek związany z ponownym wykorzystaniem informacji publicznych to 27 miliardów euro.
Ponadto bezpośredni i pośredni wpływ gospodarczy dla Europy oszacowano na 140 mld EUR rocznie.
Od 2016 r. kilka rządów ma plany rozwoju sztucznej inteligencji . Rządy te podkreśliły istotną rolę otwartych danych dla rozwoju gospodarczego sektora sztucznej inteligencji.
Istnieją różne opinie na temat wdrażania otwartych danych, które sprowadzają się do „ paradoksu kurczaka i jajka ”:
Otwarcie danych wymaga umieszczenia licencji określającej warunki, na których dane te mogą być swobodnie kopiowane, rozpowszechniane, ponownie wykorzystywane. Ponieważ konteksty prawne różnią się w zależności od kraju, obecnie na całym świecie stosuje się różne licencje.
Open data commons to projekt rozpoczęty w Wielkiej Brytanii w grudniu 2007 roku przez Open Knowledge Foundation . Pierwsza licencja wolnego projektu został opracowany w marcu 2008 roku przez Jordan Hatcher i D r Charlotte Waelde.
Licencje te można stosować do baz danych, a dane w nich zawarte są brane oddzielnie. Otwarte Knowledge Foundation opracowała trzy rodzaje licencji wolnego danych, które są oparte na ich prawem wewnętrznym, sama opiera się na anglosaskim modelu i który różni się od praw rzymsko-germańskich, to znaczy prawa cywilnego, z bardziej uznanych i skutecznej ochrony moralny prawa. W związku z tym zastosowanie niektórych z tych licencji do dzieł intelektualnych nie jest ważne we Francji, ale można rozważyć rozpowszechnianie danych publicznych, o ile z definicji są one publiczne.
Dedykacja i licencja w domenie publicznejPublic Domain i licencji (PDDL) daje możliwość do używania, kopiowania, modyfikowania, rozpowszechniania bazy danych bez żadnych ograniczeń. Jest to wolna od wszelkich praw licencja typu public domain. Dane mogą być zatem wykorzystywane w sposób całkowicie bezpłatny, a autor zrzeka się swoich autorskich praw osobistych.
Otwarta baza danych CommonsNiniejsza licencja, która znajduje się pod akronimem ODC-by, upoważnia do używania, kopiowania, redystrybucji, modyfikacji, produkcji utworów pochodzących z bazy danych, pod warunkiem wskazania nazwiska autora oryginalnej bazy danych. Zasady te można znaleźć w licencji Creative Commons By .
Licencja Open Data Commons na otwartą bazę danychLicencja ODbL opiera się na prawach autorskich i prawach do baz danych sui generis. Umożliwia użytkownikom kopiowanie, rozpowszechnianie, używanie, modyfikowanie i tworzenie dzieła pochodnego z bazy danych z zastrzeżeniem jego redystrybucji na takich samych warunkach, jakie nakłada pierwotna licencja. Polega również na wskazaniu nazwiska autora oryginalnej bazy danych.
Z wyjątkiem specjalnie zaprojektowanej licencji CC-0, licencje z rodziny Creative Commons nie nadają się do wykorzystania w bazach danych. W rzeczywistości skupiają się tylko na prawie autorskim i lekceważą prawo sui generis do baz danych: z jednej strony grozi to ich nieefektywnością (wywiązywanie się z obowiązków nie jest już powiązane z przeniesieniem praw). w celu upewnienia się co do statusu danych rozpowszechnianych na podstawie tych licencji (ewentualne prawo sui generis do nieudostępniania baz danych).
Zgodnie z francuskim prawem dane publiczne są uważane za prawdopodobne, że zawierają wrażliwe informacje, ponieważ umożliwiają identyfikację osoby lub ponieważ podlegają prawu autorskiemu, tajemnicy państwowej lub ze względów obrony narodowej . W tym kontekście dane nie mogą być swobodnie rozpowszechniane bez uprzedniego zezwolenia lub muszą podlegać anonimizacji. Po zagwarantowaniu praw do transmisji będą obowiązywać licencje. Różne organizacje opracowały darmowe licencje mające zastosowanie do wszelkiego rodzaju treści, publicznych lub wytworów umysłu. Są to proste modele licencji biznesowych, które nie wymagają zgodności. Umowy niepublikowane mogą być sporządzane pod warunkiem poszanowania prawa wewnętrznego, zarówno w odniesieniu do przepisów ustaw z dnia 17 lipca 1978 r., a nawet z dnia 6 stycznia 1978 r., jak i zasad porządku publicznego mających zastosowanie do umowy. We Francji do otwartych danych dołączono do pięciu różnych licencji na ponowne wykorzystanie. W 2013 roku harmonizacja praktyk doprowadziła do zastosowania dwóch standardowych licencji stosowanych w równoważnych proporcjach: Open License i Open Database License.
Licencja francuskiego Ministerstwa SprawiedliwościMinisterstwo Sprawiedliwości podjęło inicjatywę opracowania licencji dostosowanej do danych publicznych, Freely Reusable Public Information License, zwanej potocznie LIP.
Daje możliwość bezpłatnego ponownego wykorzystania danych Dyrekcji ministerstwa, nawet w celach komercyjnych, pod warunkiem podania źródeł, daty aktualizacji, niemodyfikowania danych i zniekształcenia ich znaczenia.
Przewidziano również, że użytkownik może zezwolić na ponowne wykorzystanie wyłącznie na podstawie licencji pod warunkiem dodania wartości do oryginalnych danych.
Licencja otwartaNiniejsza licencja stworzona przez ETALAB jest przeznaczona do użytku w szczególności na data.gouv.fr.
Licencja na otwartą bazę danychLicencja ODbL została przetłumaczona na język francuski przez miasto Paryż w celu dostosowania jej do użytku krajowego. Z tej licencji korzystają różne projekty, od OpenStreetMap po społeczności lokalne (Paryż, Nantes, Tuluza…).
Fundacja Otwartej Wiedzy opublikowała Globalny Indeks Otwartych Danych .
Fundacja World Wide Web publikuje barometr otwartych danych, aby zmierzyć otwartość danych i ich wpływ w poszczególnych krajach.
OECD publikuje ranking o nazwie Open Data rządu na otwartości danych publicznych w krajach członkowskich.
Co roku pod koniec lutego lub na początku marca Fundacja Otwartej Wiedzy organizuje Dzień Otwartych Danych (w) .