O metapodacima

Metapodaci se koriste od davnina, tj. od kada ljudi rade popise stvari, inventare, događaja i drugih objekata ili pojava u svrhu njihove sistematizacije i dobivanja pregleda nad njima. Prilikom korištenja prostornih podataka, na primjer karata u rasterskom ili vektorskom formatu u GIS okruženju ili prostornih baza podataka ili preuzimanjem podataka putem web servisa, često ne znamo ili nismo sigurni tko je i kada prikupio podatke, kakva je kvaliteta podataka, u kojem koordinatnom referentnom sustavu su podaci, koja je verzija formata podataka i druge informacije o podacima koje omogućuju njihovo korištenje i interpretaciju. Zbog toga podaci i njihova primjena (npr. proizvodi i usluge koji se izrađuju na osnovu njih) imaju manju vrijednost.

Da bi se izbjegli ovi problemi prikupljaju se metapodaci. Metapodaci su sastavni dio podataka i zajedno tvore jedinstvenu cjelinu. Metapodatke treba dokumentirati  prilikom prikupljanja podataka i potrebno ih je ažurirati kada se podaci mijenjaju. Odnosno, važnije radnje nad podacima, treba zabilježiti kroz metapodatke.

Riječ metapodatak se sastoji od riječi "meta" i "podatak". Prefiks "meta" se koristio u antičkoj grčkoj sa značenjima "uzduž" i "sa". S vremenom "meta" se koristilo prilikom označavanja transcendentnosti ili natprirodnog. Riječ podatak ima korijene u latinskoj riječi "data" koja označava dijelove informacija ili skup objekata koji se međusobno razlikuju. Danas je najopćenitija definicija metapodataka da su to podaci o podacima.

Od 1990-tih godina metapodatak označava strojno čitljiv zapis. Sa pojavom računala metapodaci se počinju sustavno primjenjivati; svaka datoteka sadrži popratne informacije o količini memorije koju zauzima, datum stvaranja, prava nad njim i sl. Metapodaci su danas postali općeniti pojam kojim se može opisati sve od interesa, od kolekcije poštanskih maraka do sportskih događaja u jednoj godini.

Međutim, opis različitih vrsta izvora zahtjeva različite vrste metapodataka i različite tematske norme metapodataka. Inventarizacija svega (znanja), koju metapodaci omogućuju, je potpomognuta računalima i količinom informacija koje računalni sustavi mogu pohraniti i obraditi, a razvojem informatičko komunikacijskih tehnologija dijeljenje podataka je postala svakodnevna nužnost. Da bi dijeljene podatke mogli koristiti, različite grupe korisnika trebaju znati u kojem formatu su podaci, u kojem su koordinatnom referentnom sustavu te druge informacije koje mogu dobiti kroz kataloge metapodataka. 

Postoji jasan trend razvoja sustavnog katalogiziranja metapodataka (npr. INSPIRE i nacionalni katalozi metapodataka). Da bi se različiti sustavi metapodataka mogli povezati, mora postojati strukturna poveznica između metapodataka. INSPIRE je izrađen pod snažnim utjecajem ISO normiranja metapodataka, a NIPP metapodaci, osim nacionalnih potreba, zadovoljavaju i INSPIRE zahtjeve. Svaki metapodatak NIPP-a ima element kojim se NIPP metapodatak uspoređuje s ISO i INSPIRE metapodacima, a to omogućuje razmjenu i interoperabilnost metapodataka. 

Harvesting, kao operacija koja omogućuje preuzimanje metapodataka iz kataloga metapodataka, omogućuje međusobno povezivanje kataloga i povezivanje više kataloga sa aplikacijama kao što rade internet pretraživači. The Dublin Core Metadata Initiative (DCMI) kao respektabilna međunarodna ne profitabilna organizacija koja se bavi normiranjem metapodataka za razne strukovne, tematske i poslovne potrebe, razlikuje četiri razine interoperabilnosti metapodataka:
 
  • Dijeljenje definicija pojmova definira interoperabilnost metapodataka koja je zasnovana na dijeljenju definicija metapodataka na prirodnim jezicima. Unutar okruženja kao što su internet, sustav knjižnice ili repozitorij, učesnici normiraju pojmove koje koriste u sustavu metapodataka. Najveći broj postojećih aplikacija je na ovoj operativnoj razini.
  • Formalna semantička interoperabilnost definira interoperabilnost metapodataka koja je zasnovana na dijeljenom formalnom modelu dostupnom kroz Resource Description Framework (RDF), a koji je razvijen da podrži povezane podatke koji su eksponirani, dijeljeni i povezuju dijelove podataka, informacije i znanja u semantički web, primjenom URL-a i RDF-a.  U zadnjih nekoliko godina ova razina interoperabilnosti je doživjela znatan razvoj kroz povezivanje podataka kako javnog tako i privatnog sektora u oblake podataka. Yahoo i neki drugi sustavi pretraživanja implementiraju ovu razinu interoperabilnosti. Zbog sve većeg razvoja data cloudinga ova razina interoperabilnosti metapodataka prolazi kroz nagli razvoj.
  • Opisni skup semantičke interoperabilnosti definira interoperabilnost metapodataka pomoću aplikacija koje su kompatibilne s modelima povezanih podataka i dodatno dijele apstraktnu sintaksu zapisa metapodataka koja se može provjeriti, "opisni skup".
  • Opisni skup profila interoperabilnosti definira interoperabilnost metapodataka kao proces kojim se provodi razmjena zapisa metapodataka između aplikacija koje koriste metapodatke te dodatno dijele apstraktni zajednički skup uvjeta, koriste isti rječnik i odražavaju dijeljeni model svijeta. Zadnje dvije razine interoperabilnosti metapodataka su u razvojnoj, odnosno u znanstvenoj domeni.

Osim temeljne uloge metapodataka da opisuju podatke, oni u sustavu INfrastructure for SPatial Information (INSPIRE) ili Nacionalna infrastruktura prostornih podataka (NIPP) zadovoljavaju određenu funkcionalnost, odnosno poslovni model.

ISO definira metapodatke kao podatke o podacima, a to je općenita definicija kojom nije naglašen poslovni model koji se želi postići metapodacima. INSPIRE definira metapodatke kao informacije koje opisuju prostorni skup podataka i usluge prostornih podataka koje omogućuju njihovo pronalaženje i korištenje.

Kroz ovu definiciju su zadani ciljevi poslovnog modela (opis prostornih podataka te otkrivanje i korištenje prostornih podataka) koje metapodaci trebaju zadovoljiti.


ISO Paketi metapodataka

Paketi metapodataka i odnosi entiteta

Metapodaci za geografske podatke su prikazani pomoću UML paketa. Svaki paket sadrži jedan ili više entiteta (UML klasa), a koje mogu biti specificirane ili generalizirane. Entiteti sadrže elemente (UML atribute klasa) koji identificiraju diskretne elemente metapodataka. Entiteti mogu biti agregirani i ponavljani po potrebi. Slika ilustrira opći prikaz paketa. Metapodaci su specificirani UML dijagramom modela i rječnikom podataka za svaki paket.



Veze između paketa metapodataka i entiteta metapodataka su prikazane u tablici. Paketi metapodataka su prikazani u stupcu paket i agregirani entitet metapodataka sadržan unutar odgovarajućeg paketa je prikazan u stupcu entitet. Svaki paket ima podklase.

 
Paket Entitet
Informacije o entitetu metapodataka MD_Metadata
Informacije o identifikaciji MD_Identification
Informacije o ograničenjima MD_Constraints
Informacije o kvaliteti podataka DQ_DataQuality
Informacije o održavanju MD_MaintenanceInformation
Informacije o prostornoj predstavi MD_SpatialRepresentation
Informacije o referentnom sustavu MD_ReferenceSystem
Informacije o sadržaju MD_ContentInformation
Informacije o opisnom katalogu MD_PortrayalCatalogueReference
Informacije o distribuciji MD_Distribution
Informacije o proširenju metapodataka MD_MetadataExtensionInformation
Informacije o aplikacijskoj shemi MD_ApplicationSchemaInformation
Informacije o obuhvatu EX_Extent
Informacije o citiranju i odgovornoj strani CI_Citation CI_ResponsibleParty


Kratice paketa

Dvoslovne kratice se koriste za označavanje paketa koje sadrže klasu. Ove kratice prethode imenu klase i povezane su pomoću znaka "_".

 
CC Changing Coordinates (ISO 19111)
CI Citation (ISO 19115)
CV   Coverages (ISO 19123)
DQ Data quality (ISO 19115)
DS Dataset (ISO 19115)
EX   Extent (ISO 19115)
FC Feature Catalogue (ISO 19110)
FE Feature (ISO 19109)
FT Feature Topology (ISO 19107)
GF General Feature (ISO 19109)
GM Geometry (ISO 19107)
GR Graph (ISO 19107)
LI Lineage (ISO 19115)
MD Metadata (ISO 19115)
PF Feature Portrayal (ISO 19117)
PS Positioning Services (ISO 19116)
RS Reference System (ISO 19115)
SC Spatial Coordinates (ISO 19111)
SI Spatial Identification (ISO 19112)
SV Services (ISO 19119)
TM Temporal (ISO 19108)
TP Topology (ISO 19107)
TS Simple Topology (ISO 19107)
 

Informacije o aplikaciji metapodataka


UML dijagram klasa na slici definira klase geografskih informacija na koje se odnose metapodaci.


UML model metapodataka


Metapodaci za opis geografskih podataka su definirani pomoću dijagrama apstraktnog objektnog UML modela. Dijagrami podklasa definiraju sekciju metapodataka (UML paket) povezanih entiteta, tipova podataka i kodnih listi.      

Entiteti mogu imati obvezne i/ili ne obvezne elemente i asocijacije. U nekim slučajevima, ne obvezni elementi mogu imati obvezne elemente.
 
Više informacija može se naći na ISO UML dijagramima: