Brandos lygiai
Duomenų brandos lygis nurodomas level
stulpelyje.
Duomenų brandos lygis atitinka 5 ★ Open Data skalę, tačiau adaptuota duomenų struktūros aprašo kontekstui. Papildomai įtrauktas nulinis lygis, kai duomenys nekaupiami, tačiau yra reikalingi ir yra parengtas jų duomenų struktūros aprašas.
Tim Berners Lee brandos lygius aprašo, kaip pavyzdį pasitelkiant duomenų distribucijų formatus. Tačiau duomenų distribucijų formatai yra labai netikslus pavyzdys. Rengiant duomenų struktūros aprašą, brandos lygis vertinamas kiekvienam duomenų laukui atskirai, todėl tarkime CSV failas, gali būti didesnio arba mažesnio nei trečias brandos lygis, priklausomai nuo CSV faile esančių duomenų turinio. Tačiau grubiai vertinant, vidutiniškai CSV failai turi daugiau ar mažiau 3 brandos lygį, koks ir yra nurodytas Tim Berners Lee pavyzdžiuose.
Taip pat reikėtų atkreipti dėmesį, kad duomenų brandos lygis ar formatas nėra susijęs su duomenų atvirumu. Duomenys gali būti pateikti aukščiausiu 5 brandos lygiu, tačiau pats duomenų prieinamumas gali būti visiškai uždaras, siauram naudotojų ratui, kurie turi ribotą ir saugų prieigos kanalą prie duomenų.
Rengiant duomenų struktūros aprašą, reikėtų nurodyti ne šaltinio duomenų brandos lygį, o galutinį brandos lygį, kuris yra gaunamas atlikus visas duomenų struktūros apraše nurodytas transformacijas.
- level
- 0
Nekaupiama
Duomenys nekaupiami. Duomenų rinkinys užregistruotas atvirų duomenų portale. Užpildyta
dataset
eilutė.Plačiau apie brandos lygio kėlimą skaitykite skyriuje Nekaupiami duomenys.
Pavyzdžiai
Imone
imones_id
imones_pavadinimas
rusis
42
UAB "Įmonė"
1
Filialas
ikurimo_data
atstumas
imones_id
imones_pavadinimas._id
tel_nr
Struktūros aprašas
d
r
b
m
property
type
ref
level
example
Imone
imones_id
4
imones_id
integer
4
imones_pavadinimas
string
2
rusis
integer
2
Filialas
0
ikurimo_data
string
0
atstumas
string
0
imone
ref
Imone
0
tel_nr
string
0
Duomenų nėra - nuliniu brandos lygiu žymimi duomenys, kurių nėra, pavyzdžiui jei įmonės filialų duomenų niekas nefiksuoja.
Duomenys nepublikuojami - nuliniu brandos lygiu žymimi duomenys, kurie fiziškai egzistuoja, tačiau nėra publikuojami jokia forma.
Ribojamas duomenų naudojimas - nuliniu brandos lygiu žymimi duomenys, kuri yra prieinami, tačiau pagal tokias naudojimo sąlygas, kurios nėra suderinamos su atvirų duomenų licencijomis.
- 1
Publikuojama
Duomenys publikuojami bet kokia forma. Užpildyta
resource
eilutė.Plačiau apie brandos lygio kėlimą skaitykite skyriuje Duomenys be aiškios struktūros.
Pirmu brandos lygiu žymimi duomenų laukai, kurių reikšmės neturi vientisumo, tarkime ta pati reikšmė gali būti pateikta keliais skirtingais variantais.
Pavyzdžiai
Imone
imones_id
imones_pavadinimas
rusis
42
UAB "Įmonė"
1
Filialas
ikurimo_data
atstumas
imones_id._id
imones_pavadinimas
tel_nr
vakar
1 m.
1
Įmonė 1
+370 345 36522
2021 rugpjūčio 1 d.
1 m
1
UAB Įmonė 1
8 345 36 522
1/9/21
1 metras
1
Įmonė 1, UAB
45 34522
21/9/1
0.001 km
1
„ĮMONĖ 1“, UAB
037034536522
Struktūros aprašas
d
r
b
m
property
type
ref
level
example
Imone
id
4
imones_id
integer
2
imones_pavadinimas
string
2
rusis
integer
2
Filialas
3
ikurimo_data
string
1
atstumas
string
1
imones_id
ref
Imone
1
imones_pavadinimas
string
1
tel_nr
string
1
Neaiški struktūra - pirmu brandos lygiu žymimi duomenys, kuriuose nėra aiškios struktūros, pavyzdžiui
ikurta
datos formatas nėra vienodas, kiekviena data užrašyta vis kitokiu formatu.Nėra vientisumo - pirmu brandos lygiu žymimi duomenuys, kuruose nėra vientisumo, pavyzdžiui
atstumas
užrašytas laikantis tam tikros struktūros, tačiau skirtingais vienetais.Neįmanomas jungimas - pirmu brandos lygiu žymimi duomenys, kurių neįmanoma arba sudėtinga sujungti. Pavyzdžiui
Filialas
duomnų laukasimone
naudoja tam tikrą identifikatorių, kuris nesutampa nei su vienu išImone
atributų, pagal kuriuose būtų galima identifikuoti filialo įmonę.
- 2
Struktūruota
Duomenys kaupiami struktūruota, mašininiu būdu nuskaitoma forma, bet kokiu formatu. Užpildytas
property.source
stulpelis.Plačiau apie brandos lygio kėlimą skaitykite skyriuje Nestandartinio formato duomenys.
Antru brandos lygiu žymimi duomenų laukai, kurie pateikti vieninga forma arba pagal aiškų ir vienodą šabloną. Tačiau pateikimo būdas nėra standartinis. Nestandartinis duomenų formatas yra toks, kuris neturi viešai skelbiamos ir atviros formato specifikacijos arba kuris nėra priimtas kaip standartas, kurį prižiūri tam tikra standartizacijos organizacija.
Pavyzdžiai
Imone
imones_id
imones_pavadinimas
rusis
42
UAB "Įmonė"
1
Filialas
ikurimo_data
atstumas
imones_id
imones_pavadinimas._id
tel_nr
1/9/21
1 m.
1
UAB "Įmonė"
(83) 111 11111
2/9/21
2 m.
1
UAB "Įmonė"
(83) 222 22222
3/9/21
3 m.
1
UAB "Įmonė"
(83) 333 33333
4/9/21
4 m.
1
UAB "Įmonė"
(83) 444 44444
Struktūros aprašas
d
r
b
m
property
type
ref
level
example
JuridinisAsmuo
kodas
4
kodas
integer
4
pavadinimas@lt
text
4
Imone
imones_id
2
imones_id
integer
2
imones_pavadinimas
string
2
rusis
integer
2
Filialas
3
ikurimo_data
string
2
atstumas
string
2
imones_id
integer
2
imones_pavadinimas
string
2
tel_nr
string
2
Nestandartiniai duomenų tipai - antru brandos lygiu žymimi duomenys, kurių nurodytas tipas neatitinka realaus duomenų tipo. Pavyzdžiui:
ikurimo_data
- nurodytasstring
, turėtu būtidate
.imones_pavadinimas
- nurodytasstring
, turėtu būtitext
.atstumas
- nurodytasstring
, turėtu būtiinteger
.
Nestandartinis formatas - antru brandos lygiu žymimi duomenys, kurie pateikti nestandartiniu formatu. Standartinis duomenų pateikimas nurodytas prie kiekvieno duomenų tipo skyriuje Duomenų tipai. Payvzdžiui:
ikurimo_data
- nurodytasDD/MM/YY
, turėtu būtiYYYY-MM-DD
.atstumas
- nurodytaX m.
, turėtu būtiX
.tel_nr
- nurodytas(XX) XXX XXXXX
, turėtu būti+XXX-XXX-XXXXX
.
Nestandartiniai kodiniai pavadinimai - antru brandos lygiu žymimi duomenys, kurių kodiniai pavadinimai, neatitinka standartinių reikalavimų keliamų kodiniams pavadinimams. Pavyzdžiui:
imones_id
- dubliuojamas modelio pavadinimas, turėtu būtiid
.imones_pavadinimas
- dubliuojamas modelio pavadinimas, turėtu būtipavadinimas
.ikurimo_data
- dubliuojamas tipo pavadinimas, turėtu būtiikurta
.
Nepatikimi identifikatoriai - antru brandos lygiu žymimi duomenys, kurių
ref
tipui naudojami nepatikimi identifikatoriai, pavyzdžiui tokie, kaip pavadinimai, kurie gali keistis arba kartotis. Pavyzdžiui:imones_pavadinimas
- jungimas daromas per įmonės pavadinimą, tačiau šiuo atveju kito varianto nėra, nesFilialas.imones_id
nesutampa suImone.imones_id
.
Denormalizuoti duomenys - antru brandos lygiu žymimi duomenys, kurie dubliuoja kito modelio duomenis ir yra užrašyti nenurodant, kad tai yra duomenys dubliuojantys kito modelio duomenis. Pavyzdžiui:
Filialas.imones_id
turėtu būtiFilialas.imone.imones_id
.Filialas.imones_pavadinimas
turėtu būtiFilialas.imone.imones_pavadinimas
.
Plačiau apie denormalizuotus duomenis skaitykite skyriuje Denormalizuoti duomenys.
Nenurodytas susiejimas - antru brandos lygiu žymimi duomenys, kurie siejasi su kitu modeliu, tačiau tokia informacija nėra pateikta metaduomenyse. Pavyzdžiui:
Filialas.imone
-Filialas
siejasi suImone
, perFilialas.imones_pavadiniams
, todėl turėtu būti nurodytasimone ref Imone
ryšys suImone
.
Neatitinka modelio bazės - antru brandos lygiu žymimi duomenys, kurie priklauso vienai semantinei klasei, tačiau duomenų schema nesutampa su bazinio modelio schema. Pavyzdžiui:
Imone
- priklauso semantinei klaseiJuridinisAsmuo
, tačiau tai nėra pažymėta metaduomenyse.Imone.imones_id
turėtu būtiImone.kodas
, kad sutaptu su baze (JuridinisAsmuo.kodas
).Imone.imones_pavadinimas
turėtu būtiImone.pavadinimas@lt
, kad sutaptu su baze (JuridinisAsmuo.pavadinimas@lt
).
Nenurodytas enum kodinėms reikšmėms - antru brandos lygiu žymimi kategoriniai duomenys, kurių reikšmės pateiktos sutartiniais kodinais, kurių prasmė nėra aiški. Pavyzdžiui:
Imone.rusis
- įmonės rūšis žymima skaičiais, tačiau nėra aišku, kokks skaičius, ką rei6kia, todėl reikia pateitkienum
sąrašą, kuriame būtų nurodyta, ką koks skaičius reiškia. Plačiau skaityti Klasifikatoriai.
- 3
Standartizuota
Duomenys saugomi atviru, standartiniu formatu. Užpildytas
property.type
stulpelis ir duomenys atitinka nurodytą tipą.Plačiau apie brandos lygio kėlimą skaitykite skyriuje Duomenys be metaduomenų.
Trečias brandos lygis suteikiamas tada, kai duomenys pateikti vieninga forma, vieningu masteliu, naudojamas formatas yra standartinis, tai reiškia, kad yra viešai skelbiama ir atvira formato specifikacija arba pats formatas yra patvirtintas ir prižiūrimas kokios nors standartizacijos organizacijos.
Pavyzdžiai
Imone
id
pavadinimas@lt
rusis
42
UAB "Įmonė"
juridinis
Filialas
ikurta
atstumas
imone._id
imone.pavadinimas@lt
tel_nr
2021-09-01
1
42
UAB "Įmonė"
+37011111111
2021-09-02
2
42
UAB "Įmonė"
+37022222222
2021-09-03
3
42
UAB "Įmonė"
+37033333333
2021-09-04
4
42
UAB "Įmonė"
+37044444444
Struktūros aprašas
d
r
b
m
property
type
ref
level
prepare
title
example
JuridinisAsmuo
kodas
4
kodas
integer
4
pavadinimas@lt
text
4
JuridinisAsmuo
4
Imone
kodas
4
kodas
4
pavadinimas@lt
4
rusis
string
3
/
Filialas
3
ikurta
date
3
atstumas
integer
3
imone
ref
Imone
3
imone.kodas
4
imone.pavadinimas@lt
4
tel_nr
string
4
Nenurodytas pirminis raktas - trečiu brandos lygiu žymimi duomenys, kurie neturi nurodyto pirminio rakto
model.ref
stulpelyje. Pavyzdžiui:Filialas
- nenurodytas pirminis raktasmodel.ref
stulpelyje.
Nenurodyt vienetai - trečiu brandos lygiu žymimi kiekybiniai duomenys, kuriems nėra nurodyti matavimo vienetai
property.ref
stulpelyje. Pavyzdžiui:atstumas
- nenurodyta, kokiais vienetais matuojamas atstumas.
Nenurodyti tikslumas - trečiu brandos lygiu žymimi laiko ir erdviniai duomenys, kuriems nėra nurodytas matavimo tikslumas. Matavimo tikslumas nurodomas
property.ref
stulpelyje. Pavyzdžiui:ikurta
- nenurodytas datos tikslumas, turėtu būtiD
- vienos dienos tiksumas.
Siejimas ne per priminį raktą - trečiu brandos lygiu žymimi
ref
tipo duomenų laukai, kurie siejami ne per perminį raktą_id
, o per kitą identifikatorių. Pavyzdžiui:Filialas.imone
- siejimas atliekamas perImone.kodas
, o ne perImone._id
.
Neaprašyti kategoriniai duomenys - trečiu brandos lygiu žymimi kategoriniai duomenys, kurių reikšmės pačios savaime yra aiškios, tačiau neišvardintos struktūros apraše. Pavyzdžiui:
Imone.rusis
- įmonės rūšies kategorijos duomenys yra pateikta tekstine forma, tačiau, struktūros apraše nėra išvardintos visos galimos kategorijos ir pats duomenų laukas nėra pažymėtas, kaip kategorinis.
- 4
Identifikuojama
Duomenų objektai turi aiškius, unikalius identifikatorius. Užpildyti
model.ref
irproperty.ref
stulpeliai.Pastaba
property.ref
stulpelis pildomas šiais atvejais:Jei duomenų laukas yra išorinis raktas (žiūrėti Išoriniai raktai).
Jei duomenų laukas yra kiekybinis ir turi matavimo vienetus (žiūrėti Matavimo vienetai).
Jei duomenų laukas žymi laiką ar vietą (žiūrėti Data ir laikas ir Erdviniai duomenys).
Plačiau apie brandos lygio kėlimą skaitykite skyriuje Duomenys be identifikatorių.
Ketvirtas duomenų brandos lygis labiau susijęs ne su pačių duomenų formatu, bet su metaduomenimis, kurie lydi duomenis.
Duomenų struktūros apraše
model.ref
stulpelyje, pateikiamas objektą unikaliai identifikuojančių laukų sąrašas, oproperty.type
stulpelyje įrašomasref
tipas, kuris nurodo ryšį tarp dviejų objektų.Pavyzdžiai
Imone
_id
id
pavadinimas@lt
rusis
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
1
Filialas
_id
id
ikurta
atstumas
imone._id
imone.id
imone.pavadinimas@lt
tel_nr
63161bd2-158f-4d62-9804-636573abb9c7
1
2021-09-01
1
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
+37011111111
65ec7208-fb97-41a8-9cfc-dfedd197ced6
2
2021-09-02
2
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
+37022222222
2b8cdfa6-1396-431a-851c-c7c6eb7aa433
3
2021-09-03
3
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
+37033333333
1882bb9e-73ee-4057-b04d-d4af47f0aae8
4
2021-09-04
4
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
+37044444444
Struktūros aprašas
d
r
b
m
property
type
ref
level
prepare
title
example
JuridinisAsmuo
kodas
4
kodas
integer
4
pavadinimas@lt
text
4
JuridinisAsmuo
4
Imone
kodas
4
id
integer
4
pavadinimas@lt
text
4
rusis
integer
4
enum
1
Juridinis
2
Fizinis
/
Filialas
id
4
id
integer
4
ikurta
date
D
4
atstumas
integer
km
4
imone
ref
Imone
4
imone.id
4
imone.pavadinimas@lt
4
tel_nr
string
4
Nesusieta su standartiniu žodynu - ketvirtu brandos lygiu žimimi duomenys, kurie nėra susieti su standartiniais žodynais ar ontologijomis. Siejimas su žodynais atliekamas
model.uri
irproperty.uri
stulpeluose.
- 5
Susieta su išoriniu žodynu
Modeliai iš įstaigų duomenų rinkinių vardų erdvės susieti su modeliais iš standartų vardų erdvės, užpildytas
base
eilutė. Standartų vardų erdvėje esantiems modeliams ir jų savybėms užpildytasuri
stulpelis.Daugiau apie vardų erdves skaitykite skyrelyje: Vardų erdvės.
Plačiau apie brandos lygio kėlimą skaitykite skyriuje Duomenys apibrėžti nestandartiniu žodynu.
Penkto brandos lygio duomenys yra lygiai tokie patys, kaip ir ketvirto brandos lygio, tačiau penktame brandos lygyje, duomenys yra praturtinami metaduomenimis, pateikiant nuorodas į išorinius žodynus arba bend jau pateikiant aiškius pavadinimus ir aprašymus, užpildant
title
irdescription
stulpelius.Penktame brandos lygyje visas dėmesys yra sutelkiamas yra semantinę duomenų prasmę.
Pavyzdžiai
Imone
_id
id
pavadinimas@lt
rusis
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
1
Filialas
_id
id
ikurta
atstumas
imone._id
imone.id
imone.pavadinimas@lt
tel_nr
63161bd2-158f-4d62-9804-636573abb9c7
1
2021-09-01
1
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
tel:+37011111111
65ec7208-fb97-41a8-9cfc-dfedd197ced6
2
2021-09-02
2
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
tel:+37022222222
2b8cdfa6-1396-431a-851c-c7c6eb7aa433
3
2021-09-03
3
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
tel:+37033333333
1882bb9e-73ee-4057-b04d-d4af47f0aae8
4
2021-09-04
4
26510da5-f6a6-45b0-a9b9-27b3d0090a58
42
UAB "Įmonė"
tel:+37044444444
Struktūros aprašas
d
r
b
m
property
type
ref
level
uri
prepare
title
example
prefix
foaf
http://xmlns.com/foaf/0.1/
dct
http://purl.org/dc/terms/
schema
http://schema.org/
JuridinisAsmuo
kodas
4
kodas
integer
4
pavadinimas@lt
text
4
JuridinisAsmuo
4
Imone
id
5
foaf:Organization
id
5
dct:identifier
pavadinimas@lt
5
dct:title
rusis
integer
4
enum
1
Juridinis
2
Fizinis
/
Filialas
id
5
schema:LocalBusiness
id
date
1D
5
dct:identifier
ikurta
date
1D
5
dct:created
atstumas
integer
km
5
schema:distance
imone
ref
Imone
5
foaf:Organization
imone.id
integer
5
dct:identifier
imone.pavadinimas@lt
text
5
dct:title
tel_nr
string
5
foaf:phone