Duomenys be aiškios struktūros

level = 1.

Duomenys, kurie kaupiami bet kokia forma, kurioje yra matoma tam tikra duomenų struktūra, tačiau patys duomenys pateikti taip, kad matomos struktūros nuskaityti galimybės nėra, tada level stulpelyje nurodome 1. Tokiu būdu pažymėdami, kad duomenys yra, juose aiškiai matoma tam tikra struktūra, bet jų nuskaityti galimybės nėra.

Nestruktūruotų duomenų inventorizacija yra svarbi, kadangi tai leidžia matyti pilnesnį viso duomenų ūkio vaizdą, leidžia užpildyti trūkstamų duomenų skyles.

Inventorizuojant nestruktūruotus duomenis, pirmiausia reikia surasti tam tikrą pasikartojančią struktūrą ir ją aprašyti.

Kaip pavyzdį galima galime imti skaitmenintus RKB metrikus.

../_images/metrikai.png

Konkrečiai šiame pavyzdyje pateikti santuokos metrikų įrašai, tokių skaitmenintų paveikslėlių yra ištisos knygos ir visose knygose pateikiami gimimo, santuokos ir mirties įrašai, turintys labai aiškią struktūrą.

Deja, nuskaityti duomenis iš tokių paveiksliukų galimybės nėra, arba tokių duomenų nuskaitymas yra ypač sunkiai įgyvendinimas, tačiau galime pateikti tokių duomenų struktūros aprašą, kuris atrodys taip:

id d r b m property type ref source level
  datasets/gov/rkb/metrikai        
    epaveldas        
        Lapas        
          paveikslas image     1
        Asmuo        
          vardas string     1
          pavarde string     1
        Ivykis        
          tipas string     1
          asmuo ref asmuo   1
          data date     1
          lapas ref lapas   1

Paruošus, kad ir labai primityvų inventorizacijos lentelės variantą, galima toliau su ja dirbti, sieti su kitais modeliais, gauti paklausos rodiklius i duomenų naudotojo, tobulinti duomenų modelį, dokumentuoti duomenų laukus.

Tai, kad tokie duomenys dalyvauja bendroje apskaitoje, reiškia, kad galima matyti, kiek potencialių projektų galėtų įdarbinti šiuos duomenis ir kokią naudą tai galėtų atnešti.