Andmebaas ja arvutustabel

Arvatavasti oled juba kasutanud mõnda tabeliarvutusrakendust, näiteks Calligra Sheets, LibreOffice Calc või Microsoft® Excel. Sellisel juhul tekib vahest mõte: kui nii arvutustabelis kui ka andmebaasis on tabelid, siis miks viimast üldse kasutada?

Arvutustabeleid ja andmebaase võrreldes puutud usutavasti kokku järgmiste probleemidega, mida vaatleme allpool lähemalt.

Mille poolest erineb andmebaas arvutustabelist?

Laiendame oma tabelit Kontaktid veidi ja lisame veeru (välja) Aadress. Lisame igale isikule veel telefoninumbreid (kodus, tööl) ning ka nende perekonnanimed. Lihtsuse mõttes eeldame järgmisi asju:

  • Tabel on piiratud kahe inimesega (mõistagi võib reaalses andmebaasis olla sadu ja tuhandeid isikuid)

  • Pole ühesuguse ees- ja perekonnanimega isikuid

Tabel 6.2. Kontaktide tabel

Ees- ja perekonnanimiTel. nr.Aadress

Joan Smith

699 23 43 12

Brama Zachodnia 1, Varssavi

Adam Willson

711 19 77 21

London, Frogs Drive 5

Joan Smith

110 98 98 00

Brama Zachodnia 1

Smith Joan

312 43 42 22

Varssavi, Brama Zachodnia 1

ADAM Willson

231 83 02 04

Frogs Drive 5, London


Sellist tabelit võib luua nii arvutustabeli kui andmebaasina. Arvutustabeli kasutamine on loomulikult väga lihtne. Milliste probleemidega me hetkel silmitsi seisame?

Andmete viiteterviklus

Oletame, et kasutad arvutustabelit ja sul tuleb muuta vähemalt ühe isiku aadressi. Sinu ees seisab pisike probleem: sageli tuleb selleks muuta aadressi paljudel ridadel. Nii võib näiteks Joan esineda kolmel real. Probleem tekib siis, kui unustad üht neist ridadest muuta: isikule omistatud aadress muutub mitmetähenduslikuks, see aga tähendab, et sinu andmed kaotavad tervikluse.

Pealegi pole kuigi lihtsat võimalust mõnda isikut tabelist kustutada: selleks tuleb kustutada kõik teda sisaldavad read.

Andmete liiasus

See on otseselt seotud eelneva probleemiga. Väljadele Ees- ja perekonnanimi ning Aadress on samu andmeid sisestatud mitu korda. See on arvutustabelitele tüüpiline vähetõhus viis andmete salvestamiseks, sest andmebaas kasvab nii või teisiti, nõudes vastavalt aina enam ressursse arvutilt (suuremad andmed ja aeglasem ligipääs).

Kuidas aitab andmebaas neid probleeme lahendada? Info võib jagada väikesteks tükkideks, luues täiendava tabeli Isikud vaid kahe veeruga: Ees- ja perekonnanimi ning Aadress:

Tabel 6.3. Isikute tabel

Ees- ja perekonnanimiAadress

Joan Smith

Brama Zachodnia 1, Varssavi

Adam Willson

Frogs Drive 5, London


Iga tabeli Isikud rida vastab ainult ühele isikule. Tabel Kontaktid on nüüd seotud tabeliga Isikud.

Andmeterviklus ja -õigsus

Pane tähele, kuidas on andmed sisestatud väljadele Ees- ja perekonnanimi ning Aadress. Andmeid sisestavad inimesed võivad mõnikord eksida või olla hooletud. Meie näites ongi andmeid sisestatud erinevalt: Joan Smith ja Smith Joan, Adam ja ADAM. Üht ja sama aadressi võib samuti mitmel moel sisestada, nagu ka meie tabel näitab.

See probleem ilmneb siis, kui otsid näiteks isiku telefoninumbrit, kelle aadress on Brama Zachodnia 1, Varssavi. Sa leiad kolme kirje asemel ainult ühe. Samuti ei leia sa kaugeltki kõiki telefoninumbreid, kui otsid välja Ees- ja perekonnanimi järgi isikut Joan Smith, sest Joan Smith ja Smith Joan loetakse antud juhul erinevaks.

Kuidas aitab andmebaas neid probleeme lahendada? Selleks tuleks muuta tabeli Isikud ülesehitust:

  1. Jagada andmed väljal Ees- ja perekonnanimi kahele väljale: Eesnimi ja Perekonnanimi.

  2. Jagada andmed väljal Aadress kolmele väljale: Tänav, Majanumber ja Linn.

  3. Tagada andmeõigsus nõudega, et väljad ei oleks tühjad (s.t. et alati tuleb sisestada ka näiteks majanumber).

Muudetud tabel näeb välja nii:

Tabel 6.4. Isikute tabel

NimiPerekonnanimiTänavMajanumberLinn

Joan

Smith

Brama Zachodnia

1

Varssavi

Adam

Willson

Frogs Drive

5

London

Tingimused

    

nõutav väli

nõutav väli

nõutav väli

nõutav väli

nõutav väli


Tänu tingimuse nõutav väli lisamisele võime olla kindlad, et sisestatud andmed on täielikud. Mõningate tabelite korral võib muidugi andmete sisestamisel lubada teatud väljade tühjaksjätmist.

Andmevaate piiramine

Arvutustabelid näitavad tabeli kõiki ridu ja veerge, mis eriti väga suurte andmetabelite korral on päris tülikas. Arvutustabelis võib muidugi ridu filtreerida ja sorteerida, kuid seejuures peab olema väga ettevaatlik. Arvutustabeli kasutajad võivad sageli unustada, et andmevaade on filtreeritud, mis võib kaasa tuua eksimusi. Näiteks summa arvutamisel võid arvata, et sul ongi 100 andmerida, ehkki tegelikult on veel 20, aga need on peidetud.

Kui soovid kasutada andmete väiksemat hulka, näiteks saata neid teistele redigeerimiseks, võib need kopeerida ja asetada teise arvutustabelisse ning redigeerimise järel muudetud andmed taas põhitabelisse asetada. Kuid sellise käsitsi redigeerimise korral valitseb suur andmekao või vigaste arvutuste võimalus.

Andmevaate piiramiseks pakuvad andmebaasirakendused päringuid, vorme ja aruandeid.

Ühe praktilise piiramise näitena vaatleme varasema tabeli Isikud laiendatud versiooni:

Tabel 6.5. Isikute tabel

NimiPerekonnanimiTänavMajanumberLinnSissetulek

Joan

Smith

Brama Zachodnia

1

Varssavi

2300

Adam

Willson

Frogs Drive

5

London

1900


Eeldame, et lisatud veerg Sissetulek sisaldab konfidentsiaalseid andmeid. Kuidas jagada nüüd näiteks isikute kontaktandmeid oma kaastöötajatega ilma nende isikute sissetulekut paljastamata? See on võimalik, kui jagad ainult päringu, aga mitte terve tabeli. Päring võib valida kõik veerud, välja arvatud veerg Sissetulek. Andmebaaside maailmas kannab selline päring sageli nimetust vaade.

Jõudlus ja võimsus

Sinu arvuti võib olla küll võimas, aga peaaegu kindlasti koged, et väga suurte arvutustabelite korral jääb see ometi aeglaseks. Selle põhjuseks on esmajoones indeksi puudumine, mis kiirendaks andmete otsingut. Andmebaasid pakuvad sellist võimalust. Kui aga kasutad näiteks süsteemset lõikepuhvrit, võib isegi andmete kopeerimisele kuluda närviajavalt palju aega.

Suuri andmekogumeid sisaldavate arvutustabelite avamisele võib kuluda väga palju aega. Arvutustabelid laadivad avamisel hulga andmeid arvuti mällu. Tõenäoliselt on enamik laaditud andmeist parajasti kasutud või ebavajalikud. Erinevalt arvutustabelitest laadivad andmebaasid andmeid arvuti mällu ainult sellise vajaduse tekkimisel.

Enamasti pole vaja andmebaaside puhul muret tunda, kuidas need andmeid salvestavad. See tähendab, et erinevalt arvutustabelitest ei ole andmebaaside puhul vaja muret tunda järgmiste asjade pärast:

  • Ridade järjekord, sest sa võid ridu järjestada vastavalt vajadusele. Pealegi võib samu andmeid vaadata mitmes vaates erineval moel.

  • Sama käib tabeli veergude (väljade) kohta.

Koos eelnevas alajaotuses kirjeldatud andmevaate piiramise võimalusega on need omadused andmebaaside väga suureks eeliseks.

Andmekirje

Tabelitöötlusrakenduste uusimad versioonid võimaldavad kujundada andmekirjete vorme. Neist on kõige enam kasu siis, kui sinu andmeid ei ole eriti mõistlik esitada tabelina: näiteks kui tekst hõlmab liiga palju ridu või kui kõik veerud ei mahu mingil tingimusel ekraanile ära.

Sellisel juhul osutuvad arvutustabelid juba olemuselt problemaatiliseks. Selliste andmekirjete väljad paiknevad arvutustabelis suvaliselt ega pole tihtipeale eriti turvaliselt kaitstud kasutaja (tahtliku või tahtmatu) sekkumise eest.

Aruanded

Andmebaasid võimaldavad andmeid rühmitada, piirata ja summeerida aruande kujul. Arvutustabelid esitatakse nii ekraanil kui ka trükituna tavaliselt väikeste tabelitena, ilma et sul oleks täielik kontroll lehekülje ja väljade paigutuse üle.

Programmeerimine

Andmebaaside loomise rakendused sisaldavad sageli terveid programmeerimiskeeli. Uuematel tabelitöötlusrakendustel on samuti see funktsionaalsus, kuid arvutused piirduvad arvutustabeli väljade muutmise ja lihtsa andmete kopeerimisega ega arvesta kuigivõrd eelpool mainitud tervikluse nõuetega.

Andmete töötlemine arvutustabelis käib sageli graafilises kasutajaliideses, mis võib aeglustada andmetöötluse kiirust. Andmebaasid võivad töötada taustal, ilma graafilist kasutajaliidest kasutamata.

Ühiskasutus

Ühe arvutustabeli ühiskasutust on isegi raske ette kujutada. Uusimate rakendustega võib see küll olla tehniliselt võimalik, kuid see nõuab kasutajatelt väga suurt distsipliini, tähelepanelikkust ja teadlikkust, mida on väga raske tagada.

Arvutustabelisse salvestatud andmete klassikaline teistega jagamise viis on saata neile fail tervikuna (tavaliselt e-postiga) või panna see tabelarvutuse failina välja võrku. Suuremate inimrühmade korral on see väga vähetõhus: andmed, mida sul mingil konkreetsel hetkel vaja läheb, võivad olla lukustatud, sest neid kasutab keegi teine.

Andmebaasid on aga juba kavandatud mõttega, et neid võib korraga kasutada ka palju inimesi. Isegi kõige lihtsamates versioonides saab lukustada või vabaks anda tabeli iga rida, mis tagab väga lihtsa ja hõlpsa tabeliandmete jagamise.

Turvalisus

Arvutustabeli või selle konkreetsete osade kaitsmine parooliga on üldiselt rohkem sümboolne. Kui tabelarvutuse fail on võrku pandud, võib iga isik, kellel on antud asukohta ligipääs, selle sealt endale kopeerida ja üritada parooli murda. Mõnikord pole see sugugi raske, sest parool on salvestatud arvutustabeliga samasse faili.

Sama lihtne on jagu saada arvutustabeli või selle osa redigeerimise või kopeerimise lukustamise võimalustest.

Andmebaasid aga (välja arvatud need, mis on serveri asemel salvestatud failina) ei pruugi üldse asuda ühes failis. Neile pääseb ligi võrgus, tavaliselt on selleks vaja anda kasutajanimi ja parool. Ligipääsu saad ainult neile aladele (tabelid, vormid või isegi konkreetsed read ja veerud), millele sulle on selline õigus antud.

Kasutamisõigused võivad tähendada õigust andmeid muuta või ka ainult neid vaadata ehk lugeda. Kui mingeid andmeid pole sulle kättesaadavaks tehtud, ei saadeta neid sinu arvutisse, nii et sul pole neid võimalik kopeerida või vähemalt ei ole see kaugeltki nii lihtne kui tabelarvutuse failide korral.