1. Argumentácia
Mojím oborom je aplikovaná informatika a na fakulte sa zaoberám programovaním a
databázami. Danú tému som si vybral, pretože dnešné aplikácie často pracujú s veľkým objemom
dát. Efektívnym spôsobom ich uloženia sú systémy riadenia bázy dát. Tieto systémy majú taktiež
nástroje na veľmi jednoduché zprístupňovanie a manipuláciu s dátami. Ich znalosť je
neodmysliteľná pre každého vývojára a tak si myslím, že táto téma je veľmi dôležitá.
Anotácia
Článok sa zaoberá pojmami systémov riadenia bázy dát. Oboznamuje čitateľa so základnými
pojmami a ich náveznosťou. Obsahuje nutné informácie pre začiatok štúdia systémov riadenia bázy
dát.
Kľúčové slová
Systém riadeniabázy dát, databáza, atribút, relácia, schéma, kľúč, SQL.
Terminológia relačných databázových systémov.
Článok obsahuje popis základných pojmov týkajúcich sa systémov riadenia bázy dát.
Znalosť týchto pojmov je veľmi podstatná pre pochopenie pred začiatkom štúdia týchto systémov.
Tento článok je teda určený pre tých, ktorý sa chcú začať zaoberať systémami riadenia dát a zatiaľ o
nich nemajú žiadne, alebo minimálne znalosti.
Systém riadenia bázy dát
Databáza je úložisko dát. Systém riadenia bázy dát (skrátene DBMS z anglického Database
Management System) je množina programových nástrojov. Sú využívané na kontrolu prístupu,
organizácie, skladovania, získavania a udržiavania dát v databáze.
Systémy riadenia bázy dát sa často nazývajú aj databázové systémy.
Atribút
Atribút je charakteristika dát. Vlastnosti dát zo skutočného sveta, namodelované do
databázy, sú reprezentované atribútmi. Atribút musí mať meno, aby sa naň dalo odkazovať a toto
meno by malo byť relevantné pre vlastnosť, ktorú popisuje.[1]
Doména
Doména je množina hodnôt, ktoré sú rovnakého typu. Hodnota je najmenšia nedeliteľná
jednotka dát v relačnom modeli. Atribút je vždy združený s doménou. Táto doména
udáva možné hodnoty pre atribút. Dva a viac atribútov môžu byť definované rovnakou doménou.
N-tica
N-tica je usporiadaná množina hodnôt. Popisuje charakteristiky dát v momente
času.
2. Relácia
Relácia je jadro relačných dát. Pozostáva z hlavičky a tela. Hlavička obsahuje fixnú
množinu atribútov, kde každý atribút zodpovedá práve jednej doméne. Telo obsahuje
časovo sa meniacu množinu n-tíc. Každá n-tica pozostáva z množiny párov, skladajúcich
sa z atribútu a hodnoty pre každý atribút v hlavičke. V každom danom páre hodnota
náleží do domény, ktorá je viazaná so zodpovedajúcim atribútom
v hlavičke.
Relačný dátový model
Jedným z možných typov databáz je relačný model. Pozostáva z množiny relácií.
Každej z nich je priradené unikátne meno, aby sa na ňu dalo odkazovať. Pre relačný
model prezentovaný tabuľkami sa neformálne relácie označujú ako tabuľky, n-tice
ako riadky a atribúty ako stĺpce. V práci sa môžu objaviť ako formálne tak aj
neformálne pomenovania.
Schéma
Schéma databázy je oficálny popis všetých databázových relácií a vzťahov existujúcich
medzi nimi. „Formálna definícia databázovej schémy je množina formulí, nazývaných integritné
obmedzenia, uložených v databáze. Tieto integritné obmedzenia zaisťujú kompatibilitu v
schéme.“[2]
Kľúče
Relačný dátový model používa kľúče na definovanie identifikátorov pre n-tice v reláciách.
Kľúče sa používajú na vynútenie pravidiel alebo obmedzení pre dáta v databáze. Tieto
obmedzenia sú podstatné pre udržiavanie konzistencie a správnosti dát. Relačný systém
riadenia bázy dát povoľuje definovanie takýchto kľúčov a začínajúc týmto bodom je
zodpovedný za overovanie a udržiavanie správnosti a konzistentnosti dát
v databáze. Kľúče sú delené na tri typy, ktoré sú ďalej popísané.
Kandidátne kľúče
Kandidátny kľúč je jedinečný identifikátor pre n-tice v relácii. Podľa definície by každá
relácia mala mať aspoň jeden kandidátny kľúč. V praxi má však väčšina viac takýchto
kľúčov.
Primárne kľúče
Primárny kľúč je kandidátny kľúč, ktorý je vybraný pre reprezentáciu relácie v databáze.
Poskytuje spôsob jedinečne identifikovať každú n-ticu relácie. Relácia v databáze musí
mať vždy práve jeden primárny kľúč. Existujú situácie, keď vlastnosti dát zo skutočného
sveta, namodelované reláciou, nemajú unikátne hodnoty. V takomto prípade musí byť
primárnym kľúčom kombinácia všetkých atribútov relácie. Takýto primárny kľúč však nie
je vhodný z praktických dôvodov. Vyžadoval by príliš veľa fyzického miesta pre skladovanie
a udržiavanie vzťahov medzi reláciami v databáze by bolo zložitejšie. V takýchto prípadoch
je zaužívaným riešením pridať ďalší atribút, napríklad id, ktorý nemá nič spoločné s dátami
zo skutočného sveta. Musí mať jedinečné hodnoty a bude vybraný ako primárny kľúč.
Takýto atribút sa zvyčajne nazýva náhradný alebo umelý kľúč.
3. Cudzí kľúč
Cudzí kľúč je atribút, alebo kombinácia viacerých atribútov. Nachádza sa v relácii,
ktorej hodnoty sa potrebujú zhodovať s tými v primárnom kľúči inej relácie. Párovanie
cudzieho a primárneho kľúča reprezentuje odkazy od jednej relácie tej ďalšej. Inými
slovami by sa dalo povedať, že párovanie kľúčov predstavuje určitý vzťah medzi n-ticami.
Cudzí a jemu náležiaci primárny kľúč by mali byť definované rovnakou
doménou.
SQL
SQL(z anglického Structured Query Language) je vysokoúrovňový jazyk, ktorý umožňuje
užívateľom manipulovať s relačnými dátami. „Je založný na množinových a relačných operáciách
s určitými zmenami a vylepšeniami.“[3] Jednou zo silných stránok SQL je, že používatelia iba
špecifikujú, aké dáta potrebujú bez toho, aby museli vedieť, ako ich dostať. Systém riadenia bázy
dát je zodpovedný za nájdenie prístupovej cesty, potrebnej pre získanie dát. SQL pracuje na
množinovej úrovni, čo znamená, že je navrhnutý na získavanie n-tíc z jednej, alebo viacerých
relácií.
DML
DML (z anglického Data Manipulation Language) je jednou z podmnožín SQL
pri jeho delení podľa funkcionality. Je to jazyk pre manipuláciu s dátami, uloženými
v databáze. Umožňuje vkladanie, zmenu, vymazávanie a získavanie dát.
DDL
DDL (z anglického Data Definition Language) je ďalžou z podmnožín SQL. Je to jazyk
slúžiaci pre definíciu dát a ich neskoršie prípadné pozmeňovanie. S jeho pomocou sa dajú definovať
reláciem, schémy, typy atribútov, ako aj obmedzenia pre dáta ktoré sa dajú ukladať. Dá sa taktiež
použiť pre neskoršie sa s jeho pomocou dajú jednotlivé štruktúri taktiež meniť a poprípade aj
vymazávať.
Obrázok
4. Použitá literatúra
[1] SHARMA, Neeraj, Liviu PERNIU, Raul CHONG, Abhishek IYER, Chaitali
NANDAN, Adi-Cristina MITEA, Mallarswami NONVINKERE a Mirela
DANUBIANU. Database Fundamentals. Canada: IBM Corporation, 2010.
[2] Database schema. Wikipedia [online]. 2012 [cit. 2013-01-04]. Dostupné z:
http://en.wikipedia.org/wiki/Database_schema
[3] SQL [online]. 2008 [cit. 2013-01-03]. Dostupné z:
https://is.muni.cz/auth/el/1433/podzim2008/PB154/um/mod04_1.pdf
Dôvody pre literatúru
[1] - obsahuje všetky základné pojmy o danej problematike.
- pútavo napísané.
- informácie zovšeobecnené pre rôzné typy systémov riadenia bázy dát, nie len pre
konkrétny produkt od IBM.
- užitočné zaujímavosti popri formálnych definíciach.
- prehľadná štruktúra knihy.
[2] - jednoducho popísané základné informácie.
- jednoducho dostupné.
- pravdivosť informácii overovaná odborníkmi.
- k danej téme sú uvedené, len podstatné informácie bez zbytožných ďalších údajov.
- informácie sú prehľadne roztriedené a majú náveznosť na príbuzné téma.
[3] - dobre popísaná základná problematika
- jednoducho vysvetlené pojmi
- dobre zrozumiteľné, sám som sa z toho učíl základy
- prehladné rozdelenie
- postupná náveznosť problematiky pre jednoduché pochopenie