Adatb - 1. gyakorlat

August 3, 2021

Miről volt szó előadáson? - elméleti összefoglaló

Hivatalos jegyzet/könyv: 1. és 4. fejezet ismerendő a gyakorlatra.

Adat (egy kicsi mese)

Az adatbázis = adat + bázis, ebből főleg az adattal foglalkoztatok eddig, és hogy azt hogy logikus rendezni. A bázis része már az, amikor az adatot meghonosítjuk, annak struktúrát és akár matematikai keretet adunk. Nem fontos, nézzük mi fontos:

Adat > Információ > Tudás > Hatalom. Ismerős lehet a felsorolás, igaz?

Az adat ugyebár - józan ésszel - az egy: ✨ dolog ✨, ami önmagában nem értelmes, csak valami a világból. A mi feladatunk ezeket az adatokat úgy tárolni és úgy kapcsolatba hozni más adatokkal (lásd később DBMS), hogy az később minden fejlesztő számára először: értelmezhető legyen (információ), aztán: könnyen kontextusba helyezhető legyen (tudás). A fenti felsorolás értelmet nyert.

DBMS

DBMS = DataBase Management System. Ez az a szoftveres és (sokszor, nem mindig) hardveres rendszer, amelyben az adatokat okosba' tároljuk:

Lehessen sok adatot tárolni
Lehessen sokféle struktúrában tárolni
Lehessen jó sokáig (hosszú életcikluson át) tárolni

Ha már szoftveresen tároljuk az adatot, akkor lehessen:

Adatot és struktúrát: írni + olvasni + módosítani + törölni (CRUD: create, read, update, delete)
Több felhasználó is tudja használni a rendszert és több feladattal is tudjon foglalkozni a rendszer (lásd később a Tranzakciók (könyv 10. fejezet) témát)

dbms

Disclaimer: jelenleg csak az ábra sötétkék egységeivel foglalkozunk.

Fenti képen is látható, amikor a tervező készen áll - és helyesnek tartja - ER diagramját, akkor azt sémaleírásba foglalja a DBMS által használt DDL nyelven (Data Definition Language, pl.: SQL). Ezt a Séma feldolgozó pedig lefordítja saját magának (fel is tölti az adatszótárba), és amikor a DB menedzsernek szüksége van a sémákra, akkor innen kéri ki azokat.

SQL

Fun fact: az SQL (Structured Query Language) - amelyet a laborokon is meg fogtok ismerni - egyszerre DML (Data Manipulation Language) és DDL nyelv (és még annál is több, érdekességek a könyv 5.4 alfejezetében), azaz ahogy az ábrán is látható, képes adatlekéréseket is intézni DBMS-ekbe. Tipp: ha laborokon kevésbé szívesen kínoznátok a BME-s adatbázis szervert, akkor vannak különféle SQL playgroundok a neten, ahol tesztelhetitek az SQL kódotokat (és esetleg értelmesebb hibakódokat tudtok visszakapni, mint egy átlag Oracle környezetben), linkek: példa1, példa2.

DB menedzser feladatkörei

Az úgy tök okés, hogy a Lekérdezés feldolgozó megküldi a DB menedzser felé a hiperszuper optimális kiértékelési tervet - ami ugye igazából egy elemi szinten leírt utasítássorozat -, az még egyáltalán nem biztos, hogy azt a DB menedzsernek muszáj csak úgy parancs-értettem módra elfogadni és kikotorni/betenni a fizikai adatbázisból a szükséges adatokat, amiket kértek. A következőkre muszáj még figyelnie a DB menedzsernek:

Adatbiztonság: az adat érték, muszáj vigyázni arra, nehogy megsemmisüljön vagy megsérüljön.
Adatvédelem: jogosultságköröket kezel, nehogy rossz kezekbe kerülhessen az adat.
Szinkronitás: mivel akár többen is küldhetnek kérést egyszerre, illetve akár térben elosztott is lehet a fizikai adatbázis, muszáj arra figyelni, hogy a kérések megfelelő szinkronitás mellett (mintha egymás után indítanánk őket) futhassanak be és kerüljenek kiszolgálásra, nehogy ütközés vagy egyéb legyen. (lásd később Tranzakciók (könyv 10. fejezet))
Integritás: magyarul ellentmondásmentesség. Meg kell vizsgálni, hogy...
- ...a formai ellenőrzésen átmegy-e.
- ...a kérés hatására megmarad-e a referenciális integritás (pl.: ha az egyik helyen csak referálunk egy másik elemre, attól még ugyanazt az értéket kell visszaadniuk).
- ...a kérés hatására megmarad-e a strukturális integritás (pl.: ne legyen üres valami tulajdonság, ide tartoznak a kényszerek is, amelyről majd a Normalizálás témakörében (könyv: 9.2.2 alalfejezet) még bőven tanultok).

DBMS modellrétegei

Amikor egy DBMS működéséről beszélünk úgy általában, érdemesebb annak modelljét egy rétegmodellel ábrázolni az egyszerűség kedvéért:

Nézetek (+ külső séma)
Logikai adatbázis (+ séma)
Fizikai adatbázis

ERD

ERD = Entity-Relation Diagram, azaz entitás-kapcsolat diagram - adatmodellezési nyelv. Illetve csak majdnem. Ugyanis tudjuk, hogy egy jó adatmodell két dologból áll:

Formális jelölőrendszer (adatokra, kapcsolatukra) ✅
Műveleteket definiál az adatokon ❌

Az ER diagramnak a műveletek a gyengesége. Az igazi adatmodellek: hálós, hierarchikus, obj. orientált és a relációs. Ezek közül a legfontosabbal (és egyben a legelterjedtebbel), a relációssal fogtok majd később megismekedni jó sokáig (könyv: 5., 6., 9. fejezetek).

Jelölőrendszere

Kulcs: az a tulajdonsághalmaz(ok), amely egyértelműen azonosítani képes egy entitást. Pl.: a TAJ szám mivel minden személy számára egyedi, jól használható kulcsként önmagában. Aláhúzással jelöljük.

Kapcsolatok lehetséges formái

Aritás: A kapcsolat hány egyedhalmaz közé húzható
- Mi a 2 egyedhalmaz között húzható kapcsolatokkal foglalkozunk, aminek neve is van: bináris kapcsolat
Kardinalitás / Funkcionalitás: Bináris kapcsolatban használt jellemző, megadja hogy az egyik egyedhalmaz 1 db egyede hány a másik egyedhalmazbelivel kapcsolható össze, és hogy a másik egyedhalmaz 1 db egyede hány az előző egyedhalmazbelivel kapcsolható össze.
- 1:1 (Személy --- Személyi igazolvány)
- 1:N (Személy --- Egyéni mobil előfizetés)
- N:M (Személy --- Lakás)
- Ne felejtsük, hogy mindig az "1-es" irányába nézzen a nyíl a kapcsolatok rajzolásakor!

Extended ERD

"is-a" kapcsolat - öröklődés

OO programozásnál találkozhattatok ehhez hasonló jelölésrendszerrel. Megörökli az összes tulajdonságot és kapcsolatot.

Gyenge entitás

Gyenge az entitás, hiszen önmagában nem tudja semmilyen tulajdonságában azonosítani magát, megkülönböztetni több másik egyedtől. A kurzusokhoz a megfelelő tárgykódokat hozzárendelve lesznek az egyes kurzusok mint entitások egyértelműen megkülönböztethetők, azaz egyediek.

Tehát a tárggyal együtt a kapcsolata determináló. A nyíl mindig arra mutat, amire a gyenge entitás felkapaszkodik.

Minek tanulunk adatbázisokat?

Nyugodtan ugord át ezt a fejezetet, nem tartalmaz szükséges tudást, csupán lelki fröccsöt.

Az ismeretek elsajátításával rájössz, hogy te lehetsz...

az a fejlesztő, aki a világ - megrendelő által kért - entitásait, azok tulajdonságait és az entitások közti kapcsolatokat okosan* tervezi meg és ezáltal épít adatbázisokat.
az a fejlesztő, aki - a DBMS segítségével - ezeket az adatokat lekéri, és információként kínálja fel mondjuk egy weboldalon.
az a mérnök, aki új funkcionalitásokat tud beletenni a DBMS-be, okosíthatja az optimalizációt, újíthatja az lekérések és sémadefiníciók nyelvét.
az a mérnök, aki új algoritmusokkal oldja meg a rekordok begyűjtését, új fizikai adatstruktúrákkal rukkolhat elő a fizikai állományok rendezésére.

*Az, hogy hogy lehet okosan tervezni adatbázisokat, később, a Relációs lekérdezések optimalizációja (könyv: 6. fejezet) és Relációs sématervezés normalizálással (könyv: 9. fejezet) témájú előadásokon találkozhatsz.

Feladatsor

Forrás.

Filmeket, azok rendezőit, színészeit, forgatókönyvíróit kívánjuk tárolni. A filmekről tároljuk a hosszukat, a megjelenésük dátumát, a megtekintésükhöz ajánlott minimális életkort és a címüket. A cím egyértelműen azonosítja a filmet. Rendezőkről, színészekről és forgatókönyvírókról tároljuk a nevüket, címüket, személyi számukat és telefonszámukat. A személyi szám egyértelműen azonosít minden személyt.
- a) Tervezze meg a feladatnak megfelelő ER diagramot!
- b) Az ER diagramban tárolni szeretnénk, hogy az egyes színészek mely filmekben mely szereplőt játsszák. Ennek megfelelően bővítse a diagramot!
- c) A filmekről tárolni szeretnénk, hogy krimi esetén ki(k) játsszák az áldozato(ka)t, természetfilmeknél pedig azt, hogy milyen ország(ok)ban forgatták őket.
Iskolákat, azokon belüli osztályokat valamint tanárokat és diákokat tartunk nyilván. Az iskolákról tároljuk a nevüket, címüket, igazgatóik kilétét. Az osztályokról tároljuk létszámukat, nevüket, osztályfőnökük valamint tanulóik kilétét. A tanárokról tároljuk, hogy melyik osztályokat tanítják, mit tanítanak. Minden emberről továbbá tároljuk a személyes adatokat (név, lakcím, szem_szám, születési időpont)
- a) Tervezze meg az ER diagramot, válassza meg a kulcsokat!
- b) Az ER diagramban tároljuk a munkaviszonyok, hallgatói jogviszonyok kezdetét is.
Egy lízing-szerződés kapcsán a kereskedő átadja a kocsit az ügyfélnek, a kocsit a bank fizeti ki a kereskedőnek és az ügyfél pedig a banknak törleszt. Milyen módokon lehet ábrázolni ER diagrammal? Melyiknek mi az előnye és a hátránya?

Zárógondolat: A jövő gyakorlatra érdemes lehet úgy készülni, hogy...

vagy elmész előadásra
vagy elolvasod a könyv szükséges fejezeteit
vagy megnézed a következő poszt elméleti összefoglalóját

Házi feladat

Nem kötelező jelleggel, csupán mert ZH-szagú feladat: Könyv, 217. oldal, 4. feladat

Ha találtok egyéb feladatot a könyvben, megoldjátok, elküldhetitek nekem a megoldásotokat, hogy rápillantsak, jónak tűnik-e. Ide emailezz: trisz@kir-dev.hu No stress.

Házi feladat megoldása: Könyv, 233. oldal

Extra gondolatok

Az adatbázisok érdekességei

Ebben a tárgyban az előadásokon és gyakorlatokon az adatbázisok logikai részével, illetve a fizikai részével ismerkedhettek meg, illetve a laborokon pedig egy enterprise környezetben is használt konkrét szoftveres-hardveres rendszerrel ismerkedhettek meg: az OracleDB-vel. Aki érdeklődik, esetleg a Relációs adatbázisok előadás után nézzen utána a PostgreSQL, MySQL (ezek open source-ok) vagy MSSQL nevű RDBMS-eknek (Relational DBMS), tartogathatnak érdekességeket számotokra. Ezt természetesen akkor, ha időtök is engedi. Aki pedig még ennél is több ismeretre vágyna, olvassa el a könyv C függelékét (274. oldal), amelyben a NoSQL adatbázisokról olvashat. Ehhez a témakörhöz a MongoDB vagy Redis konkrét DBMS-eket ajánlom ismerkedésre, ha időtök van rá.

Az első gyakorlat margójára

Ne feledjétek, nem a tantárgy nehéz, maximum az akadály sok, amivel meg kell küzdeni. Ha megfelelő prioritást adtok a tantárgynak, bőven kellemes csalódást fog hozni a befektetett munkáért kiérdemelt vizsgajegy, amit elértek - ehhez a küzdelem fáj, tudom. Érdemes lehet gyakorlat előtt elolvasod a könyv előadáshoz tartozó részét - nem kell bemagolni, elég 1 olvasás is akár. Labor előtt pedig ugyanezt mégegyszer megtenni - de azért megnyugatásképp: laborra nem kell a gyakorlat anyaga. A laborfeladatokat otthon is be tudod fejezni, ha a laboron nem sikerül időben, a laborfeladatok alapos megoldása általában hosszadalmas, de tanulságos (és az SQL-ezés közel áll a szakmai munkához, szóval az jó buli), azonban mindig figyelj a határidőkre!