2. Le banche dati, in inglese database, sono un insieme di
dati (opportunamente strutturati), ma comunemente
l’espressione indica anche il software con cui questi
dati sono gestiti. Il termine “strutturati” sta a
significare che sono state stabilite delle regole con cui
inserire i dati e che questi sono in relazioni e
collegamento tra loro in modo da poter essere oggetto
di ricerca e di analisi.
Il software per la gestione dei database è denominato
DBMS (Data Base Management System) il quale
consente all’utente di definire,creare, e mantenere il
database e fornisce accesso controllato ad esso.
3. All’inizio i dati non erano considerati oggetti separati ma parte
integrante del programma, organizzati seguendo i cosi detti “modelli
degli archivi”.
Per esempio, se si disponeva di un nastro magnetico per archiviare i
dati di una banca, i dati dovevano essere trattati in modo sequenziali
per la natura del mezzo fisico di memorizzazione (pensiamo all’usare
una audio cassetta in cui per ascoltare la canzone 3 dobbiamo prima
arrivare al termine della canzone 2)
Questo creava problemi di diversa natura e si è iniziato a pensare di
modellare i dati come oggetto indipendente: nasce così la disciplina
dell’organizzazione dell’informazione, nota come “Sistemi informativi
e database”.
L’obiettivo di questa disciplina è organizzare concettualmente e
logicamente i dati per rappresentarli indipendentemente dal supporto
fisico di memorizzazione (memorie di massa) o dalla funzione che
devono assolvere (programma).
4. Dato: è la più piccola unità significativa che rappresenta un
oggetto, un evento, un fatto, un’astrazione, un concetto di senso
compiuto;
Il Dato ha un ciclo di vita (potrebbe cambiare o non servire più),
un valore (sia numerico che testuale), una necessità per
qualche unità organizzativa (serve per qualche motivo a chi lo
inserisce o lo consulta);
Un dato si dice persistente quando, spento il calcolatore,
mantiene la sua integrità;
Il dato è una risorsa preziosa;
Il dato deve essere rappresentato nel suo valore intensionale
(ossia legato alle qualità essenziali del significato) e astratto,
indipendentemente dalle attuali e contingenti applicazioni.
Il dato persistente è memorizzato in apposite strutture dati, dette
ARCHIVI o file;
Un archivio è una collezione di dati organizzati secondo uno
schema, detto record logico (a lunghezza fissa o lunghezza
variabile);
5. Un dato è semplicemente un elemento noto, senza
alcuna connotazione: il numero “222333444”, è un dato,
ma non è un’informazione, perché non ci dice niente su
cosa rappresenta
Un’informazione è l’elaborazione di questo elemento,
ovvero un dato connotato: Se definiamo un campo
“numero di telefono” a cui assegnare il numero
“222333444”, otteniamo un’informazione; sapremo, cioè,
che quel numero è assegnato a un’utenza telefonica.
7. Per comprendere come è formato un archivio occorre
partire dall’unità di base ossia il Record (o
registrazione) ossia l’insieme di dati (anche
eterogenei, quindi di diversa tipologia) relativi ed un
singolo elemento. I Campi sono invece elementi
omogenei ovvero con caratteristiche simili tra loro ma
che nell’archivio si riferiscono a molteplici elementi.
negli archivi strutturati ogni record è suddiviso in
campi, ciascuno dei quali codifica una singola
informazione elementare, numerica o alfanumerica;
negli archivi di testo il record è composto da una riga o
paragrafo
8. I Campi I Record
Nome: testo, 20 caratteri (è il massimo di caratteri) Tizio Caio
Via Tal dei Tali, 17
00100
Mario Rossi
Via Taranto, 30
00200
Cognome: testo, 30 caratteri //
Indirizzo: testo, 30 caratteri //
Numero Civico: numero intero
CAP: numero intero
I CAMPI CONTENGONO NELL’ARCHIVIO
SEMPRE LA STESSA TIPOLOGIA DI
INFORMAZIONI STRUTTURATE MA CHE
SARANNO RIFERITE A MOLTEPLICI SOGGETTI
I RECORD CONTENGONO
DIVERSE TIPOLOGIE DI
INFORMAZIONI MA
RIFERITE AI SINGOLI
SOGGETTI
9. Un file strutturato é destinato a contenere un insieme
di record dotati della medesima struttura(formato);
esso viene creato o modificato mediante il linguaggio
di programmazione o interfacce grafiche.
Esistono vari tipi di file: sequenziale, ad accesso
diretto, ad accesso con chiave, invertiti.
10. File
sequenziali
•I dati sono memorizzati in sequenza e si accedono in sequenza
•Per leggere l’ultimo record occorre scorrere tutto il file
•Per scrivere un nuovo record occorre leggere tutto il file,
posizionarsi sull’ultimo record e poi accodare il nuovo record
File ad
accesso
diretto
•I dati sono memorizzati casualmente sulla memoria
•La posizione dei dati è data da un campo detto chiave.
•Si accede al dato in modo diretto sia in lettura sia in scrittura
File con
chiave
•I dati sono memorizzati a blocchi sequenziali sulla memoria
•I record sono identificati con un campo detto chiave primaria
•Le chiavi sono inserite in un file a parte detto indice
•Per accedere ai dati si utilizza il file indice che rimanda
all’indirizzo dove sono memorizzati i dati
File invertiti
•Tutti i dati del record sono chiavi di accesso ai dati
•Si costruiscono delle tabelle accessorie per l’accesso ai dati
•Poiché lo stesso dato può ricorrere in più record si crea una tabella
di valori contenente gli indirizzi in cui i valori si trovano
•La ricerca agisce sulle tabelle dei valori e recupera gli indirizzi dei
record in cui questi valori ricorrono
11. I DBMS consentono l’indipendenza dei dati dai programmi
garantendo le seguenti caratteristiche:
persistenza - i dati persistono nel tempo
non ridondanza dei dati - i dati vengono memorizzati una
sola volta
sicurezza - meccanismi di accesso autorizzato ai dati
integrità - ad ogni dato vengono associati vincoli di
integrità e i programmi che non rispettano queste regole
vengono “bloccati”
utilizzo concorrente - i dati possono essere utillizzati da
più programmi contemporaneamente
sistemi di backup e recovery dei dati in caso di errore
12. Livello fisico: insieme di record memorizzati nella
memoria fisica
Livello logico: organizzazione dei dati e delle sue relazioni
Livello esterno o vista o livello concettuale: i dati così
come vengono visti da un utente
È inoltre importante evidenziare altre due caratteristiche:
Indipendenza fisica - si può ridefinire il livello fisico senza
modificare il modello logico
Indipendenza logica - si può estendere il modello logico
senza alterare il livello esterno
13. I database si creano dunque in diverse fasi seguendo lo
schema dei livelli di astrazione:
Livello concettuale – Ideazione delle relazione dei dati
Livello logico – Scelta del modello del DBMS e
modellazione delle tabelle
Livello fisico – Creazione del supporto di
memorizzazione e della programmazione utile per la
gestione dei supporti di memorizzazione
14. Hardware: da singolo PC a una rete di computer
Software: DBMS, sistema operativo, programmi
applicativi, software di rete (se necessario)
Dati: organizzazione e loro struttura
Procedure: istruzioni e regole da applicare al progetto e
all’uso del database e dal DBMS
Persone: Data Base Administrator – DBA, Data
administrator, programmatori applicativi, Progettisti
di database (sia logici che fisico), Utenti
15. Le transazioni sono operazioni che agiscono sulla banca
dati e non alterano la sua integrità :
Commit – fine della transazione con esito positivo
Roll-back – fine della transazione con esito negativo e
quindi ritorno allo stato precedente l’inizio della
transazione
16. Entità: oggetti (fatti, persone,cose) con proprietà
comuni e con esistenza “autonoma”.
Relazione (o associazione): legame logico, significativo
per l’applicazione di interesse, fra due o più entità.
Part-of (composizione)
Is-a (gerarchica)
Associazione funzionale
Attributi: proprietà elementare di un’entità o di una
relazione, che associa ad ogni entità o relazione un
valore appartenente a un insieme, il quale è detto
dominio dell’attributo
17. La chiave primaria di una tabella è il campo i cui valori
identificano univocamente ciascun record della
tabella: ad esempio, in un database di studenti, il
numero di matricola può costituire la chiave primaria.
La chiave primaria deve essere:
Univoca
Persistente nel tempo
Non dipendere da nessun altro campo