Le Basi di Dati

Materie:Appunti
Categoria:Informatica

Voto:

2.5 (2)
Download:209
Data:10.01.2001
Numero di pagine:7
Formato di file:.doc (Microsoft Word)
Download   Anteprima
basi-dati_1.zip (Dimensione: 8.28 Kb)
trucheck.it_le-basi-di-dati.doc     33 Kb
readme.txt     59 Bytes


Testo

LE BASI DI DATI

Prima di iniziare il discorso sulle basi di dati bisognerà accennare al significato di dato e di informazione. In entrambi i casi abbiamo due concetti fondamentali. Per quanto riguarda il significato di DATO:
1) è la rappresentazione di un’informazione ottenuta per mezzo di alcune caratteristiche fondamentali dell’informazione stessa.
2) risulta essere la descrizione di aspetti elementari di un’entità o fenomeno (forma, peso…)
Inoltre esso, DATO, ha come caratteristiche tre elementi, quali: NOME, VALORE, FORMATO. Oltre tutto i DATI a seconda della loro natura possono essere:
- PRIMITIVI se scaturiscono dall’osservazione di un fenomeno;
- RISULTANTI se sono l’elaborazione dei primitivi;
- STRUTTURATI quali le variabili.
Il DATO può essere quindi definito un’ENTITÀ’ DESCRIVIBILE ed IDENTIFICABILE.

Mentre per quanto riguarda il concetto di INFORMAZIONE per essa si intende:
1) l’incremento di conoscenza che può essere acquisito dai dati;
2) l’insieme dei dati elaborati sulla base di esigenze di utilizzo.

Solo ora è possibile introdurre il concetto di BASE DI DATI. Con questa espressione si indicano gli archivi di dati gestiti in modo integrato con lo scopo di avere una grande efficienza nel trattamento e nel ritrovamento dei dati stessi. In parole povere la BASE DI DATI è una collezione di archivi di dati ben organizzati e ben strutturati, in modo che possano costituire una “base” di lavoro per utenti diversi con programmi diversi.
La BASE DI DATI deve essere EFFICIENTE e PRODUTTIVA, cioè deve essere possibile ritrovare con facilità le informazioni richieste, in termini di velocità, sicurezza ed integrità delle informazioni stesse. Per SICUREZZA si intende che il data base deve essere protetto sia da eventi accidentali che da accessi non autorizzati; mentre per INTEGRITA’ significa garantire che le operazioni effettuate dal data base da utenti autorizzati non provochino una perdita di consistenza di dati; dove per CONSISTENZA DEGLI ARCHIVI si intende che i dati in essi contenuti devono essere significativi ed effettivamente utilizzabili nelle applicazioni dell’utente.

Per gestire i data base esistono prodotti software indicati con il termine DBMS(Data Base Management System) i quali consentono all’utente di collocarsi in una posizione lontana dall’hardware, dai Sistemi Operativi e dalle memorie di massa; mentre più vicina all’applicazione gestionale. Il DBMS consente di: CREARE archivi con le strutture desiderate; MEMORIZZARE su supporti; AGGIORNARE e MODIFICARE i dati; ed, infine, REPERIRE le informazioni. Il DBMS è dunque un’interfaccia tra gli utenti di un data base con le loro applicazioni e le risorse costituite dall’hardware e dagli archivi di dati presenti nel sistema di elaborazione. Il DBMS è capace di fornire all’utente, mediante i suoi moduli software, delle funzioni, quali:
1) IMPLEMENTAZIONE DEL MODELLO LOGICO SUL SISTEMA DI ELABORAZIONE
- definizione dei dati e delle strutture dati derivate dallo schema logico ;
- definizione dei sottoschemi;
- organizzazione fisica dei dati su supporti di memorizzazione.
2) MANIPOLAZIONE ED INTERROGAZIONE
- inserimento dati;
- interfaccia programmi di utenti e data base;
- accesso ai dati contenuti nel data base.
3) CONTROLLO INTEGRITA’ DATI
4) SICUREZZA E PROTEZIONE
A gestire l’intera gestione dati è il DBA.

Oltre al DBMS esistono altri linguaggi che consentono di:
- Descrivere i dati, ovvero creare la struttura logica del data base: DDL(Data Definition Language);
- Controllare i supporti di memorizzazione dati: DMCL(Device Media Control Language);
- Manipolare i dati: DML(Data Manipulation Language);
- Fissare i vincoli di integrità: DCL(Data Control Language);
- Interrogare il data base in base a criteri richiesti dall’utente: QUERY LANGUAGE.

Tornando ai data base la loro gestione può sembrare semplice, ma non lo è.
Di solito le informazioni sono organizzate in archivi di record che però hanno dei difetti quali; la RIDONDANZA dei dati (quando questi sono compaiono in maniera duplicata) che può portare all’INCONGRUENZA nel caso in cui una stesso dato è aggiornato in un archivio e non in un altro, e da questa all’INCONSISTENZA dei dati i quali diventano non affidabili poiché non si sa il loro corretto valore. Limiti di tale organizzazione sono dovuti al fatto che:
- i programmi sono legati agli archivi che gestiscono;
- alcuni dati si presentano più volte in diversi archivi;
- l’accesso dei dati dipende dal tipo di organizzazione degli archivi.
Obiettivo dei data base è superare tali limitazioni nei seguenti modi:
- INDIPENDENZA DALLA STRUTTURA FISICA DEI DATI;
- INDIPENDENZA DALLA STRUTTURA LOGICA DEI DATI;
- UTILIZZO DA PARTE DI PIU’ UTENTI;
- ELIMINAZIONE DELLA RIDONDANZA;
- ELIMINAZIONE DELL’INCONSISTENZA;
- FACILITA’ DI ACCESSO;
- INTEGRITA’ DEI DATI;
- SICUREZZA DATI;
- USO DI LINGUAGGI PER LA GESTIONE DEI data base.
E proprio questi costituiscono gli elementi positivi del data base.

La progettazione del data base avviene a 3 diversi livelli:
1) CONCETTUALE: rappresenta la realtà dei dati e le relazioni tra essi mediante uno schema;
2) LOGICO: rappresenta il modo in cui i dati sono organizzati negli archivi elettronici;
3) FISICO: rappresenta l’effettiva installazione degli archivi elettronici.

Il 1° modello è definito con uno schema di dati indipendentemente dai valori che verranno ad essi assegnati dalle applicazioni e dalle visioni degli utenti.

Con il 2° livello i dati sono dotati di una struttura capace di facilitare la manipolazione e l’interrogazione dei dati stessi.
Per la costruzione di un modello CONCETTUALE dei dati è utilizzata la rappresentazione grafica del modello ENTITA’ RELAZIONI. Elementi di tale modello sono: le ENTITA’, le ASSOCIAZIONI e gli ATRIBUTI.
Le ENTITA’ è qualsiasi cosa astratta o concreta che assume un significato quando viene considerata in modo isolata ed è di interesse per la realtà considerata.
L’ASSOCIAZIONE il legame che stabilisce un rapporto tra le entità. Essa può essere OBBLIGATORIA se il legame tra le entità deve essere per forza presente oppure OPZIONALE quando il legame può anche non essere presente.
Inoltre esse possono essere di 3 tipi:
1) 1 : 1 (BIUNIVOCA)
Quando ad ogni elemento del primo insieme E1 corrisponde un solo elemento dell’insieme E2 e viceversa. Un esempio è una persona e il suo codice fiscale.
2) 1 : N (UNO A MOLTI o SEMPLICE)
Quando ad un elemento dell’insieme E1 corrispondono più elementi del secondo insieme. Tale è un’associazione di tipo gerarchico, un esempio è dato dal rapporto che intercorre tra padre – figlio.
3) N : N (MOLTI A MOLTI o COMPLESSA)
Quando ad ogni elemento di E1 corrispondo più elementi di E2 e viceversa. Questo tipo di associazione è spesso scomposta in due associazioni 1 : N, in modo da poter rappresentare gli attributi dell’associazione. Un esempio è dato dal rapporto intercorrente tra fratello – sorella.
Gli ATTRIBUTI sono le proprietà delle entità e delle associazioni. Le loro caratteristiche sono:
- FORMATO: carattere, numero…
- DIMENSIONI;
- OPZIONALITA’ costituita dal fatto che una variabile può essere nulla o meno.
L’insieme dei possibili valori assunti da un attributo è detto DOMINIO.
È indicato con il termine CHIAVE o CHIAVE PRIMARIA l’insieme di uno o più attributi capaci di distinguere un’ISTANZA (modello con valori) dall’altra per la stessa entità.
Il MODELLO LOGICO per data base è di solito utilizzato con la struttura FLAT FILE adatta solo per data base semplici. Per tale motivo si sono sviluppati altri modelli: GERARCHICO, RETICOLARE, RELAZIONALE.

MODELLO GERARCHICO adottato per meccanismi di strutture semplici che si applicano in modo naturale alla realtà in modo gerarchico. Presenta però degli SVANTAGGI, infatti, non è adatto in caso di realtà non gerarchica si deve ricorrere ad una duplicazione di fonte dei dati, non sono presenti situazioni di ritorno quindi lo schema risulterà non essere di immediata interpretazione.

Bisogna ricordare a tal punto che un ALBERO è un grafo orientato privo di cicli.

MODELLO RETICOLARE atto a rimuovere i limiti del precedente modello mediante la rappresentazione di un diagramma E/R ad un grafo. Presenta anch’esso degli SVANTAGGI, infatti, la “navigazione” reticolare è più complessa, anche se tale complessità si riduce con l’utilizzo di puntatori espliciti, introducendo un ulteriore problema dei puntatori doppi. Le difficoltà comunque si possono risolvere con l’utilizzo di un linguaggio adatto.

MODELLO RELAZIONALE secondo il quale il data base è rappresentato da un insieme di tabelle. Esso si basa su dei concetti matematici (di relazioni cartesiani) assegnando una grande importanza all’uso rigoroso del linguaggio matematico, con due fini principali:
1) utilizzare un modello conosciuto a livello universale;
2) eliminare problemi di ambiguità dovuti alla terminologia e alla simbologia.
L’insieme delle n-uple è definito RELAZIONE, n è il GRADO della relazione (colonne), gli insiemi sono definiti DOMINI ed il numero delle n-uple CARDINALITA’ (righe).
La RELAZIONE è il sottoprodotto dell’insieme cartesiano.
La CHIAVE è invece un ATTRIBUTO che identifica univocamente le n-uple (righe tabella).
Cinque sono gli elementi che caratterizzano il modello relazionale:
1) tutte le righe hanno lo stesso numero di colonne;
2) gli attributi sono informazioni elementari;
3) i valori assunti dai campi sono dello stesso tipo;
4) ogni riga è diversa dalle altre e per questo caratterizzata da una chiave primaria;
5) le n-uple non hanno un ordine prefissato.

Le operazioni che consentono di fare le interrogazioni alle basi di dati sono dette OPERATORI RELAZIONALI, le principali sono:
- SELEZIONE dà come risultato una relazione costituita dalle sole n-uple che soddisfano una data condizione;
- PROIEZIONE risultato è una nuova relazione da colonne soddisfacenti attributi prefissati;
- CONGIUNZIONE risultato è la combinazione di due relazioni che hanno in comune due o più attributi. Nel suo ambito possiamo distinguere: JOIN ESTERNO che a sua volta si divide in LEFT JOIN e RIGHT JOIN; e SELF JOIN.
Se le tabelle su cui si opera hanno una struttura tabellare omogenea si possono fare anche altre operazioni:
- UNIONE il cui risultato è una nuova tabella contenente le righe della prima e seconda tabella con riduzione a una di quelle ripetute;
- INTERSEZIONE la quale genera una nuova tabella contenente le sole righe comuni;
- DIFFERENZA che produce una nuova tabelle contenente le sole righe della prima tabella non contenute nella seconda.
Le tabelle sono trasformate in modo che ognuna di essa corrisponda ad un singolo aspetto della realtà, tale processo è definito NORMALIZZAZIONE. Le principali forme normali del modello relazionale sono:
- PRIMA FORMA NORMALE (1FN) quando sono rispettati i requisiti fondamentali del modello relazionale.attributi in forma semplice.
- SECONDA FORMA NORMALE (2FN) quando la relazione è in 1FN e tutti gli attributi non chiave dipendono dalla chiave parzialmente.
- TERZA FORMA NORMALE (3FN) quando è in 2FN e non ci sono attributi non chiave che dipendono transitivamente dalla chiave.
Infine il modello relazione possiede la cosiddetta INTEGRITA’ REFERENZIALE, essa non è altro che un insieme di regole che garantiscono l’integrità dei dati quando si hanno relazioni associate tra loro mediante chiavi esterne.
1

1
Le Basi di Dati

Esempio



  


  1. Jeannie

    Heck yeah bay-bee keep them coinmg!

  2. valeria

    appunti di archivi dati per interrogazione di informatica

  3. valeria

    sto cercando gli appunti sul archivio dati per un interrogazione di informatica