archivi di dati

Materie:Appunti
Categoria:Informatica
Download:332
Data:18.05.2005
Numero di pagine:5
Formato di file:.doc (Microsoft Word)
Download   Anteprima
archivi-dati_1.zip (Dimensione: 6.78 Kb)
trucheck.it_archivi-di-dati.doc     31.5 Kb
readme.txt     59 Bytes



Testo

ARCHIVI DI DATI Per poter gestire grandi volumi di dati è necessario che questi siano memorizzati secondo una logica ben precisa in modo che in seguito la ricerca e la consultazione siano più rapide possibile.
La conservazione di queste informazioni avviene attraverso l’uso di archivi memorizzati sulla memoria di massa mediante sequenze di byte.
Le problematiche legate agli archivi di dati, cioè a quell’insieme di informazioni relative a determinati oggetti.

I FILE DI DATI: Un archivio o file (termine inglese per identificare un archivio) è definito come un insieme di record memorizzati su un supporto di memoria permanente (non necessariamente magnetica, si pensi agli archivi cartacei ancora presenti in molti uffici). Per record si intende un insieme di informazioni (attributi) riguardanti un determinato oggetto.
Una persona ad esempio è un oggetto che può essere caratterizzato da: nome; cognome….
Le informazioni componenti il record sono dette campi del record (nome, cognome…)
Il campo di un record può a sua volta essere suddiviso in sottocampi, ad esempio il campo data di nascita può essere rappresentato attraverso il giorno, il mese e l’anno.
Per maggiore chiarezza diremo che un file contiene dati della stessa natura (omogenei), di cui si registrano le caratteristiche (attributi) omogenee, scelte in vista dell’obiettivo da raggiungere.
Nella progettazione di un archivio è necessario definire quali sono gli attributi generali (campi) che meglio rappresentano i dati in oggetto.
È necessario definire la struttura del record e cioè quali sono i campi e gli eventuali sottocampi che lo compongono, il loro tipo e la loro dimensione in byte.
Per migliorare l’attività di ricerca può essere utile, nella definizione di un file, definire una chiave primaria, cioè uno o più campi che identificano univocamente ciascun record ; i valori assunti dalla chiave primaria devono essere tutti diversi, cioè non possono esistere due record con lo stesso valore della chiave primaria.

OPERAZIONI SUI FILE. Per poter elaborare tramite un programma i dati presenti nei file è necessario prima spostarli nella memoria centrale. È compito del sistema operativo (file system) trasportare fisicamente i dati dalla memoria di massa (hardisk, floppy disk, cd-rom) alla memoria centrale e viceversa. Queste funzioni vengono richiamate con i comandi READ e WRITE presenti in tutti i linguaggi di programmazione. Con un’operazione di READ viene fatto un accesso alla memoria di massa e viene ricopiato un record dalla memoria di massa alla memoria centrale. Con l’operazione di WRITE avvine il contrario e cioè il record presente nella memoria centrale viene copiato nella memoria di massa.
• La prima operazione da analizzare è la creazione di un archivio, cioè l’operazione che riserva lo spazio sulla memoria di massa in grado di contenere i dati interessati.
• L’operazione di consultazione riguarda il reperimento dei dati contenuti nell’archivio.

• Modifica
• Inserimento
• Cancellazione
• Ordinamento
• Fusione
• Cancellazione di un file

METODI DI ORGANIZZAZIONE
Il metodo di organizzazione di un file stabilisce la logica e le modalità con cui le informazioni sono memorizzate sui supporti fisici. I tipi di organizzazione sono:
1. FILE SEQUENZIALI: Con il termine di file sequenziale si intende un tipo di archivio in cui i dati sono disposti in sequenza, cioè uno di seguito all’altro. Si parla di file ordinato quando i record sono registrati in ordine crescente o decrescente del campo chiave; quando invece i record sono memorizzati consecutivamente senza alcun ordine logico, il file ridirà non ordinato.
2. FILE AD ACCESSO DIRETTO: Un file si definisce ad accesso diretto quando è possibile accedere direttamente alle informazioni contenute in un record attraverso la chiave. Esistono vari tipi: sequenziale a indice, accesso calcolato e relativa.

BASE DI DATI può essere vista come una collezione di dati strutturati progettati per essere usati in applicazioni differenti e da differenti utenti. È quindi una base di lavoro a cui possono accedere utenti diversi con programmi diversi, per conservare, inserire, modificare e rielaborare informazioni.
DBMS è un software per la gestione del DATA BASE.

LE ENTITA’ sono elementi della realtà che vengono raggruppati in una classe essendo dotati di caratteristiche comuni (la classe costituisce il tipo di entità, le istanze della classe sono le entità).
Ad esempio: entità persona con le caratteristiche nome e città, una istanza dell’entità persona è ROSSI di Milano.
LE ASSOCIAZIONI (o relazioni) sono i legami logici esistenti tra due o più entità. Corrispondono esattamente al concetto matematico di relazione tra elementi di un insieme. Anche in questo caso si può parlare di classi di associazioni se si considerano tutte le associazioni possibili tra due entità.
GLI ATTRIBUTI sono le proprietà attraverso cui è possibile descrivere una entità (o un associaz.)
Non possono esistere da soli. A seconda del tipo di dato l’attributo può essere caratterizzato in:
• Attributi semplici
• Attributi composti
• Attributi multipli sono quelli di tipo sequenza.
I tipi di relazioni tra entità riprendono i concetti tipici dell’insiemistica.
RELAZIONI 1:1 – A ogni elemento del primo insieme ne corrisponde uno e uno solo del secondo insieme ed è vero anche il contrario.
RELAZIONI 1:M – A un elemento del primo insieme possono corrispondere più elementi del secondo insieme, ma non è vero il contrario.
RELAZIONI M:N – A un elemento del primo insieme possono corrispondere più elementi del secondo insieme e così anche il contrario.

MODELLO ANSI/SPARC
Nell’organizzazione delle basi di dati possiamo evidenziare tre livelli di astrazione:
• Schema fisico: si pone al livello interno e descrive come sono organizzati fisicamente i dati su supporti di memoria di massa.
• Schema logico concettuale: rappresenta l’organizzazione logico-concettuale dei dati cioè quali entità e quali relazioni devono essere rappresentate.
• Sottoschemi o viste: livello esterno in cui differenti utenti possono avere differenti visioni degli stessi dati a seconda dell’uso che ne devono fare.
Per INDIPENDENZA LOGICA si intende la possibilità di modificare lo schema concettuale senza dover modificare i programmi che usano le singole applicazioni.
Per INDIPENDENZA FISICA si intende la possibilità di modificare l’organizzazione fisica dei dati senza dover modificare l’organizzazione logico-concettuale.
LINGUAGGI = 1) Linguaggio di definizione dei dati (DDL): ha lo scopo di specificare i tipi di entità presenti nello schema e le loro relazioni.
2) Linguaggio di manipolazione dei dati (DML): ha lo scopo di fornire all’utente uno strumento per interrogare e modificare le informazioni contenute nella base di dati.
3) Linguaggio di interrogazione dei dati (QL): linguaggio di tipo interattivo per l’interrogazione e
La modifica della base di dati. È stato ideato principalmente per risolvere il problema degli utenti
casuali che, pur non avendo conoscenze di programmazione, possono interrogare la base di dati
senza dover scrivere gli appositi programmi. I query language hanno in genere sintassi e semantica
proprie.

Esempio



  


  1. giuseppe delgaudio

    appunti dei dati informatici