D2I
Integrazione, Warehousing e Mining di sorgenti eterogenee
Prototipo per l'ottimizzazione di interrogazioni - Cost-k-decomp

Alfredo Mazzitelli e Francesco Scarcello

 
Tema Tema 2: Progettazione e interrogazione di Data Warehouse
Codice D2-P2
Data 13 settembre 2002
Tipo di prodotto Prodotto software
Unità responsabile CS
Unità coinvolte CS
Autori Alfredo Mazzitelli e Francesco Scarcello
Autore da contattare Francesco Scarcello
Università della Calabria
scarcello@unical.it
Presentazione prototipo D2-P2
Documentazione in linea  http://wwwinfo.deis.unical.it/~frank/Hypertrees/D2I/
 


Descrizione

Cost-k-decomp è un prototipo sviluppato per l'ottimizzazione di interrogazioni, che combina la tecnica di decomposizione di interrogazioni Hypertree, basata sulla struttura delle interrogazioni, con tecniche più tradizionali di ottimizzazione, basate sui parametri quantitativi della base di dati. Studiato per la valutazione efficiente di interrogazioni con molte relazioni coinvolte e su grosse moli di dati, il protitipo si rivela particolarmente utile per il popolamento e l'aggiornamento dei data warehouse. Forniti in input una interrogazione e le informazioni quantitative sulle relazioni ad essa associate, l'applicazione calcola una hypertree decomposition ottimale basata sul costo ed il relativo piano di valutazione. Il modello di costo sfruttato dal prototipo si basa sulle informazioni quantitative di cardinalità e selettività degli attributi delle relazioni coinvolte. Se non esiste alcuna decomposizione di width limitata dal valore k fissato in input, Cost-k-decomp segnala che per l'istanza considerata  non è possibile utilizzare questa tecnica. L'output è costituito da un piano di valutazione dell'interrogazione, espresso sotto forma di viste (con Hint per Oracle), e da un albero di decomposizione, espresso nel formato standard GML (Graph Modelling Language), che fornisce informazioni sulle stime dei costi di valutazione. In particolare, la radice è etichettata con la stima del costo di valutazione di tutta l'interrogazione fornita in input, calcolata in base alle informazioni statistiche disponibili.


Ambiente di sviluppo e di esecuzione

Sviluppato in Visual C++ 6.0 e GNU gcc 2.95.2.
Eseguibile in ambienti Windows 9x/NT e Unix-Like.


 

Back

 
 
 
Sito a cura di Domenico Lembo
lembo@dis.uniroma1.it