|
olap.it
The N° 1 site for Data Warehousing Professionals |
Business Intelligence & Data Warehouse Resource Center |
|
|
|
||
Breve introduzione alla Business Intelligence e glossario dei termini
| La BI in 3 minuti | Glossario |
| Business Intelligence | Glossario dei termini di BI |
| Data Warehouse, OLAP, Knowledge Management | |
| A cosa serve un Data Warehouse? |
Il
termine Business Intelligence, coniato all’inizio degli anni '90
da Howard Dresner, un analista del Gartner Group, viene utilizzato per indicare un
insieme di strumenti e metodologie per la raccolta e l'analisi dei dati,
atti a presentare i dati stessi in maniera tale che rappresentino
un'informazione utile per gestire i processi decisionali di un'azienda o
di un'organizzazione.
Si può intuire come questa definizione piuttosto ampia includa varie
sottocategorie che vengono identificate con sigle e nomi diversi, come Data Warehousing, Data Mining,
BPM, CPM, CRM, Scorecards, Dashboards, Budgeting, Planning fino ad
includere aree confinanti come il Knowledge
Management.
Un sistema di BI risponde a requisiti di funzionalità e progettazione che vanno ben oltre quelli propri di un normale ambiente di reportistica facente parte di un'applicazione gestionale. In particolare, un sistema di BI deve possedere le seguenti caratteristiche:
|
Facilità d'uso: presentare i dati in un formato che sia facile da leggere e da interpretare, dove sia possibile navigare sui dati seguendo dei percorsi di analisi e che faccia un ampio uso di grafici. I nomi dei campi devono essere facilmente comprensibili dall'utente finale | |
|
Velocità: possibilità di trattare grandi volumi di dati con tempi di risposta quasi istantanei grazie all'uso di tecniche di modellazione, memorizzazione e indicizzazione dei dati orientate all'analisi piuttosto che all'aggiornamento dei dati. | |
|
Integrazione: integrare tra loro dati provenienti da fonti differenti, sia interne che esterne all'azienda. Il processo di integrazione deve essere affidabile e testato, in modo che gli utenti possano fare affidamento sui dati presenti nel DW. Se i dati provenienti dai sistemi operazionali non sono puliti ed affidabili, prima di essere inseriti nel DW devono passare attraverso un processo di pulizia (data cleansing) e certificazione. | |
|
Storicizzazione: mantenere la storia dei cambiamenti subiti da certi attributi selezionati, per permettere analisi storiche contestualizzate. | |
|
Identificazione di trend ed anomalie: gli strumenti devono facilitare l'identificazione di trend nei dati, ad esempio confrontando periodi e prodotti diversi. Queste operazioni sono possibili solo con l'utilizzo di strumenti interattivi che permettano di effettuare operazioni di drill down/drill up (visualizzazione dei dettagli su un certo dato) e di slice & dice (cambiamento delle dimensioni di analisi sui due assi). | |
|
Subject orientation: presentare i dati in modo da fornire la visione di un processo aziendale (supply chain, vendite, qualità...), attraversando i confini delle singole aree dei sistemi gestionali. | |
|
Simulazione scenari: in certi casi (applicazioni di budgeting, forecasting and planning) deve essere possibile impostare degli scenari e confrontarli poi con i valori reali ("actual") | |
|
Indipendenza dal reparto I.T.: gli strumenti di analisi e reportistica devono dare la possibilità agli utenti finali di crearsi da soli i report di cui hanno bisogno | |
|
Adattabilità nel tempo, intesa come la capacità di resistere alle inevitabili evoluzioni della realtà aziendale, dei sistemi operazionali e delle esigenze di analisi | |
|
Sicurezza: deve essere possibile controllare in maniera al tempo stesso stretta e flessibile l'accesso ai dati, che in molti casi includono informazioni altamente riservate. |
Soprattutto, nel disegnare un sistema di BI è necessario ricordarsi che deve svolgere bene il suo compito originario, che è quello di supportare le decisioni
|
Analizzare le vendite del passato per capire i fattori di successo e di fallimento | |
|
Individuare i trend per prodotto, zona, stagione, negozio | |
|
Analizzare i risultati delle promozioni |
|
Analizzare la redditività dei clienti per età, zona, fascia di reddito | |
|
Comprendere le preferenze degli utenti per inviare promozioni mirate | |
Individuare i clienti che non acquistano più e capire come riconquistarli |
|
Confrontare budget e risultati operativi | |
|
Prevedere i flussi di cassa sulla base dei dati passati |
|
Andamento degli ordini e del fatturato, sconti | |
|
Spedizioni e consegne: puntualità, distribuzione nel tempo e nello spazio, modalità, costi |
|
Struttura organizzativa dell'azienda, mansioni e tipologie contrattuali | |
|
Caratteristiche dei collaboratori (dati personali, curriculum, formazione e specializzazioni maturate, attitudini e competenze, mansione, ruolo, categoria) | |
|
Giornate e ore lavorate, assenze, infortuni | |
|
Costi del personale suddivisi per divisione, livello, mansione, centro di costo | |
|
Retribuzioni, benefit, rimborsi spese |
Glossario dei termini di BI (fonte: Technetdati)
|
Back-end |
Componenti dell’architettura che consentono al DWH di fornire nei tempi e nei modi previsti le informazioni necessarie al business (processi di alimentazione, trasformazione, aggregazione, controllo, ecc.).
|
|
Data Mart (DM) |
Insieme di dati organizzati per supportare specifiche esigenze di un gruppo di utenti (es. dipartimento) che viene alimentato da processi di estrazione e trasformazione utilizzando i dati del DWH. L’organizzazione dei dati è multidimensionale e può essere implementato con base dati multidimensionale o relazionale. Contiene dati di dettaglio e aggregati ed è anche detta "base dati di secondo livello" (possono essere presenti più livelli di Data Mart a seconda delle esigenze).
|
|
Data Warehouse (DWH) |
Insieme di dati tematici, integrati, temporali, permanenti finalizzato al supporto dei processi decisionali. Viene alimentato attraverso processi di alimentazione e trasformazione utilizzando dati contenuti nei database operazionali ed eventualmente dati esterni. Contiene dati di dettaglio o con aggregazioni minime ed è anche detta "base dati di primo livello".
|
|
Dimensioni |
Insieme di attributi, generalmente di tipo testo, che definiscono e danno un significato alle misure (es. Tempo, Prodotto, Cliente, Mercato, Promozione, Contratti, Fornitore, Transazioni, ecc.)
|
|
Drill |
Funzionalità OLAP che consente di visualizzare dati a diversi livelli di dettaglio, “navigando” attraverso le gerarchie. Si parla di drill-up quando l’operazione provoca un’aggregazione delle informazioni (es. da quantità venduta per modello a quantità venduta per marca), drill-down quando succede il contrario.
|
|
ETT |
Letteralmente Extraction, Transformation and Transportation, è l’insieme dei processi che consentono l’alimentazione dell’architettura DWH a partire dai dati contenuti nei sistemi sorgente (operazionali e dati esterni).
|
|
Front-end |
Componenti dell’architettura che consentono la fruizione delle informazioni da parte degli utenti (strumenti di query e analisi o applicazioni personalizzate).
|
|
Gerarchie |
Naturale correlazione tra attributi appartenenti alla stessa dimensione, dipendente dall’organizzazione e dalle specifiche esigenze applicative. Qui di seguito sono riportati alcuni esempi di gerarchie (tra parentesi la dimensione). (Tempo) Anno – Trimestre - Mese – Giorno (Prodotto) Marca – Modello – Versione (Prodotto) Classe Merceologica – Disegno (Transazione) Tipo transazione – transazione Possono esistere più gerarchie all’interno della stessa dimensione. Nei modelli dimensionali le gerarchie stabiliscono le modalità di aggregazione dei dati, ovvero delle misure.
|
|
Metadati |
Letteralmente “dati sui dati”, è l’insieme di tutte le informazioni che riguardano l’architettura di DWH a parte i dati stessi. Si possono suddividere in metadati di business: informazioni a supporto delle attività di analisi (es. data ultimo aggiornamento, regole di calcolo degli indicatori, sistema di provenienza, ecc.) metadati tecnici: informazioni a supporto dell’attività IT di gestione dell’architettura (es. algoritmi di trasformazione e aggregazione, regole di integrazione, dipendenze dei processi di alimentazione, strutture dati dei sistemi operazionali, responsabili dei sistemi, ecc.).
|
|
Misure o Fatti |
Valori, generalmente numerici, utilizzati dagli utenti per la misurazione del loro business (es. Quantità venduta, Ricavo, Costo, Presenza/Assenza di un evento, ecc.).
|
|
Modello multidimensionale |
Organizzazione delle informazioni orientata alle funzioni di reporting e analisi realizzata per consentire un efficace utilizzo degli strumenti automatici di query, reporting ed analisi. Può essere realizzata fisicamente su strutture dati proprietarie (database multidimensionali) o su database relazionali attraverso una modellazione dati denominata “star-schema”.
|
|
OLAP |
Letteralmente On Line Analytical Processing, è l’insieme delle funzionalità utente che consentono di rendere “dinamica” la visualizzazione delle informazioni attraverso alcune funzionalità utente denominate drill, slice and dice, pivoting (descritte di seguito).
|
|
Slice and dice o pivoting |
Funzionalità OLAP che consente di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione: creazione di master-detail e rotazione degli assi delle rappresentazioni a matrice.
|
|
Staging Area |
E’ un’area in cui i dati provenienti dai sistemi operazionali sono temporaneamente memorizzati per essere sottoposti a processi di “pulizia”, trasformazione e aggregazione allo scopo di alimentare correttamente il Data Warehouse
|