Scienze statistiche

Software per la gestione dell'informazione statistica

venerdì 4 giugno 2010

Key Performance Indicators

Key Performance Indicators, in italiano Indicatori di prestazione chiave, sono indicatori che ci aiutano a monitorare l'andamento di un processo aziendale. Aiutano a definire e misurare i progressi compiuti per raggiungere gli obiettivi della propria organizzazione. Sono misure quantitative, identificate e definite in anticipo che riflettono i fattori di successo di un'organizzazione. Ad esempio, una scuola, avrà come KPI il tasso di promozione dei suoi studenti; un call center avrà come KPI il numero di telefonate soddisfatte in un minuto. Anche se diversi, è fondamentale che riflettino gli obiettivo dell'organizzazione perchè verranno sottoposti a valutazione quantitativa e rispecchieranno il successo o fallimento dell'organizzazione stessa.

Esistono quattro diversi tipi di indicatori:

- INDICATORI GENERALI: misurano il volume del lavoro del processo

- INDICATORI DI COSTO

- INDICATORI DI QUALITA': valutano la qualità dell'output di processo sulla base di determinati standard

- INDICATORI DI SERVIZIO: misurano il tempo di risposta, dall'avvio del processo alla sua conclusione

Sono degli indicatori:

- SPECIFICI: in quanto legati all'obiettivo dell'organizzazione

- RAGGIUNGIBILI: ovvero realistici all'interno dell'ambiente di business a cui si riferiscono

- MISURABILI: permettendo all'organizzazione di valutare i propri progressi

- COLLEGATI AL TEMPO: in quanto collocano gli obiettivi all'interno di un orizzonte temporale

-RILEVANTI: in quanto fanno riferimento direttamente al business

Microsoft Office Professional...scopriamolo!

"Risparmia tempo, organizzati al meglio e concentra le tue energie sulle vendite, sul marketing e sui clienti"

Ecco come la Microsoft sponsorizza il pacchetto Office Professional, parole che chiaramente ci dicono:" qualsiasi cosa ti serva con noi l'avrai". In effetti un buon utilizzo di questi strumenti riesce a semplificare e non poco le attività che svolgiamo quotidiamente nella nostra azienda.
Vediamo i singoli elementi nello specifico:
  • ACCESS: "Prima di prendere una decisione, acquisisci un quadro completo verificando e condividendo le informazioni ed elaborando report". Con Access è possibile raccogliere informazioni tramite moduli allegati, messaggi di posta elettronica o importando dati da applicazioni esterne; l'obiettivo è quello di creare report dettagliati con informazioni precedentemente filtrate, raggruppate e organizzate in modo da facilitare il processo decisionale.
  • EXCEL: "Analizza, condividi e gestisci le informazioni per ottimizzare i processi decisionali". Il programma permette la creazione di fogli di calcolo potendo così analizzare le informazioni attraverso la realizzazione di grafici e tabelle Pivot, ovvero tabelle che permettono di riepilogare i dati provenienti da elenchi o database esistenti; le tabelle Pivot, infatti, non consentono l'inserimenti di dati ma solo la presentazioni di dati già esistenti.
  • POWER POINT: "Crea presentazioni dinamiche e di forte impatto in modo più rapido che mai". Creato da Gaskins e Austin, inizialmente aveva il nome "Presenter" e veniva prodotto dalla Forethought Inc. acquisita nel 1987 dal gruppo Microsoft. E' un software che permette la realizzazione di slide (diapositive) nelle quali è possibile inserire testo, immagini, video, suoni, link. E' molto usato in quanto è forte la persuasione tecnologica che offre una presentazione di slide.

giovedì 29 aprile 2010

Query di Join


Una Join è un comando che serve a combinare le righe di due o più tabelle di un database e il modo più semplice per capirne il funzionamento è immaginare le due tabelle che prendiamo ad esame come se fossero due insiemi; in questo modo otteniamo due aree separate (giallo e azzurro) e una zona condivisa (verde). Le diverse tipologie di Join di cui disponiamo, ci permettono di arrivare a risultati diversi analizzando solo la sezione che ci interessa.

  • INNER JOIN: crea una nuova tabella comparando ogni riga della tabella A con ciascuna riga della tabella B applicando la regola di controllo definita. In base all'esistenza o meno della condizione "where", la Inner Join restituisce solo i record verificati esistenti in entrambe le tabelle, verranno escluse tutte le righe che non hanno corrispondenza.

  • OUTER JOIN: crea una nuova tabella nella quale inserisce tutti i record che non hanno alcuna corrispondenza tra le tabelle. Le Outer Join si suddividono in: Left Outer Join, la query avrà come risultato tutti i valori della tabella A (left) e tutti i valori della tabella B che trovano corrispondenza nella regola di confronto; Right Outer Join, ricalca in funzionamento della precedente invertendo l'ordine delle tabelle.

martedì 20 aprile 2010

"Interrogando" ...query e funzioni aggregative!

Nel campo dell'informatica, con il termine "query", si indica l'interrogazione di un database aggiungere, modificare, esaminare o eliminare dati. Con la sola osservazione diretta di una tabella, non riusciremmo ad ottenere informazioni precise, risposte a domande specifiche in quanto la query ci permette di filtrare i dati, eseguire calcoli e automatizzare molte attività di gestione dei dati.
E' possibile eseguire diversi tipi di query:
  • Query di selezione: esegue un'interrogazione sui dati memorizzati nelle tabelle e restituisce un set di risultati in forma di foglio dati.

  • Query a campi incrociati: calcolca una somma, una media, un conteggio e raggruppa i risultati in base a due tipi di informazioni, un tipo rappresentato in verticale sul lato sinistro del foglio dati e il secondo lungo il lato superiore.

  • Query di comando: consentono di modificare i dati delle tabelle su cui si basano. Possono essere: query di accomodamento, che aggiungono i record del set di risultati di una query alla fine di una tabella esistente; query di eliminazione, che rimuovono le righe che soddisfano i criteri specificati da una più tabelle; query di aggiornamento, che modificano un set di record secondo i criteri specificati; query di creazione tabella, che creano una nuova tabella e quindi un nuovo record in essa copiando i record da una tabella esistente.

  • Query con parametri: richiede l'immissione di un valore durante la sua esecuzione il quale viene applicato dalla query con parametri sotto forma di criterio di campo.

Le funzioni di aggregazione permettono di eseguire un calcolo su un set di valore restituendo un valore singolo. Il valore restituito è sempre lo stesso ogni volta che vengono chiamate con un set specifico di valori di input se lo stato del database rimane invariato, questo le rende deterministiche. Il Transat - SQL include delle funzioni di aggregazione specifiche:

  • AVG: restituisce la media dei valori di un gruppo

  • COUNT: restituisce il numero degli elementi contenuti in un gruppo

  • MAX: restituisce il valore massimo dell'espressione

  • MIN: restituisce il valore minimo dell'espressione

  • SUM: restituisce la somma di tutti i valori

  • STDEV: restituisce la deviazione statistica standard di tutti i valori nell'espressione specificata

  • VAR: restituisce lo scostamento statistico di tutti i valori dell'espressione specificata

CRM


CRM acronimo di Customer Relationship Management è un concetto legato a quello di fidelizzazione del cliente. Fidelizzare il cliente significa conoscerlo, capire e prevederne i bisogni; un cliente avrà forti motivazioni per restare fedele se ravvisa nel fornitore una significativa attenzione alla sua identità. Il cliente è l'asset più importante per un'azienda e investire nelle relazioni con il cliente significa investire nel futuro dell'azienda. Un'impresa che si definisce Market Oriented non ha a cuore solo il cliente bensì il contesto all'interno del quale il suo target di riferimento si trova.


L'attività del CRM è sostanzialmente indirizzate verso quattro sezioni diverse:
  • L'acquisizione di nuovi clienti

  • La trasformazione degli attuali clienti in consumatori che lodano l'azienda incoraggiando altre persone all'acquisto

  • L'aumento delle relazioni con i clienti più importanti

  • La fidelizzazione più longeva possibile dei clienti che hanno maggiori rapporti con l'impresa
Esistono tre diverse tipologie di CRM:
  • CRM COLLABORATIVO: il contatto con il cliente è gestito da strumenti di comunicazione integrati con tecnologie e metodologie

  • CRM OPERATIVO: i processi di business che prevedono il contatto diretto con il cliente vengono automatizzate attraverso soluzioni metodologiche e tecnologiche

  • CRM ANALITICO: strumenti e procedure che migliorano la conoscenza del cliente attraverso l'estrazione, l'analisi e lo studio revisionale dei dati e dei comportamenti dei clienti stessi
Spesso si tende ad equiparare il CRM a un software, in realtà, pur sfruttando in maniera massiccia strumenti informatici e automatizzati, si tratta di una strategia aziendale, di comunicazione, ponendo al centro dell'attenzione il cliente.
Prima di applicare il concetto del CRM, un'azienda deve investire in strategia e comunicazione, solo dopo in tecnologia e software, sia nel caso in cui l'obiettivo sia il ROI - Return on Investment, sia nel caso in cui lo scopo finale sia il LV - Lifetime Value.
Un buon sistema di CRM comprende sia il Front Office, ovvero le relazioni con l'esterno, sia il Back Office, ovvero l'analisi e la misurazione dei risultati ottenuti e gli strumenti di cui sono molteplici, non sempre complessi da un punto di vista tecnologico. (chat online; storia dei pagamenti effettuati dal cliente; preventivi e fatture rivolte al cliente; un indirizzo e-mail a cui rivolgersi; forum di discussione)

Reporting e Mining

Nel secolo scorso, i settori dell'archiviazione e della memorizzazione delle informazioni, hanno subito profondi cambiamenti soprattutto vista la mole di dati posseduti da una sola azienda, i quali non vengono raccolti solo per essere sottoposti ad analisi o per ricavarne modelli di previsione ma anche per costituire la base dei processi decisionali in qualsiasi settore.

In un'azienda, in sede di pianificazione operativa, vengono stabiliti degli obiettivi ed è attraverso il controllo di gestione, ovvero un sistema operativo detto anche controllo direzionale e composto da indicatori, che si rileva lo scostamento tra obiettivi pianificati e risultati conseguiti con lo scopo di informare i responsabili che decideranno, poi, come intervenire. Inizialmente veniva utilizzato solo nelle imprese ma oggi anche la pubblica amministrazione inizia ad usufruire di questo sistema, secondo la filosofia del new public management, sostituendo i tradizionali controlli formali di legalità.
L'obiettivo non è individuare un colpevole in presenza di una perdita aziendale o di un errore logistico bensì quello di inquadrare il comportamento di tutti i dipendenti affinchè ciascuno di essi possa svolgere al meglio la propria professione, ecco perchè il controllo di gestione è solitamente affiancato da sistemi di valutazione del personale e da sistemi incentivanti.
Inoltre, i report possono essere classificati in: di conoscenza, di controllo e decisionali in base alla loro finalità, ma anche in: di routine, strutturati e periodici; di approfondimento, più analitici ma su richiesta; non strutturati, ad hoc per specifici problemi.

Il processo di controllo è composto da tre fasi:
  1. FASE ANTECEDENTE O BUDGETING: in questa fase di stanziamento del bugdet, gli obiettivi operativi vengono resi misurabili attraverso degli indicatori con lo scopo di verificarne successivamente il conseguimento; vengono corredati delle risorse necessarie valutate in termini di costi; vengono assegnati agli organi aziendali responsabili

  2. CONTROLLO CONCOMITANTE: si svolge parallelamente alla gestione e prevede dei controlli periodici degli indicatori; una raccolta di informazioni da trasmettere ai vertici aziendali; ipotetiche decisioni di intervento da parte del vertice aziendali e conseguente attuazione di tali decisioni.

  3. CONTROLLO SUSSEGUENTE: è la fase di chiusera del controllo di gestione e prevede la comunicazione ai vertici della misurazione finale degli indicatori. lo scopo è quello di considerare in vecchio controllo di gestione come base per la stesura dei nuovi obiettivi operativi e il relativo budget.

Sia il controllo concomitante che quello susseguente si avvalgono dell'utilizzo del sistema di reporting, il quale va progettato attentamente affinchè arrivi la giusta comunicazione, alle persone giuste e al momento giusto.

Il reporting è un insieme di report ed analisi che mettono i responsabili aziendali nella condizione di poter costantemente controllare la gestione individuando anche gli scostamenti avvenuti dal budget iniziale.

Un buon reporting è ben fatto se caratterizzato da caratteristiche quali:

CHIAREZZA: le informazioni e i numeri devono essere ridotte al minimo indispensabile.

ESSENZIALITA': le informazioni e i numeri devono essere solamente quelle indispensabili magari indirizzando ad ogni singolo dirigente solo la parte di suo interesse.

TEMPESTIVITA': i report devono essere consegnati al management in tempi brevi.

AFFIDABILITA': il più possibile corretti affinchè il management prenda decisioni su basi solide.

Le due principali tipologie di reporting sono:

REPORTING DIREZIONALE: non segue una normativa contabile esterna bensì principi definiti all'interno dell'azienda. Si fonda sui dati della contabilità analitica e dell'analisi di bilancio i quali possono essere divisi per aree geografiche, gruppi clienti, linee di prodotto.

REPORTING OPERATIVO: Si tratta di rilevazioni ed elaborazioni specifiche su richiesta del management: statistiche di vendita; monitoraggio dei costi aziendali; analisi dei tempi dei processi aziendali.

Il termine datamining è diventato popolare negli anni '90 ed ha per oggetto l'estrazione di una conoscenza a partire da grandi quantità di dati. Ha una duplice valenza: ESTRAZIONE, con tecniche analitiche, di informazioni nascoste da dati già strutturati; ESPLORAZIONE ED ANALISI, su grandi quantità di dati, eseguita in modo automatico o semi-automatico, con lo scopo di scoprirne i significati. Qualora se ne volesse dare un definizione, si potrebbe affermare che: "Il datamining è il processo di esplorazione e analisi, automatico o semiautomatico, di un'ampia mole di dati al fine di scoprire modelli e regole significativi".

Nelle ricerche di mercato, il datamining è volto ad ampliare la conoscenza su cui basare i processi decisionali ed è considerato parte del processo che porta alla creazione di un datawarehouse. Affinchè l'informazione sia significativa e quindi utile, deve essere: VALIDA, cioè che può agire anche i sui nuovi dati; PRECEDENTEMENTE CONOSCIUTA e COMPRENSIBILE.

Le attività del datamining sono:

  • CLASSIFICAZIONE: assegnazione di un nuovo oggetto a una classe predefinita dopo averne esaminato le caratteristiche.
  • STIMA

  • PREVISIONE: si utilizzano i dati storici per costruire modelli generali sui quali basarsi per proiezioni future.

  • RAGGRUPPAMENTO PER AFFINITA' O REGOLE DI ASSOCIAZIONE: l'obiettivo è individuare quali oggetti possono abbinarsi.

  • CLUSTERING: segmentazione di un gruppo eterogeneo in sottogruppi più omogenei senza l'utilizzo di classi predefinite.

  • DESCRIZIONE E VISUALIZZAZIONE: la descrizione di un database complesso serve per capire meglio i singoli dati e la visualizzazioneè una forma di datamining descrittivo che permette di individuare le regole di associazione proprio grazie alla forma dei dati visivi.

Alcuni software di datamining:

  • ORACLE DATA MINER: componente opzionale di Oracle Database che permette di produrre informazioni predettive utili ai fini decisionali ma anche per la creazione di applicazioni di business intelligence integrate.

  • MICROSOFT SQL SERVER: offre soluzioni circa il Business Intelligence e il Data warehousing permettendo all'azienda di avere un quadro completo e in costante aggiornamento dei dati, integrando tutti i sistemi aziendali e riducendo il carico di lavoro del personale.
  • WEKA - WAIKATO ENVIRONMENT FOR KNOWLEDGE ANALYSIS: è un software opensource rilasciato con licenza GNU sviluppato nell'Università di Waikato in Nuova Zelanda. E' un ambiente software scritto in Java e consiste nell'applicare dei metodi di apprendimento automatici ad un dataset ed analizzarne il risultato.

  • ORANGE CANVAS: software opensource per la visualizzazione dei dati e l'analisi degli stessi, risulta essere completo, flessibile e veloce ed adatto sia ai principianti che ai più esperti.

Il Report

Il Report serve a sintetizzare i dati contenuti in un database attraverso l'elaborazione di grafici e tabelle che permettono un'interpretazione di ciò che viene considerato saliente ai fini dell'andamento aziendale. Il contenuto del Report può essere suddiviso in sezioni: innanzitutto viene inserita l'intestazione che contiene un titolo, un logo e preferibilmente una data; anche ogni singola pagina è dotata di un'intestazione che mostra sinteticamente il contenuto delle colonne; il corpo del report è la parte più consistente e contiene tutti i dati e le tabelle delle query d'origine; tutte le pagine vengono numerate e la numerazione progressiva è inserita nel piè di pagina; infine è previsto un piè di pagina report il quale viene inserito solamente alla fine del report e contiene i risultati.

La creazione più semplice di un Report avviene attraverso l'autocompilazione la quale consente di inserire automaticamente i campi nel report e di scegliere uno tra gli stili disponibili. Il modello più utilizzato è il Report Standard dotato di formattazione predefinita. Il report standard a colonne visualizza ciascun campo su una riga separata con un'etichetta posta a sinistra; il report standard tabellare visualizza su una riga tutti i campi di ogni record e le etichette figurano una sola volta nella parte superiore di ciascuna pagina.
Seguendo l'autocompilazione fornita dal database stesso, il Report dispone di tre tipi di visualizzazione:
- ANTEPRIMA DI LAYOUT: permette di controllare i caratteri e le dimensioni generali del
layout.
- ANTEPRIMA DI STAMPA: consente un ultimo controllo generale del report.
- STRUTTURA: usata per modificare il layout o crearne uno nuovo.
Il Report, una volta completato, può essere inviato alla stampa ma, spesso, possono essere realizzati anche in formati diversi, soprattutto se si necessita di effettuare una proiezione, magari al CDA, o un'archiviazione digitale. In questi casi si ricorre a diapositivi realizzate in Power Point, oppure inserimento dei dati in formato Excel o all'utilizzo del Pdf.
Il layout del Report può essere orizzontale o verticale. La differenza consiste nella distribuzione dei dati durante la redazione. Nel caso del layout orizzontale il processo di immissione è tipo il seguente:
1 2 3
4 5 6
7 8 9

Nel caso del layout verticale l'immissione, invece, è tipo la seguente:
1 4 7
2 5 8
3 6 9

Inoltre è possibile ricorrere ad un layout cross il quale prevede l'inserimento di tabelle, grafici e immagini dislocate all'interno della stessa pagina.

Database federati - Dashboard e Sistemi ERP

Un sistema di database federato è un tipo di database che integra in forma congiunta più sistemi di database. Il collegamento avviene una rete di computer anche geograficamente decentrata. In un database federato, attraverso l'astrazione dei dati, è possibile, per più utenti e clienti, memorizzare e recuperare dati attraverso una singola query. I FDBS possono essere classificativi come sistemi:

  1. 1. DEBOLMENTE ACCOPPIATI: l'utente accede da diversi database utilizzando un linguaggio multidatabase, ma ciò elimina la trasparenza circa la posizione.
    2. STRETTAMENTE ACCOPPIATI: l'approccio integrato federato avviene attraverso processi indipendenti.

Alla base di conoscenza di un database si appoggia il DSS - DECISION SUPPORT SYSTEM - che permette di avere un alto numero di alternative di supporto alle decisioni. Il DSS contiene strumenti di Business Intelligence e tecnologie dei Sistemi esperti come modello di supporto decisionale.

Il numero dei dati disponibile in un azienda è in continuo aumento e la comprensione viene facilitata da grafici e tabelle posti a supporto dei processi decisionali. Per queste ragioni si vanno diffondendo rapidamente i cruscotti aziendali, noti come Dashboard o Tableau de board, che rappresentano una sintesi dei dati sull'andamento aziendale focalizzando l'attenzione sui principali indicatori in grado di esprimere l'andamento generale dell'azienda.

Tra i DBMS relazionali è meritevole di essere citato DB2, sviluppato da IBM nel 1983 e attualmente al primo posto, insieme a Oracle, nel mercato dei database. La grande diffusione dei DBMS opensource ha portato IBM a mettere a disposizione degli sviluppatori una versione gratuita scaricabile per Windows e Linux. Il successo di MySQL ha aperto la strada delle licenze royalty-free, strada intrapresa da IBM con DB2-C dove la C indica Community Edition.
All'interno dei sistemi informativi è presente un sistema gestionale ERP - ENTERPRISE RESOURCE PLANNING - che integra i processi di business, quali le vendite, gli acquisti, la contabilità, con l'obiettivo di aiutare i business manager nelle attività come il controllo degli inventari, i servizi per i clienti, le risorse umane. La prima versione collegava contabilità e logistica in seguito sono state inserite le aree di vendita, produzione, manutenzione. Oggi, all'interno di un'azienda, il sistema ERP copre tutte le attività di monitoraggio che possono essere automatizzate permettendo agli utilizzatori di operare, indipendentemente dall'area applicativa, in un contesto integrato ed uniforme.
Le componenti di un ERP sono:
  1. Contabilità
  2. Gestione degli asset
  3. Gestione della distribuzione

  4. Controllo di gestione

  5. Gestione vendite

  6. Gestione della produzione

  7. Gestione dei magazzini

  8. Gestione dei progetti

  9. Gestione della manutenzione impianti

  10. Gestione del personale

Oltre il 50% delle aziende europee utilizza sistemi ERP e oltre il 35% li usa in almeno tre aree funzionali. I produttori che dominano il mercato sono SAP, Oracle, Peoplesoft, Baa

lunedì 22 marzo 2010

Sistemi informativi aziendali

Con il termine Datawarehouse di intende sostanzialemente un magazzino di dati, un archivio che consente di produrre facilmente relazioni ed analisi. Fu Inmon il primo a parlarne definendolo come "una raccolta di dati integrata, orientata al soggetto, varianile nel tempo e non volatiledi supporto ai processi decisionali". Sono quattro i livelli architetturali del datawarehouse:

TRASFORMAZIONE DEI DATI: livello che si occupa di acquisire i dati e validarli.

PREPARAZIONE E STOCCAGGIO DATI: livello che fornisce i dati agli utenti e alle applicazioni analitiche.

INTERPRETAZIONE E ANALISI DATI: livello che gestisce la trasformazione dei dati in informazioni dotate di senso strategico.

PRESENTAZIONE DATI: livello che gestisce la presentazione finale dei dati agli utenti circa le risposte cercate.

I dati gestiti dal datawarehouse possono essere:

ATTUALI: validi al momento dell'interrogazione e utili ai fini dei processi decisionali.

STORICI: dati che hanno superato la fase dell'attuale e che vengono posizionati su supporti meno impegnativi e meno costosi.

AGGREGATI: aggragazioni di dati predisposte derivanti da considerazioni circa l'efficienza e la praticità.

Con il termine Datamart si intende, invece, un raccoglitore di dati specializzati in un particolare soggetto. Un DM contiene dati riguardanti il passato e comunque utili ai fini dei processi decisionali. E' solitamente posizionato a valle di un Datawarehouse ma la sua creazione avviene in maniera specifica per una determinata esigenza, a differenza del datawarehouse che è invece caratterizzato da una crezione generalizzata.

I sistemi di reportistica appartengono alla famiglia dei sistemi informativi frutto dell'evoluzione informatica. L'obiettivo è quello di fornire documentazione analitica sulle attività importanti all'interno dell'organizzazione e lo sviluppo consiste nell'attuazione di alcune fasi:
1. Identificazione delle esigenze informative e di visualizzazione.

2. Identificazione del contesto informativo e delle fonti.

3. Identificazione della configurazione del sistema hardware/software.

4. Fase di integrazione hardware/software delle risorse informative.

5. Preparazione del report.

6. Validazione del report.

7. Fase di collaudo del sistema.

8. Fase di esercizio del sistema di reportistica.

Il Report è un documento composto da tabelle e grafici che presentano le misure di rilievo del fenomeno analizzato.

Data Warehouse

Le aziende, attraverso le tecnologie di data warehouse, riescono a gestire un vasto patrimonio di dati. Il data warehouse trasforma i dati dell'impresa in informazioni strutturate rendendole facilmente consultabili ed esaminabili e pronte per il controllo direzionale. I dati dell'organizzazione, dislocati su fonti informative diverse, vengono integrate in un unico magazzino dati fruibile da utenti posti a livelli diversi nella gerarchia aziendale.

I criteri fondamentali su cui poggia un data warehouse sono:

ORIENTAMENTO AL SOGGETTO: i dati vengono organizzati in base alla loro funzione o al processo aziendale d'appartenenza.

INTEGRAZIONE E CONSISTENZA: i dati accorpati in un unico magazzino danno coerenza ai dati stessi, provenienti da applicazioni diverse.

NON VOLATILITA': il data warehouse viene usato per fare indagini, pertanto i dati non sono modificabili.

STORICITA': il patrimonio informativo può essere organizzato in funzione della dimensione tempo.

COLLEGAMENTO ALLE FONTI INFORMATIVE: possibilità di collegamento con tutte le fonti informative aziendali quali, applicazioni gestionali, ERP, dati del web.


ETL: acronimo di EXTRACTION - TRANSFORM - LOADING. Permette l'estrazione e la raccolta, l'integrazione e la trasformazione di grandi quantitativi di dati provenienti da fonti informative diverse e di qualsiasi tipologia, da file sequenziali con struttura semplice a tabelle di RDBMS, file XML con struttura complessa, ma anche dati provenienti dal WEB o da fogli elettronici. Grazie all'ETL si opera in Business Intelligence ottendendo numerosi benefici, quali: la riduzione dei tempi vista la rapida generazione di un data warehouse; un controllo dei costi per il processo di integrazione dei dati; la creazione di processi ETL riutilizzabili e ritorno in termini economici circa l'organizzazione dell'intero sistema IT.

Per garantire prestazioni migliori durante le ricerche effettuate sulla base di molti dati, si ricorre alla denormalizzazione, procedimento che permette di accorpare attributi appartenenti a relazioni diverse in un'unica relazione. Se, per esempio, disponiamo di un database dove sono registrati film e attori, per sapere a quali ha partecipato uno specifico attore, si può memorizzare il numero di tali film direttamente nella sezione attori, incrementando ad ogni nuovo film girato dall'attore stesso. Questa procedura può aumentare il rischio di inconsistenza dei dati conservati visto che il software usato dal database aumenterà in termini di complessità gestendo direttamente l'aggiornamento.

All'interno del database è presente un linguaggio di interrogazione definito SQL - STRUCTURED QUERY LANGUAGE, il quale permette di leggere, modificare e gestire i dati memorizzati in un RDBMS. L'SQL nasce, nei laboratori IBM, nel 1974, dalla mente di Donald Chamberlin. Inizialmente chiamato SEQUEL, opera attraverso costrutti di programmazione chiamati QUERY. Il termine Query indica l'interrogazione di un database nel compiere alcune operazioni ed è attraverso il linguaggio SQL che la query viene interpretata.

On line analytical processing

La tabella a doppia entrata rappresenta una distribuzione di dati bivariati ovvero che prende in considerazione contemporaneamente due variabili, una qualitativa e una quantitativa, riferite alla stessa unità statistica. Un particolare tipo di tabella a doppia entrata è la tabella di contingenza, utilizzata in statistica per rappresentare e analizzare le relazioni tra due o più variabili. La tipologia di tabella di contingenza più semplice è quella tetracorica in cui le variabili possono assumere al massimo due valori.
Uno studio che prende in considerazioni tre dimensioni può essere effettuato attraverso l'ipercubo in cui, ogni componente di un dato, è rappresentata da una dimensione spaziale dell'ipercubo.
OLAP: acronimo dell'espressione ON LINE ANALYTICAL PROCESSING. E' un insieme di tecniche software che permettono l'analisi di grandi quantitativi di dati.E' un'analisi multidimensionale, dall'inglese "slice & dice", rapida, flessibile ed efficiente e permette all'utente di scegliere interattivamente le informazioni da visualizzare e i filtri da applicare. E' la componente tecnologica base del data warehouse e viene utilizzato dalle università per i sondaggi, dal marketing per misurare il successo di una campagna pubblicitaria e dalle aziende per analizzare i risultati delle vendite o l'andamento dei costi.
Creare un database OLAP significa fotografare, in un determinato momento, le informazioni a disposizione, magari inserite in un database relazionale, e trasformare le singole informazioni in dati multidimensionali. Le interrogazioni poste successivamente ci permettono di ottenere un gran numero di informazioni in tempi estremamente ridotti. Il cubo può essere creato in diversi modi ma quello più comune è quello definito "schema a stella" il quale prevede al centro i principali elementi oggetto dell'interrogazione e, collegate, tutte le dimensioni che specificano come saranno aggregrati i dati. In sintesi, un sistema OLAP, permette di studiare un grande quantitativo di dati, da prospettive diverse supportando i processi decisionali.

Le funzioni di base di uno strumento OLAp sono:
SLICING: operazione di rotazione delle dimensioni di analisi per analizzare totali ottenuti in base a dimensioni diverse.
DICING: operazione di estrazione di informazioni dall'aggregato che si sta analizzando.
DRILL-DOWN: operazione di esplosione del dato nelle sue determinanti.
DRILL-ACCROSS: operazione mediante la quale si naviga attraverso uno stesso livello nell'ambito di una gerarchia.
DRILL-THROUGH: operazione mediante la quale si passada un livello aggregato al livello di dettaglio appartenenti alla base dati normalizzata.

Microsoft Access.....Northwind insegna!

Microsoft Access è un database relazionale realizzato da Microsoft, compreso nel pacchetto Office Professional, ed unisce l'interfaccia grafica al motore relazionale Microsoft Jet Database Engine. Per il salvataggio segue il modello tabella relazionale ed è quindi possibile immagazzinare i dati in tabelle composte da molti record, ciascuno dei quali contiene i dati distinti per campi; qualora una tabella non fosse sufficiente è possibile realizzarne altre e collegarle con una relazione dando vita alla possibilità di consultare un grande numero di dati diversi in forma complessa. Tabelle, query, macro, pagine, moduli e report sono compresi in un unico file con il quale sviluppare le applicazioni complete pur mantenendo una separazione fisica tra le tabelle dei dati. Le tabelle permettono l'inserimento e la memorizzazione dei dati in quanto contengono tutti i dati del database e sono strutturate in righe e colonne come in un foglio elettronico; le query ci permettono di manipolare ed interrogare i dati e le più utilizzate sono quelle di selezione che estraggono solo alcuni dati eventualmente messi in relazione con altre tabelle; le macro contengono istruzioni ottenibili attraverso i menu di access; le pagine permettono la pubblicazione dei dati attraverso un server web; i moduli contengono i codici che si vogliono rendere globali, ovvero richiamabili da un qualsiasi elemento dell'applicazione; i report consentono la visualizzazione dei risultati basati su query, tabelle e dati permettondone la stampa.

In Access è possibile trovare alcuni database di esempio che facilitano l'apprendimento del programma. Attraverso il menu "?" è possibile accedere al Database Northwind il quale contiene i dati relativi alle vendite di una società, fittizia, denominata Northwind Traders, specializzata nell'import-export di prodotti alimentari. Da Northwind è possibile trarre tutte le indicazioni e gli spunti necessari per realizzare applicazioni di database personalizzate. Il Database Northwind è possibile scaricarlo e salvarlo sul proprio pc attraverso il tutorial di Access 2000 e seguendo la semplice procedura guidata.

NORMALIZZAZIONE: procedimento che mira ad eliminare la ridondanza e il rischio di incoerenza del database. La normalizzazione è un procedimento graduale che realizza un'ottimizzazione progressiva a partire da relazioni non normalizzate. Quando si parla di ridondanza ci si riferisce a quei dati memorizzati più volte inutilmente. L'obiettivo è quello di eliminare l'incogruenza tra i dati derivante dai diversi modi di scrivere la stessa parola (come ad con la prima lettera maiuscola o minuscola) o da errori di scrittura. Nel testo normalizzato il termine compare una sola volta.

Quando ci si riferisce ai componenti concettuali e tecnici dei databse, gli informatici e gli statistici chiamano le stesse cose con nomi diversi. Le CELLE rappresentano l'intersezione di ogni riga con ogni colonna, in statistica ciò da luogo alla modalità, in informatica alla misura; il REPORT, in entrambi i casi, rappresenta l'aggregazione di dati in un unico documento; l'UNITA' STATISTICA rappresenta l'elemento di base della popolazione sul quale viene rilevata la caratteristica oggetto di studio, in statistica, mentre in informatica rappresenta l'unità di misura che valuta la quantità di informazioni; le TABELLE permettono lo stesso tipo di operazione ovvero l'immissione di dati in costrutti formati da righe e colonne. Questo per dire che ragionare in termini statistici non significa essere distanti dal mondo informatico, significa solo usare tecnicismi diversi i quali però, qualora se n'è assimilato il concetto, possono essere trasferiti con estrema semplicità al mondo informatico.

giovedì 18 marzo 2010

Spreadsheet e DBMS...open source o programmi proprietari.


Spreadsheet è il termine inglese traducibile come foglio elettronico, ovvero un software di produttività personale che permette di tracciare rappresentazioni grafiche, effettuare calcoli ed elaborare dati attraverso una tabella, formata da celle identificate con lettera e numero, in cui si possono inserire dati, numeri e formule.
L'invenzione del foglio di calcolo è attribuita a Dan Bricklin e Bob Frankston, i quali collaborano per lo sviluppo di VisiCalc, primo foglio di calcolo per personal computer.

I principali fogli di calcolo sono:
EXCEL: inserito nella suite di programmi Microsoft Office, viene considerato uno dei migliori fogli di calcolo.
OPEN OFFICE: viene eseguito da Microsoft, Mac, Linux e Sun Solaris e salva i propri documenti con l'estenzione XML. E' disponibile in due versioni: OpenOffice gratuita in open-source e Sun Star Office, relativamente economica ma con alcune funzionalità aggiuntive.
LOTUS 1-2-3: è l'originale "killer application" che legittimava i pc per le imprese. E' un ottimo foglio di calcolo che esegue perfettamente le funzioni soprattutto se utilizzato in forma congiunta con la suite Lotus.
QUATTRO PRO: nasce come clone di Lotus 1-2-3 ma è attualmente compatibile per Windows offerto come parte del pacchetto WordPerfectOffice.
GNUMERIC: è parte del progetto GNU della suite GnomeOffice, nasce con l'obiettivo di sostituire Excel e Lotus per sistemi operativi Unix-like.
GNKSPREAD: è il foglio di calcolo per la suite KOffice, essendo gratuito non ha l'ampiezza di funzioni di altri fogli di calcolo ma soddisfa le esigenze basilari eseguendo tutte le funzionalità standard che ci si aspeta da un moderno foglio di calcolo.
GOBE PRODUCTIVE: è un programma che ti permette di avere in un unico documento grafici, testi, presentazioni, senza utilizzare programmi separeati. Attualmente è disponibile anche per Windows.
NUMBERS: rappresenta il foglio elettronico della suite iWork di Apple ed è disponibile anche per Mac.

Il DBMS - database management system - è un sistema software progettato per creare e manipolare collezioni di dati strutturati da parte di più utenti. I DBMS hanno un utilizzo diffuso in ogni contesto, dalla contabilità alla gestione delle risorse umane. Sono costituiti da un insieme di programmi software che controllano l'organizzazione, la memorizzazione e il reperimento dei dati tutelando la sicurezza e l'integrità del database, i non autorizzati non hanno, infatti, accesso ai dati e possibilità di modificarli.
Un DBMS può ricevere comandi attraverso diversi linguaggi, linguaggi che possono essere raggruppati in base alle loro funzioni:
DDL - Data Description Language: linguaggi con i quali si stabiliscono le strutture del database.
DML - Data Manipulation Language: linguaggi per impartire comandi di elaborazione dati.
QL - Query Language: linguaggi che presentano una natura interattiva.
Le caratteristiche che hanno reso così popolare l'utilizzo del database sono: la riduzione della ridondanza dei dati, ovvero la possibilità di evitare che i dati si ripetino nella base; la condivisione dei dati da parte di tutte le applicazioni che ne facciano richiesta; sicurezza e riservatezza che evitano l'accesso dei non autorizzati; l'indipendenza dei dati dalle applicazioni.
All'interno di un azienda, il sistema informatico commerciale è costituito da soggetti (clienti, venditori, impiegati) e da attività (pagamenti, acquisti, ordini) ed è il database a consentirel'organizzazione di questi dati in tipi di record e le conseguenziali relazioni che si instaurano tra i record stessi.
I principali tipi di DBMS sono:
DB2: database rfelazionale della IBM
FILEMAKERPRO: database sviluppato da FileMaker Inc., è stato uno dei primi database sviluppati per Apple Macintosh.
ORACLE: è uno dei database più famosi. Sviluppato dalla Oracle Corporation dal 1977

I software citati possono rientrare nella categoria dei programmi open source o nella categoria dei programmi proprietari. La differenza è netta.
I programmi open source (sorgente aperta) sono quei software i cui autori, che ne detengono tutti i diritti, decidono di metterli a disposizione di chiunque con l'obiettivo di migliorare il prodotto grazie alla collaborazione di programmatori, magari geograficamente distanti, che lavorano apportando delle modifiche sia in termini di complessità che di completezza. Risultati ai quali non giungerebbe anche una specializzata equipe di programmatori.
(OpenOffice - VLC - GNU - Linux)
I programmi proprietari sono quei software con restrizioni nell'utilizzo, nella modifica, nella riproduzione o ridistribuzione, imposte dai proprietari sia in termini legali che tecnici. L'obiettivo, in questo caso, è unico ovvero operare a scopo di lucro. Per i produttori di programmi proprietari, la massima aspirazione, non è "scoprire" qualcosa di nuovo e arricchire le conoscenze tematiche bensì ottenere un guadagno.
(RealPlayer - WinZip - Adobe Photoshop)

lunedì 1 marzo 2010

Scienze della comunicazione...destinata a scomparire?

I dati parlano chiaro, negli ultimi 4 anni le iscrizioni al primo anno della facoltà di scienze della comunicazione si sono quasi dimezzate. Si è passati da 1338 iscritti all'anno accademico 2006/2007 a 833 nell'anno accademico 2009/2010.

http://www.uniroma1.it/infostat/default.php

Dati impressionanti se si considerano i quasi 20000 iscritti del 2001 nelle facoltà italiane.
Quali le cause di tale tendenza?
Alcuni sostengono che la motivazione principale sia il mancato inserimento nel mondo del lavoro. In effetti, nel 2004, i tassi di disoccupazione ad un anno dall'ottenimento del titolo sfioravano il 50%.
Scienze della comunicazione, fin dall'inizio, si è presentata come il corso di laurea maggiormente "professionalizzato" del panorama universitario italiano, andando in contro al fabbisogno comunicativo di aziende e imprese.
Prometteva una delle più elevate percentuali di placement in Italia ma oggi, purtroppo, le promesse sembrano essere state disattese, viene vista con diffidenza dal mondo del lavoro e della comunicazione professionale e l'immagine che ne danno i media è quella di una "forgia di disoccupati".
Una delle critiche più aspre riguarda il percorso formativo ritenuto troppo lineare al punto da permettere a tutti gli studenti di raggiungere il traguardo della laurea senza troppa fatica e senza troppi ostacoli.
"Abbiamo bisogno di ingegneri, abbiamo bisogno di tecnici importanti. Una sola preghiera: non vi iscrivete a scienze della comunicazione, non fate questo tragico errore, che paghereste per il resto della vita!”. Sono queste le parole del presentatore tv Bruno Vespa.


Parole dure che hanno gettato nel dubbio tantissimi giovani, non solo quelli che stanno vagliando l'ipotesi di tale percorso ma anche quelli che lo hanno già intrapreso e, prossimi alla laurea, iniziano a temere un futuro pieno di incertezze professionali.
A queste parole risponde il Prof. Emanuele Invernizzi, docente di Comunicazione d'impresa presso la Libera università di lingue e comunicazione di Milano (IULM). Questa è l'intervista che ridona speranza, il docente infatti afferma l'instabilità di questo corso di laurea ma afferma anche la grande richiesta, da parte del mercato, di questa figura professionale tanto criticata.


Chi ha ragione? Difficile stabilirlo, di sicuro saranno i dati sul placement dei prossimi anni a dimostrare se veramente la facoltà di Scienze della Comunicazione aveva solo bisogno di assestarsi o se le paure odierne sono fondate.