Di: Sergio Palumbo e Tiziana Palumbo

Non tutti i nostri visitatori sapranno cos’è il Data Mining, pertanto è fondamentale soffermarcisi un istante. La definizione che è possibile trovare nel libro di Paolo Giudici è perfetta:

“Per Data Mining si intende il processo di selezione, esplorazione e modellazione di grandi masse di dati, al fine di scoprire regolarità o relazioni non note a priori e allo scopo di ottenere un risultato chiaro e utile al proprietario del database”.

Questa definizione viene ripresa in questa recensione con un duplice obiettivo: da un lato, spiegare al visitatore che non è a conoscenza della specifica tematica cosa sia il Data Mining; dall’altro, mettere in evidenza con un esempio lampante quello che è il punto di forza di questo libro: la chiarezza e la semplicità espositiva di Paolo Giudici.

Il libro è sapientemente suddiviso in due parti: una inerente alla metodologia, che illustra le principali problematiche inerenti le varie componenti del processo di Data Mining ed una relativa alle applicazioni, veri e propri casi di studio che illustrano le applicazioni delle tecniche di data mining trattate nella prima parte ad interessanti ambiti: market basket analysis, analisi clickstream, analisi dei comportamenti di visita a un sito web, CRM (Customer Relationship Management), valutazione e classificazione del merito creditizio e previsione degli ascolti televisivi: decisamente un ampio ventaglio di applicazioni dove il Data Mining da tempo non è più un’utopia o una metodologia relegata alla mera sperimentazione, ma ove è una corrente e persistente realtà, molto più diffusa di quanto si possa pensare o di quanto si potesse originariamente prevedere.

La parte metodologica è particolarmente completa e dettagliata, ma è esposta in un modo decisamente semplice e fruibile anche per i neofiti. Fondamentale, però, per la comprensione di questa parte del testo (propedeutica, del resto, per la seconda parte), è l’avere acquisito almeno le fondamentali nozioni di probabilità e statistica, diffusamente utilizzate nel testo, che, peraltro, non dà nulla per scontato: chi ha studiato anni addietro probabilità e statistica non dovrà rispolverare i propri libri di testo, ma troverà nel libro di Giudici, seppur sinteticamente, tutto ciò che gli serve per la comprensione degli argomenti trattati.

In conclusione,questo libro colma (fin dalla sua prima edizione) una grossa falla nel panorama editoriale italiano: seppur esistevano già testi di introduzione al Data Mining, non erano presenti in catalogo libri che esponessero in modo così esaustivo le tecniche e le metodologie per il Data Mining. Né libri che esponessero in modo così concreto tanti casi di studio come nella seconda parte di questo volume. Pertanto, quello di Paolo Giudici è un libro indispensabile sia per il professionista della problematica sia per lo studente universitario, ma anche per chi vuole capirne qualcosa di più di una famiglia di tecniche che prendono sempre più piede nel settore dei Sistemi Informativi.

Link: il sito di McGraw-Hill Italia – www.mcgraw-hill.it