Il Data mining e l’apprendimento automatico  

Il Data

Applicabile a vari settori quali: marketing, ricerca scientifica, telecomunicazioni, finanza, statistica e nell’industria. Il Data mining è la tecnologia che permettere l’estrazione di informazioni utili dalle banche dati. Un esempio per comprendere meglio questa tecnologia può essere la scoperta di un corpo celeste in un sistema o galassia. Giorno dopo giorno i telescopi spaziali e terrestri inviano una quantità di dati enorme alle banche dati dei centri di ricerca astronomica. Attraverso la valutazione di questi dati e riconoscendo determinati pattern, cioè schemi o regolarità, vengono fatte ogni giorno nuove scoperte nel campo dell’astronomia.

E cosa c’entra quindi il Data mining con l’apprendimento automatico o Machine Learning?

Sono concetti correlati, come sappiamo per Machine Learning intendiamo la capacità di un sistema informatico di riconoscere determinati output attraverso l’elaborazione di dati. Ora iniziate a percepire qualche correlazione probabilmente. La sostanziale differenza tra i due sta nel fatto che le Machine Learning prevedono determinati schemi dopo aver appreso determinati dati, cioè gli input. Mentre il Data mining ricerca schemi e correlazioni mai scoperte. Esso infatti sfrutta le tecniche dell’machine learning ma con fini completamente diversi, mentre il ML utilizza l’apprendimento automatico non supervisionato del DM per apprendere informazioni.

Ma quali sono i compiti del Data mining? Le tecniche utilizzate principalmente sono: il Clustering cioè l’analisi dei gruppi con selezione e raggruppamento dei dati omogenei e le Reti Neurali cioè la creazione di neuroni artificiali e sono applicati con funzione di approssimazione o regressione.

Questo tipo di tecnologia viene quindi sfruttato per lavorare su enormi quantità di dati nel minor tempo possibile, in futuro potrebbero crearsi dei social data mining che andranno ad analizzare tutte le informazioni generate dai social network per arrivare ad avere un’analisi del sentiment cioè l’identificazione di determinate opinioni da testi scritti, una pratica molto utilizzata in politica o nei mercati azionari.

Stiamo parlando quindi di una tecnologia che permette di scoprire anche cose che non stiamo cercando, di cui non conosciamo la loro esistenza. A loro serve solamente la giusta quantità di dati.