<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=150415092460129&amp;ev=PageView&amp;noscript=1">

Visione

Offerta

Scenari

Tecnologie di Frontiera

Ruoli

Tilt

I 5 algoritmi del Machine Learning che bisogna conoscere

I 5 algoritmi del Machine Learning che bisogna conoscere

Il machine learning non è un concetto nuovo. I primi riferimenti a un suo utilizzo risalgono al 1950 e al famoso test di Turing, teso a individuare se l’intelligenza di un computer fosse comparabile a quella di un essere umano. La novità sta nel poter sfruttare software basati sull’apprendimento automatico per potenziare processi e metodi di business, in settori verticali e fino a poco tempo fa privi di un qualsiasi interesse verso la materia.  

In un mondo che produce dati continuamente, l’aspetto più importante del Machine Learning è che più sistemi e macchine sono esposti a informazioni contestuali, più i modelli successivi potranno adattarsi alle inferenze ambientali, che si tratti di intendere meglio i sensori per il monitoraggio degli impianti, sviluppare complesse soluzioni predittive, analisi statistiche e così via. Ma in cosa consiste realmente il complesso mondo del Machine Learning?  

In generale, i codici più usati ricadono in 3 categorie: supervisionati, non supervisionati e di rinforzo. La prima comprende algoritmi che lavorano in contesti in cui input e output sono predefiniti, contrariamente al secondo gruppo, dove non vi è un obiettivo ben preciso e i risultati vengono classificati in cluster differenti. Gli algoritmi di rinforzo invece sono allenati per prendere decisioni che si ottimizzano giorno dopo giorno, grazie all’esperienza degli esiti precedenti. Molti dei software predittivi nascondo proprio da tale integrazione. 

 

1Regressione lineare. Nato in ambito statistico, il concetto di regressione lineare sottende un metodo di stima del valore atteso o condizionato di una variabile dipendente, partendo dai valori di altre variabili indipendenti. In informatica, l’algoritmo in questione è finalizzato a costruire su un asse X e Y una linea retta che tocchi il più possibile punti predefiniti da modellare. La regressione è molto utilizzata in linguaggio python, ad esempio per il modello scikit-learn, che serve anche ad individuare valori medi per dataset specifici. 

2

 

Macchine a vettori di supporto. La finalità è quella della classificazione binaria, utile per categorizzare all’istante migliaia di foto in base al sesso del ritraente. Partendo da un database di immagini già consolidate, cioè etichettate di default come uomo e donna, l’algoritmo può prendere in considerazioni elementi determinanti del volto o del fisico per distinguere le persone e assegnarle un valore di riferimento.  

 

3Albero decisionale. Come un arbusto, questo algoritmo si divide in tre parti: il tronco, i rami e le foglie. La prima comprende le istruzioni assegnate in partenza, la seconda le correzioni derivate dalle esperienze precedenti, la terza gli eventi finali risultati dalle indicazioni guida. Viene sfruttato per creare inferenze anche a scopo di marketing: considerando l’età media dei visitatori di un sito (> 30 anni) e quella di chi ha una carta di credito (> 30 anni), se indirizzo la campagna a un target di ultratrentenni su prodotti per la famiglia è probabile che si ottenga un rate di conversione in clienti soddisfacente. 

 

Classificatori bayesiani. Antivirus e spam di nuova generazione si basano proprio su tali codici. L’obiettivo è calcolare la probabilità che un evento si ripeta 4considerando gli elementi associati a uno precedente, effettivamente accaduto. È il caso di una email: analizzando il testo di un messaggio, un classificatore può decidere, confrontando le frasi con quelle di una posta spazzatura presa come esempio, se inserire la comunicazione nella casella In Arrivo o in quella Indesiderata. 

 

5Incremento graduale. Si tratta di un super-algoritmo che mette assieme diverse parti di codici deboli per accrescere le sue potenzialità. Il vantaggio è che invece di usare un singolo validatore, ne legge diversi per creare un software più stabile e robusto, ma anche flessibile e versatile. Ciò consente di affidarsi a previsioni statistiche che vanno al di là delle mere classificazioni binarie, per ottenere stratificazioni non lineari e più simili al ragionamento umano. In che senso? La foto di un quadro (o di un capitello, una scultura, un evento storico), che ritrae un nudo, potrebbe non essere censurata da un social network perché considerata arte e non pornografia, valicando dunque le considerazioni binarie causa-effetto. 

New Call-to-action

Iscriviti al Blog