I modelli di machine learning vengono applicati in tutti i settori: ads di Google, meccanismi di riconoscimento delle frodi, personalizzazione dei contenuti sui social network e via dicendo. Per ogni applicazione di machine learning bisogna realizzare un modello: esso è un’astrazione del comportamento che vogliamo ottenere. Esistono due elementi propedeutici e quindi fondamentali: i dati e gli algoritmi.
Per quanto riguarda i dati è necessario prendere in considerazione un set significativo ovvero che ci consenta sia di eseguire delle sessioni di training che di completare una fase di verifica. Una pratica comunemente diffusa è quella di utilizzare un set di dati per la fase di training e uno diverso per la fase di verifica: questo approccio consente di ottenere un’accuratezza maggiore ed evitare dei bias che possono essere intrinsecamente legati al set di dati di training. Questa è una lunga e iterativa fase per la quale il risultato finale non è garantito.
I dati devono essere necessariamente associati ad un algoritmo. Di seguito alcuni esempi di algoritmo comunemente utilizzati:
- Linear Regression
- Logistic Regression
- Decision Tree
- Artificial Neural Network
- k-Nearest Neighbours
- k-Means
La combinazione di un algoritmo e dei dati costituisce il modello che quindi viene poi applicato da un sito, app o qualsiasi altro device.
DATI + ALGORITMO = MODELLO
Da un punto di vista tecnico oggi la complessità della costruzione del modello non è più un problema. L’ unico vero vincolo è il tempo necessario poiché prima di ottenere un buon modello si può incorrere in diversi fallimenti.