Il campione ( artificiale) di videogiochi che impara da solo

Cortesia Google DeepMind (with permission from Atari Interactive Inc.)
Cortesia Google DeepMind (with permission from Atari Interactive Inc.)

Un sistema di intelligenza artificiale è riuscito a imparare da solo – e a partire da pochissimi dati – la strategia ottimale da adottare in 49 videogiochi, ottenendo punteggi paragonabili a quelli di un professionista umano impegnato a testarli. Il sistema – realizzato da un gruppo di ricercatori di Google DeepMind e descritto in un articolo su “Nature” – combina tecniche di apprendimento automatico puramente algoritmiche con meccanismi di apprendimento tipici degli animali e dell'uomo.

L'apprendimento automatico (omachine learning) è il settore dell'intelligenza artificiale che sviluppa algoritmi che permettono alla macchina di imparare a riconoscere modelli complessi in vasti insiemi di dati dopo un periodo di “addestramento” con un numero ristretto di dati. Le forme più semplici di apprendimento automatico sono quelle “supervisionate”, in cui i dati in ingresso al sistema sono preclassificati in qualche modo dall'agente umano. Questo sistema di apprendimento è però ben lontano da quello necessario a gestire situazioni del mondo reale in cui non c'è alcuna classificazione preliminare degli input: qualsiasi animale, per esempio, deve imparare da sé quali stimoli sono significativi e quali rumore di fondo.
Un tipo più sofisticato di apprendimento è quello per rinforzo, in cui non sono classificati gli stimoli ma i risultato dell'azione intrapresa dalla macchina di fronte a quegli stimoli. Molto più versatile dell'apprendimento supervisionato, anche l'apprendimento per rinforzo si è dimostrato però poco maneggevole per affrontare situazioni simili a quelle del mondo reale, a causa della complessità di progettazione e di calcolo richiesta.
Per questo Volodymyr Mnih, Demis Hassabis e colleghi hanno pensato di coniugare uno degli algoritmi di apprendimento per rinforzo più articolati – il cosiddetto Q-learning – con un sistema di reti neurali artificiali (le reti neurali artificiali sono circuiti che imitano i collegamenti fra i neuroni cerebrali e ne seguono i principi di funzionamento). Nel sistema progettato da Mnih e colleghi, queste reti neurali sono usate per archiviare temporaneamente i risultati via via ottenuti dall'algoritmo di Q-learning, e procedere in un secondo momento a una rivalutazione di tutti i dati. Questo processo di valutazione è paragonato dai ricercatori a quelli che avvengono nell'ippocampo durante il sonno, una struttura cerebrale essenziale per l'apprendimento di nuove abilità, che provvede a cancellare gli eventi meno significativi avvenuti durante la giornata e a consolidare il ricordo di quelli più importanti.

http://www.lescienze.it/news/2015/02/26/news/apprendimento_automatico_algoritmi_reti_neurali_videogiochi-2499501/

Per essere informato degli ultimi articoli, iscriviti:
Cedistic © 2014 -  Ospitato da Overblog