Intelligenza Artificiale: che cos’è e come funziona

articolo di Marco Capobussi del 4 febbraio 2021

Mechine learning

Definizione di AI: Introduzione alle AI(da)

Definire l'Intelligenza Artificiale (IA in italiano, AI in inglese) è complesso.
Nel corso degli ultimi 70 anni più e più volte gli studiosi hanno cercato di dare una definizione precisa e ben definita.

Dopo la nascita dei primissimi computer negli anni '50, fu chiaro a tutti che lo strumento appena inventato non doveva limitarsi a fare semplici calcoli numerici ma sarebbe dovuto diventare un fedele compagno dell'uomo, capace di aiutarlo a svolgere molte altre funzioni in qualità di co-creatore e, perché no, un giorno anche di produrre risultati che solo l'intelligenza umana avrebbe potuto concepire.

Si iniziò così a chiamarlo volgarmente "cervello elettronico", proprio per questa idea (ancora alle sue origini) di poter simulare e un giorno replicare le attività svolte da una mente umana.

Molti studiosi e visionari hanno contribuito allo studio e ai progressi dell'AI. Tra questi alcuni sono considerati i suoi padri fondatori e hanno a loro volta dato delle definizioni sul loro ambito di studio.

  • L'intelligenza in genere significa “la capacità di risolvere problemi difficili” - Marvin Minsky, co-fondatore della sezione di AI del MIT
  • L'AI è la scienza e l'ingegneria di rendere le macchine intelligenti - John McCarthy, "padre" del termine AI.

Ancora oggi, nel 2021, la questione sembra ancora aperta e non sembra essere arrivati ad una definizione esatta che accontenti tutti.

Possiamo però riflettere su cosa significa veramente  l’ “AI” per noi.

Partiamo dalla nostra definizione di “intelligenza”: la capacità di ragionamento complesso, con lo scopo di risolvere un problema.

Ma cosa significa "ragionare”? Per chi non lavora tutti i giorni con numeri e algoritmi, l’idea di ragionamento applicato ad una macchina sembra un concetto molto complesso, ma possiamo partire dall’esperienza di un ragionamento che facciamo tutti ogni mattina: quale vestito vogliamo indossare?

Quello che coincide con il nostro processo di ragionamento non ha nulla a che fare con regole matematiche o teoremi complessi, si tratta principalmente di “cercare di indovinare” un risultato, acquisendo prima informazioni e, dopo averle elaborate in questo processo, prendere decisioni in base alle esperienze. 

intelligenza artificiale

Partendo da questo concetto possiamo pensare a molti altri esempi di ragionamenti che ci conducono a specifiche conclusioni: cercare di capire se è meglio comprare un computer ora o il prossimo anno o decidere la pizzeria dove cenare il sabato sera (quando si potrà tornare a farlo!). 

I processi che guidano l’AI oggi sono quindi ragionamenti (generalmente complessi) che portano a prevedere, o cercare di indovinare con dati non sempre certi e precisi, ma in maniera plausibile, un determinato fenomeno, per poi agire di conseguenza.

Di cosa si compone l’AI: ML e Deep learning

Deep Learning

In generale si parla di Intelligenza Artificiale quando una macchina o un algoritmo può eseguire compiti (task) che tipicamente richiedono l’intervento dell’intelligenza umana.

Per raggiungere questo obiettivo sono stati sviluppati modelli di machine learning e di deep learning in grado di consentire alla macchina di imparare.

Che cosa sono gli algoritmi di machine learning?

Artificial Intelligent

Sono modelli statistici che ricostruiscono una rappresentazione dei dati e conducono analisi per scoprire relazioni tra le variabili presenti nel dataset. Gli strumenti di machine learning utilizzano modelli matematici o statistici per ottenere una comprensione generalizzata dei dati e fornire previsioni. Questi algoritmi consentono ai modelli di imparare attraverso l’osservazione dei dati ed acquisire competenze senza l’intervento umano.

Che cosa sono gli algoritmi di deep learning?

Gli algoritmi di deep learning sono modelli ispirati al cervello umano che cercano di ricostruire il metodo di apprendimento. Quando si parla di deep learning in generale si fa riferimento alle reti neurali e da qui l’analogia con il cervello umano. Gli algoritmi di deep learning eseguono lo stesso task ripetutamente e ciascuna volta modificando leggermente il metodo di esecuzione del task in modo da ottimizzare il processo di apprendimento e, quindi il risultato del modello.

Come per noi umani, il processo di apprendimento delle reti neurali si basa su un insieme di nodi (detti anche neuroni) che, scambiandosi le informazioni tra di loro, consentono il processo di apprendimento. Un modello di deep learning è costituito da un primo livello, detto input layer, che raccoglie le informazioni dalle variabili presenti nel dataset. Un secondo layer (chiamato hidden layer) è responsabile del vero processo di apprendimento ed è quello nel quale avvengono tutte le elaborazioni dei dati di input. A seconda della complessità del task possono essere presenti molteplici hidden layer che si scambiano informazioni tra di loro. Infine, c’è il cosiddetto output layer, il cui compito è riassumere tutte le informazioni già elaborate nei precedenti step e fornire la previsione finale.

Quando usare il ML e quando il Deep Learning?

SEO AI-1

La risposta a questa domanda dipende da diverse considerazioni che riguardano la complessità del problema che vogliamo risolvere, in particolare quanto sia importante l’accuratezza dei risultati rispetto alla interpretazione dei risultati stessi. Bisogna inoltre considerare la mole di dati a disposizione: nei casi in cui si sia interessati ad un modello predittivo è necessaria una quantità sufficiente di dati classificati nella cosiddetta “variabile target”.

Il Machine Learning verrà applicato nei casi in cui:

  • i risultati del modello devono essere facilmente interpretati 
  • non si ha a disposizione una grande quantità di dati (alcune migliaia di righe di database)
  • i dati a disposizione possono essere facilmente elaborati anche con limitate risorse computazionali 
  • la velocità di esecuzione è una caratteristica importante per la operatività del modello
  • si ha bisogno di utilizzare diversi tipi di algoritmi di predizione 

Il Deep Learning verrà applicato nei casi in cui:

  • l’accuratezza dei risultati del modello è più importante della loro interpretabilità. Spesso nel deep learning si parla di “black box”, proprio perchè non si è in grado di capire su quali informazioni o variabili l’algoritmo fornisce una certa previsione. 
  • si ha a disposizione una grande mole di dati, nell’ordine di diversi milioni di righe di database 
  • i dati a disposizione hanno bisogno di una complessa elaborazione, possibile solo con hardware in grado di fornire una elevata potenza di calcolo.

Se pensiamo ad un algoritmo di deep learning sviluppato dai ricercatori di Google AI Language per la comprensione dei testi (Natural Language Understanding), capiamo la complessità che si cela dietro questi tipi algoritmi:

  • la base di dati utilizzata è costituita dalla libreria di BookCorpus, composta da 11.038 libri, più tutte le pagine della versione inglese di Wikipedia, per un totale di 3,3 miliardi di parole. Per il training del modello l’algoritmo ha riletto per 40 volte tutti i dati forniti e ci ha impiegato circa 6 giorni
  • La rete neurale su cui si basa BERT (che sta per Bidirectional Encoder Representations from Transformers) elabora circa 340 milioni di paramenti

Il modello più potente di generazione dei testi (Natural Language Generating), chiamato GPT-3, ha utilizzato l’equivalente del consumo di energia elettrica di 126 case (studio danese).


Nel prossimo articolo parleremo dei diversi ambiti di applicazione dell'AI. Lascia la tua email cliccando qui per essere avvisato quando sarà disponibile.

Topics: SEO AI, intelligenza artificiale