În mod obișnuit, există două tipuri principale de inteligență artificială (IA), în procesul de formare și tehnologiile utilizate: IA tradițională și generativă.

Inteligenţă artificială. Prezentare generală.

IA tradițional

IA tradițională, denumită adesea IA îngustă sau slabă, se concentrează pe realizarea unei sarcini specifice în mod inteligent. Se referă la sisteme care sunt proiectate să răspundă la un set specific de intrări. Astfel de sisteme sunt capabile să învețe din date și să ia decizii sau predicții pe baza acestora.

Imaginează-ți că joci șah pe computer. Calculatorul cunoaște toate regulile, vă poate prezice mișcările și își poate face propriile pe baza unei strategii predeterminate. Nu inventează noi moduri de a juca șah, ci alege o strategie dintre cele deja programate. Aceasta este IA tradițională.

Inteligența artificială tradițională este ca un maestru strateg, capabil să ia decizii inteligente în cadrul unui set specific de reguli. Alte exemple de IA tradițională sunt asistenții vocali precum Siri sau Alexa, sistemele de recomandare Netflix sau Amazon și algoritmul de căutare Google. Au fost instruiți să urmeze anumite reguli, să facă anumite lucrări, dar nu creează nimic nou.

IA generativ

Inteligența artificială generativă poate fi considerată următoarea generație de inteligență artificială. Aceasta este o formă de IA care este capabilă să creeze ceva nou. Să presupunem că ai un prieten căruia îi place să spună povești. Dar în loc de un prieten uman, ai inteligență artificială. Îi dai IA o linie de pornire, spune: „Cu mult timp în urmă într-o galaxie departe, departe…”, apoi IA o ia și creează o poveste întreagă de aventură în spațiu, cu personaje, răsturnări de situație, și un final palpitant.

Spre deosebire de IA tradițională, IA generativă creează ceva nou pe baza informațiilor pe care le oferă. Poate crea conținut original, creativ, fie că este text, imagini, muzică sau cod de calculator. Modelele IA generative sunt antrenate pe un set de date și, prin învățarea tiparelor subiacente, generează date noi care reproduc setul de antrenament.

Un prim exemplu de IA generativă este GPT-4 [Wiki], modelul de predicție a limbajului OpenAI [Wiki]. Antrenat pe cantități mari de date de pe Internet, este capabil să creeze texte asemănătoare oamenilor care sunt practic imposibil de distins de textele pe care le-ar scrie un om.

Tabel rezumat al comparației IA

Principala diferență dintre IA tradițională și cea generativă constă în capabilitățile și aplicațiile lor. Sistemele tradiționale de inteligență artificială sunt utilizate în principal pentru a analiza datele și a face predicții, în timp ce inteligența artificială generativă merge mai departe și creează conținut complet nou.

#

IA tradițional

IA generativ

Principalele caracteristici

Sarcini specifice

Abilitatea de a crea date noi

Examinează datele și ia decizii sau predicții

Utilizarea datelor brute pentru a crea conținut nou, original

Funcționează într-un set predefinit de reguli

Poate genera text, imagini, muzică și cod

Metoda de predare

Învățare supravegheată

Învățare nesupravegheată

Necesar pentru a eticheta datele de antrenament

Nu necesită date de antrenament etichetate

Restricții

Limitat la sarcini specifice

Necesită cantități mari de date de antrenament

Incapacitatea de a crea conținut nou, original

Este posibil ca conținutul generat să nu fie suficient de consistent sau precis

Formarea poate necesita o cantitate mare de date etichetate

Este dificil să controlezi specificul conținutului generat

Exemple

IA jucând șah

GPT-4 de la  OpenAI

Filtre de spam în e-mail

IA pentru a transmite stilul DeepArt

Asistenți vocali (Siri, Alexa)

Creare de conținut (povestiri, artă, muzică)

Sisteme de recomandare (Netflix, Amazon)

Crearea de falsuri

Algoritmi de căutare (Google)

Răspunsuri personalizate IA

Procesul de instruire în inteligența artificială

IA tradițional

  1. Colectare de date. Setul de date trebuie să fie relevant pentru sarcina pentru care este destinat IA. De exemplu, dacă antrenați un IA să recunoască e-mailurile spam, veți avea nevoie de un set de date de e-mailuri etichetate ca „spam” sau „nu spam”.
  2. Preprocesarea datelor. Datele trebuie deseori curățate și formatate înainte de a putea fi folosite pentru antrenament. Aceasta poate include eliminarea informațiilor inutile, gestionarea datelor lipsă sau conversia datelor text într-un format numeric.
  3. Separarea datelor. Setul de date este de obicei împărțit într-un set de antrenament și un set de testare. Setul de antrenament este folosit pentru a antrena modelul, iar setul de testare este utilizat pentru a evalua performanța modelului pe date nevăzute.
  4. Antrenamentul modelului. Modelul este antrenat pe baza datelor de antrenament. În învățarea supravegheată, modelele arată intrări și rezultate corecte. Modelul face o predicție pe baza intrării și se calculează diferența dintre predicție și rezultatul corect (eroarea). Parametrii modelului sunt apoi ajustați pentru a minimiza această eroare.
  5. Evaluarea modelului. Odată ce modelul este antrenat, acesta este evaluat folosind datele de testare. Acest lucru oferă o idee despre cât de bine poate funcționa modelul pe date nevăzute în viitor.
  6. Configurare și optimizare. În funcție de performanța modelului în ceea ce privește datele de testare, puteți decide să reveniți și să ajustați parametrii modelului, să utilizați un alt model sau să colectați mai multe date.

IA generativ

  1. Colectare de date. Ca și în cazul IA tradiționale, primul pas este colectarea unui set de date. Pentru modelele GPT, acest set de date constă dintr-un corpus mare de texte. De exemplu, GPT-4 a fost antrenat pe sute de gigaocteți de text de pe Internet.
  2. Preprocesarea datelor. Datele sunt apoi preprocesate. Aceasta implică curățarea datelor și convertirea lor într-un format pe care modelul îl poate înțelege. Pentru GPT, aceasta include tokenizarea, în care textul este împărțit în bucăți sau simboluri mai mici.
  3. Antrenamentul modelului. Modelul este antrenat folosind modelarea limbajului bazat pe transformator. Modelelor li se arată o secvență de jetoane și li se cere să prezică următorul jetoane din secvență. De exemplu, când introduceți „Pisica stătea pe…”, modelului i se poate cere să prezică cuvântul lipsă. Modelul face o predicție și se calculează diferența dintre predicție și cuvântul real. Această diferență (pierdere) este utilizată pentru a actualiza ponderile modelului și pentru a îmbunătăți predicțiile acestuia.
  4. Backpropagare și optimizare. Pierderea este utilizată pentru a efectua retropropagarea, un proces care calculează gradientul funcției de pierdere în raport cu parametrii modelului. Un algoritm de optimizare, cum ar fi Adam sau coborârea gradientului stocastic, este apoi utilizat pentru a ajusta parametrii pentru a minimiza pierderea.
  5. Repetiţie. Pașii 3 și 4 se repetă de multe ori până când performanța modelului nu se mai îmbunătățește. Fiecare trecere prin datele de antrenament se numește epocă.
  6. Reglaj fin. După pregătirea inițială, modelul poate fi reglat în continuare la o anumită sarcină. Aceasta implică instruirea în continuare a modelului pe un set de date mai mic, specific unei sarcini. De exemplu, dacă doriți să utilizați GPT pentru a genera text medical, îl puteți personaliza în continuare pe un set de date de articole medicale

Inteligenţă artificială. Soluții cu Sursă Deschisă