Terminologia de la IA: Machine Learning, Deep Learning (DL) i large Language Models (LLM)
- apuntiturull
- May 1
- 6 min de lectura
En els darrers anys, l'auge de la IA generativa ha portat una allau de paraules de moda com ara IA, aprenentatge automàtic , aprenentatge profund i grans models de llenguatge. Tot i que aquests termes s'utilitzen amb freqüència, sovint s'entenen malament i s'utilitzen indistintament, cosa que dificulta la comprensió dels seus significats diferents. Aquest article pretén aclarir aquesta confusió explicant les diferències clau entre aquestes tecnologies i per què és important entendre-les.
Què és la Intel·ligència Artificial?
Comencem abordant la pregunta clau: què és la intel·ligència artificial? La IA és un concepte ampli que fa referència a diverses tècniques dissenyades per replicar la lògica, els processos i la intel·ligència humans en màquines, algoritmes o cervells "artificials". Aquestes tècniques es poden agrupar en quatre àrees principals, cadascuna de les quals és un subconjunt més avançat de l'anterior: intel·ligència artificial (IA), aprenentatge automàtic (ML), aprenentatge profund (DL) i models de llenguatge gran (LLM) .

En aquest article, explorarem cadascun d'aquests camps en ordre cronològic i amb nivells creixents de complexitat. Per replicar la lògica humana, la IA pot utilitzar enfocaments que van des de sistemes basats en regles, on programem explícitament les regles a la màquina, fins a mètodes més avançats que permeten al sistema aprendre aquestes regles i lògica analitzant dades amb patrons implícits i complexos.
El viatge de la IA comença amb l'enfocament més simple (la IA basada en regles i els algoritmes) que serveix de base per a tècniques més sofisticades.
IA basada en regles i algoritmes
La forma més tradicional d'IA implica la creació d'algoritmes basats en regles. Aquests algoritmes segueixen regles predefinides per replicar el raonament humà. Per exemple, si volguéssim identificar si una imatge conté un gos, podríem crear una llista de característiques facials predefinides. Aquestes podrien incloure característiques com ara "orelles punxegudes", "musell", "nas humit" i "bigotis". Aleshores analitzaríem la imatge per comprovar si hi ha aquestes característiques facials específiques. Si la imatge coincideix amb la majoria de les característiques facials predefinides, podríem classificar-la com a que conté un gos. Si la imatge no té aquestes característiques clau, la classificaríem com a que no conté un gos.

En la IA basada en regles, tenim control total sobre la lògica de l'algoritme. Sabem exactament com processa la informació i per què pren decisions específiques. Aquest tipus d'IA s'ha utilitzat àmpliament, des de la regulació de termostats fins al guiatge de robots, i fins i tot impulsant Deep Blue, el programa d'escacs que va derrotar el campió del món Garry Kasparov el 1997.


Aquests algoritmes poden basar-se des de lògiques simples fins a processos de decisió profunds, incloent-hi models matemàtics i estadístics altament complexos per dur a terme una tasca. Tanmateix, aquests algoritmes basats en regles tenen una capacitat d'aprenentatge o adaptació limitada. Si necessitem que el sistema es comporti de manera diferent, hem de modificar manualment o afegir noves regles. Això contrasta fortament amb els sistemes d'IA més avançats, com els que utilitzen l'aprenentatge automàtic, que poden adaptar-se i aprendre de les dades.
Aprenentatge automàtic (ML)
L'aprenentatge automàtic (ML) és un subconjunt de la IA que permet als ordinadors aprendre de les dades sense necessitat de programació explícita per a cada tasca. En lloc de proporcionar regles predefinides, proporcionem exemples (com ara imatges etiquetades com a conté gos o no) i l'ordinador aprèn patrons de les dades per prendre les seves pròpies decisions. En aquest procés, controlem com aprèn la IA, però no exactament què aprèn.

Els desenvolupadors d'aprenentatge automàtic configuren el marc d'aprenentatge, però el sistema mateix descobreix la lògica subjacent. Per modificar-ne el comportament, introduïm noves dades en lloc de reescrivint les regles. Tot i que tenim control sobre el procés d'aprenentatge i les dades d'entrada, perdem la capacitat de governar directament les decisions específiques que pren l'algoritme. L'aprenentatge automàtic inclou una àmplia gamma de models, cadascun adequat per aprendre diferents patrons en les dades. Quan ens referim a l'aprenentatge automàtic tradicional, en contraposició a l'aprenentatge profund, normalment parlem de models com la regressió, els arbres de decisió o XGBoost.
Aquests models sovint construeixen arbres de decisió complexos basats en les dades proporcionades, cosa que els fa molt més adaptables que els sistemes basats en regles. En lloc de definir manualment l'estructura de l'arbre, com faríem en un enfocament basat en regles, el model aprèn de manera autònoma les "decisions" més efectives basades en un conjunt d'entrades i la sortida desitjada. Durant l'entrenament, refina aquestes decisions per alinear millor els resultats amb el resultat desitjat, aprenent a través d'un conjunt divers d'exemples d'entrada-sortida.
Per exemple, considerem un model d'aprenentatge automàtic dissenyat per classificar objectes en funció de les seves característiques, com ara la mida del diàmetre i el color. Primer, extraiem les característiques rellevants del conjunt de dades (per exemple, el diàmetre i el color de l'objecte). El model utilitza aquestes característiques per dividir els objectes en diferents categories. Per exemple, primer podria dividir-los en funció de la mida del diàmetre i després refinar encara més la classificació mitjançant el color. En entrenar el model amb exemples etiquetats, aprèn a classificar amb precisió els nous objectes en funció d'aquestes característiques.

Els models d'aprenentatge automàtic (ML) s'utilitzen àmpliament en aplicacions com ara recomanacions de productes, previsió de la demanda d'energia i avaluació del risc de crèdit. Aprofiten dades històriques i patrons de comportament similar per predir resultats futurs. Tanmateix, a mesura que les dades es tornen més complexes, es fa cada cop més difícil comprendre completament com aquests sistemes arriben a les seves conclusions. Hi ha certes tasques, que sovint requereixen intuïció o sentit comú , que fins i tot els arbres de decisió altament sofisticats tenen dificultats per gestionar. Aquí és on l'aprenentatge profund sobresurt, abordant les limitacions de l'ML tradicional descobrint patrons més complexos a les dades.
Aprenentatge profund (DL)
L'aprenentatge profund, un subconjunt de l'aprenentatge automàtic, va un pas més enllà mitjançant l'ús de xarxes neuronals artificials inspirades en el funcionament de les neurones biològiques. Aquestes xarxes poden aprendre patrons complexos que abans eren impossibles de detectar. Per exemple, un model d'aprenentatge profund encarregat d'analitzar les emocions en un text no només compta les paraules; entén les relacions entre elles, el context i fins i tot matisos com el sarcasme i l'humor.


La manera com funcionen els models d'aprenentatge profund és molt complexa. Cada capa de la xarxa neuronal processa les dades de manera diferent, cosa que dificulta entendre exactament com es prenen les decisions. Aquests models sovint s'anomenen "caixes negres" perquè, si bé podem veure les entrades i les sortides, el funcionament intern roman opac. Aquesta opacitat és particularment preocupant en sectors d'alt risc com la salut, les finances i els sistemes legals. Confiar en les decisions preses per la IA sense un raonament clar, sobretot quan aquestes decisions poden tenir un impacte profund en la vida d'algú, planteja riscos importants. En aquests sectors on l'explicabilitat és fonamental, hi ha una atenció creixent al desenvolupament d'eines i tècniques per proporcionar més informació sobre com els models d'aprenentatge profund arriben a les seves conclusions. Tanmateix, aconseguir la transparència total en aquests sistemes continua sent un repte.

Malgrat la seva complexitat, els models d'aprenentatge profund són extremadament potents i s'utilitzen àmpliament en aplicacions com el reconeixement de veu, l'anàlisi d'imatges i la classificació de text. Exemples del món real inclouen cotxes autònoms, inspecció automàtica de qualitat en línies de producció, filtratge de correu brossa i monitorització del trànsit mitjançant càmeres intel·ligents. Una de les aplicacions més destacades de l'aprenentatge profund és el processament del llenguatge natural, on els models de llenguatge gran (LLM) com ChatGPT han revolucionat la manera com processàvem el text fins ara.
Grans Models de Llenguatge (LLM)
Els LLM són sistemes d'IA especialitzats dissenyats per entendre i generar llenguatge humà. Poden realitzar tasques com classificar, resumir i fins i tot crear text. Però, com aprèn un model d'IA les complexitats del llenguatge?

Els LLM s'entrenen amb grans quantitats de text, aprenent a predir la següent paraula d'una frase, de manera molt semblant a la funció de text predictiu d'un telèfon intel·ligent. En predir contínuament paraula rere paraula, aquests models poden generar text coherent i contextualment rellevant.

Tanmateix, els LLM no "entenen" realment el contingut. Generen text basat en patrons que es troben a les seves dades d'entrenament, cosa que els ha valgut el sobrenom de "lloros estocàstics ": repeteixen patrons en lloc de captar el significat. El procés de presa de decisions d'aquests models és molt complex, i implica milers de milions de paràmetres que s'ajusten durant l'entrenament, cosa que fa impossible explicar exactament per què trien una paraula per sobre d'una altra.
Aquesta complexitat presenta reptes per controlar l'ús ètic de la IA. Les empreses estan invertint molt en mètodes per guiar el comportament de la IA, però encara estem lluny de tenir el control total.
Conclusió
La IA té el potencial de transformar la nostra vida quotidiana i la manera com funciona el món. Tanmateix, és important reconèixer que la IA no és una solució única per a tothom. Engloba una àmplia gamma de tecnologies, cadascuna amb els seus propis punts forts i aplicacions. Comprendre les distincions entre aquestes tecnologies és clau per triar l'enfocament adequat per a cada repte específic. Els diferents mètodes d'IA requereixen diferents volums i tipus de dades, així com processos diferents per entrenar i optimitzar models per a tasques particulars. El primer pas per aprofitar el poder de la IA de manera efectiva és obtenir una comprensió clara dels diversos camps dins d'aquesta disciplina àmplia i en ràpida evolució.