
Recent, cercetările din domeniul inteligenței artificiale au început să ofere o perspectivă nouă asupra modului în care modelele generate de mașini, precum DALL·E sau Stable Diffusion, produc imagini creative. Studiile arată că această „creativitate” nu este o magie, ci rezultatul unor limitări și imperfecțiuni tehnice ale arhitecturii lor. În special, procesul de denoising al acestor modele contribuie la apariția unor compoziții originale, neașteptate.
Modelele de generare grafică funcționează prin transformarea unei imagini în „nor” de pixeli aleatori și apoi reconstruierea treptată. Logica ar sugera că rezultatele ar fi simple reproducții, dar algoritmii combină elemente din diferite surse, creând compoziții unice. Cercetătorii de la Stanford și École Normale Supérieure au descoperit că această inovație provine din două trăsături tehnice: localitatea și echivarianța translațională.
Aceste limitări, considerate anterior erori, determină rețelele neuronale să reconstruiască imagini noi, în vârtejul unor decizii locale. Astfel, modelele „aleg” și plasează piese mici, fără un plan central, generând rezultate surprinzătoare. Cercetările au dus la dezvoltarea unui set de ecuații, denumit „equivariant local score machine”, cu o acuratețe de aproximativ 90% în prezicerea rezultatelor.
O paralelă interesantă se face cu biologia. Modelele matematice propuse de Alan Turing pentru formarea organelor și a membrelor explică cum apar structuri complexe din interacțiuni locale. În procesul de generare de imagini, similar, fiecare „patch” de pixeli influențează rezultatul final și produce forme imprevizibile.
Această perspectivă sugerează că creativitatea, fie la mașini sau oameni, poate avea la bază mecanisme simple, emergente. Imperfecțiunile devin astfel motorul inovației și ale surprisei, contrar așteptărilor anterioare.
Implicațiile pentru viitorul inteligenței artificiale sunt semnificative. Studiul explică modul în care modelele de difuzie, deși reproduc după datele de antrenament, pot genera opere originale. De asemenea, oferă un instrument matematic pentru a anticipa și controla nivelul de originalitate al acestor sisteme.
În plus, există o apropiere între mecanismele AI și procesul uman de gândire, unde imperfectiunile și inconștiența sunt substanța procesului creativ. Cercetările pot contribui la înțelegerea mai profundă a modului în care inteligența și creativitatea funcționează, atât la mașini, cât și la oameni.
Rezultatele recente subliniază că imperfecțiunea și limitările tehnice pot alimenta inovația, fără a fi neapărat unele probleme. Este important ca cercetarea și monitorizarea evoluțiilor în domeniu să continue, pentru a înțelege mai bine mecanismele din spatele creativității artificiale și umane.
Fii primul care comentează