Ako se danas ozbiljno razgovara o umjetnoj inteligenciji, onda se više ne uspoređuju samo chatbotovi, nego cijele filozofije tehnološkog razvoja. ChatGPT, Grok, Claude, Gemini i DeepSeek nisu važni samo zato što su popularni, nego zato što svaki od njih predstavlja drugačiji pogled na to kako bi AI trebao izgledati, kako bi se trebao trenirati i kome bi zapravo trebao služiti. Na jednoj strani imamo sisteme građene kao univerzalni digitalni asistenti, na drugoj modeli oblikovani za dubinsko zaključivanje, a negdje između njih nastaju alati koji su jednako fascinantni zbog infrastrukture iza kulisa kao i zbog onoga što korisnik vidi na ekranu.
OpenAI je osnovan 2015-e sa javno najavljenom obavezom financiranja od milijardu dolara, što je već u startu pokazalo da ambicija nije bila napraviti samo još jedan istraživački laboratorij, nego postaviti temelje za novu računalnu platformu. Upravo se to i dogodilo, ChatGPT je od svih alata najbliži pojmu opće AI radne površine. Piše, sažima, kodira, prevodi, analizira slike, barata dokumentima i sve više funkcionira kao alat koji ne zamjenjuje samo tražilicu, nego i dobar dio uredskog softvera. Tehnički gledano, riječ je o obitelji velikih transformera, a ključna stvar koja je OpenAI izdvojila u ranoj fazi bila je primjena RLHF-a, odnosno učenja uz ljudsku povratnu informaciju. To je pristup kojim model ne postaje samo gramatički tačniji, nego i korisniji. OpenAI danas više ne objavljuje pune detalje aktualnih flagship modela, pa se o preciznom broju parametara, topologiji ili potrošnji po svakom odgovoru može govoriti samo okvirno. Već je odavno jasno da je riječ o sustavu koji se vrti na računalnoj infrastrukturi kakva je nekada bila rezervirana za nacionalne superračunalne projekte. Još 2020-e Microsoft je za OpenAI imao superračunalo sa više od 10.000 GPU-ova i 285.000 CPU jezgri, a danas je ta infrastruktura mnogo veća. U prijevodu, ChatGPT nije najzanimljiviji samo zbog onoga što zna, nego i zato što je postao industrijski standard za to kako jedan AI proizvod izgleda kada sazrije.
Claude je njegov elegantniji i tiši rival. Anthropic je osnovan 2021-e, a već od prvih investicijskih rundi bilo je jasno da ne želi biti sporedni igrač. Rani kapital kretao se od 124 miliona dolara u prvoj većoj rundi do 580 miliona u sljedećoj, a kasnije su stigla i golema strateška ulaganja Amazona i ostalih partnera. Ono što je Claude doista izdvojilo nije samo novac, nego ton cijele kompanije. Anthropic od početka gradi identitet oko sigurnosti, interpretabilnosti i kontroliranog ponašanja modela. U tehničkom smislu to znači da Claude nije samo još jedan veliki jezični model sa finesama, nego sisstem snažno oblikovan pristupom Constitutional AI, u kojem se ponašanje modela usmjerava prema unapred definiranim principima, a ne isključivo prema preferencijama ljudskih anotatora. To u praksi daje alat koji djeluje smirenije, urednije i često ozbiljnije u radu s dugim dokumentima, složenim tekstovima i poslovnim zadacima. Claude možda nema istu popkulturnu prisutnost kao ChatGPT, ali je među profesionalcima stekao reputaciju jednog od najpouzdanijih alata za dubinsko čitanje, strukturirano mišljenje i promišljeno odgovaranje. Infrastrukturno je također prerastao fazu “razumnog laboratorija”. Planovi povezani s TPU kapacitetima i budućim energetskim opterećenjima pokazuju da Anthropic “puca” na visoko.
Gemini je najčišći proizvod jedne tehnološke imperije. Za razliku od OpenAI-ja i Anthropica, koji su krenuli kao specijalizirani AI laboratoriji, Gemini dolazi iz Googleova svijeta, a to znači da iza njega ne stoji samo model, nego cijela vertikala; čipovi, cloud, istraživanje, distribucija i golemo iskustvo u radu s podacima i masovnim sustavima. Google kao kompanija postoji od 1998-e, pokrenua vrlo skromnim početnim kapitalom u odnosu na današnje standarde, dok je DeepMind, laboratorij čija je osnova snažno ugrađena u Gemini, osnovan 2010-e. Gemini je tehnički posebno zanimljiv zato što se oslanja na sparse mixture-of-experts arhitekturu. To znači da model ne aktivira cijelu svoju masu pri svakom zadatku, nego samo dio specijaliziranih “eksperata”, što omogućuje golem kapacitet uz razumniju računalnu potrošnju po upitu. U teoriji to zvuči jednostavno ali u praksi znači da Google može graditi modele ogromne širine bez toga da svaki odgovor mora energetski izgledati kao lansiranje rakete. Dodatna prednost Geminija je nativna multimodalnost. On nije zamišljen samo kao alat za tekst nego kao model koji se prirodno kreće između slike, zvuka i jezika. Kada se tome doda činjenica da Google raspolaže TPU infrastrukturom u mjerilu o kojem drugi uglavnom mogu samo pregovarati s dobavljačima, postaje jasno zašto je Gemini manje “zvijezda društvenih mreža”, a više ozbiljan infrastrukturni projekt budućnosti.
Grok je posve drukčija priča. xAI je nastao 2023-e, a već u prvoj velikoj investicijskoj fazi prikupio je oko 6 milijardi dolara što dovoljno govori o razini ambicije. Dok su drugi gradili reputaciju kroz postupno sazrijevanje proizvoda, Grok je od početka nastupio kao demonstracija sile. U središtu te priče nije samo model nego gigantski računski centar i računalni klaster, koji je xAI predstavio kao sistem od 100.000 GPU-ova, a zatim i kao infrastrukturu proširenu sa 200.000 akceleratora. Ta brojka nije zanimljiva samo zato što impresivno zvuči, nego zato što odmah otvara pitanje energije, logistike i održivosti. Sistemi takve veličine ulaze u zonu potrošnje koja se više ne opisuje računima za servere, nego stotinama megavata i ozbiljnim elektroenergetskim opterećenjem. Grok je zato možda najbolji primjer onoga u što se AI pretvara kada iza njega stoji filozofija “više računanja, više brzine, više sirove snage”. Algoritamski, xAI snažno naglašava reasoning i reinforcement learning na velikoj skali, a proizvodno gledano Grok želi biti brži, neposredniji i povezaniji sa stvarnim vremenom od većine suparnika. To mu daje vrlo živ karakter, ali i određenu sirovost. Grok je fascinantan kada želite osjećaj da razgovarate s modelom koji je priključen na motor od trkaćeg automobila, ali upravo zbog te energije katkad djeluje manje uglađeno od konkurenata.
DeepSeek je najmlađi, ali možda i najprovokativniji igrač u cijelom društvu. Osnovan 2023-e, bez klasične zapadnjačke startup mitologije i bez glamura koji prate američke AI kompanije. DeepSeek je u vrlo kratkom roku pokazao da velika inovacija ne mora nužno dolaziti s najvećim proračunom. Njegovi modeli, osobito DeepSeek-V3 i DeepSeek-R1, postali su važni zato što kombiniraju vrlo ozbiljnu arhitekturu s osjetno discipliniranijim troškovima treninga. DeepSeek-V3 opisan je kao mixture-of-experts model s ukupno 671 milijardom parametara ali s aktivacijom od oko 37 milijardi parametara po tokenu, što je iznimno važna razlika. Nije isto imati velik model i svaki put paliti cijelu infrastrukturu ili imati velik model koji aktivira samo onoliko inteligencije koliko je u tom trenutku stvarno potrebno. U tome je jedan od ključnih razloga zašto se DeepSeek doživljava kao tehnički elegantan. Još je zanimljiviji R1, koji je postao simbol modela čije se zaključivanje snažno razvijalo kroz reinforcement learning, uz bitno drukčiju ekonomiku treninga od dominantnog američkog pristupa. Javne procjene treninga V3 modela govorile su o oko 2,8 milijuna H800 GPU-sati i trošku od približno 5,6 milijuna dolara za taj ciklus, što ne znači da je cijela infrastruktura tvrtke toliko koštala ali vrlo jasno sugerira koliko je pristup bio štedljiviji od uobičajenih predodžbi o tome koliko frontier AI mora biti skup.
Kada se usporede kroz prizmu algoritama, ChatGPT i Claude djeluju kao dva lica iste generacije, ali s različitim temperamentom. Oba pripadaju tradiciji velikih transformera uz snažan post-trening, no ChatGPT je više oblikovan kao široko prilagodljiv opći alat, dok Claude naginje discipliniranijem, tekstualno urednijem i sigurnosno opreznijem ponašanju. Gemini je tehnički najviše fokusiran na efikasnost velikog sustava kroz mixture-of-experts pristup i nativnu multimodalnost. Grok je više simbol compute-first filozofije, gdje se kroz veliku količinu računalne snage i vrlo agresivnu iteraciju pokušava što brže doći do modela koji može konkurirati samom vrhu. DeepSeek najjasnije pokazuje da se velik dio buduće AI utrke neće voditi samo u broju parametara, nego i u tome kako se parametri aktiviraju, koliko učinkovito treniraju i koliko električne energije treba pretvoriti u korisnu inteligenciju.
Potrošnja energije upravo je mjesto na kojem ove razlike postaju stvarne. Kompanije gotovo nikada ne objavljuju jednostavan podatak tipa “ovaj alat troši toliko i toliko vata po korisniku” jer takva metrika ovisi o modelu, duljini konteksta, tipu hardvera, opterećenju centra i hiljadu drugih varijabli. Na nivou reda veličine jasno je da glavni modeli danas žive u energetskom svijetu koji se mjeri megavatima i gigavatima. OpenAI i ChatGPT oslanjaju se na infrastrukturu koja je već godinama u vrhu hyperscale svijeta. Anthropic se otvoreno kreće prema razinama kapaciteta koje se uspoređuju s ozbiljnim energetskim sustavima. Google je vjerojatno najefikasniji po pitanju ukupne vertikale jer sam projektira TPU-ove i može optimizirati cijeli lanac. xAI je najvidljiviji primjer ekstremnog povećanja računalne mase, što gotovo neizbježno znači i ekstremne energetske zahtjeve. DeepSeek, s druge strane, ima reputaciju igrača koji je pokazao da se dio iste frontier kvalitete može postići s manje ukupnog hardverskog rasipanja, barem u odnosu na dominantnu percepciju tržišta.
Naš konačni zaključak je slijedeći; ChatGPT je danas najzreliji univerzalac sa raznim nepotrebnim moralnim kočnicama i skrivenom agendom, Claude najotmjeniji radni partner koji neće nikad postati nešto veće, Gemini će ostati najdominantniji infrastrukturni AI sistem, Grok najagresivnija mašina sirove računalne volje, a DeepSeek najopasniji dokaz da elegancija arhitekture može biti jednako važna kao veličina budžeta. U tome i jeste prava drama savremene umjetne inteligencije. Ne pobjeđuje nužno samo onaj tko ima najveći model, sve češće pobjeđuje onaj tko zna spojiti kapital, algoritam, čip, energiju i osjećaj za stvarnu ljudsku upotrebu. Ova velika AI utrka će zbog realnosti i stvarnih potreba dovesti do pucanja tog balona i velikog uništavanja kapitala, indirektno vjerovatno na naš račun. Potencijal zloupotrebe je veliki oko čega će se voditi mnoge bitke.


