Najnapredniji AI alati

Ako se danas ozbiljno razgovara o umjetnoj inteligenciji, onda se više ne uspoređuju samo chatbotovi, nego cijele filozofije tehnološkog razvoja. ChatGPT, Grok, Claude, Gemini i DeepSeek nisu važni samo zato što su popularni, nego zato što svaki od njih predstavlja drukčiji pogled na to kako bi AI trebao izgledati, kako bi se trebao trenirati i kome bi zapravo trebao služiti. Na jednoj strani stoje sistemi građeni kao univerzalni digitalni asistenti, na drugoj modeli oblikovani za dubinsko zaključivanje, a negdje između njih nastaju alati koji su jednako fascinantni zbog infrastrukture iza kulisa kao i zbog onoga što korisnik vidi na ekranu.

OpenAI je osnovan 2015. sa javno najavljenom obvezom financiranja od milijardu dolara, što je već u startu pokazalo da ambicija nije bila napraviti samo još jedan istraživački laboratorij, nego postaviti temelje za novu računalnu platformu. Upravo se to i dogodilo. ChatGPT je od svih alata najbliži pojmu opće AI radne površine: piše, sažima, kodira, prevodi, analizira slike, barata dokumentima i sve više funkcionira kao alat koji ne zamjenjuje samo tražilicu, nego i dobar dio uredskog softvera. Tehnički gledano, riječ je o obitelji velikih transformera, a ključna stvar koja je OpenAI izdvojila u ranoj fazi bila je primjena RLHF-a, odnosno učenja pojačanjem uz ljudsku povratnu informaciju. To je pristup kojim model ne postaje samo gramatički točniji, nego i korisnički korisniji. OpenAI danas više ne objavljuje pune detalje aktualnih flagship modela, pa se o preciznom broju parametara, topologiji ili potrošnji po svakom odgovoru može govoriti samo okvirno. No već je odavno jasno da je riječ o sustavu koji se vrti na računalnoj infrastrukturi kakva je nekada bila rezervirana za nacionalne superračunalne projekte. Još 2020. Microsoft je za OpenAI imao superračunalo s više od 10.000 GPU-ova i 285.000 CPU jezgri, a današnja je stvarna skala gotovo sigurno osjetno veća. U prijevodu, ChatGPT nije najzanimljiviji samo zbog onoga što zna, nego i zato što je postao industrijski standard za to kako jedan AI proizvod izgleda kada sazrije.

Claude je njegov elegantniji i tiši rival. Anthropic je osnovan 2021., a već od prvih investicijskih rundi bilo je jasno da ne želi biti ni mali ni nišni igrač. Rani kapital kretao se od 124 miliona dolara u prvoj većoj rundi do 580 miliona u sljedećoj, a kasnije su stigla i golema strateška ulaganja Amazona i drugih partnera. No ono što je Claude doista izdvojilo nije samo novac, nego ton cijele kompanije. Anthropic od početka gradi identitet oko sigurnosti, interpretabilnosti i kontroliranog ponašanja modela. U tehničkom smislu to znači da Claude nije samo još jedan veliki jezični model s finetuningom, nego sustav snažno oblikovan pristupom Constitutional AI, u kojem se ponašanje modela usmjerava prema unaprijed definiranim principima, a ne isključivo prema preferencijama ljudskih anotatora. To u praksi daje alat koji djeluje smirenije, urednije i često ozbiljnije u radu s dugim dokumentima, složenim tekstovima i poslovnim zadacima. Claude možda nema istu popkulturnu prisutnost kao ChatGPT, ali je među profesionalcima stekao reputaciju jednog od najpouzdanijih alata za dubinsko čitanje, strukturirano mišljenje i promišljeno odgovaranje. Infrastrukturno je također prerastao fazu “razumnog laboratorija”; planovi povezani s TPU kapacitetima i budućim energetskim opterećenjima pokazuju da Anthropic više ne igra igru malog istraživačkog tima, nego frontier industrije u punom smislu riječi.

Gemini je najčišći proizvod jedne tehnološke imperije. Za razliku od OpenAI-ja i Anthropica, koji su krenuli kao specijalizirani AI laboratoriji, Gemini dolazi iz Googleova svijeta, a to znači da iza njega ne stoji samo model, nego cijela vertikala: čipovi, cloud, istraživanje, distribucija i golemo iskustvo u radu s podacima i masovnim sustavima. Google kao kompanija postoji od 1998-e, pokrenut vrlo skromnim početnim kapitalom u odnosu na današnje standarde, dok je DeepMind, laboratorij čija je DNK snažno ugrađena u Gemini, osnovan 2010. Gemini je tehnički posebno zanimljiv zato što se oslanja na sparse mixture-of-experts arhitekturu. To znači da model ne aktivira cijelu svoju masu pri svakom zadatku, nego samo dio specijaliziranih “eksperata”, što omogućuje golem kapacitet uz razumniju računalnu potrošnju po upitu. U teoriji to zvuči suho, ali u praksi znači da Google može graditi modele ogromne širine bez toga da svaki odgovor mora energetski izgledati kao lansiranje rakete. Dodatna prednost Geminija je nativna multimodalnost. On nije zamišljen samo kao alat za tekst, nego kao model koji se prirodno kreće između slike, zvuka i jezika. Kada se tomu doda činjenica da Google raspolaže TPU infrastrukturom u mjerilu o kojem drugi uglavnom mogu samo pregovarati s dobavljačima, postaje jasno zašto je Gemini manje “zvijezda društvenih mreža”, a više ozbiljan infrastrukturni projekt budućnosti.

Grok je posve drukčija priča. xAI je nastao 2023., a već u prvoj velikoj investicijskoj fazi prikupio je oko 6 milijardi dolara, što dovoljno govori o razini ambicije. Dok su drugi gradili reputaciju kroz postupno sazrijevanje proizvoda, Grok je od početka nastupio kao demonstracija sile. U središtu te priče nije samo model, nego Colossus, golemi podatkovni centar i računalni klaster koji je xAI komunicirao kao sustav od 100.000 GPU-ova, a zatim i kao infrastrukturu proširenu prema 200.000 akceleratora. Ta brojka nije zanimljiva samo zato što impresivno zvuči, nego zato što odmah otvara pitanje energije, logistike i održivosti. Sustavi takve veličine ulaze u zonu potrošnje koja se više ne opisuje računima za servere, nego stotinama megavata i ozbiljnim elektroenergetskim opterećenjem. Grok je zato možda najbolji primjer onoga u što se frontier AI pretvara kada iza njega stoji filozofija “više računanja, više brzine, više sirove snage”. Algoritamski, xAI snažno naglašava reasoning i reinforcement learning na velikoj skali, a proizvodno gledano Grok želi biti brži, neposredniji i povezaniji sa stvarnim vremenom od većine suparnika. To mu daje vrlo živ karakter, ali i određenu sirovost. Grok je fascinantan kada želite osjećaj da razgovarate s modelom koji je priključen na motor od trkaćeg automobila, ali upravo zbog te energije katkad djeluje manje uglađeno od najzrelijih konkurenata.

DeepSeek je najmlađi, ali možda i najprovokativniji igrač u cijelom društvu. Osnovan 2023., bez klasične zapadnjačke startup mitologije i bez glamura koji prate američke AI kompanije, DeepSeek je u vrlo kratkom roku pokazao da velika inovacija ne mora nužno dolaziti s najvećim proračunom. Njegovi modeli, osobito DeepSeek-V3 i DeepSeek-R1, postali su važni zato što kombiniraju vrlo ozbiljnu arhitekturu s osjetno discipliniranijim troškovima treninga. DeepSeek-V3 opisan je kao mixture-of-experts model s ukupno 671 milijardom parametara, ali s aktivacijom od oko 37 milijardi parametara po tokenu, što je iznimno važna razlika. Nije isto imati velik model i svaki put paliti cijelu tvornicu, ili imati velik model koji aktivira samo onoliko inteligencije koliko je u tom trenutku potrebno. U tome je jedan od ključnih razloga zašto se DeepSeek doživljava kao tehnički elegantan. Još je zanimljiviji R1, koji je postao simbol modela čije se zaključivanje snažno razvijalo kroz reinforcement learning, uz bitno drukčiju ekonomiku treninga od dominantnog američkog pristupa. Javne procjene treninga V3 modela govorile su o oko 2,8 milijuna H800 GPU-sati i trošku od približno 5,6 milijuna dolara za taj ciklus, što ne znači da je cijela infrastruktura tvrtke toliko koštala, ali vrlo jasno sugerira koliko je pristup bio štedljiviji od uobičajenih predodžbi o tome koliko frontier AI mora biti skup. Ako Grok pokazuje što se događa kad se problem gađa topništvom, DeepSeek pokazuje što se događa kad se inženjerski problem rješava skalpelom.

Kada se usporede kroz prizmu algoritama, ChatGPT i Claude djeluju kao dva lica iste generacije, ali s različitim temperamentom. Oba pripadaju tradiciji velikih transformera uz snažan post-trening, no ChatGPT je više oblikovan kao široko prilagodljiv opći alat, dok Claude naginje discipliniranijem, tekstualno urednijem i sigurnosno opreznijem ponašanju. Gemini je tehnički najviše fokusiran na efikasnost velikog sustava kroz mixture-of-experts pristup i nativnu multimodalnost. Grok je više simbol compute-first filozofije, gdje se kroz veliku količinu računalne snage i vrlo agresivnu iteraciju pokušava što brže doći do modela koji može konkurirati samom vrhu. DeepSeek pak najjasnije pokazuje da se velik dio buduće AI utrke neće voditi samo u broju parametara, nego i u tome kako se parametri aktiviraju, koliko učinkovito treniraju i koliko električne energije treba pretvoriti u korisnu inteligenciju.

Potrošnja energije upravo je mjesto na kojem ove razlike postaju brutalno stvarne. Tvrtke gotovo nikada ne objavljuju jednostavan podatak tipa “ovaj alat troši toliko i toliko vata po korisniku”, jer takva metrika ovisi o modelu, duljini konteksta, tipu hardvera, opterećenju centra i tisuću drugih varijabli. No na razini reda veličine jasno je da frontier modeli danas žive u energetskom svijetu koji se mjeri megavatima i gigavatnim planovima. OpenAI i ChatGPT oslanjaju se na infrastrukturu koja je već godinama u vrhu hyperscale svijeta. Anthropic se otvoreno kreće prema razinama kapaciteta koje se uspoređuju s ozbiljnim energetskim sustavima. Google je vjerojatno najefikasniji po pitanju ukupne vertikale jer sam projektira TPU-ove i može optimizirati cijeli lanac. xAI je najvidljiviji primjer ekstremnog povećanja računalne mase, što gotovo neizbježno znači i ekstremne energetske zahtjeve. DeepSeek, s druge strane, ima reputaciju igrača koji je pokazao da se dio iste frontier kvalitete može postići s manje ukupnog hardverskog rasipanja, barem u odnosu na dominantnu percepciju tržišta.

U svakodnevnoj upotrebi ti tehnički temelji pretvaraju se u vrlo jasne karaktere. ChatGPT ostaje najbolji kada želite alat koji može gotovo sve i pri tome uglavnom zvuči prirodno, sposobno i sigurno u širokom rasponu zadataka. Claude je iznimno privlačan kada trebate smireniji, uredniji i često misaono čišći rad s dugačkim sadržajem. Gemini je možda najlogičniji izbor za korisnike koji žele AI uklopljen u golemi produktivni i cloud ekosustav, uz osjećaj da iza svega stoji jedna od najmoćnijih računalnih infrastruktura na svijetu. Grok je alat za one koji vole energiju, brzinu i osjećaj da je model stalno priključen na puls trenutka. DeepSeek je najuzbudljiviji za svakoga tko prati tehnologiju ne samo kao korisnik nego i kao promatrač industrije, jer pokazuje da se ravnoteža moći u AI-ju može promijeniti i bez beskonačnog spaljivanja kapitala.

Kad bi se cijela ova usporedba morala svesti na jednu rečenicu, ona bi zvučala ovako: ChatGPT je danas najzreliji univerzalac, Claude najotmjeniji radni partner, Gemini najmoćniji infrastrukturni sustav, Grok najagresivniji stroj sirove računalne volje, a DeepSeek najopasniji dokaz da elegancija arhitekture može biti jednako važna kao veličina budžeta. U tome i jest prava drama suvremene umjetne inteligencije. Ne pobjeđuje nužno samo onaj tko ima najveći model. Sve češće pobjeđuje onaj tko zna spojiti kapital, algoritam, čip, energiju i osjećaj za stvarnu ljudsku upotrebu.

Leave a Comment

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)

This site uses Akismet to reduce spam. Learn how your comment data is processed.

High Tech News
Scroll to Top