Testirao sam Claude Sonnet 4.5 protiv ChatGPT-5 i Opus 4.1: Rezultati će vas iznenaditi
8 min čitanja

Loading youtube content...
Sadržaj
Kada je Claude (Anthropic) objavio Sonnet 4.5 tvrdeći da je to "najbolji model za kodiranje na svijetu", znao sam da ga moram testirati.
Uostalom, ChatGPT-5 je upravo izašao i napravio valove u AI zajednici. A Opus 4.1 je mjesecima bio omiljeni kralj AI-ja za kodiranje. Može li ovaj novi Sonnet model doista nadmašiti oboje?
Odlučio sam sve tri modele staviti kroz iste izazove kodiranja kako bih vidio koji najbolje funkcionira u stvarnim scenarijima. Ono što sam otkrio promijenilo je moju perspektivu o tome kako trebamo razmišljati o "najboljem" AI asistentu za kodiranje.
Metodologija testiranja
Kako bih sve održao poštenim, svakom modelu dao sam potpuno iste upute i izazove. Bez pomoći, bez prilagodbi između pokušaja (barem na početku). Samo čista izvedba.
Evo što sam testirao:
Izazov 1: Razvoj igre
Zamolio sam svaki model da napravi potpuno funkcionalnu Angry Birds igru koja radi u pregledniku. Zahtjevi su bili jednostavni: učini je zabavnom, dodaj animacije, osiguraj da stvarno radi i učini je vizualno privlačnom.
Izazov 2: Dizajn odredišne stranice
Zamolio sam svaki model da napravi profesionalnu odredišnu stranicu za agenciju za email marketing. Cilj je bio dizajn fokusiran na konverziju s odgovarajućim tekstom, vizualnom privlačnošću i pridržavanjem postojećih smjernica brenda.
Modeli su imali pristup referentnim materijalima i mogli su postavljati dodatna pitanja. Želio sam vidjeti kako se nose sa složenim zadacima iz stvarnog svijeta s kojima se programeri i dizajneri svakodnevno susreću.
Rezultati: Iznenađujuće putovanje
Prije nego što uđem u detalje, želim podijeliti nešto što me stvarno iznenadilo: Niti jedan model nije pobijedio u svim kategorijama. Svaki je briljirao na različite načine, otkrivajući da "najbolji" uvelike ovisi o tome što pokušavate postići.
ChatGPT-5: Kralj vizualne kreativnosti
ChatGPT-5 je apsolutno briljirao u Angry Birds izazovu. Kad kažem briljirao, mislim da je napravio nešto čemu stvarno želiš igrati. Fizika ptica i blokova bila je zadovoljavajuća, animacije su bile glatke, a ukupni izgled imao je onaj "još jedna runda" faktor.
Ono što me najviše impresioniralo bio je vizualni dizajn. ChatGPT-5 je razumio da igra mora biti više od funkcionalne - mora biti privlačna. Dodao je suptilne gradijente, efekte čestica za sudare, pa čak i ekran završetka razine koji je bio uglađen.
Međutim, kad je došlo do odredišne stranice, stvari su postale manje impresivne. Dizajn je bio estetski ugodan, ali nije slijedio vlastiti zadatak. Ignorirao je smjernice brenda koje sam pružio, a tekst je djelovao generično. Bio je tip stranice koji bi mogao osvojiti nagradu za dizajn, ali ne bi nužno konvertirao posjetitelje.
Opus 4.1: Dosljedni izvođač
Opus 4.1 bio je pouzdani izvođač u skupini. U obama izazovima isporučio je točno ono što bi očekivao od iskusnog senior programera - nije bljesnuo, ali je bio solidan u svakom detalju.
Angry Birds igra radila je savršeno od prvog pokušaja. Fizika je bila precizna, kontrole su bile responsive, a kod je bio čist i dobro organiziran. Da sam ovo dao klijentu, bio bi zadovoljan. Ali ako sam iskren, nedostajala mu je ona magija ChatGPT-5 verzije.
Gdje je Opus 4.1 stvarno briljirao bila je odredišna stranica. Pažljivo je pročitao smjernice brenda, koristio točnu paletu boja i strukturirao sadržaj točno kako sam specificirao. Tekst je bio namjeran - svaka sekcija imala je jasnu svrhu u korisničkom putovanju.
Ako želiš programera na kojeg se možeš osloniti da isporuči predvidive kvalitetne rezultate, Opus 4.1 je tvoj izbor. Neće te iznenaditi divljom kreativnošću, ali neće ni zakazati.
Claude Sonnet 4.5: Suradničko iznenađenje
Sonnet 4.5 me potpuno iznenadio, ali ne iz razloga koje sam očekivao. Umjesto da pokuša odmah isporučiti savršeno rješenje, postavio je pitanja. Mnogo pitanja.
Za izazov igre:
- "Koju razinu težine ciljate za prvu razinu?"
- "Preferirate li više arkadnu ili realističniju fiziku?"
- "Postoji li određeni umjetnički stil koji imate na umu?"
- "Treba li biti optimizirano za desktop, mobitel ili oboje?"
U početku sam bio blago frustriran. Ostali modeli su samo počeli graditi. Ali onda sam shvatio nešto: Sonnet 4.5 je radio ono što bi stvarno dobar programer napravio - osiguravao se da razumije problem prije nego što počne kodirati.
Nakon što sam odgovorio na pitanja, rezultati su bili izvanredni. Igra nije samo bila funkcionalna i vizualno privlačna - osjećala se kao da je bila napravljena posebno za moj slučaj uporabe. Fizika je odgovarala mojim preferencijama, korisničko sučelje je bilo optimizirano za platforme koje sam spomenuo, pa čak i komentari koda izgledali su prilagođeni mom stilu rada.
Odredišna stranica je bila ista priča. Nakon sesije pitanja i odgovora o ciljanoj publici i ciljevima konverzije, stvorio je nešto što se osjećalo pažljivo dizajnirano. Nije to bila samo generička odredišna stranica - bila je odredišna stranica napravljena za moje specifične poslovne potrebe.
Prava objava: Poboljšanje kroz suradnju
Evo gdje su stvari postale stvarno zanimljive. Nakon početnih rundi, pokušao sam raditi sa svakim modelom na usavršavanju njihovih rezultata. Ovdje su razlike postale još jasnije.
Poboljšanje s ChatGPT-5
ChatGPT-5 je bio odličan u vizualnim iteracijama. Kad sam tražio promjene u animacijama ili dizajnu, brzo ih je implementirao i često dodavao poboljšanja na koja nisam pomislio. Ali kad sam ga pokušao natjerati da bliže prati smjernice brenda, borio se. Bilo je kao da je njegova kreativnost bila toliko snažna da ju je bilo teško ukrotiti.
Poboljšanje s Opus 4.1
Opus 4.1 je postupao s povratnim informacijama točno kako bi očekivao: profesionalno i učinkovito. Napravio je promjene koje sam tražio bez problema. Ali rijetko je predlagao poboljšanja izvan onoga što sam konkretno tražio. Bio je odličan izvršitelj, ali ne proaktivni suradnik.
Poboljšanje s Sonnet 4.5
Ovo je bilo suradničko iskustvo koje je promijenilo moju perspektivu. Kad bi tražio promjene, Sonnet 4.5 bi često došao natrag s pojašnjenjima:
"Želim učiniti ovu hero sekciju privlačnijom. Pokušavam li je učiniti vizualno privlačnijom ili jasnijom u pogledu poruke? Ili oboje?"
Ili:
"Primijetio sam da želiš promijeniti fiziku igre. Trebam li prilagoditi i težinu kako bih kompenzirao, ili želiš da bude namjerno lakše/teže?"
Bilo je kao da radim sa senior programerom koji aktivno razmišlja o većem problemu, a ne samo izvršava zadatke.
Presuda: Nema univerzalnog pobjednika
Nakon tjedana testiranja ovih modela, moj zaključak je kontraintuivan: Ne bi trebao birati jednog "pobjednika".
Evo kako sada razmišljam o njima:
Koristi ChatGPT-5 kad:
- Trebaš kreativne vizualne koncepte i istraživanje dizajna
- Radiš na nečemu gdje je estetika jednako važna kao funkcionalnost
- Želiš vidjeti kreativne mogućnosti na koje ne bi pomislio
- Spreman si dati specifične povratne informacije kako bi ga usmjerio prema tvojim ciljevima
Koristi Opus 4.1 kad:
- Imaš jasne i dobro definirane zahtjeve
- Trebaš pouzdano i predvidivo izvršenje
- Radiš s strogim smjernicama brenda ili tehničkim ograničenjima
- Želiš čist i dobro organiziran kod bez iznenađenja
Koristi Sonnet 4.5 kad:
- Tvoj problem je složen i imao bi koristi od rasprave
- Želiš suradnika, ne samo izvršitelja
- Otvoren si za usavršavanje svojih zahtjeva kroz razgovor
- Cijenjiš promišljena rješenja koja uzimaju u obzir šire implikacije
Veća lekcija
Testiranje ova tri modela naučilo me nečemu važnom o AI općenito: Ne radi se o pronalaženju "najboljeg" alata - radi se o razumijevanju snaga svakog alata i kada ih koristiti.
U svojoj praksi razvoja sada koristim sva tri, često za različite dijelove istog projekta. Možda počnem sa Sonnet 4.5 kako bih uskladio arhitekturu i zahtjeve, koristim Opus 4.1 za osnovnu implementaciju i pozivam se na ChatGPT-5 kad mi treba ta kreativna iskra za sučelje.
Tvrdnja Anthropica da je Sonnet 4.5 "najbolji model za kodiranje na svijetu" tehnički je točna - ali ne na način na koji sam očekivao. Nije najbolji jer pobjeđuje sve druge modele u svakom zadatku. Najbolji je jer mijenja odnos koji imaš s AI-jem za kodiranje od "alata" do "suradnika".
Moja preporuka
Ako moram odabrati samo jedan za nekoga tko počinje s AI kodiranjem:
Za početnike: Počni s ChatGPT-5. Njegova kreativnost i vizualna svestranost učinit će učenje ugodnijim, a njegova sposobnost generiranja koda koji "samo radi" je odlična dok još učiš.
Za srednje programere: Opus 4.1 će biti tvoj najbolji prijatelj. Njegova dosljednost i pouzdanost postat će neprocjenjive dok gradiš složenije projekte.
Za napredne programere: Sonnet 4.5. Ako već znaš koja pitanja postavljati i kako strukturirati probleme, njegov suradnički pristup učinit će te produktivnijim nego što bi bio sam.
Ali iskreno? Ako možeš, koristi sva tri. Moj mjesečni AI proračun je porastao, ali i moja produktivnost. Važnije, kvaliteta onoga što gradim poboljšala se jer koristim pravi alat za svaki posao.
Završne misli
Rat AI kodiranja ne radi se o tome tko pobjeđuje konkurente - radi se o tome koliko dobro nam ovi alati mogu pomoći da gradimo bolje stvari brže. U tom smislu, sva tri su pobjednici.
Claude Sonnet 4.5 može biti "najbolji" u benchmark testovima, ali u stvarnom svijetu, najbolji alat je onaj koji odgovara tvojim potrebama u tom trenutku. Ponekad je to kreativnost ChatGPT-5. Ponekad je to pouzdanost Opus 4.1. A ponekad je to suradnički pristup Sonnet 4.5.
Prava moć dolazi iz znanja kada koristiti koji i fleksibilnosti da se prebacuješ između njih dok se tvoje potrebe razvijaju.
Watch the full testing process here: https://youtu.be/TAGUl0Xj7xg