আমি Claude Sonnet 4.5 vs ChatGPT-5 vs Opus 4.1 পরীক্ষা করেছি: ফলাফল আপনাকে অবাক করবে
8 মিনিট পড়তে

Loading youtube content...
সূচিপত্র
যখন Claude (Anthropic) Sonnet 4.5 লঞ্চ করল এটা দাবি করে যে এটি "বিশ্বের সেরা কোডিং মডেল", আমি জানতাম যে আমাকে এটি পরীক্ষা করতে হবে।
সর্বোপরি, ChatGPT-5 সবেমাত্র মুক্তি পেয়েছিল এবং AI সম্প্রদায়ে ঢেউ তুলেছিল। এবং Opus 4.1 মাসের পর মাস কোডিং AI-এর প্রিয় রাজা ছিল। এই নতুন Sonnet মডেল কি সত্যিই উভয়কে হারাতে পারে?
আমি তিনটি মডেলকেই একই কোডিং চ্যালেঞ্জের মধ্য দিয়ে রাখার সিদ্ধান্ত নিয়েছিলাম দেখতে যে কোনটি বাস্তব-বিশ্বের পরিস্থিতিতে সবচেয়ে ভাল কাজ করে। আমি যা আবিষ্কার করেছি তা আমার দৃষ্টিভঙ্গি পরিবর্তন করেছে যে আমাদের "সেরা" AI কোডিং সহায়ক সম্পর্কে কীভাবে চিন্তা করা উচিত।
পরীক্ষার পদ্ধতি
জিনিসগুলি ন্যায্য রাখতে, আমি প্রতিটি মডেলকে হুবহু একই প্রম্পট এবং চ্যালেঞ্জ দিয়েছিলাম। কোনও সাহায্য নেই, প্রচেষ্টার মধ্যে কোনও সমন্বয় নেই (অন্তত শুরুতে)। শুধুমাত্র খাঁটি পারফরম্যান্স।
এখানে আমি যা পরীক্ষা করেছি:
চ্যালেঞ্জ 1: গেম ডেভেলপমেন্ট
আমি প্রতিটি মডেলকে ব্রাউজারে কাজ করে এমন একটি সম্পূর্ণ কার্যকরী Angry Birds গেম তৈরি করতে বলেছিলাম। প্রয়োজনীয়তাগুলি সহজ ছিল: এটিকে মজাদার করুন, অ্যানিমেশন যোগ করুন, নিশ্চিত করুন যে এটি আসলে কাজ করে এবং এটিকে দৃশ্যত আকর্ষণীয় করুন।
চ্যালেঞ্জ 2: ল্যান্ডিং পেজ ডিজাইন
আমি প্রতিটি মডেলকে একটি ইমেল মার্কেটিং এজেন্সির জন্য একটি পেশাদার ল্যান্ডিং পেজ তৈরি করতে বলেছিলাম। লক্ষ্য ছিল উপযুক্ত কপি, ভিজ্যুয়াল আবেদন এবং বিদ্যমান ব্র্যান্ড নির্দেশিকা মেনে চলা সহ একটি রূপান্তর-কেন্দ্রিক ডিজাইন।
মডেলগুলির রেফারেন্স উপকরণগুলিতে অ্যাক্সেস ছিল এবং তারা ফলো-আপ প্রশ্ন জিজ্ঞাসা করতে পারত। আমি দেখতে চেয়েছিলাম যে তারা জটিল বাস্তব-বিশ্বের কাজগুলি কীভাবে পরিচালনা করে যা ডেভেলপার এবং ডিজাইনাররা প্রতিদিন মুখোমুখি হয়।
ফলাফল: একটি আশ্চর্যজনক যাত্রা
বিস্তারিত জানার আগে, আমি এমন কিছু শেয়ার করতে চাই যা সত্যিই আমাকে অবাক করেছে: কোনও মডেলই সমস্ত বিভাগে জিতেনি। প্রতিটি বিভিন্ন উপায়ে উৎকৃষ্ট ছিল, প্রকাশ করে যে "সেরা" আপনি যা অর্জন করার চেষ্টা করছেন তার উপর অনেক নির্ভর করে।
ChatGPT-5: ভিজ্যুয়াল সৃজনশীলতার রাজা
ChatGPT-5 Angry Birds চ্যালেঞ্জে একেবারে উজ্জ্বল ছিল। যখন আমি উজ্জ্বল বলি, আমার মানে হল এটি এমন কিছু তৈরি করেছে যা আপনি সত্যিই খেলতে চান। পাখি এবং ব্লকের পদার্থবিদ্যা সন্তোষজনক অনুভূত হয়েছিল, অ্যানিমেশনগুলি মসৃণ ছিল এবং সামগ্রিক চেহারায় সেই "আরও এক রাউন্ড" ফ্যাক্টর ছিল।
যা আমাকে সবচেয়ে বেশি মুগ্ধ করেছিল তা হল ভিজ্যুয়াল ডিজাইন। ChatGPT-5 বুঝতে পেরেছে যে একটি গেমকে কার্যকরী হওয়ার চেয়ে বেশি হতে হবে - এটি নিমগ্ন হতে হবে। এটি সূক্ষ্ম গ্রেডিয়েন্ট, সংঘর্ষের জন্য কণা প্রভাব এবং এমনকি একটি পালিশ করা লেভেল সমাপ্তি স্ক্রীন যোগ করেছে।
তবে, যখন ল্যান্ডিং পেজের কথা আসে, তখন জিনিসগুলি কম প্রভাবশালী হয়ে ওঠে। ডিজাইনটি নান্দনিকভাবে মনোরম ছিল কিন্তু নিজের সংক্ষিপ্তবিবরণী অনুসরণ করেনি। এটি আমার প্রদত্ত ব্র্যান্ড নির্দেশিকা উপেক্ষা করেছে এবং কপিটি সাধারণ মনে হয়েছে। এটি এমন ধরনের পৃষ্ঠা ছিল যা ডিজাইন পুরস্কার জিততে পারে কিন্তু অগত্যা দর্শকদের রূপান্তর করবে না।
Opus 4.1: ধারাবাহিক সম্পাদক
Opus 4.1 গ্রুপের নির্ভরযোগ্য সম্পাদক ছিল। উভয় চ্যালেঞ্জে, এটি ঠিক তাই সরবরাহ করেছে যা আপনি একজন অভিজ্ঞ সিনিয়র ডেভেলপারের কাছ থেকে আশা করবেন - চটকদার নয় কিন্তু প্রতিটি বিবরণে কঠিন।
Angry Birds গেম প্রথম প্রচেষ্টা থেকেই নিখুঁতভাবে কাজ করেছে। পদার্থবিদ্যা নিখুঁত ছিল, নিয়ন্ত্রণগুলি প্রতিক্রিয়াশীল ছিল এবং কোড পরিষ্কার এবং সুসংগঠিত ছিল। যদি আমি এটি একজন ক্লায়েন্টকে দিতাম, তারা সন্তুষ্ট হতো। কিন্তু সৎ হতে, এটি ChatGPT-5 সংস্করণের সেই জাদু অভাব ছিল।
যেখানে Opus 4.1 সত্যিই উজ্জ্বল ছিল তা হল ল্যান্ডিং পেজ। এটি সাবধানে ব্র্যান্ড নির্দেশিকা পড়েছে, সঠিক রঙ প্যালেট ব্যবহার করেছে এবং বিষয়বস্তুটি ঠিক আমি যেভাবে নির্দিষ্ট করেছি সেভাবে গঠন করেছে। কপি উদ্দেশ্যমূলক মনে হয়েছে - প্রতিটি বিভাগের ব্যবহারকারীর যাত্রায় একটি স্পষ্ট উদ্দেশ্য ছিল।
আপনি যদি এমন একজন ডেভেলপার চান যার উপর আপনি ভরসা করতে পারেন যে তিনি পূর্বাভাসযোগ্য মানের ফলাফল সরবরাহ করবেন, Opus 4.1 হল আপনার পছন্দ। এটি আপনাকে বন্য সৃজনশীলতার সাথে অবাক করবে না, তবে এটি ব্যর্থও হবে না।
Claude Sonnet 4.5: সহযোগিতার বিস্ময়
Sonnet 4.5 আমাকে সম্পূর্ণরূপে অবাক করেছে, কিন্তু আমি যে কারণগুলি আশা করছিলাম তার জন্য নয়। অবিলম্বে একটি নিখুঁত সমাধান সরবরাহ করার চেষ্টা করার পরিবর্তে, এটি প্রশ্ন জিজ্ঞাসা করেছে। অনেক প্রশ্ন।
গেম চ্যালেঞ্জের জন্য:
- "আপনি প্রথম স্তরের জন্য কোন অসুবিধা স্তর লক্ষ্য করছেন?"
- "আপনি কি আরও আর্কেড বা আরও বাস্তবসম্মত পদার্থবিদ্যা পছন্দ করেন?"
- "কোন নির্দিষ্ট শিল্পকলা শৈলী আছে যা আপনার মাথায় আছে?"
- "এটি ডেস্কটপ, মোবাইল বা উভয়ের জন্য অপ্টিমাইজ করা উচিত?"
শুরুতে, আমি সামান্য হতাশ ছিলাম। অন্যান্য মডেলগুলি কেবল নির্মাণ শুরু করেছিল। কিন্তু তারপর আমি কিছু উপলব্ধি করলাম: Sonnet 4.5 যা করছিল তা হল একজন সত্যিকারের ভাল ডেভেলপার যা করবে - কোডিং শুরু করার আগে সমস্যাটি বোঝে তা নিশ্চিত করা।
প্রশ্নের উত্তর দেওয়ার পরে, ফলাফলগুলি উল্লেখযোগ্য ছিল। গেমটি কেবল কার্যকরী এবং দৃশ্যত আবেদনময় ছিল না - এটি অনুভূত হয়েছিল যেন এটি বিশেষভাবে আমার ব্যবহারের ক্ষেত্রের জন্য তৈরি করা হয়েছে। পদার্থবিদ্যা আমার পছন্দের সাথে মিলে গেছে, UI আমি উল্লেখ করা প্ল্যাটফর্মগুলির জন্য অপ্টিমাইজ করা হয়েছে এবং এমনকি কোড মন্তব্যগুলি আমার কাজের শৈলীতে সাজানো বলে মনে হয়েছে।
ল্যান্ডিং পেজ একই গল্প ছিল। লক্ষ্য দর্শক এবং রূপান্তর লক্ষ্য সম্পর্কে একটি প্রশ্ন-উত্তর সেশনের পরে, এটি এমন কিছু তৈরি করেছে যা সাবধানে ডিজাইন করা মনে হয়েছে। এটি কেবল একটি সাধারণ ল্যান্ডিং পেজ ছিল না - এটি আমার নির্দিষ্ট ব্যবসায়িক প্রয়োজনের জন্য তৈরি একটি ল্যান্ডিং পেজ ছিল।
প্রকৃত প্রকাশ: সহযোগিতার মাধ্যমে উন্নতি
এখানে জিনিসগুলি সত্যিই আকর্ষণীয় হয়ে ওঠে। প্রাথমিক রাউন্ডের পরে, আমি প্রতিটি মডেলের সাথে তাদের আউটপুট পরিমার্জন করার জন্য কাজ করার চেষ্টা করেছি। এখানে পার্থক্যগুলি আরও স্পষ্ট হয়ে ওঠে।
ChatGPT-5 এর সাথে উন্নতি
ChatGPT-5 ভিজ্যুয়াল পুনরাবৃত্তিতে দুর্দান্ত ছিল। যখন আমি অ্যানিমেশন বা ডিজাইনে পরিবর্তনের জন্য অনুরোধ করেছি, এটি দ্রুত সেগুলি বাস্তবায়ন করেছে এবং প্রায়শই উন্নতি যোগ করেছে যা আমি ভাবিনি। কিন্তু যখন আমি এটিকে ব্র্যান্ড নির্দেশিকা আরও ঘনিষ্ঠভাবে অনুসরণ করার চেষ্টা করেছি, এটি সংগ্রাম করেছে। এটি এমন ছিল যেন এর সৃজনশীলতা এতটাই শক্তিশালী ছিল যে এটি নিয়ন্ত্রণ করা কঠিন ছিল।
Opus 4.1 এর সাথে উন্নতি
Opus 4.1 ঠিক যেভাবে আপনি আশা করবেন সেভাবে প্রতিক্রিয়া পরিচালনা করেছে: পেশাদার এবং দক্ষ। এটি আমার অনুরোধ করা পরিবর্তনগুলি কোনও সমস্যা ছাড়াই করেছে। কিন্তু এটি খুব কমই আমি বিশেষভাবে অনুরোধ করেছি তার বাইরে উন্নতি প্রস্তাব করেছে। এটি একটি চমৎকার নির্বাহক ছিল, কিন্তু একটি সক্রিয় সহযোগী নয়।
Sonnet 4.5 এর সাথে উন্নতি
এটি সহযোগিতামূলক অভিজ্ঞতা ছিল যা আমার দৃষ্টিভঙ্গি পরিবর্তন করেছে। যখন আপনি পরিবর্তনের জন্য অনুরোধ করেছিলেন, Sonnet 4.5 প্রায়শই স্পষ্টীকরণের সাথে ফিরে এসেছে:
"আমি এই হিরো বিভাগটিকে আরও আকর্ষক করতে চাই। আমি কি এটিকে দৃশ্যত আরও আবেদনময় বা বার্তার ক্ষেত্রে আরও স্পষ্ট করার চেষ্টা করছি? নাকি উভয়?"
অথবা:
"আমি লক্ষ্য করেছি যে আপনি গেম পদার্থবিদ্যা পরিবর্তন করতে চান। আমি কি এটি ক্ষতিপূরণ করতে অসুবিধা সামঞ্জস্য করা উচিত, নাকি আপনি চান এটি ইচ্ছাকৃতভাবে সহজ/কঠিন হোক?"
এটি এমন ছিল যেন আমি একজন সিনিয়র ডেভেলপারের সাথে কাজ করছিলাম যিনি সক্রিয়ভাবে বৃহত্তর সমস্যা সম্পর্কে চিন্তা করছেন, শুধু কাজ সম্পাদন করছেন না।
রায়: কোনও সর্বজনীন বিজয়ী নেই
এই মডেলগুলি সপ্তাহের পর সপ্তাহ পরীক্ষা করার পর, আমার উপসংহার প্রতিকূল-সহজাত: আপনার একটি "বিজয়ী" বেছে নেওয়া উচিত নয়।
এখানে আমি এখন তাদের সম্পর্কে কীভাবে ভাবি:
ChatGPT-5 ব্যবহার করুন যখন:
- আপনার সৃজনশীল ভিজ্যুয়াল ধারণা এবং ডিজাইন অন্বেষণ প্রয়োজন
- আপনি এমন কিছুতে কাজ করছেন যেখানে নান্দনিকতা কার্যকারিতা হিসাবে গুরুত্বপূর্ণ
- আপনি সৃজনশীল সম্ভাবনা দেখতে চান যা আপনি ভাবতে পারেননি
- আপনি আপনার লক্ষ্যের দিকে এটি গাইড করতে নির্দিষ্ট প্রতিক্রিয়া দিতে ইচ্ছুক
Opus 4.1 ব্যবহার করুন যখন:
- আপনার স্পষ্ট এবং সুসংজ্ঞায়িত প্রয়োজনীয়তা রয়েছে
- আপনার নির্ভরযোগ্য এবং পূর্বাভাসযোগ্য সম্পাদন প্রয়োজন
- আপনি কঠোর ব্র্যান্ড নির্দেশিকা বা প্রযুক্তিগত সীমাবদ্ধতা সহ কাজ করছেন
- আপনি বিস্ময় ছাড়া পরিষ্কার এবং সুসংগঠিত কোড চান
Sonnet 4.5 ব্যবহার করুন যখন:
- আপনার সমস্যা জটিল এবং আলোচনা থেকে উপকৃত হবে
- আপনি একজন সহযোগী চান, শুধু একজন নির্বাহক নয়
- আপনি কথোপকথনের মাধ্যমে আপনার প্রয়োজনীয়তাগুলি পরিমার্জন করতে উন্মুক্ত
- আপনি চিন্তাশীল সমাধানগুলি মূল্য দেন যা বৃহত্তর প্রভাবগুলি বিবেচনা করে
বৃহত্তর পাঠ
এই তিনটি মডেল পরীক্ষা করা আমাকে সাধারণভাবে AI সম্পর্কে গুরুত্বপূর্ণ কিছু শিখিয়েছে: এটি "সেরা" সরঞ্জাম খুঁজে পাওয়ার বিষয়ে নয় - এটি প্রতিটি সরঞ্জামের শক্তি বোঝা এবং কখন সেগুলি ব্যবহার করতে হবে সে সম্পর্কে।
আমার উন্নয়ন অনুশীলনে, আমি এখন তিনটিই ব্যবহার করি, প্রায়শই একই প্রকল্পের বিভিন্ন অংশের জন্য। সম্ভবত আমি স্থাপত্য এবং প্রয়োজনীয়তা সূক্ষ্ম সুর করতে Sonnet 4.5 দিয়ে শুরু করি, মূল বাস্তবায়নের জন্য Opus 4.1 ব্যবহার করি এবং যখন আমার ইন্টারফেসের জন্য সেই সৃজনশীল স্ফুলিঙ্গের প্রয়োজন হয় তখন ChatGPT-5 ডাকি।
Anthropic-এর দাবি যে Sonnet 4.5 হল "বিশ্বের সেরা কোডিং মডেল" প্রযুক্তিগতভাবে সত্য - কিন্তু আমি যেভাবে আশা করেছিলাম সেভাবে নয়। এটি সেরা নয় কারণ এটি প্রতিটি কাজে অন্যান্য সমস্ত মডেল পরাজিত করে। এটি সেরা কারণ এটি AI কোডিং এর সাথে আপনার সম্পর্ককে "সরঞ্জাম" থেকে "সহযোগী" তে পরিবর্তন করে।
আমার সুপারিশ
যদি আমাকে AI কোডিং শুরু করা কারও জন্য মাত্র একটি বেছে নিতে হয়:
শিক্ষানবিসদের জন্য: ChatGPT-5 দিয়ে শুরু করুন। এর সৃজনশীলতা এবং ভিজ্যুয়াল বহুমুখিতা শেখাকে আরও উপভোগ্য করে তুলবে এবং এর কোড তৈরি করার ক্ষমতা যা "শুধু কাজ করে" আপনি এখনও শিখছেন যখন দুর্দান্ত।
মধ্যবর্তী ডেভেলপারদের জন্য: Opus 4.1 আপনার সেরা বন্ধু হবে। এর সামঞ্জস্য এবং নির্ভরযোগ্যতা অমূল্য হয়ে উঠবে যখন আপনি আরও জটিল প্রকল্প তৈরি করবেন।
উন্নত ডেভেলপারদের জন্য: Sonnet 4.5। আপনি যদি ইতিমধ্যে জানেন কোন প্রশ্ন জিজ্ঞাসা করতে হবে এবং কীভাবে সমস্যাগুলি গঠন করতে হবে, এর সহযোগিতামূলক পদ্ধতি আপনাকে একা থাকার চেয়ে আরও উত্পাদনশীল করে তুলবে।
কিন্তু সৎভাবে? আপনি যদি পারেন, তিনটিই ব্যবহার করুন। আমার মাসিক AI সাবস্ক্রিপশন বাজেট বৃদ্ধি পেয়েছে, কিন্তু আমার উত্পাদনশীলতাও। আরও গুরুত্বপূর্ণ, আমি যা তৈরি করি তার মান উন্নত হয়েছে কারণ আমি প্রতিটি কাজের জন্য সঠিক সরঞ্জাম ব্যবহার করছি।
চূড়ান্ত চিন্তা
AI কোডিং যুদ্ধ কে তাদের প্রতিযোগীদের পরাজিত করে তা নিয়ে নয় - এটি এই সরঞ্জামগুলি আমাদের দ্রুত আরও ভাল জিনিস তৈরি করতে কতটা ভাল সাহায্য করতে পারে তা নিয়ে। সেই অর্থে, তিনটিই বিজয়ী।
Claude Sonnet 4.5 বেঞ্চমার্ক পরীক্ষায় "সেরা" হতে পারে, কিন্তু বাস্তব জগতে, সেরা সরঞ্জাম হল যা সেই মুহূর্তে আপনার প্রয়োজনের সাথে খাপ খায়। কখনও কখনও এটি ChatGPT-5-এর সৃজনশীলতা। কখনও কখনও এটি Opus 4.1-এর নির্ভরযোগ্যতা। এবং কখনও কখনও এটি Sonnet 4.5-এর সহযোগিতামূলক পদ্ধতি।
প্রকৃত শক্তি আসে কখন কোনটি ব্যবহার করতে হবে তা জানা এবং আপনার প্রয়োজন বিকশিত হওয়ার সাথে সাথে তাদের মধ্যে স্যুইচ করার নমনীয়তা থেকে।
Watch the full testing process here: https://youtu.be/TAGUl0Xj7xg