Anthropic کی اگلی نسل کے AI ماڈل Claude 3 Opus نے چیٹ بوٹ ایرینا لیڈر بورڈ پر پول پوزیشن حاصل کی ہے، جس نے OpenAI کے GPT-4 کو دوسرے بہترین مقام پر دھکیل دیا ہے۔
چونکہ اسے پچھلے سال لانچ کیا گیا تھا، یہ پہلا موقع ہے کہ کلاڈ 3 اوپس ماڈل نے چیٹ بوٹ ایرینا کی فہرست میں سرفہرست مقام حاصل کیا ہے، جس کے تینوں کلاڈ 3 ورژن ٹاپ 10 میں ہیں۔
کلاڈ 3 ماڈل ایک نشان بناتے ہیں۔
LMSYS چیٹ بوٹ ایرینا درجہ بندی سے پتہ چلتا ہے کہ Claude 3 Sonnet نے Gemini Pro کے ساتھ مشترکہ چوتھی پوزیشن حاصل کی ہے جبکہ Claude 3 Haiku، جو اس سال لانچ کیا گیا تھا، GPT-4 کے پہلے ورژن کے ساتھ چھٹے نمبر پر ہے۔
اگرچہ کلاڈ 3 ہائیکو سونیٹ یا اوپس کی طرح ذہین نہیں ہوسکتا ہے، ماڈل تیز اور نمایاں طور پر سستا ہے، پھر بھی یہ "بلائنڈ ٹیسٹوں پر زیادہ بڑے ماڈلز جتنا اچھا ہے،" جیسا کہ میدان کے نتائج سے ظاہر ہوتا ہے۔
"Claude 3 Haiku نے سب کو متاثر کیا ہے، یہاں تک کہ ہمارے صارف کی ترجیح کے مطابق GPT-4 کی سطح تک پہنچ گیا ہے! اس کی رفتار، صلاحیتیں اور سیاق و سباق کی لمبائی اب مارکیٹ میں بے مثال ہے،" LMSYS نے وضاحت کی۔
ٹام کی گائیڈ کے مطابق، ہائیکو کو جو چیز زیادہ متاثر کن بناتی ہے وہ یہ ہے کہ یہ "جیمنی نینو سے موازنہ کرنے والا مقامی سائز کا ماڈل ہے۔" یہ ہو سکتا ہے معلومات سے بھرپور تحقیق کو پڑھیں اور اس پر کارروائی کریں۔ تین سیکنڈ سے بھی کم وقت میں کاغذات۔
یہ ماڈل Opus کے ٹریلین پلس پیرامیٹر اسکیل یا GPT-4 کلاس کے کسی بھی ماڈل کے بغیر بھی شاندار نتائج حاصل کر رہا ہے۔
[میدان کی تازہ کاری]
70K+ نئے ایرینا ووٹ🗳️ داخل ہیں!
Claude-3 ہائیکو نے سب کو متاثر کیا ہے، یہاں تک کہ ہمارے صارف کی ترجیح کے مطابق GPT-4 کی سطح تک پہنچ گیا ہے! اس کی رفتار، صلاحیتیں اور سیاق و سباق کی لمبائی اب مارکیٹ میں بے مثال ہے۔
مبارک ہو @AnthropicAI ناقابل یقین Claude-3 لانچ پر!
زیادہ دلچسپ… pic.twitter.com/p1Guuf0B3K
— lmsys.org (@lmsysorg) مارچ 26، 2024
کیا یہ قلیل المدتی کامیابی ہو سکتی ہے؟
دوسری پوزیشن پر دھکیلنے کے باوجود، OpenAI کے GPT-4 ورژن اب بھی چار ورژن کے ساتھ فہرست میں ٹاپ 10 پر حاوی ہیں۔
کے مطابق ٹام گائیڈ، OpenAI کے GPT-4 ورژن اپنی مختلف شکلوں میں "اتنے عرصے سے سرفہرست مقام پر فائز رہے ہیں کہ اس کے معیارات کے قریب آنے والا کوئی دوسرا ماڈل GPT-4 کلاس ماڈل کے طور پر جانا جاتا ہے۔"
اس سال کچھ وقت متوقع "نمایاں طور پر مختلف" GPT-5 کے ساتھ، Anthropic اس پوزیشن کو زیادہ دیر تک برقرار نہیں رکھ سکتا، کیونکہ Claude 3 Opus اور GPT-4 کے درمیان سکور کا فرق کم ہے۔
اگرچہ اوپن اے آئی نے اس کی اصل ریلیز پر خاموشی اختیار کی ہے۔ GPT-5، مارکیٹ اس کے آغاز کی بہت زیادہ توقع کر رہی ہے۔ مبینہ طور پر ماڈل کچھ سے گزر رہا ہے۔ "سخت حفاظتی جانچاور نقلی حملے جو کہ رہائی سے پہلے اہم ہیں۔
LMSYS چیٹ بوٹ ایرینا
یہ درجہ بندی انسانی ووٹوں پر انحصار کرتی ہے، جیسا کہ AI ماڈلز کے لیے بینچ مارکنگ کی دیگر اقسام کے برعکس ہے۔ اس کے ساتھ، لوگ ایک ہی پرامپٹ پر دو مختلف ماڈلز کے آؤٹ پٹ کو اندھا درجہ دیتے ہیں۔
چیٹ بوٹ ایرینا LMSYS کے ذریعے چلایا جاتا ہے اور اس میں بہت سے بڑے لینگویج ماڈلز (LLMs) شامل ہیں جو "گمنام بے ترتیب لڑائیوں" میں اس سے لڑ رہے ہیں۔
اسے پہلی بار گزشتہ مئی میں لانچ کیا گیا تھا اور اس نے ان صارفین سے 400,000 سے زیادہ ووٹ اکٹھے کیے ہیں جن کے پاس گوگل، اینتھروپک اور AI ماڈلز ہیں۔ اوپنائی.
"LMSYS چیٹ بوٹ ایرینا LLM ایولز کے لیے ایک کراؤڈ سورسڈ اوپن پلیٹ فارم ہے۔ ہم نے ایلو رینکنگ سسٹم کے ساتھ ایل ایل ایم کی درجہ بندی کرنے کے لیے 400,000 سے زیادہ انسانی ترجیحی ووٹ اکٹھے کیے ہیں،" LMSYS نے کہا۔
ایلو سسٹم زیادہ تر شطرنج جیسے کھیلوں میں کسی کھلاڑی کی متعلقہ مہارت کا اندازہ لگانے کے لیے استعمال ہوتا ہے۔ لیکن اس معاملے میں، درجہ بندی کا اطلاق چیٹ بوٹ پر ہوتا ہے اور "ماڈل استعمال کرنے والے انسان پر نہیں۔"
مزید پڑھئے: مائیکروسافٹ نے Copilot AI بٹن کے ساتھ 'پہلے' سرفیس پی سی کا انکشاف کیا۔
کوتاہیاں
چیٹ بوٹ ایرینا کی درجہ بندی میں خامیوں کی کمی نہیں ہے۔ Tom's Guide کے مطابق، اس میں شامل تمام ماڈلز یا ماڈلز کے ورژن شامل نہیں ہیں جبکہ صارفین کو بعض اوقات GPT-4 لوڈ ہونے میں ناکامی کے برے تجربات ہوتے ہیں۔ یہ کچھ ماڈلز کو بھی پسند کر سکتا ہے جن کے پاس براہ راست انٹرنیٹ تک رسائی ہے، مثال کے طور پر گوگل جیمنی پرو۔
جبکہ دوسرے ماڈلز جیسے فرانسیسی AI سٹارٹ اپ سے مجرم اور علی بابا جیسی چینی فرموں نے حال ہی میں اوپن سورس ماڈلز کے علاوہ میدان میں سرفہرست مقام حاصل کیا ہے، میدان اب بھی کچھ ہائی پروفائل ماڈلز سے محروم ہے۔ مثال کے طور پر، اس میں گوگل کے جیمنی پرو 1.5 جیسے ماڈل غائب ہیں۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://metanews.com/claude-3-opus-takes-top-spot-on-chatbot-rankings/
- : ہے
- : ہے
- : نہیں
- 000
- 1
- 10
- 14
- 26٪
- 400
- 7
- 8
- 9
- a
- تک رسائی حاصل
- کے مطابق
- حصول
- اصل
- اس کے علاوہ
- AI
- اے آئی ماڈلز
- Alibaba
- تمام
- بھی
- an
- اور
- بشری
- متوقع ہے
- کوئی بھی
- اطلاقی
- کیا
- میدان
- AS
- حملے
- برا
- لڑائیوں
- لڑائی
- BE
- اس سے پہلے
- کیا جا رہا ہے
- بینچ مارکنگ
- معیارات
- BEST
- کے درمیان
- لیکن
- by
- کر سکتے ہیں
- صلاحیتوں
- کیس
- چیٹ بٹ
- سستی
- شطرنج
- چینی
- کلوز
- آنے والے
- موازنہ
- سیاق و سباق
- اہم
- مختلف
- کرتا
- غلبہ
- اس سے قبل
- اندازہ
- بھی
- توقع
- تجربات
- وضاحت کی
- ناکامی
- تیز تر
- غلطیاں
- کی حمایت
- خصوصیات
- فرم
- پہلا
- پہلی بار
- کے لئے
- فارم
- چار
- چوتھے نمبر پر
- فرانسیسی
- سے
- کھیل
- فرق
- جیمنی
- نسل
- اچھا
- گوگل
- گوگل
- عظیم
- رہنمائی
- ہے
- Held
- ہائی
- انتہائی
- پکڑو
- میزبان
- HTTPS
- انسانی
- متاثر
- متاثر کن
- in
- شامل
- شامل
- ناقابل اعتماد
- مثال کے طور پر
- انٹیلجنٹ
- انٹرنیٹ
- انٹرنیٹ تک رسائی
- IT
- میں
- مشترکہ
- JPEG
- جانا جاتا ہے
- زبان
- بڑے
- بڑے
- آخری
- آخری سال
- شروع
- شروع
- لیڈربورڈ
- لمبائی
- کم
- سطح
- کی طرح
- لسٹ
- رہتے ہیں
- ایل ایل ایم
- لوڈ
- لانگ
- بنا
- بنا
- بناتا ہے
- مارکیٹ
- مئی..
- شاید
- یاد ہے
- لاپتہ
- ماڈل
- ماڈل
- زیادہ
- زیادہ تر
- بہت
- نینو
- تنگ
- نئی
- اگلے
- اب
- of
- on
- ایک
- کھول
- اوپن سورس
- اوپنائی
- مخالفت کی
- or
- دیگر
- ہمارے
- باہر
- پیداوار
- پر
- کاغذات
- پیرامیٹر
- پی سی
- لوگ
- پلیٹ فارم
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- کھلاڑی
- علاوہ
- پوزیشن
- فی
- عمل
- پروفائل
- دھکیل دیا
- دھکیلنا
- بے ترتیب
- درجہ بندی
- رینکنگ
- رینکنگ
- پہنچنا
- پڑھیں
- حال ہی میں
- رشتہ دار
- جاری
- انحصار کرتا ہے
- رہے
- مبینہ طور پر
- نتائج کی نمائش
- ظاہر
- پتہ چلتا
- رن
- سیفٹی
- کہا
- اسی
- پیمانے
- اسکور
- دوسری
- سیکنڈ
- مختصر
- دکھائیں
- نمایاں طور پر
- چھٹی
- سائز
- مہارت
- So
- کچھ
- کبھی کبھی
- تیزی
- کمرشل
- مقامات
- شروع
- ابھی تک
- کامیابی
- سطح
- کے نظام
- لیا
- لیتا ہے
- ٹیسٹ
- سے
- کہ
- ۔
- ان
- اس
- اس سال
- ان
- تین
- وقت
- کرنے کے لئے
- مل کر
- بھی
- سب سے اوپر
- اوپر 10
- سب سے اوپر
- ٹریلین
- سچ
- ٹویٹر
- دو
- گزر رہا ہے
- بے مثال
- اپ ڈیٹ کریں
- استعمال کیا جاتا ہے
- رکن کا
- صارفین
- کا استعمال کرتے ہوئے
- مختلف
- ورژن
- ورژن
- ووٹ
- تھا
- راستہ..
- کیا
- جس
- جبکہ
- ساتھ
- بغیر
- سال
- ابھی
- زیفیرنیٹ