پیداواری AI۔ ماڈلز انٹرپرائز آپریشنز میں انقلاب لانے کی صلاحیت رکھتے ہیں، لیکن کاروباری اداروں کو احتیاط سے غور کرنا چاہیے کہ ڈیٹا کی حفاظت اور AI سے تیار کردہ مواد کے معیار کو یقینی بنانے جیسے چیلنجوں پر قابو پاتے ہوئے اپنی طاقت کو کس طرح استعمال کیا جائے۔
Retrieval-Augmented Generation (RAG) کا فریم ورک ڈومین سے متعلق مخصوص کاموں کے لیے فاؤنڈیشن ماڈلز کو موثر بنانے کے لیے متعدد ذرائع، جیسے دستاویز کے ذخیرے، ڈیٹا بیس، یا APIs کے بیرونی ڈیٹا کے ساتھ اشارہ کرتا ہے۔ یہ پوسٹ RAG ماڈل کی صلاحیتوں کو پیش کرتی ہے اور MongoDB Atlas کی تبدیلی کی صلاحیت کو اس کے ویکٹر سرچ فیچر کے ساتھ نمایاں کرتی ہے۔
مونگو ڈی بی اٹلس ڈیٹا سروسز کا ایک مربوط مجموعہ ہے جو ڈیٹا سے چلنے والی ایپلی کیشنز کی ترقی کو تیز اور آسان بناتا ہے۔ اس کا ویکٹر ڈیٹا اسٹور بغیر کسی رکاوٹ کے آپریشنل ڈیٹا سٹوریج کے ساتھ ضم ہوجاتا ہے، جس سے علیحدہ ڈیٹا بیس کی ضرورت ختم ہوجاتی ہے۔ یہ انضمام طاقتور سیمنٹک تلاش کی صلاحیتوں کے ذریعے قابل بناتا ہے۔ ویکٹر کی تلاشسیمنٹک سرچ اور AI سے چلنے والی ایپلی کیشنز بنانے کا ایک تیز طریقہ۔
ایمیزون سیج میکر انٹرپرائزز کو مشین لرننگ (ML) ماڈل بنانے، تربیت دینے اور تعینات کرنے کے قابل بناتا ہے۔ ایمیزون سیج میکر جمپ اسٹارٹ ML کے ساتھ شروع کرنے میں آپ کی مدد کے لیے پہلے سے تربیت یافتہ ماڈل اور ڈیٹا فراہم کرتا ہے۔ آپ سیج میکر جمپ سٹارٹ لینڈنگ پیج کے ذریعے پہلے سے تربیت یافتہ ماڈلز اور ڈیٹا تک رسائی، تخصیص اور تعینات کر سکتے ہیں۔ ایمیزون سیج میکر اسٹوڈیو صرف کچھ کلکس کے ساتھ۔
ایمیزون لیکس ایک بات چیت کا انٹرفیس ہے جو کاروباروں کو چیٹ بوٹس اور صوتی بوٹس بنانے میں مدد کرتا ہے جو قدرتی، زندگی بھر کی بات چیت میں مشغول ہوتے ہیں۔ Amazon Lex کو جنریٹیو AI کے ساتھ مربوط کر کے، کاروبار ایک مکمل ماحولیاتی نظام تشکیل دے سکتے ہیں جہاں صارف کی ان پٹ بغیر کسی رکاوٹ کے مربوط اور سیاق و سباق سے متعلقہ جوابات میں منتقل ہو جاتی ہے۔
حل جائزہ
مندرجہ ذیل خاکہ حل کے فن تعمیر کی وضاحت کرتا ہے۔
مندرجہ ذیل حصوں میں، ہم اس حل اور اس کے اجزاء کو لاگو کرنے کے لیے اقدامات کرتے ہیں۔
ایک MongoDB کلسٹر قائم کریں۔
ایک مفت درجے کا MongoDB Atlas کلسٹر بنانے کے لیے، میں دی گئی ہدایات پر عمل کریں۔ ایک کلسٹر بنائیں. ڈیٹا بیس مرتب کریں۔ تک رسائی حاصل اور نیٹ ورک تک رسائی حاصل.
سیج میکر ایمبیڈنگ ماڈل تعینات کریں۔
آپ ایمبیڈنگ ماڈل (ALL MiniLM L6 v2) کا انتخاب کر سکتے ہیں۔ سیج میکر جمپ اسٹارٹ ماڈلز، نوٹ بک، حل صفحہ.
میں سے انتخاب کریں تعینات ماڈل کو تعینات کرنے کے لئے.
تصدیق کریں کہ ماڈل کامیابی کے ساتھ تعینات ہو گیا ہے اور تصدیق کریں کہ اختتامی نقطہ بن گیا ہے۔
ویکٹر ایمبیڈنگ
ویکٹر ایمبیڈنگ متن یا تصویر کو ویکٹر کی نمائندگی میں تبدیل کرنے کا عمل ہے۔ درج ذیل کوڈ کے ساتھ، ہم SageMaker JumpStart کے ساتھ ویکٹر ایمبیڈنگز تیار کر سکتے ہیں اور ہر دستاویز کے لیے تخلیق کردہ ویکٹر کے ساتھ مجموعہ کو اپ ڈیٹ کر سکتے ہیں۔
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
مندرجہ بالا کوڈ سے پتہ چلتا ہے کہ ایک مجموعہ میں کسی ایک چیز کو کیسے اپ ڈیٹ کیا جائے۔ تمام اشیاء کو اپ ڈیٹ کرنے کے لیے اس پر عمل کریں۔ ہدایات.
مونگو ڈی بی ویکٹر ڈیٹا اسٹور
مونگو ڈی بی اٹلس ویکٹر کی تلاش ایک نئی خصوصیت ہے جو آپ کو MongoDB میں ویکٹر ڈیٹا کو ذخیرہ کرنے اور تلاش کرنے کی اجازت دیتی ہے۔ ویکٹر ڈیٹا ڈیٹا کی ایک قسم ہے جو اعلی جہتی جگہ میں ایک نقطہ کی نمائندگی کرتا ہے۔ اس قسم کا ڈیٹا اکثر ایم ایل اور مصنوعی ذہانت کی ایپلی کیشنز میں استعمال ہوتا ہے۔ MongoDB Atlas Vector Search نامی تکنیک استعمال کرتا ہے۔ k-قریب ترین پڑوسی (k-NN) ملتے جلتے ویکٹر تلاش کرنے کے لیے۔ k-NN کسی دیے گئے ویکٹر سے k سب سے زیادہ ملتے جلتے ویکٹرز تلاش کرکے کام کرتا ہے۔ سب سے ملتے جلتے ویکٹر وہ ہیں جو یوکلیڈین فاصلے کے لحاظ سے دیے گئے ویکٹر کے قریب ترین ہوتے ہیں۔
آپریشنل ڈیٹا کے ساتھ ویکٹر ڈیٹا کو ذخیرہ کرنے سے مختلف اسٹوریج سسٹمز کے درمیان ڈیٹا منتقل کرنے کی ضرورت کو کم کرکے کارکردگی کو بہتر بنایا جا سکتا ہے۔ یہ خاص طور پر ان ایپلی کیشنز کے لیے فائدہ مند ہے جنہیں ویکٹر ڈیٹا تک حقیقی وقت تک رسائی کی ضرورت ہوتی ہے۔
ویکٹر سرچ انڈیکس بنائیں
اگلا مرحلہ ایک بنانا ہے۔ مونگو ڈی بی ویکٹر سرچ انڈیکس ویکٹر فیلڈ پر جو آپ نے پچھلے مرحلے میں بنایا تھا۔ MongoDB استعمال کرتا ہے۔ knnVector
انڈیکس ویکٹر ایمبیڈنگ میں ٹائپ کریں۔ ویکٹر فیلڈ کو نمبروں کی ایک صف کے طور پر پیش کیا جانا چاہئے (صرف BSON int32، int64، یا ڈبل ڈیٹا کی قسمیں)۔
کا حوالہ دیتے ہیں knnVector قسم کی حدود کا جائزہ لیں۔ کی حدود کے بارے میں مزید معلومات کے لیے knnVector
قسم
مندرجہ ذیل کوڈ ایک نمونہ انڈیکس کی تعریف ہے:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
نوٹ کریں کہ طول و عرض آپ کے سرایت کرنے والے ماڈل کے طول و عرض سے مماثل ہونا چاہیے۔
ویکٹر ڈیٹا اسٹور سے استفسار کریں۔
آپ ویکٹر ڈیٹا اسٹور سے استفسار کرسکتے ہیں۔ ویکٹر سرچ ایگریگیشن پائپ لائن. یہ ویکٹر سرچ انڈیکس کا استعمال کرتا ہے اور a اصطلاحی تلاش ویکٹر ڈیٹا اسٹور پر۔
درج ذیل کوڈ ایک نمونہ تلاش کی تعریف ہے:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
SageMaker بڑے زبان کے ماڈل کو تعینات کریں۔
سیج میکر جمپ اسٹارٹ فاؤنڈیشن ماڈل پہلے سے تربیت یافتہ بڑے لینگویج ماڈلز (LLMs) ہیں جو کہ مختلف قسم کے قدرتی لینگویج پروسیسنگ (NLP) کے کاموں کو حل کرنے کے لیے استعمال کیے جاتے ہیں، جیسے کہ متن کا خلاصہ، سوال کا جواب دینا، اور قدرتی زبان کا اندازہ۔ وہ مختلف سائز اور ترتیب میں دستیاب ہیں۔ اس حل میں، ہم استعمال کرتے ہیں گلے لگانے والا چہرہ FLAN-T5-XL ماڈل۔
SageMaker JumpStart میں FLAN-T5-XL ماڈل تلاش کریں۔
میں سے انتخاب کریں تعینات FLAN-T5-XL ماڈل قائم کرنے کے لیے۔
تصدیق کریں کہ ماڈل کامیابی کے ساتھ تعینات ہے اور اختتامی نقطہ فعال ہے۔
ایمیزون لیکس بوٹ بنائیں
ایمیزون لیکس بوٹ بنانے کے لیے، درج ذیل مراحل کو مکمل کریں:
- ایمیزون لیکس کنسول پر، منتخب کریں۔ بوٹ بنائیں.
- کے لئے بوٹ کا نام، ایک نام درج کریں۔
- کے لئے رن ٹائم کردارمنتخب ایمیزون لیکس کی بنیادی اجازتوں کے ساتھ ایک کردار بنائیں.
- اپنی زبان کی ترتیبات کی وضاحت کریں، پھر منتخب کریں۔ کیا.
- میں ایک نمونہ کلام شامل کریں۔
NewIntent
UI اور منتخب کریں۔ ارادے کو بچائیں۔. - پر تشریف لے جائیں
FallbackIntent
جو آپ کے لیے بطور ڈیفالٹ اور ٹوگل بنایا گیا تھا۔ ایکٹو میں مکمل سیکشن پر ایک اقتصادی کینڈر سکین کر لیں۔ - میں سے انتخاب کریں تعمیر اور تعمیر کامیاب ہونے کے بعد، منتخب کریں۔ ٹیسٹ.
- جانچ کرنے سے پہلے، گیئر آئیکن کا انتخاب کریں۔
- وضاحت کریں او ڈبلیو ایس لامبڈا۔ فنکشن جو جوابات فراہم کرنے کے لیے MongoDB Atlas اور LLM کے ساتھ تعامل کرے گا۔ لیمبڈا فنکشن بنانے کے لیے فالو کریں۔ ان اقدامات.
- اب آپ LLM کے ساتھ بات چیت کر سکتے ہیں۔
صاف کرو
اپنے وسائل کو صاف کرنے کے لیے، درج ذیل مراحل کو مکمل کریں:
- ایمیزون لیکس بوٹ کو حذف کریں۔
- لیمبڈا فنکشن کو حذف کریں۔
- ایل ایل ایم سیج میکر اینڈ پوائنٹ کو حذف کریں۔
- ایمبیڈنگز ماڈل سیج میکر اینڈ پوائنٹ کو حذف کریں۔
- MongoDB Atlas کلسٹر کو حذف کریں۔
نتیجہ
پوسٹ میں، ہم نے دکھایا کہ ایک سادہ بوٹ کیسے بنایا جائے جو MongoDB Atlas semantic تلاش کا استعمال کرے اور SageMaker JumpStart کے ماڈل کے ساتھ مربوط ہو۔ یہ بوٹ آپ کو سیج میکر جمپ سٹارٹ میں مختلف LLMs کے ساتھ صارف کے تعامل کو تیزی سے پروٹو ٹائپ کرنے کی اجازت دیتا ہے جبکہ انہیں MongoDB Atlas میں شروع ہونے والے سیاق و سباق کے ساتھ جوڑا بناتا ہے۔
ہمیشہ کی طرح، AWS تاثرات کا خیر مقدم کرتا ہے۔ براہ کرم تبصرے کے سیکشن میں اپنی رائے اور سوالات چھوڑیں۔
مصنفین کے بارے میں
ایگور الیکسیف ڈیٹا اور تجزیات کے ڈومین میں AWS میں ایک سینئر پارٹنر سلوشن آرکیٹیکٹ ہے۔ اپنے کردار میں Igor سٹریٹجک شراکت داروں کے ساتھ کام کر رہا ہے جو انہیں پیچیدہ، AWS سے بہتر بنائے گئے فن تعمیرات کی تعمیر میں مدد کر رہا ہے۔ AWS میں شامل ہونے سے پہلے، بطور ڈیٹا/سولیوشن آرکیٹیکٹ اس نے بگ ڈیٹا ڈومین میں بہت سے پروجیکٹس کو لاگو کیا، بشمول ہڈوپ ایکو سسٹم میں کئی ڈیٹا لیکس۔ ڈیٹا انجینئر کے طور پر وہ فراڈ کا پتہ لگانے اور آفس آٹومیشن کے لیے AI/ML کا اطلاق کرنے میں ملوث تھا۔
بابو سری نواسن MongoDB میں ایک سینئر پارٹنر سلوشنز آرکیٹیکٹ ہے۔ اپنے موجودہ کردار میں، وہ AWS اور MongoDB سلوشنز کے لیے تکنیکی انضمام اور ریفرنس آرکیٹیکچرز بنانے کے لیے AWS کے ساتھ کام کر رہا ہے۔ اسے ڈیٹا بیس اور کلاؤڈ ٹیکنالوجیز میں دو دہائیوں سے زیادہ کا تجربہ ہے۔ وہ متعدد جغرافیوں میں متعدد گلوبل سسٹم انٹیگریٹرز (GSIs) کے ساتھ کام کرنے والے صارفین کو تکنیکی حل فراہم کرنے کے بارے میں پرجوش ہیں۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- : ہے
- : ہے
- :کہاں
- $UP
- 100
- 200
- 321
- 361
- 7
- 9
- a
- ہمارے بارے میں
- اوپر
- رفتار کو تیز تر
- تک رسائی حاصل
- کے پار
- فعال
- کے بعد
- مجموعی
- AI
- AI سے چلنے والا
- AI / ML
- تمام
- کی اجازت دیتا ہے
- ہمیشہ
- ایمیزون
- ایمیزون لیکس
- ایمیزون سیج میکر
- ایمیزون سیج میکر جمپ اسٹارٹ
- ایمیزون ویب سروسز
- an
- تجزیاتی
- اور
- APIs
- ایپلی کیشنز
- درخواست دینا
- فن تعمیر
- کیا
- لڑی
- مصنوعی
- مصنوعی ذہانت
- AS
- At
- augments
- میشن
- دستیاب
- AWS
- او ڈبلیو ایس لامبڈا۔
- بنیادی
- BE
- فائدہ مند
- کے درمیان
- بگ
- بگ ڈیٹا
- بوٹ
- خودکار صارف دکھا ئیں
- تعمیر
- کاروبار
- لیکن
- by
- کہا جاتا ہے
- کر سکتے ہیں
- صلاحیتوں
- احتیاط سے
- چیلنجوں
- چیٹ بٹس
- میں سے انتخاب کریں
- صاف
- بادل
- کلسٹر
- کوڈ
- مربوط
- مجموعہ
- تبصروں
- مکمل
- پیچیدہ
- اجزاء
- غور کریں
- کنسول
- مواد
- سیاق و سباق
- سنوادی
- تبدیل کرنا
- تخلیق
- بنائی
- موجودہ
- گاہکوں
- اپنی مرضی کے مطابق
- اعداد و شمار
- ڈیٹا اسٹوریج
- اعداد و شمار پر مبنی ہے
- ڈیٹا بیس
- ڈیٹا بیس
- دہائیوں
- پہلے سے طے شدہ
- غلطی
- تعریف
- تعیناتی
- تعینات
- کھوج
- ترقی
- مختلف
- طول و عرض
- طول و عرض
- فاصلے
- دستاویز
- ڈومین
- دوگنا
- متحرک
- ماحول
- موثر
- ختم کرنا
- سرایت کرنا
- کے قابل بناتا ہے
- اختتام پوائنٹ
- مشغول
- انجینئر
- کو یقینی بنانے ہے
- درج
- انٹرپرائز
- اداروں
- خاص طور پر
- ہر کوئی
- تجربہ
- بیرونی
- فاسٹ
- نمایاں کریں
- آراء
- چند
- میدان
- قطعات
- فلٹر
- تلاش
- پر عمل کریں
- کے بعد
- کے لئے
- فاؤنڈیشن
- فریم ورک
- دھوکہ دہی
- فراڈ کا پتہ لگانے
- مفت
- سے
- تقریب
- گئر
- پیدا
- نسل
- پیداواری
- پیداواری AI۔
- جغرافیے
- حاصل
- دی
- گلوبل
- کنٹرول
- ہے
- he
- مدد
- مدد
- مدد کرتا ہے
- پر روشنی ڈالی گئی
- ان
- کلی
- کس طرح
- کیسے
- HTML
- HTTP
- HTTPS
- آئکن
- وضاحت کرتا ہے
- تصویر
- پر عملدرآمد
- عملدرآمد
- کو بہتر بنانے کے
- in
- سمیت
- انڈکس
- معلومات
- ان پٹ
- ہدایات
- ضم
- انٹیگریٹٹس
- انضمام کرنا
- انضمام
- انضمام
- انٹیلی جنس
- بات چیت
- بات چیت
- بات چیت
- انٹرفیس
- میں
- ملوث
- IT
- میں
- شمولیت
- JSON
- صرف
- جھیلوں
- لینڈنگ
- زبان
- بڑے
- سیکھنے
- چھوڑ دو
- زندگی بھر
- حدود
- ایل ایل ایم
- مشین
- مشین لرننگ
- بنا
- بہت سے
- میچ
- ML
- ماڈل
- ماڈل
- منگو ڈی بی
- زیادہ
- سب سے زیادہ
- منتقل
- ایک سے زیادہ
- ضروری
- نام
- قدرتی
- قدرتی زبان عملیات
- ضرورت ہے
- نیٹ ورک
- نئی
- اگلے
- ویزا
- اب
- تعداد
- اعتراض
- اشیاء
- of
- دفتر
- اکثر
- on
- والوں
- صرف
- آپریشنل
- آپریشنز
- or
- شروع کرنا
- پر قابو پانے
- مجموعی جائزہ
- صفحہ
- جوڑی
- پارٹنر
- شراکت داروں کے
- جذباتی
- راستہ
- کارکردگی
- کارکردگی کا مظاہرہ
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- مہربانی کرکے
- پوائنٹ
- پوسٹ
- ممکنہ
- طاقت
- طاقتور
- تحفہ
- پچھلا
- پہلے
- عمل
- پروسیسنگ
- منصوبوں
- پروٹوٹائپ
- فراہم
- فراہم کرتا ہے
- فراہم کرنے
- معیار
- سوال
- سوالات
- جلدی سے
- اصل وقت
- کو کم کرنے
- حوالہ
- متعلقہ
- نمائندگی
- نمائندگی
- کی نمائندگی کرتا ہے
- کی ضرورت
- وسائل
- جوابات
- انقلاب
- کردار
- حفاظت کرنا
- sagemaker
- سکور
- بغیر کسی رکاوٹ کے
- تلاش کریں
- سیکشن
- سیکشنز
- سینئر
- علیحدہ
- سروسز
- مقرر
- ترتیبات
- کئی
- ہونا چاہئے
- سے ظاہر ہوا
- شوز
- اسی طرح
- سادہ
- آسان بنانے
- ایک
- سائز
- حل
- حل
- حل
- ذرائع
- خلا
- شروع
- مرحلہ
- مراحل
- ذخیرہ
- ذخیرہ
- حکمت عملی
- اسٹریٹجک شراکت دار
- کامیاب
- کامیابی کے ساتھ
- اس طرح
- سویٹ
- کے نظام
- سسٹمز
- کاموں
- ٹیکنیکل
- تکنیک
- ٹیکنالوجی
- شرائط
- ٹیسٹ
- ٹیسٹنگ
- متن
- سے
- کہ
- ۔
- ان
- ان
- تو
- وہ
- اس
- کے ذریعے
- درجے
- کرنے کے لئے
- ٹرین
- تبدیلی
- منتقلی
- سچ
- دو
- قسم
- اقسام
- ui
- اپ ڈیٹ کریں
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- استعمال
- کا استعمال کرتے ہوئے
- مختلف اقسام کے
- اس بات کی تصدیق
- وائس
- چلنا
- تھا
- راستہ..
- we
- ویب
- ویب خدمات
- خیرمقدم ہے۔
- جبکہ
- گے
- ساتھ
- کام کر
- کام کرتا ہے
- تم
- اور
- زیفیرنیٹ