هوش مصنوعی مولد مدلها این پتانسیل را دارند که عملیات سازمانی را متحول کنند، اما کسبوکارها باید به دقت در نظر بگیرند که چگونه از قدرت خود استفاده کنند و در عین حال بر چالشهایی مانند حفاظت از دادهها و اطمینان از کیفیت محتوای تولید شده توسط هوش مصنوعی غلبه کنند.
چارچوب Retrieval-Augmented Generation (RAG) با دادههای خارجی از منابع متعدد، مانند مخازن اسناد، پایگاههای داده یا APIها، درخواستها را تقویت میکند تا مدلهای بنیادی را برای وظایف خاص دامنه مؤثر کند. این پست قابلیت های مدل RAG را ارائه می دهد و پتانسیل تحول آفرین MongoDB Atlas را با ویژگی جستجوی برداری آن برجسته می کند.
MongoDB اطلس مجموعه ای یکپارچه از خدمات داده است که توسعه برنامه های کاربردی داده محور را تسریع و ساده می کند. ذخیره داده های برداری آن به طور یکپارچه با ذخیره سازی داده های عملیاتی ادغام می شود و نیاز به یک پایگاه داده جداگانه را از بین می برد. این ادغام قابلیت های قدرتمند جستجوی معنایی را از طریق امکان پذیر می کند جستجوی برداری، راهی سریع برای ساخت جستجوی معنایی و برنامه های کاربردی مبتنی بر هوش مصنوعی.
آمازون SageMaker شرکت ها را قادر می سازد تا مدل های یادگیری ماشینی (ML) را بسازند، آموزش دهند و به کار گیرند. Amazon SageMaker JumpStart مدل ها و داده های از پیش آموزش دیده را برای کمک به شما در شروع کار با ML ارائه می دهد. میتوانید از طریق صفحه فرود SageMaker JumpStart به مدلها و دادههای از پیش آموزشدیده، سفارشیسازی و استقرار دهید. Amazon SageMaker Studio فقط با چند کلیک
آمازون لکس یک رابط مکالمه است که به کسب و کارها کمک می کند ربات های چت و ربات های صوتی ایجاد کنند که در تعاملات طبیعی و واقعی شرکت می کنند. با ادغام آمازون لکس با هوش مصنوعی مولد، کسبوکارها میتوانند یک اکوسیستم کل نگر ایجاد کنند که در آن ورودی کاربر به طور یکپارچه به پاسخهای منسجم و مرتبط با زمینه تبدیل میشود.
بررسی اجمالی راه حل
نمودار زیر معماری راه حل را نشان می دهد.
در قسمت های بعدی مراحل پیاده سازی این راه حل و اجزای آن را طی می کنیم.
یک خوشه MongoDB راه اندازی کنید
برای ایجاد یک خوشه MongoDB Atlas لایه رایگان، دستورالعملهای موجود را دنبال کنید یک خوشه ایجاد کنید. پایگاه داده را راه اندازی کنید دسترسی و شبکه دسترسی.
مدل تعبیه SageMaker را اجرا کنید
می توانید مدل تعبیه شده (ALL MiniLM L6 v2) را بر روی آن انتخاب کنید مدلها، نوتبوکها، راهحلهای SageMaker JumpStart احتمال برد مراجعه کنید.
را انتخاب کنید گسترش برای استقرار مدل
بررسی کنید که مدل با موفقیت مستقر شده است و تأیید کنید که نقطه پایانی ایجاد شده است.
جاسازی وکتور
جاسازی وکتور فرآیند تبدیل یک متن یا تصویر به یک نمایش برداری است. با کد زیر میتوانیم با SageMaker JumpStart جاسازیهای برداری تولید کنیم و مجموعه را با بردار ایجاد شده برای هر سند بهروزرسانی کنیم:
payload = {"text_inputs": [document[field_name_to_be_vectorized]]}
query_response = query_endpoint_with_json_payload(json.dumps(payload).encode('utf-8'))
embeddings = parse_response_multiple_texts(query_response) # update the document
update = {'$set': {vector_field_name : embeddings[0]}}
collection.update_one(query, update)
کد بالا نحوه به روز رسانی یک شی واحد در یک مجموعه را نشان می دهد. برای به روز رسانی تمام اشیاء، موارد زیر را دنبال کنید دستورالعمل.
ذخیره اطلاعات برداری MongoDB
جستجوی برداری اطلس MongoDB ویژگی جدیدی است که به شما امکان می دهد داده های برداری را در MongoDB ذخیره و جستجو کنید. داده های برداری نوعی داده است که نقطه ای را در فضایی با ابعاد بالا نشان می دهد. این نوع داده اغلب در برنامه های کاربردی ML و هوش مصنوعی استفاده می شود. MongoDB Atlas Vector Search از تکنیکی به نام استفاده می کند k-نزدیک ترین همسایگان (k-NN) برای جستجوی بردارهای مشابه. k-NN با یافتن k شبیه ترین بردارها به یک بردار معین کار می کند. مشابه ترین بردارها بردارهایی هستند که از نظر فاصله اقلیدسی به بردار داده شده نزدیکترند.
ذخیره داده های برداری در کنار داده های عملیاتی می تواند با کاهش نیاز به انتقال داده ها بین سیستم های ذخیره سازی مختلف، عملکرد را بهبود بخشد. این به ویژه برای برنامه هایی که نیاز به دسترسی بلادرنگ به داده های برداری دارند مفید است.
یک فهرست جستجوی برداری ایجاد کنید
مرحله بعدی ایجاد یک است فهرست جستجوی برداری بردار MongoDB در قسمت برداری که در مرحله قبل ایجاد کردید. MongoDB از knnVector
جاسازی های برداری را تایپ کنید تا نمایه شود. فیلد برداری باید به صورت آرایه ای از اعداد نمایش داده شود (فقط BSON int32، int64 یا دو نوع داده).
به مراجعه محدودیت های نوع knnVector را مرور کنید برای اطلاعات بیشتر در مورد محدودیت های knnVector
تایپ کنید
کد زیر یک نمونه تعریف شاخص است:
{ "mappings": { "dynamic": true, "fields": { "egVector": { "dimensions": 384, "similarity": "euclidean", "type": "knnVector" } } }
}
توجه داشته باشید که بعد باید با ابعاد مدل تعبیهها مطابقت داشته باشد.
ذخیره داده های برداری را پرس و جو کنید
می توانید با استفاده از پرس و جو از ذخیره داده های برداری استفاده کنید خط لوله جمع آوری جستجوی برداری. از نمایه جستجوی برداری استفاده می کند و a را انجام می دهد جستجوی معنایی در فروشگاه داده های برداری
کد زیر یک تعریف نمونه جستجو است:
{ $search: { "index": "<index name>", // optional, defaults to "default" "knnBeta": { "vector": [<array-of-numbers>], "path": "<field-to-search>", "filter": {<filter-specification>}, "k": <number>, "score": {<options>} } }
}
مدل زبان بزرگ SageMaker را اجرا کنید
مدل های پایه SageMaker JumpStart مدل های زبان بزرگ (LLM) از پیش آموزش دیده ای هستند که برای حل انواع وظایف پردازش زبان طبیعی (NLP) مانند خلاصه سازی متن، پاسخ به سؤال و استنتاج زبان طبیعی استفاده می شوند. آنها در اندازه ها و پیکربندی های مختلف موجود هستند. در این راه حل از در آغوش کشیدن صورت مدل FLAN-T5-XL.
مدل FLAN-T5-XL را در SageMaker JumpStart جستجو کنید.
را انتخاب کنید گسترش برای راه اندازی مدل FLAN-T5-XL.
بررسی کنید که مدل با موفقیت مستقر شده است و نقطه پایانی فعال است.
یک ربات آمازون لکس ایجاد کنید
برای ایجاد ربات آمازون لکس، مراحل زیر را انجام دهید:
- در کنسول آمازون لکس، انتخاب کنید ایجاد ربات.
- برای نام ربات، یک نام وارد کنید.
- برای نقش زمان اجرا، انتخاب کنید با مجوزهای اساسی آمازون لکس یک نقش ایجاد کنید.
- تنظیمات زبان خود را مشخص کنید، سپس انتخاب کنید انجام شده.
- یک عبارت نمونه را در
NewIntent
UI و انتخاب کنید صرفه جویی در قصد. - حرکت به
FallbackIntent
که به صورت پیش فرض برای شما ایجاد شده و تغییر دهید فعال در تکمیل بخش. - را انتخاب کنید ساختن و پس از موفقیت آمیز بودن ساخت، انتخاب کنید تست.
- قبل از آزمایش، نماد چرخ دنده را انتخاب کنید.
- مشخص AWS لامبدا عملکردی که با MongoDB Atlas و LLM برای ارائه پاسخ تعامل خواهد داشت. برای ایجاد تابع لامبدا دنبال کنید این مراحل.
- اکنون می توانید با LLM تعامل داشته باشید.
پاک کردن
برای پاکسازی منابع خود، مراحل زیر را انجام دهید:
- ربات آمازون لکس را حذف کنید.
- تابع Lambda را حذف کنید.
- نقطه پایانی LLM SageMaker را حذف کنید.
- نقطه پایانی SageMaker مدل جاسازی ها را حذف کنید.
- خوشه MongoDB Atlas را حذف کنید.
نتیجه
در این پست، نحوه ایجاد یک ربات ساده را نشان دادیم که از جستجوی معنایی MongoDB Atlas استفاده می کند و با مدلی از SageMaker JumpStart ادغام می شود. این ربات به شما امکان می دهد تا به سرعت از تعامل کاربر با LLM های مختلف در SageMaker Jumpstart نمونه سازی کنید، در حالی که آنها را با زمینه منشاء MongoDB Atlas جفت کنید.
مثل همیشه، AWS از بازخورد استقبال می کند. لطفا نظرات و سوالات خود را در قسمت نظرات مطرح کنید.
درباره نویسندگان
ایگور آلکسیف یک معمار راه حل شریک ارشد در AWS در حوزه داده و تجزیه و تحلیل است. ایگور در نقش خود با شرکای استراتژیک همکاری می کند و به آنها کمک می کند تا معماری های پیچیده و بهینه شده AWS بسازند. قبل از پیوستن به AWS، بهعنوان معمار داده/راهحل، او پروژههای زیادی را در حوزه دادههای بزرگ اجرا کرد، از جمله چندین دریاچه داده در اکوسیستم Hadoop. به عنوان یک مهندس داده، او در استفاده از AI/ML برای کشف تقلب و اتوماسیون اداری شرکت داشت.
بابو سرینیواسان یک معمار ارشد راه حل های شریک در MongoDB است. در نقش فعلی خود، او در حال کار با AWS برای ایجاد یکپارچگی فنی و معماری مرجع برای راه حل های AWS و MongoDB است. او بیش از دو دهه تجربه در زمینه فناوری های پایگاه داده و ابری دارد. او مشتاق ارائه راهحلهای فنی برای مشتریانی است که با چندین سیستم ادغامکننده سیستم جهانی (GSI) در مناطق مختلف جغرافیایی کار میکنند.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoData.Network Vertical Generative Ai. به خودت قدرت بده دسترسی به اینجا.
- PlatoAiStream. هوش وب 3 دانش تقویت شده دسترسی به اینجا.
- PlatoESG. کربن ، CleanTech، انرژی، محیط، خورشیدی، مدیریت پسماند دسترسی به اینجا.
- PlatoHealth. هوش بیوتکنولوژی و آزمایشات بالینی. دسترسی به اینجا.
- منبع: https://aws.amazon.com/blogs/machine-learning/retrieval-augmented-generation-with-langchain-amazon-sagemaker-jumpstart-and-mongodb-atlas-semantic-search/
- : دارد
- :است
- :جایی که
- $UP
- 100
- 200
- 321
- 361
- 7
- 9
- a
- درباره ما
- بالاتر
- شتاب دادن
- دسترسی
- در میان
- فعال
- پس از
- تجمع
- AI
- مجهز به هوش مصنوعی
- AI / ML
- معرفی
- اجازه می دهد تا
- همیشه
- آمازون
- آمازون لکس
- آمازون SageMaker
- Amazon SageMaker JumpStart
- آمازون خدمات وب
- an
- علم تجزیه و تحلیل
- و
- رابط های برنامه کاربردی
- برنامه های کاربردی
- با استفاده از
- معماری
- هستند
- صف
- مصنوعی
- هوش مصنوعی
- AS
- At
- تقویت می کند
- اتوماسیون
- در دسترس
- AWS
- AWS لامبدا
- اساسی
- BE
- مفید
- میان
- بزرگ
- بزرگ داده
- ربات
- رباتها
- ساختن
- کسب و کار
- اما
- by
- نام
- CAN
- قابلیت های
- Осторожно
- چالش ها
- chatbots
- را انتخاب کنید
- تمیز
- ابر
- خوشه
- رمز
- منسجم
- مجموعه
- نظرات
- کامل
- پیچیده
- اجزاء
- در نظر بگیرید
- کنسول
- محتوا
- زمینه
- محاورهای
- تبدیل
- ایجاد
- ایجاد شده
- جاری
- مشتریان
- سفارشی
- داده ها
- ذخیره سازی داده ها
- داده محور
- پایگاه داده
- پایگاه های داده
- دهه
- به طور پیش فرض
- پیش فرض
- تعریف
- گسترش
- مستقر
- کشف
- پروژه
- مختلف
- بعد
- ابعاد
- فاصله
- سند
- دامنه
- دو برابر
- پویا
- اکوسیستم
- موثر
- از بین بردن
- تعبیه کردن
- را قادر می سازد
- نقطه پایانی
- تعامل
- مهندس
- حصول اطمینان از
- وارد
- سرمایه گذاری
- شرکت
- به خصوص
- هر
- تجربه
- خارجی
- FAST
- ویژگی
- باز خورد
- کمی از
- رشته
- زمینه
- فیلتر
- پیدا کردن
- به دنبال
- پیروی
- برای
- پایه
- چارچوب
- تقلب
- کشف تقلب
- رایگان
- از جانب
- تابع
- چرخ دنده
- تولید می کنند
- نسل
- مولد
- هوش مصنوعی مولد
- جغرافیاها
- دریافت کنید
- داده
- جهانی
- دهنه
- آیا
- he
- کمک
- کمک
- کمک می کند
- های لایت
- خود را
- جامع
- چگونه
- چگونه
- HTML
- HTTP
- HTTPS
- ICON
- نشان می دهد
- تصویر
- انجام
- اجرا
- بهبود
- in
- از جمله
- شاخص
- اطلاعات
- ورودی
- دستورالعمل
- یکپارچه
- ادغام
- ادغام
- ادغام
- یکپارچگی
- اطلاعات
- تعامل
- اثر متقابل
- فعل و انفعالات
- رابط
- به
- گرفتار
- IT
- ITS
- پیوستن
- json
- تنها
- دریاچه ها
- فرود
- زبان
- بزرگ
- یادگیری
- ترک کردن
- واقعی
- محدودیت
- LLM
- دستگاه
- فراگیری ماشین
- ساخت
- بسیاری
- مسابقه
- ML
- مدل
- مدل
- MongoDB
- بیش
- اکثر
- حرکت
- چندگانه
- باید
- نام
- طبیعی
- پردازش زبان طبیعی
- نیاز
- شبکه
- جدید
- بعد
- nlp
- اکنون
- تعداد
- هدف
- اشیاء
- of
- دفتر
- غالبا
- on
- آنهایی که
- فقط
- قابل استفاده
- عملیات
- or
- سرچشمه
- فائق آمدن
- مروری
- با ما
- جفت کردن
- شریک
- شرکای
- احساساتی
- مسیر
- کارایی
- انجام می دهد
- افلاطون
- هوش داده افلاطون
- PlatoData
- لطفا
- نقطه
- پست
- پتانسیل
- قدرت
- قوی
- هدیه
- قبلی
- قبلا
- روند
- در حال پردازش
- پروژه ها
- نمونه اولیه
- ارائه
- فراهم می کند
- ارائه
- کیفیت
- سوال
- سوالات
- به سرعت
- زمان واقعی
- کاهش
- مرجع
- مربوط
- نمایندگی
- نمایندگی
- نشان دهنده
- نیاز
- منابع
- پاسخ
- انقلابی کردن
- نقش
- حفاظت
- حکیم ساز
- نمره
- یکپارچه
- جستجو
- بخش
- بخش
- ارشد
- جداگانه
- خدمات
- تنظیم
- تنظیمات
- چند
- باید
- نشان داد
- نشان می دهد
- مشابه
- ساده
- ساده کردن
- تنها
- اندازه
- راه حل
- مزایا
- حل
- منابع
- فضا
- آغاز شده
- گام
- مراحل
- ذخیره سازی
- opbevare
- استراتژیک
- شرکای استراتژیک
- موفق
- موفقیت
- چنین
- دنباله
- سیستم
- سیستم های
- وظایف
- فنی
- تکنیک
- فن آوری
- قوانین و مقررات
- آزمون
- تست
- متن
- نسبت به
- که
- La
- شان
- آنها
- سپس
- آنها
- این
- از طریق
- ردیف
- به
- قطار
- دگرگونی
- گذار
- درست
- دو
- نوع
- انواع
- ui
- بروزرسانی
- استفاده کنید
- استفاده
- کاربر
- استفاده
- با استفاده از
- تنوع
- بررسی
- صدا
- راه رفتن
- بود
- مسیر..
- we
- وب
- خدمات وب
- خوش آمدید
- در حین
- اراده
- با
- کارگر
- با این نسخهها کار
- شما
- شما
- زفیرنت