ایمیزون کیندر مشین لرننگ (ML) سے چلنے والی ایک انتہائی درست اور استعمال میں آسان ذہین تلاش کی خدمت ہے۔ Amazon Kendra ڈیٹا سورس کنیکٹرز کا ایک مجموعہ پیش کرتا ہے تاکہ آپ کا مواد جہاں بھی رہتا ہو اسے ہضم کرنے اور انڈیکس کرنے کے عمل کو آسان بنا سکے۔
تنظیموں میں قیمتی ڈیٹا کو سٹرکچرڈ اور غیر ساختہ دونوں ذخیروں میں محفوظ کیا جاتا ہے۔ انٹرپرائز کی تلاش کا حل آپ کو مکمل طور پر منظم تجربہ فراہم کرنے اور انٹرپرائز میں مختلف ڈیٹا ذرائع سے آپ کے مواد کی انڈیکس کرنے کے عمل کو آسان بنانے کے قابل ہونا چاہیے۔
ایسی ہی ایک غیر ساختہ ڈیٹا ریپوزٹری اندرونی اور بیرونی ویب سائٹس ہیں۔ ویب سائٹ کے ڈیٹا کی بنیاد پر سوالات کے جوابات دینے کے لیے نیوز فیڈز بنانے، زبان کے استعمال کا تجزیہ کرنے، یا بوٹس بنانے کے لیے سائٹس کو کرال کرنے کی ضرورت پڑ سکتی ہے۔
ہمیں یہ اعلان کرتے ہوئے خوشی ہو رہی ہے کہ اب آپ نئے Amazon Kendra Web Crawler کا استعمال اندرونی اور بیرونی ویب سائٹس میں محفوظ کردہ مواد سے جوابات تلاش کرنے یا چیٹ بوٹس بنانے کے لیے کر سکتے ہیں۔ اس پوسٹ میں، ہم دکھاتے ہیں کہ ویب سائٹس میں ذخیرہ شدہ معلومات کو کیسے انڈیکس کیا جائے اور اندرونی اور بیرونی ویب سائٹس میں محفوظ مواد سے جوابات تلاش کرنے کے لیے Amazon Kendra میں ذہین تلاش کا استعمال کیا جائے۔ اس کے علاوہ، ML سے چلنے والی ذہین تلاش قدرتی زبان کے بیانیہ کے مواد کے ساتھ غیر ساختہ دستاویزات سے آپ کے سوالات کے جوابات درست طریقے سے حاصل کر سکتی ہے، جس کے لیے مطلوبہ الفاظ کی تلاش زیادہ موثر نہیں ہے۔
ویب کرالر درج ذیل نئی خصوصیات پیش کرتا ہے:
- بنیادی، NTLM/Kerberos، فارم، اور SAML تصدیق کے لیے سپورٹ
- 100 سیڈ یو آر ایل کی وضاحت کرنے اور کنکشن کنفیگریشن کو اسٹور کرنے کی صلاحیت ایمیزون سادہ اسٹوریج سروس (ایمیزون S3)
- پراکسی اسناد فراہم کرنے کی اہلیت کے ساتھ ویب اور انٹرنیٹ پراکسی کے لیے سپورٹ
- متحرک مواد کو رینگنے کے لیے سپورٹ، جیسے کہ جاوا اسکرپٹ پر مشتمل ویب سائٹ
- فیلڈ میپنگ اور ریجیکس فلٹرنگ کی خصوصیات
حل جائزہ
Amazon Kendra کے ساتھ، آپ اپنے دستاویز کے ذخیرے میں تلاش کرنے کے لیے ایک مرکزی جگہ فراہم کرنے کے لیے متعدد ڈیٹا ذرائع کو ترتیب دے سکتے ہیں۔ ہمارے حل کے لیے، ہم یہ ظاہر کرتے ہیں کہ Amazon Kendra Web Crawler کا استعمال کرتے ہوئے کرال شدہ ویب سائٹ کو کیسے انڈیکس کیا جائے۔ حل مندرجہ ذیل اقدامات پر مشتمل ہے:
- ویب سائٹ کے لیے تصدیقی طریقہ کار کا انتخاب کریں (اگر ضرورت ہو) اور تفصیلات کو اس میں محفوظ کریں۔ AWS سیکرٹس مینیجر.
- ایمیزون کینڈر انڈیکس بنائیں۔
- Amazon Kendra کنسول کے ذریعے ایک ویب کرالر ڈیٹا سورس V2 بنائیں۔
- حل کو جانچنے کے لیے ایک نمونہ استفسار چلائیں۔
شرائط
Amazon Kendra Web Crawler کو آزمانے کے لیے، آپ کو درج ذیل کی ضرورت ہے:
تصدیق کی تفصیلات جمع کریں۔
محفوظ اور محفوظ ویب سائٹس کے لیے، درج ذیل توثیق کی اقسام اور معیارات تعاون یافتہ ہیں:
- بنیادی
- NTLM/Kerberos
- فارم کی توثیق
- فروخت
جب آپ ڈیٹا سورس سیٹ اپ کرتے ہیں تو آپ کو تصدیقی معلومات کی ضرورت ہوتی ہے۔
بنیادی یا NTLM تصدیق کے لیے، آپ کو اپنے سیکرٹس مینیجر کا راز، صارف کا نام، اور پاس ورڈ فراہم کرنے کی ضرورت ہے۔
فارم اور SAML تصدیق کے لیے اضافی معلومات درکار ہیں، جیسا کہ درج ذیل اسکرین شاٹ میں دکھایا گیا ہے۔ کچھ فیلڈز جیسے رکن کا نام کا بٹن Xpath اختیاری ہیں اور اس بات پر منحصر ہوں گے کہ آیا آپ جس سائٹ کو کرال کر رہے ہیں وہ صارف کا نام درج کرنے کے بعد بٹن استعمال کرتی ہے۔ یہ بھی نوٹ کریں کہ آپ کو یہ جاننے کی ضرورت ہوگی کہ صارف کا نام اور پاس ورڈ فیلڈ اور جمع کرانے والے بٹنوں کے Xpath کا تعین کیسے کریں۔
ایمیزون کینڈر انڈیکس بنائیں
ایمیزون کینڈر انڈیکس بنانے کے لیے، درج ذیل مراحل کو مکمل کریں:
- ایمیزون کینڈر کنسول پر، منتخب کریں۔ ایک انڈیکس بنائیں.
- کے لئے اشاریہ کا نامانڈیکس کے لیے ایک نام درج کریں (مثال کے طور پر، ویب کرالر)۔
- ایک اختیاری تفصیل درج کریں۔
- کے لئے کردار کا نام، IAM کردار کا نام درج کریں۔
- اختیاری خفیہ کاری کی ترتیبات اور ٹیگز کو ترتیب دیں۔
- میں سے انتخاب کریں اگلے.
- میں صارف تک رسائی کے کنٹرول کو ترتیب دیں۔ سیکشن، ترتیبات کو ان کے ڈیفالٹ پر چھوڑ دیں اور منتخب کریں۔ اگلے.
- کے لئے پروویژننگ ایڈیشنمنتخب ڈویلپر ایڈیشن اور منتخب کریں اگلے.
- جائزہ کے صفحے پر، منتخب کریں۔ تخلیق کریں.
یہ IAM کے کردار کو تخلیق کرتا ہے اور اس کی تشہیر کرتا ہے اور پھر Amazon Kendra انڈیکس بناتا ہے، جس میں 30 منٹ تک کا وقت لگ سکتا ہے۔
ایک Amazon Kendra Web Crawler ڈیٹا سورس بنائیں
اپنا ڈیٹا ماخذ بنانے کے لیے درج ذیل مراحل کو مکمل کریں:
- ایمیزون کینڈر کنسول پر، منتخب کریں۔ اعداد و شمار ذرائع نیوی گیشن پین میں.
- تلاش کریں WebCrawler کنیکٹر V2.0 ٹائل اور منتخب کریں کنیکٹر شامل کریں۔.
- کے لئے ڈیٹا سورس کا نام، ایک نام درج کریں (مثال کے طور پر، crawl-fda)۔
- ایک اختیاری تفصیل درج کریں۔
- میں سے انتخاب کریں اگلے.
- میں ماخذ سیکشن، منتخب کریں ماخذ یو آر ایل اور URL درج کریں۔ اس پوسٹ کے لیے، ہم استعمال کرتے ہیں۔ https://www.fda.gov/ مثال کے طور پر سورس یو آر ایل۔
- میں کی توثیق سیکشن، اس سائٹ کی بنیاد پر مناسب توثیق کا انتخاب کیا جسے آپ کرال کرنا چاہتے ہیں۔ اس پوسٹ کے لیے، ہم منتخب کرتے ہیں۔ کوئی تصدیق نہیں۔ کیونکہ یہ ایک عوامی سائٹ ہے اور اسے تصدیق کی ضرورت نہیں ہے۔
- میں ویب پراکسی سیکشن میں، آپ سیکرٹس مینیجر کا راز بتا سکتے ہیں (اگر ضرورت ہو)۔
- میں سے انتخاب کریں نیا راز بنائیں اور شامل کریں۔.
- تصدیق کی وہ تفصیلات درج کریں جو آپ نے پہلے جمع کی تھیں۔
- میں سے انتخاب کریں محفوظ کریں.
- میں IAM کا کردار سیکشن کا انتخاب کریں، ایک نیا کردار بنائیں اور ایک نام درج کریں (مثال کے طور پر،
AmazonKendra-Web Crawler-datasource-role
). - میں سے انتخاب کریں اگلے.
- میں مطابقت پذیری کا دائرہ سیکشن، آپ جس سائٹ کو کرال کر رہے ہیں اس کی بنیاد پر اپنی مطابقت پذیری کی ترتیبات کو ترتیب دیں۔ اس پوسٹ کے لیے، ہم تمام ڈیفالٹ سیٹنگز چھوڑ دیتے ہیں۔
- کے لئے مطابقت پذیری کا طریقہمنتخب کریں کہ آپ اپنے انڈیکس کو کیسے اپ ڈیٹ کرنا چاہتے ہیں۔ اس پوسٹ کے لیے، ہم منتخب کرتے ہیں۔ مکمل مطابقت پذیری.
- کے لئے رن شیڈول کو مطابقت پذیر بنائیںمنتخب کریں مانگ پر چلائیں۔.
- میں سے انتخاب کریں اگلے.
- اختیاری طور پر، آپ فیلڈ میپنگ سیٹ کر سکتے ہیں۔ اس پوسٹ کے لیے، ہم ابھی کے لیے ڈیفالٹس رکھتے ہیں۔
فیلڈز کی نقشہ سازی ایک مفید مشق ہے جہاں آپ فیلڈ کے ناموں کو ان اقدار سے بدل سکتے ہیں جو صارف دوست ہوں اور جو آپ کی تنظیم کے الفاظ میں فٹ ہوں۔
- میں سے انتخاب کریں اگلے.
- میں سے انتخاب کریں ڈیٹا کا ماخذ شامل کریں.
- ڈیٹا ماخذ کی مطابقت پذیری کے لیے، منتخب کریں۔ ابھی مطابقت پذیری کریں ڈیٹا سورس کی تفصیلات کے صفحے پر۔
- مطابقت پذیری مکمل ہونے کا انتظار کریں۔
ایک تصدیق شدہ ویب سائٹ کی مثال
اگر آپ کسی ایسی سائٹ کو کرال کرنا چاہتے ہیں جس کی توثیق ہو، تو میں کی توثیق پچھلے مراحل میں سیکشن، آپ کو تصدیق کی تفصیلات بتانے کی ضرورت ہے۔ اگر آپ نے منتخب کیا تو درج ذیل ایک مثال ہے۔ فارم کی توثیق.
- میں ماخذ سیکشن، منتخب کریں ماخذ یو آر ایل اور URL درج کریں۔ اس مثال کے لیے ہم استعمال کرتے ہیں۔ https://accounts.autodesk.com.
- میں کی توثیق سیکشن، منتخب کریں فارم کی توثیق.
- میں ویب پراکسی سیکشن، اپنے سیکرٹس مینیجر کے راز کی وضاحت کریں۔ اس کے علاوہ کسی بھی آپشن کے لیے یہ ضروری ہے۔ کوئی تصدیق نہیں۔.
- میں سے انتخاب کریں نیا راز بنائیں اور شامل کریں۔.
- تصدیق کی وہ تفصیلات درج کریں جو آپ نے پہلے جمع کی تھیں۔
- میں سے انتخاب کریں محفوظ کریں.
حل کی جانچ کریں۔
اب جب کہ آپ نے سائٹ سے مواد کو اپنے Amazon Kendra انڈیکس میں داخل کر لیا ہے، آپ کچھ سوالات کی جانچ کر سکتے ہیں۔
- اپنے انڈیکس پر جائیں اور منتخب کریں۔ انڈیکس شدہ مواد تلاش کریں۔.
- ایک نمونہ تلاش کا استفسار درج کریں اور اپنے تلاش کے نتائج کی جانچ کریں (آپ کا استفسار آپ کی کرال کردہ سائٹ کے مواد اور درج کردہ استفسار کی بنیاد پر مختلف ہوگا)۔
مبارک ہو! آپ نے اپنے کرال کردہ سائٹ سے ترتیب کردہ مواد کی بنیاد پر جوابات اور بصیرت کو سامنے لانے کے لیے Amazon Kendra کا کامیابی سے استعمال کیا ہے۔
صاف کرو
مستقبل کے اخراجات سے بچنے کے لیے، اس حل کے حصے کے طور پر اپنے بنائے گئے وسائل کو صاف کریں۔ اگر آپ نے اس حل کو جانچتے ہوئے ایک نیا ایمیزون کینڈر انڈیکس بنایا ہے تو اسے حذف کر دیں۔ اگر آپ نے Amazon Kendra Web Crawler V2 کا استعمال کرتے ہوئے صرف ایک نیا ڈیٹا ماخذ شامل کیا ہے تو اس ڈیٹا سورس کو حذف کر دیں۔
نتیجہ
نئے Amazon Kendra Web Crawler V2 کے ساتھ، تنظیمیں کسی بھی ایسی ویب سائٹ کو کرال کر سکتی ہیں جو عوامی ہو یا تصدیق کے پیچھے ہو اور اسے Amazon Kendra کے ذریعے چلنے والی ذہین تلاش کے لیے استعمال کر سکے۔
ان امکانات اور مزید کے بارے میں جاننے کے لیے، کا حوالہ دیں۔ ایمیزون کینڈر ڈویلپر گائیڈ. اپنے ڈیٹا کو ہضم کرتے وقت آپ میٹا ڈیٹا اور مواد کو کیسے تخلیق، ترمیم یا حذف کر سکتے ہیں اس بارے میں مزید معلومات کے لیے، ملاحظہ کریں ادخال کے دوران اپنے دستاویزات کو بہتر بنانا اور Amazon Kendra میں اپنی مرضی کے مطابق دستاویز کی افزودگی کے ساتھ اپنے تلاش کے تجربے کو بڑھانے کے لیے اپنے مواد اور میٹا ڈیٹا کو بہتر بنائیں.
مصنفین کے بارے میں
جیتن ڈیڈھیا سافٹ ویئر انڈسٹری میں 20 سال سے زیادہ کا تجربہ رکھنے والا ایک سینئر سولیوشن آرکیٹیکٹ ہے۔ اس نے عالمی مالیاتی خدمات کے کلائنٹس کے ساتھ کام کیا ہے، انہیں AWS کی طرف سے فراہم کردہ خدمات کا استعمال کرکے جدید بنانے کے بارے میں مشورہ فراہم کیا ہے۔
گنونت والبے ایمیزون ویب سروسز میں سافٹ ویئر ڈویلپمنٹ انجینئر ہے۔ وہ سیکھنے کا شوقین ہے اور نئی ٹیکنالوجی کو اپنانے کا خواہشمند ہے۔ وہ پیچیدہ کاروباری ایپلی کیشنز تیار کرتا ہے، اور جاوا اس کی پسند کی بنیادی زبان ہے۔
- SEO سے چلنے والا مواد اور PR کی تقسیم۔ آج ہی بڑھا دیں۔
- پلیٹو ڈیٹا ڈاٹ نیٹ ورک ورٹیکل جنریٹو اے آئی۔ اپنے آپ کو بااختیار بنائیں۔ یہاں تک رسائی حاصل کریں۔
- پلیٹوآئ اسٹریم۔ ویب 3 انٹیلی جنس۔ علم میں اضافہ۔ یہاں تک رسائی حاصل کریں۔
- پلیٹو ای ایس جی۔ کاربن، کلین ٹیک، توانائی ، ماحولیات، شمسی، ویسٹ مینجمنٹ یہاں تک رسائی حاصل کریں۔
- پلیٹو ہیلتھ۔ بائیوٹیک اینڈ کلینیکل ٹرائلز انٹیلی جنس۔ یہاں تک رسائی حاصل کریں۔
- ماخذ: https://aws.amazon.com/blogs/machine-learning/index-your-web-crawled-content-using-the-new-web-crawler-for-amazon-kendra/
- : ہے
- : ہے
- : نہیں
- :کہاں
- $UP
- 100
- 16
- 20
- 20 سال
- 30
- 7
- a
- کی صلاحیت
- قابلیت
- ہمارے بارے میں
- تک رسائی حاصل
- درست
- درست طریقے سے
- کے پار
- شامل کریں
- شامل کیا
- اس کے علاوہ
- ایڈیشنل
- اضافی معلومات
- اپنانے
- مشورہ
- کے بعد
- تمام
- بھی
- ایمیزون
- ایمیزون کیندر
- ایمیزون ویب سروسز
- an
- تجزیے
- اور
- اعلان کریں
- جواب
- جواب
- کوئی بھی
- ایپلی کیشنز
- مناسب
- کیا
- AS
- At
- مصنف
- تصدیق شدہ
- کی توثیق
- autodesk
- سے اجتناب
- AWS
- کی بنیاد پر
- بنیادی
- BE
- کیونکہ
- پیچھے
- دونوں
- خودکار صارف دکھا ئیں
- کاروبار
- بزنس ایپلی کیشنز
- بٹن
- by
- کر سکتے ہیں
- مرکزی
- چیٹ بٹس
- انتخاب
- میں سے انتخاب کریں
- کا انتخاب کیا
- کلائنٹس
- COM
- مکمل
- پیچیدہ
- ترتیب
- کنکشن
- مشتمل
- کنسول
- مواد
- مندرجات
- کنٹرول
- اخراجات
- کرالر
- تخلیق
- بنائی
- پیدا
- اپنی مرضی کے
- اعداد و شمار
- پہلے سے طے شدہ
- غلطی
- مظاہرہ
- تفصیل
- تفصیلات
- اس بات کا تعین
- ڈیولپر
- ترقی
- تیار ہے
- دستاویز
- دستاویزات
- نہیں کرتا
- کے دوران
- متحرک
- ایڈیشن
- موثر
- خفیہ کاری
- انجینئر
- بڑھانے کے
- درج
- داخل ہوا
- اندر
- انٹرپرائز
- مثال کے طور پر
- بہت پرجوش
- ورزش
- تجربہ
- بیرونی
- ایف ڈی اے
- خصوصیات
- میدان
- قطعات
- فلٹرنگ
- مالی
- مالیاتی خدمات
- فٹ
- کے بعد
- کے لئے
- فارم
- سے
- مکمل طور پر
- مستقبل
- جمع
- حاصل
- گلوبل
- عالمی مالیاتی
- ہے
- he
- انتہائی
- ان
- کس طرح
- کیسے
- HTML
- HTTP
- HTTPS
- if
- in
- انڈکس
- انڈیکس شدہ
- صنعت
- معلومات
- بصیرت
- انٹیلجنٹ
- اندرونی
- انٹرنیٹ
- میں
- IT
- اعلی درجے کا Java
- فوٹو
- Keen
- رکھیں
- جان
- زبان
- جانیں
- سیکھنے
- چھوڑ دو
- کی طرح
- مشین
- مشین لرننگ
- میں کامیاب
- مینیجر
- تعریفیں
- مئی..
- میکانزم
- میٹا ڈیٹا
- منٹ
- ML
- جدید کاری
- نظر ثانی کرنے
- زیادہ
- ایک سے زیادہ
- نام
- نام
- وضاحتی
- قدرتی
- سمت شناسی
- ضرورت ہے
- نئی
- نئی خصوصیات
- نئی ٹیکنالوجی
- خبر
- اب
- of
- تجویز
- on
- صرف
- اختیار
- or
- تنظیمیں
- دیگر
- ہمارے
- باہر
- پر
- صفحہ
- پین
- حصہ
- پاس ورڈ
- مقام
- پلاٹا
- افلاطون ڈیٹا انٹیلی جنس
- پلیٹو ڈیٹا
- امکانات
- پوسٹ
- طاقت
- پچھلا
- پہلے
- پرائمری
- عمل
- محفوظ
- فراہم
- فراہم
- فراہم کرنے
- پراکسی
- عوامی
- سوالات
- سوالات
- کا حوالہ دیتے ہیں
- ریجیکس
- ذخیرہ
- کی ضرورت
- ضرورت
- وسائل
- نتائج کی نمائش
- کا جائزہ لینے کے
- کردار
- رن
- تلاش کریں
- خفیہ
- راز
- سیکشن
- محفوظ بنانے
- سیکورٹی
- بیج
- منتخب
- سروس
- سروسز
- مقرر
- قائم کرنے
- ترتیبات
- ہونا چاہئے
- دکھائیں
- دکھایا گیا
- سادہ
- آسان بنانے
- سائٹ
- سائٹس
- سافٹ ویئر کی
- سوفٹ ویئر کی نشوونما
- حل
- حل
- کچھ
- ماخذ
- ذرائع
- معیار
- شروع کریں
- مراحل
- ذخیرہ
- ذخیرہ
- ذخیرہ
- منظم
- جمع
- کامیابی کے ساتھ
- اس طرح
- سویٹ
- تائید
- سطح
- لے لو
- ٹیکنالوجی
- ٹیسٹ
- ٹیسٹنگ
- سے
- کہ
- ۔
- ان
- ان
- تو
- یہ
- اس
- کرنے کے لئے
- کوشش
- اقسام
- اپ ڈیٹ کریں
- URL
- استعمال کی شرائط
- استعمال کیا جاتا ہے
- رکن کا
- صارف دوست
- استعمال
- کا استعمال کرتے ہوئے
- اقدار
- مختلف اقسام کے
- بہت
- کی طرف سے
- چاہتے ہیں
- we
- ویب
- ویب خدمات
- ویب سائٹ
- ویب سائٹ
- جب
- چاہے
- جس
- جبکہ
- گے
- ساتھ
- کام کیا
- سال
- تم
- اور
- زیفیرنیٹ