ארגונים ברחבי העולם מחפשים להשתמש במספר מקורות נתונים כדי ליישם חווית חיפוש מאוחדת עבור העובדים ולקוחות הקצה שלהם. בהתחשב בכמות הנתונים הגדולה שיש לבחון ולהוסיף לאינדקס, מהירות האחזור, מדרגיות הפתרון וביצועי החיפוש הופכים לגורמים מרכזיים שיש לקחת בחשבון בעת בחירת פתרון חיפוש חכם ארגוני. בנוסף, מקורות הנתונים הייחודיים הללו כוללים מאגרי תוכן מובנים ובלתי מובנים - כולל סוגי קבצים שונים - שעלולים לגרום לבעיות תאימות.
אמזון קנדרה הוא שירות חיפוש מדויק ואינטליגנטי ביותר המאפשר למשתמשים לחפש תשובות לשאלותיהם מתוך הנתונים הלא מובנים והמובנים שלך באמצעות עיבוד שפה טבעית ואלגוריתמי חיפוש מתקדמים. הוא מחזיר תשובות ספציפיות לשאלות, ומעניק למשתמשים חוויה שקרובה לאינטראקציה עם מומחה אנושי.
היום, אמזון קנדרה השיקה שבע אפשרויות תמיכה נוספות בפורמט נתונים לשימושך. זה מאפשר לך לשלב בקלות את מקורות הנתונים הקיימים שלך כפי שהם ולבצע חיפוש חכם על פני מאגרי תוכן מרובים.
בפוסט זה, אנו דנים בפורמטי הנתונים החדשים הנתמכים וכיצד להשתמש בהם.
פורמטי נתונים נתמכים חדשים
בעבר, אמזון קנדרה מסמכים נתמכים שכלל טקסט מובנה בצורה של שאלות ותשובות נפוצות, כמו גם טקסט לא מובנה בצורה של קובצי HTML, מצגות Microsoft PowerPoint, מסמכי Microsoft Word, מסמכי טקסט רגיל וקובצי PDF.
עם השקה זו, אמזון קנדרה מציעה כעת תמיכה בשבעה פורמטים נוספים של נתונים:
- פורמט טקסט עשיר (RTF)
- סימון אובייקט JavaScript (JSON)
- Markdown (MD)
- ערכים מופרדים בפסיקים (CSV)
- Microsoft Excel (MS Excel)
- שפת סימון ניתנת להרחבה (XML)
- טרנספורמציות של שפת גליונות סגנון הניתנים להרחבה (XSLT)
משתמשי אמזון קנדרה יכולים להטמיע מסמכים אלה עם פורמטים שונים של נתונים לאינדקס שלהם בשתי הדרכים הבאות:
סקירת פתרונות
בסעיפים הבאים, אנו עוברים על השלבים להוספת מסמכים ממקור נתונים וביצוע חיפוש במסמכים אלה.
התרשים הבא מציג את ארכיטקטורת הפתרון שלנו.
לבדיקת פתרון זה עבור כל אחד מהפורמטים הנתמכים, עליך להשתמש בנתונים שלך. אתה יכול לבדוק על ידי העלאת מסמכים באותו פורמט או בפורמט שונה לדלי S3.
צור אינדקס אמזון קנדרה
להוראות ליצירת אינדקס אמזון קנדרה שלך, עיין ב יצירת אינדקס.
אתה יכול לדלג על שלב זה אם יש לך אינדקס קיים לשימוש עבור הדגמה זו.
העלה מסמכים לדלי S3 והטמעה לאינדקס באמצעות מחבר S3
השלם את השלבים הבאים כדי לחבר דלי S3 לאינדקס שלך:
- צור דלי S3 כדי לאחסן את המסמכים שלך.
- צור תיקיה בשם מדגם-נתונים.
- העלה את המסמכים שברצונך לבדוק לתיקיה.
- בקונסולת אמזון קנדרה, עבור לאינדקס שלך ובחר מקורות מידע.
- בחרו הוסף מקור נתונים.
- תַחַת מקורות נתונים זמינים, בחר S3 ולבחור הוסף מחבר.
- הזן שם עבור המחבר שלך (כגון
Demo_S3_connector
) ובחר הַבָּא. - בחרו דפדף ב- S3 ובחר בדלי S3 שבו העלית את המסמכים.
- בעד תפקיד IAM, צור תפקיד חדש.
- בעד הגדר את לוח הזמנים של ריצת הסנכרון, בחר הפעל לפי דרישה.
- בחרו הַבָּא.
- על סקור וצור עמוד, בחר הוסף מקור נתונים.
- לאחר השלמת תהליך היצירה, בחר סנכרן עכשיו.
כעת, לאחר שהכנסת כמה מסמכים, תוכל לנווט אל מסוף החיפוש המובנה כדי לבדוק שאילתות.
חפש במסמכים שלך עם מסוף החיפוש של Amazon Kendra
בקונסולת אמזון קנדרה, בחר חפש תוכן באינדקס בחלונית הניווט.
להלן דוגמאות לתוצאות מהחיפוש אחר סוגי מסמכים שונים:
- RTF - הזן נתונים בפורמט RTF שהועלו לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
- JSON - הזן נתונים בפורמט JSON שהועלו לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
- Markdown - הזן נתונים בפורמט MD שהועלו לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
- CSV - הזן נתונים בפורמט CSV שהועלו לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
- Excel - הזן נתונים בפורמט Excel שהועלו לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
- XML - הזן נתונים בפורמט XML שהועלה לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
- XSLT - הזן נתונים בפורמט XSLT שהועלו לדלי S3 וסנכרן את מקור הנתונים:
צילום המסך הבא מציג את תוצאות החיפוש.
לנקות את
כדי למנוע עלויות עתידיות, נקה את המשאבים שיצרת כחלק מפתרון זה באמצעות השלבים הבאים:
- בקונסולת אמזון קנדרה, בחר אינדקסים בחלונית הניווט.
- בחר את האינדקס שמכיל את מקור הנתונים למחיקה.
- בחלונית הניווט בחר מקורות מידע.
- בחר את מקור הנתונים להסרה ולאחר מכן בחר מחק.
כאשר אתה מוחק מקור נתונים, אמזון קנדרה מסירה את כל המידע המאוחסן על מקור הנתונים. אמזון קנדרה מסירה את כל נתוני המסמכים המאוחסנים באינדקס, ואת כל היסטוריות הריצה והמדדים הקשורים למקור הנתונים. מחיקת מקור נתונים אינה מסירה את המסמכים המקוריים מהאחסון שלך.
- בקונסולת אמזון קנדרה, בחר אינדקסים בחלונית הניווט.
- בחר באינדקס למחיקה ולאחר מכן בחר מחק.
עיין מחיקת אינדקס ומקור נתונים לקבלת פרטים נוספים.
- במסוף S3 של אמזון בחר דליים בחלונית הניווט.
- בחר את הדלי שברצונך למחוק ולאחר מכן בחר מחק.
- הזן את שם הדלי כדי לאשר את המחיקה, ולאחר מכן בחר מחק דלי.
אם הדלי מכיל אובייקטים כלשהם, תקבל התראת שגיאה. רוקן את הדלי לפני מחיקתו על ידי בחירה בקישור בהודעת השגיאה וביצוע ההוראות ב- דלי ריק עמוד. לאחר מכן חזור אל מחק דלי עמוד ולמחוק את הדלי.
- כדי לוודא שמחקת את הדלי, פתח את דליים עמוד והזן את שם הדלי שמחקת. אם לא ניתן למצוא את הדלי, המחיקה שלך הצליחה.
עיין מחיקת דף דלי לקבלת פרטים נוספים.
סיכום
בפוסט זה, דנו בפורמטי הנתונים החדשים שבהם אמזון קנדרה תומכת כעת. בנוסף, דנו כיצד להשתמש באמזון קנדרה כדי להטמיע ולבצע חיפוש בסוגי מסמכים חדשים אלה המאוחסנים בדלי S3. למידע נוסף על פורמטי הנתונים השונים הנתמכים, עיין ב סוגי מסמכים.
הכרנו לכם את היסודות, אך ישנן תכונות נוספות רבות שלא כיסינו בפוסט זה, כגון:
- אתה יכול להפעיל בקרת גישה מבוססת משתמש עבור אינדקס אמזון קנדרה שלך ולהגביל את הגישה למשתמשים ולקבוצות שאתה מגדיר.
- אתה יכול למפות שדות נוספים לתכונות האינדקס של אמזון קנדרה ולאפשר אותם ליצירת פנים, חיפוש והצגה בתוצאות החיפוש.
- אתה יכול לשלב מחברי מקור נתונים שונים של צד שלישי כמו Service Now ו-Salesforce עם יכולת העשרת מסמכים מותאמת אישית (CDE) באמזון קנדרה כדי לבצע לוגיקה נוספת של מיפוי תכונות ואפילו שינוי תוכן מותאם אישית במהלך ההטמעה. לרשימה המלאה של המחברים הנתמכים, עיין ב מחברים.
כדי ללמוד על האפשרויות הללו ועוד, עיין ב- מדריך למפתחים של אמזון קנדרה.
על המחברים
רישב"ח ידב הוא ארכיטקט פתרונות שותפים ב-AWS עם רקע נרחב בהצעות DevOps ואבטחה ב-AWS. הוא עובד עם שותפי ASEAN כדי לספק הנחיות לגבי אימוץ ענן ארגוני וסקירות ארכיטקטורה יחד עם בניית פרקטיקת AWS באמצעות יישום Well-Architected Framework. מחוץ לעבודה, הוא אוהב לבלות את זמנו במגרש הספורט ובמשחקי FPS.
קרותי ג'ייסימה ראו הוא אדריכל פתרונות שותפים עם התמקדות ב-AI ו-ML. היא מספקת הדרכה טכנית לשותפי AWS בביצוע שיטות עבודה מומלצות לבניית פתרונות מאובטחים, עמידים וזמינים במיוחד בענן AWS.
Keerthi Kumar Kallur הוא מהנדס פיתוח תוכנה ב-AWS. הוא נמצא בצוות AWS Kendra מאז השנתיים האחרונות ועבד על תכונות שונות כמו גם על לקוחות. בזמנו הפנוי הוא אוהב לעשות פעילויות חוצות כמו טיולים רגליים, ספורט כמו כדורעף.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- Platoblockchain. Web3 Metaverse Intelligence. ידע מוגבר. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/new-expanded-data-format-support-in-amazon-kendra/
- 10
- 100
- 7
- a
- אודות
- גישה
- מדויק
- לרוחב
- פעילויות
- תוספת
- נוסף
- בנוסף
- אימוץ
- מתקדם
- AI
- ערני
- אלגוריתמים
- תעשיות
- מאפשר
- אמזון בעברית
- אמזון קנדרה
- ו
- תשובות
- ארכיטקטורה
- Asean
- המשויך
- תכונות
- זמין
- AWS
- רקע
- יסודות
- להיות
- לפני
- הטוב ביותר
- שיטות עבודה מומלצות
- לִבנוֹת
- בִּניָן
- מובנה
- לגרום
- בחרו
- בחירה
- סְגוֹר
- ענן
- אימוץ ענן
- תאימות
- להשלים
- לאשר
- לְחַבֵּר
- לשקול
- בהתחשב
- קונסול
- מכיל
- תוכן
- לִשְׁלוֹט
- עלויות
- לכסות
- לִיצוֹר
- נוצר
- יוצרים
- יצירה
- מנהג
- לקוחות
- נתונים
- פרטים
- מפתח
- צעצועי התפתחות
- אחר
- לדון
- נָדוֹן
- לְהַצִיג
- מסמך
- מסמכים
- בְּמַהֲלָך
- בקלות
- עובדים
- לאפשר
- מאפשר
- מהנדס
- זן
- מִפְעָל
- שגיאה
- אֲפִילוּ
- דוגמאות
- Excel
- קיימים
- מורחב
- ניסיון
- מומחה
- נרחב
- גורמים
- תכונות
- שדה
- שדות
- שלח
- קבצים
- להתמקד
- הבא
- טופס
- פוּרמָט
- מצא
- fps
- מסגרת
- בתדירות גבוהה
- החל מ-
- עתיד
- המשחקים
- נתינה
- כדור הארץ
- Go
- קבוצה
- מאוד
- איך
- איך
- HTML
- HTTPS
- בן אנוש
- ליישם
- הפעלה
- in
- כלול
- מדד
- מידע
- קלט
- הוראות
- לשלב
- אינטליגנטי
- אינטראקציה
- הציג
- בעיות
- IT
- ג'סון
- מפתח
- שפה
- גָדוֹל
- לשגר
- הושק
- לִלמוֹד
- קשר
- רשימה
- הסתכלות
- רב
- מַפָּה
- מיפוי
- הודעה
- מדדים
- מיקרוסופט
- ML
- יותר
- MS
- מספר
- שם
- שם
- טבעי
- עיבוד שפה טבעית
- נווט
- ניווט
- צורך
- צרכי
- חדש
- אובייקט
- אובייקטים
- הצעות
- המיוחדות שלנו
- לפתוח
- אפשרויות
- מְקוֹרִי
- בחוץ
- שֶׁלוֹ
- זגוגית
- חלק
- שותף
- שותפים
- עבר
- לְבַצֵעַ
- ביצועים
- ביצוע
- מישור
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- אפשרויות
- הודעה
- תרגול
- פרקטיקות
- מצגות
- תהליך
- תהליך
- לספק
- מספק
- שאלות
- לקבל
- להסיר
- מִתאוֹשֵׁשׁ מַהֵר
- משאבים
- לְהַגבִּיל
- תוצאות
- לַחֲזוֹר
- החזרות
- חוות דעת של לקוחותינו
- תפקיד
- הפעלה
- כוח מכירות
- אותו
- בקרת מערכות ותקשורת
- חיפוש
- סעיפים
- לבטח
- אבטחה
- שרות
- שבע
- הופעות
- since
- תוכנה
- פיתוח תוכנה
- פִּתָרוֹן
- פתרונות
- כמה
- מָקוֹר
- מקורות
- ספציפי
- מְהִירוּת
- לבלות
- ספורט
- שלב
- צעדים
- אחסון
- חנות
- מאוחסן
- מובנה
- מוצלח
- כזה
- תמיכה
- נתמך
- תומך
- נבחרת
- טכני
- מבחן
- בדיקות
- השמיים
- היסודות
- שֶׁלָהֶם
- צד שלישי
- דרך
- זמן
- ל
- טרנספורמציה
- טרנספורמציות
- סוגים
- מאוחד
- ייחודי
- נטען
- העלאה
- להשתמש
- משתמשים
- לנצל
- ערכים
- שונים
- לאמת
- כֶּרֶך
- דרכים
- Word
- תיק עבודות
- עבד
- עובד
- XML
- XSLT
- שנים
- אתה
- זפירנט