Amazon SageMaker JumpStart מציעה כעת מחברות Amazon Comprehend עבור סיווג מותאם אישית וזיהוי ישויות מותאם אישית PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

Amazon SageMaker JumpStart מציעה כעת מחברות Amazon Comprehend לסיווג מותאם אישית וזיהוי ישויות מותאם אישית

אמזון להתבונן הוא שירות עיבוד שפה טבעית (NLP) המשתמש בלמידה חישובית (ML) כדי לגלות תובנות מטקסט. Amazon Comprehend מספקת תכונות מותאמות אישית, זיהוי ישות מותאם אישית, סיווג מותאם אישית, ו ממשקי API מאומנים מראש כגון מיצוי ביטויי מפתח, ניתוח סנטימנטים, זיהוי ישויות ועוד כדי שתוכל לשלב בקלות NLP ביישומים שלך.

לאחרונה הוספנו מחברות הקשורות ל- Amazon Comprehend אמזון SageMaker JumpStart מחברות שיכולות לעזור לך להתחיל במהירות להשתמש במסווג המותאם אישית של Amazon Comprehend ומזהה ישויות מותאם אישית. אתה יכול להשתמש בסיווג מותאם אישית כדי לארגן מסמכים בקטגוריות (מחלקות) שאתה מגדיר. זיהוי ישויות מותאם אישית מרחיב את היכולת של ה-API לזיהוי ישויות מאומן מראש של Amazon Comprehend על ידי כך שהוא עוזר לך לזהות סוגי ישויות שייחודיים לדומיין או לעסק שלך שאינם נמצאים בגרסה הגנרית המוגדרת מראש. סוגי ישויות.

בפוסט זה, אנו מראים לך כיצד להשתמש ב-JumpStart כדי לבנות סיווג מותאם אישית של Amazon Comprehend ומודלים מותאמים אישית של זיהוי ישויות כחלק מצרכי ה-NLP הארגוניים שלך.

SageMaker JumpStart

השמיים סטודיו SageMaker של אמזון דף הנחיתה מספק את האפשרות להשתמש ב-JumpStart. JumpStart מספקת דרך מהירה להתחיל בעבודה על ידי אספקת מודלים מאומנים מראש למגוון סוגי בעיות. אתה יכול לאמן ולכוון את הדגמים האלה. JumpStart מספק גם משאבים אחרים כמו מחברות, בלוגים וסרטונים.

מחברות JumpStart הן בעצם קוד לדוגמה שאתה יכול להשתמש בו כנקודת התחלה כדי להתחיל במהירות. נכון לעכשיו, אנו מספקים לך למעלה מ-40 מחברות שתוכל להשתמש בהן כפי שהן או להתאים אישית לפי הצורך. אתה יכול למצוא את המחברות שלך באמצעות החיפוש או בחלונית התצוגה עם הכרטיסיות. לאחר שתמצא את המחברת שבה ברצונך להשתמש, תוכל לייבא את המחברת, להתאים אותה לדרישות שלך ולבחור את התשתית והסביבה שבה תפעיל את המחברת.

התחל לעבוד עם מחברות JumpStart

כדי להתחיל עם JumpStart, עבור אל אמזון SageMaker מסוף ופתח את Studio. מתייחס התחל בעבודה עם SageMaker Studio לקבלת הוראות כיצד להתחיל בעבודה עם Studio. לאחר מכן השלם את השלבים הבאים:

  1. בסטודיו, עבור לדף ההשקה של JumpStart ובחר עבור אל SageMaker JumpStart.

מוצעות לך מספר דרכים לחיפוש. אתה יכול להשתמש בכרטיסיות בחלק העליון כדי להגיע למה שאתה רוצה, או להשתמש בתיבת החיפוש כפי שמוצג בצילום המסך הבא.

  1. כדי למצוא מחברות, אנחנו הולכים ל- מחברה TAB.

עבור ללשונית מחברות

בזמן הכתיבה, JumpStart מציעה 47 מחברות. אתה יכול להשתמש במסננים כדי למצוא מחברות הקשורות ל- Amazon Comprehend.

  1. על סוג תוכן התפריט הנפתח, בחר מחברת.

כפי שניתן לראות בצילום המסך הבא, יש לנו כרגע שתי מחברות של Amazon Comprehend.

מצא מחברות Comprehend

בסעיפים הבאים, אנו חוקרים את שתי המחברות.

סיווג מותאם אישית של Amazon Comprehend

במחברת זו, אנו מדגימים כיצד להשתמש ב- API לסווג מותאם אישית כדי ליצור מודל סיווג מסמכים.

הסיווג המותאם אישית הוא תכונה מנוהלת במלואה של Amazon Comprehend המאפשרת לך לבנות מודלים מותאמים אישית של סיווג טקסט הייחודיים לעסק שלך, גם אם יש לך מומחיות מועטה או ללא מומחיות ב-ML. הסיווג המותאם אישית מתבסס על היכולות הקיימות של Amazon Comprehend, שכבר הוכשרו על עשרות מיליוני מסמכים. הוא מופשט הרבה מהמורכבות הנדרשת לבניית מודל סיווג NLP. הסיווג המותאם אישית טוען ובודק אוטומטית את נתוני האימון, בוחר את אלגוריתמי ה-ML הנכונים, מאמן את המודל שלך, מוצא את הפרמטרים האופטימליים, בודק את המודל ומספק מדדי ביצועים של המודל. הסיווג המותאם אישית של Amazon Comprehend מספק גם קונסולה קלה לשימוש עבור כל זרימת העבודה של ML, כולל תיוג טקסט באמצעות האמת של אמזון SageMaker, הדרכה ופריסה של מודל, והצגה של תוצאות הבדיקה. עם מסווג מותאם אישית של Amazon Comprehend, אתה יכול לבנות את הדגמים הבאים:

  • מודל סיווג רב-מעמדי – בסיווג רב מחלקות, לכל מסמך ניתן להקצות מחלקה אחת ויחידה. השיעורים הבודדים סותרים זה את זה. לדוגמה, ניתן לסווג סרט כסרט תיעודי או כמדע בדיוני, אך לא את שניהם בו-זמנית.
  • מודל סיווג רב-תוויות – בסיווג ריבוי תוויות, מחלקות בודדות מייצגות קטגוריות שונות, אך קטגוריות אלו קשורות איכשהו ואינן סותרות זו את זו. כתוצאה מכך, לכל מסמך הוקצתה לפחות מחלקה אחת, אך יכולה להכיל יותר. לדוגמה, סרט יכול להיות פשוט סרט פעולה, או שהוא יכול להיות סרט פעולה, סרט מדע בדיוני וקומדיה, כולם בו זמנית.

מחברת זו אינה דורשת מומחיות ב-ML כדי להכשיר מודל עם מערך הנתונים לדוגמה או עם מערך הנתונים הספציפי לעסק שלך. אתה יכול להשתמש בפעולות ה-API הנדונות במחברת זו ביישומים שלך.

אמזון זיהוי ישויות מותאם אישית

במחברת זו, אנו מדגימים כיצד להשתמש ב- API לזיהוי ישויות מותאם אישית ליצירת מודל לזיהוי ישויות.

זיהוי ישויות מותאם אישית מרחיב את היכולות של Amazon Comprehend בכך שהוא עוזר לך לזהות את סוגי הישויות הספציפיות שלך שאינם בסוגי הישויות הגנריות המוגדרות מראש. זה אומר שאתה יכול לנתח מסמכים ולחלץ ישויות כמו קודי מוצר או ישויות ספציפיות לעסק שמתאימות לצרכים הספציפיים שלך.

בניית מזהה ישויות מותאם אישית מדויק בעצמך יכולה להיות תהליך מורכב, הדורש הכנה של קבוצות גדולות של מסמכי הדרכה ידנית ובחירת האלגוריתמים והפרמטרים הנכונים לאימון מודלים. Amazon Comprehend עוזרת להפחית את המורכבות על ידי מתן הערות ופיתוח מודלים אוטומטיים ליצירת מודל זיהוי ישויות מותאם אישית.

המחברת לדוגמה לוקחת את מערך ההדרכה בפורמט CSV ומפעילה הסקה כנגד קלט טקסט. Amazon Comprehend תומכת גם במקרה שימוש מתקדם שלוקח נתונים מוזכרים של Ground Truth להדרכה ומאפשר לך להפעיל הסקה ישירות על קובצי PDF ומסמכי Word. למידע נוסף, עיין ב בנו מזהה ישויות מותאם אישית עבור מסמכי PDF באמצעות Amazon Comprehend.

Amazon Comprehend הורידה את מגבלות ההערות ואפשרה לך לקבל תוצאות יציבות יותר, במיוחד עבור תת-דגימות של מעט יריות. למידע נוסף על שיפור זה, עיין ב Amazon Comprehend מכריזה על מגבלות נמוכות יותר של הערות לזיהוי ישויות מותאמות אישית.

מחברת זו אינה דורשת מומחיות ב-ML כדי להכשיר מודל עם מערך הנתונים לדוגמה או עם מערך הנתונים הספציפי לעסק שלך. אתה יכול להשתמש בפעולות ה-API הנדונות במחברת זו ביישומים שלך.

השתמש, התאם אישית ופרוס מחברות Amazon Comprehend JumpStart

לאחר שתבחר את מחברת Amazon Comprehend שבה ברצונך להשתמש, בחר ייבוא ​​מחברת. בזמן שאתה עושה את זה, אתה יכול לראות את ליבת המחברת מתחילה.

ייבא מחברת

ייבוא ​​המחברת שלך מפעיל את הבחירה של מופע המחברת, הליבה והתמונה המשמשים להפעלת המחברת. לאחר הקצאת תשתית ברירת המחדל, תוכל לשנות את הבחירות לפי הדרישות שלך.

מחברת בסטודיו SageMaker שלך

כעת, עבור על קווי המתאר של המחברת וקרא בעיון את הסעיפים להגדרת דרישות מוקדמות, הגדרת נתונים, אימון המודל, הפעלת מסקנות ועצירת המודל. אל תהסס להתאים אישית את הקוד שנוצר לפי הצרכים שלך.

בהתבסס על הדרישות שלך, ייתכן שתרצה להתאים אישית את הסעיפים הבאים:

  • הרשאות – עבור יישום ייצור, אנו ממליצים להגביל את מדיניות הגישה רק לאלה הדרושים להפעלת היישום. ניתן להגביל הרשאות על סמך מקרה השימוש, כגון הדרכה או הסקה, ושמות משאבים ספציפיים, כגון מלא שירות אחסון פשוט של אמזון (Amazon S3) שם דלי או תבנית שם דלי S3. כמו כן, עליך להגביל את הגישה לסיווג המותאם אישית או לפעולות SageMaker רק לאלה שהאפליקציה שלך צריכה.
  • נתונים ומיקום - המחברת לדוגמה מספקת לך נתונים לדוגמה ומיקומי S3. בהתבסס על הדרישות שלך, תוכל להשתמש בנתונים שלך לצורך הדרכה, אימות ובדיקות, ולהשתמש במיקומי S3 שונים לפי הצורך. באופן דומה, כאשר המודל נוצר, אתה יכול לבחור לשמור את המודל במיקומים שונים. רק ודא שסיפקת את ההרשאות הנכונות לגישה לדליים של S3.
  • שלבי עיבוד מקדים – אם אתה משתמש בנתונים שונים להדרכה ובדיקות, ייתכן שתרצה להתאים את שלבי העיבוד המקדים לפי הדרישות שלך.
  • בדיקת נתונים - אתה יכול להביא נתוני מסקנות משלך לבדיקה.
  • לנקות את - מחק את המשאבים שהושק על ידי המחברת כדי למנוע חיובים חוזרים.

סיכום

בפוסט זה, הראינו לכם כיצד להשתמש ב-JumpStart כדי ללמוד ולהתקדם במהירות באמצעות ממשקי API של Amazon Comprehend על ידי כך שיהיה נוח למצוא ולהפעיל מחברות הקשורות ל-Amazon Comprehend מ-Studio תוך אפשרות לשנות את הקוד לפי הצורך. המחברות משתמשות במערך נתונים לדוגמה עם הכרזות על מוצרים של AWS ומאמרי חדשות לדוגמה. אתה יכול להשתמש במחברת זו כדי ללמוד כיצד להשתמש ב-Amazon Comprehend APIs במחברת Python, או שאתה יכול להשתמש בו כנקודת התחלה ולהרחיב את הקוד עוד יותר עבור הדרישות הייחודיות שלך ופריסות הייצור.

אתה יכול להתחיל להשתמש ב-JumpStart ולנצל למעלה מ-40 מחברות בנושאים שונים בכל האזורים שבהם Studio זמין ללא עלות נוספת.


על הכותבים

מחברת - לאנה ג'אנגלאנה ג'אנג הוא Sr. Solutions Architect בצוות שירותי AI של AWS WWSO עם מומחיות ב-AI ו-ML עבור ניהול וזיהוי תוכן. היא נלהבת לקדם שירותי AI של AWS ולעזור ללקוחות לשנות את הפתרונות העסקיים שלהם.

מחבר - Meenakshisundaram ThandavarayanMeenakshisundaram Thandavarayan הוא מומחה בכיר בינה מלאכותית/ML עם AWS. הוא עוזר לחשבונות אסטרטגיים הייטק במסע ה-AI וה-ML שלהם. הוא מאוד נלהב מבינה מלאכותית מונעת נתונים

מחבר - Rachna Chadhaרחנה צ'דהא הוא ארכיטקט פתרונות ראשי AI/ML בחשבונות אסטרטגיים ב-AWS. רחנה היא אופטימית המאמינה ששימוש אתי ואחראי בבינה מלאכותית יכול לשפר את החברה בעתיד ולהביא לשגשוג כלכלי וחברתי. בזמנה הפנוי, רחנה אוהבת לבלות עם משפחתה, לטייל ולהאזין למוזיקה.

בול זמן:

עוד מ למידת מכונות AWS