פרוס דגמי שפה גדולים למקרה שימוש של Healthtech ב-Amazon SageMaker

הועלה מחדש על ידי אפלטון

עוקב: 0

ב 2021, תעשיית התרופות הניבה הכנסות של 550 מיליארד דולר בארה"ב. חברות תרופות מוכרות בשוק מגוון של תרופות שונות, לעתים קרובות חדשות, שבהן עלולות להתרחש לפעמים תופעות לוואי לא מכוונות אך חמורות.

ניתן לדווח על אירועים אלו בכל מקום, מבתי חולים או בבית, ויש לעקוב אחריהם באחריות וביעילות. עיבוד ידני מסורתי של תופעות לוואי הופך למאתגר בגלל הכמות הגוברת של נתוני בריאות ועלויות. בסך הכל, 384 מיליארד דולר צפויה להיות העלות של פעילויות מעקב תרופתי לתעשיית הבריאות הכוללת עד 2022. כדי לתמוך בפעילויות כלליות של מעקב תרופתי, לקוחות התרופות שלנו רוצים להשתמש בכוח של למידת מכונה (ML) כדי להפוך את זיהוי תופעות לוואי ממקורות מידע שונים. , כגון עדכונים של מדיה חברתית, שיחות טלפון, מיילים והערות בכתב יד, ומפעילים פעולות מתאימות.

בפוסט זה, אנו מראים כיצד לפתח פתרון מונחה ML באמצעות אמזון SageMaker לאיתור תופעות לוואי באמצעות מערך הנתונים של תגובות שליליות של תרופות הזמינות לציבור על חיבוק פנים. בפתרון זה, אנו מכווננים מגוון דגמים ב-Huging Face אשר הוכשרו מראש על נתונים רפואיים ומשתמשים במודל BioBERT, אשר הוכשר מראש ב- מערך נתונים של Pubmed ומבצע את הטוב ביותר מבין אלה שנוסו.

הטמענו את הפתרון באמצעות ה ערכת פיתוח ענן AWS (AWS CDK). עם זאת, אנו לא מכסים את הפרטים של בניית הפתרון בפוסט זה. למידע נוסף על יישום פתרון זה, עיין ב בנה מערכת לאיתור תופעות לוואי בזמן אמת באמצעות Amazon SageMaker ו- Amazon QuickSight.

פוסט זה מתעמק במספר תחומים מרכזיים ומספק חקירה מקיפה של הנושאים הבאים:

אתגרי הנתונים שבהם נתקלים השירותים המקצועיים של AWS
הנוף והיישום של מודלים של שפה גדולה (LLMs):
- רובוטריקים, BERT ו-GPT
- פנים מחבקות
פתרון ה-LLM המותאם והמרכיבים שלו:
- הכנת נתונים
- אימון מודל

אתגר נתונים

הטיית נתונים היא לעתים קרובות בעיה כאשר מגיעים עם משימות סיווג. באופן אידיאלי תרצה לקבל מערך נתונים מאוזן, ומקרה שימוש זה אינו יוצא מן הכלל.

אנחנו מתייחסים להטיה הזו עם AI ייצור מודלים (Falcon-7B ו-Falcon-40B), שהתבקשו להפיק דגימות של אירועים על סמך חמש דוגמאות ממערך האימונים כדי להגדיל את המגוון הסמנטי ולהגדיל את גודל המדגם של אירועים חריגים שסומנו. זה יתרון עבורנו להשתמש כאן במודלים של פלקון מכיוון שבניגוד לחלק מה-LLMs ב-Hugging Face, Falcon נותן לך את מערך ההדרכה שבו הם משתמשים, כך שאתה יכול להיות בטוח שאף אחת מהדוגמאות של ערכת המבחנים שלך אינה כלולה בערכת האימונים של Falcon ולהימנע מנתונים נְגִיעוּת.

אתגר הנתונים הנוסף עבור לקוחות שירותי בריאות הם דרישות תאימות HIPAA. יש לשלב הצפנה במנוחה ובמעבר בפתרון כדי לעמוד בדרישות אלו.

רובוטריקים, BERT ו-GPT

ארכיטקטורת השנאים היא ארכיטקטורת רשת עצבית המשמשת למשימות עיבוד שפה טבעית (NLP). זה הוצג לראשונה בעיתון "תשומת לב היא כל מה שאתה צריך" מאת Vaswani et al. (2017). ארכיטקטורת השנאי מבוססת על מנגנון הקשב, המאפשר למודל ללמוד תלות ארוכת טווח בין מילים. רובוטריקים, כפי שנקבעו במסמך המקורי, מורכבים משני מרכיבים עיקריים: המקודד והמפענח. המקודד לוקח את רצף הקלט כקלט ומייצר רצף של מצבים נסתרים. לאחר מכן המפענח לוקח את המצבים הנסתרים הללו כקלט ומייצר את רצף הפלט. מנגנון הקשב משמש גם במקודד וגם במפענח. מנגנון הקשב מאפשר למודל לטפל במילים ספציפיות ברצף הקלט בעת יצירת רצף הפלט. זה מאפשר למודל ללמוד תלות ארוכת טווח בין מילים, דבר חיוני למשימות NLP רבות, כגון תרגום מכונה וסיכום טקסט.

אחת הארכיטקטורות הפופולריות והשימושיות יותר מבין ארכיטקטורות השנאים, Bidirectional Encoder Representations from Transformers (BERT), היא מודל ייצוג שפה שהיה מוצג ב 2018. BERT מאומן על רצפים שבהם חלק מהמילים במשפט מכוסות, ועליו למלא את המילים הללו תוך התחשבות במילים לפני ואחרי המילים המסכות. ניתן לכוונן את BERT למגוון משימות NLP, כולל מענה לשאלות, הסקת שפה טבעית וניתוח סנטימנטים.

ארכיטקטורת השנאים הפופולרית הנוספת שכבשה את העולם בסערה היא Generative Pre-trained Transformer (GPT). דגם ה-GPT הראשון היה הוצג בשנת 2018 על ידי OpenAI. זה עובד על ידי הכשרה לחזות בקפדנות את המילה הבאה ברצף, רק מודע להקשר שלפני המילה. מודלים של GPT מאומנים על מערך נתונים עצום של טקסט וקוד, וניתן לכוונן אותם עבור מגוון משימות NLP, כולל הפקת טקסט, מענה לשאלות וסיכום.

באופן כללי, BERT טוב יותר במשימות הדורשות הבנה מעמיקה יותר של ההקשר של מילים, ואילו GPT מתאים יותר למשימות הדורשות יצירת טקסט.

פנים מחבקות

Hugging Face היא חברת בינה מלאכותית המתמחה ב-NLP. הוא מספק פלטפורמה עם כלים ומשאבים המאפשרים למפתחים לבנות, לאמן ולפרוס מודלים של ML המתמקדים במשימות NLP. אחת ההצעות המרכזיות של Hugging Face היא הספרייה שלה, רוֹבּוֹטרִיקִים, הכולל מודלים מאומנים מראש שניתן לכוונן עבור משימות שפה שונות כגון סיווג טקסט, תרגום, סיכום ומענה לשאלות.

Hugging Face משתלב בצורה חלקה עם SageMaker, שהוא שירות מנוהל במלואו המאפשר למפתחים ומדעני נתונים לבנות, לאמן ולפרוס מודלים של ML בקנה מידה. סינרגיה זו מועילה למשתמשים בכך שהיא מספקת תשתית חזקה וניתנת להרחבה לטיפול במשימות NLP עם הדגמים החדישים שמציעה Hugging Face, בשילוב עם שירותי ה-ML החזקים והגמישים של AWS. אתה יכול גם לגשת לדגמי Hugging Face ישירות מ אמזון SageMaker JumpStart, מה שהופך את זה לנוח להתחיל עם פתרונות מובנים מראש.

סקירת פתרונות

השתמשנו בספריית Hugging Face Transformers כדי לכוונן עדין דגמי שנאים ב- SageMaker עבור המשימה של סיווג אירועי לוואי. עבודת ההדרכה נבנית באמצעות הערכת SageMaker PyTorch. ל- SageMaker JumpStart יש גם כמה אינטגרציות משלימות עם Hugging Face שמאפשרות יישום פשוט. בחלק זה, אנו מתארים את השלבים העיקריים הכרוכים בהכנת נתונים ובהכשרת מודלים.

הכנת נתונים

השתמשנו בנתוני התגובות השליליות (ade_corpus_v2) בתוך מערך הנתונים של Hugging Face עם חלוקת הדרכה/מבחן של 80/20. למבנה הנתונים הנדרש עבור אימון והסקת המודל שלנו יש שתי עמודות:

עמודה אחת לתוכן טקסט כנתוני קלט של מודל.
עמודה נוספת למחלקת התווית. יש לנו שתי כיתות אפשריות לטקסט: Not_AE ו Adverse_Event.

אימון וניסוי מודל

על מנת לחקור ביעילות את המרחב של מודלים אפשריים של Hugging Face כדי לכוונן את הנתונים המשולבים שלנו של אירועים חריגים, בנינו עבודה של SageMaker Hyperparameter Optimization (HPO) והעברנו מודלים שונים של Hugging Face כהיפרפרמטר, יחד עם יתר פרמטרים חשובים אחרים כגון גודל אצווה אימון, אורך רצף, מודלים וקצב למידה. בעבודות ההדרכה נעשה שימוש במופע ml.p3dn.24xlarge ולקח בממוצע 30 דקות לכל עבודה עם סוג המופע הזה. מדדי אימון נלכדו למרות ה ניסויים באמזון SageMaker כלי, וכל עבודת הכשרה עברה 10 עידנים.

אנו מציינים את הדברים הבאים בקוד שלנו:

גודל אצווה אימון – מספר הדגימות שעובדו יחד לפני עדכון משקלי הדגם
אורך רצף – אורך מקסימלי של רצף הקלט ש-BERT יכול לעבד
שיעור למידה – באיזו מהירות הדגם מעדכן את המשקולות שלו במהלך האימון
מודלים – דוגמניות שהוכשרו מראש לחבק פנים

# we use the Hyperparameter Tuner
from sagemaker.tuner import IntegerParameter,ContinuousParameter, CategoricalParameter
tuning_job_name = 'ade-hpo'
# Define exploration boundaries
hyperparameter_ranges = { 'learning_rate': ContinuousParameter(5e-6,5e-4), 'max_seq_length': CategoricalParameter(['16', '32', '64', '128', '256']), 'train_batch_size': CategoricalParameter(['16', '32', '64', '128', '256']), 'model_name': CategoricalParameter(["emilyalsentzer/Bio_ClinicalBERT", "dmis-lab/biobert-base-cased-v1.2", "monologg/biobert_v1.1_pubmed", "pritamdeka/BioBert-PubMed200kRCT", "saidhr20/pubmed-biobert-text-classification" ])
} # create Optimizer
Optimizer = sagemaker.tuner.HyperparameterTuner( estimator=bert_estimator, hyperparameter_ranges=hyperparameter_ranges, base_tuning_job_name=tuning_job_name, objective_type='Maximize', objective_metric_name='f1', metric_definitions=[ {'Name': 'f1', 'Regex': "f1: ([0-9.]+).*$"}], max_jobs=40, max_parallel_jobs=4,
) Optimizer.fit({'training': inputs_data}, wait=False)

תוצאות

הדגם שהציג את הביצועים הטובים ביותר במקרה השימוש שלנו היה monologg/biobert_v1.1_pubmed מודל מתארח ב-Huging Face, שהיא גרסה של ארכיטקטורת BERT שהוכשרה מראש במערך הנתונים של Pubmed, המורכב מ-19,717 פרסומים מדעיים. אימון מקדים של BERT על מערך נתונים זה נותן למודל זה מומחיות נוספת בכל הנוגע לזיהוי הקשר סביב מונחים מדעיים הקשורים לרפואה. זה מגביר את ביצועי המודל עבור משימת זיהוי אירועי לוואי מכיוון שהוא עבר הכשרה מראש על תחביר ספציפי רפואי המופיע לעתים קרובות במערך הנתונים שלנו.

הטבלה הבאה מסכמת את מדדי ההערכה שלנו.

מספר סימוכין	דיוק	להיזכר	F1
בסיס BERT	0.87	0.95	0.91
ביו-ברט	0.89	0.95	0.92
BioBERT עם HPO	0.89	0.96	0.929
BioBERT עם HPO ותופעות לוואי שנוצרו באופן סינתטי	0.90	0.96	0.933

למרות שמדובר בשיפורים קטנים יחסית ומצטברים בהשוואה למודל BERT הבסיסי, זה בכל זאת מדגים כמה אסטרטגיות ברות קיימא לשיפור ביצועי המודל באמצעות שיטות אלו. נראה כי יצירת נתונים סינתטיים עם Falcon טומנת בחובה הרבה הבטחות ופוטנציאל לשיפורי ביצועים, במיוחד כאשר דגמי הבינה המלאכותית הגנרטיבית הללו משתפרים עם הזמן.

לנקות את

כדי להימנע מחיובים עתידיים, מחק את כל המשאבים שנוצרו כמו המודל ונקודות הקצה של המודל שיצרת עם הקוד הבא:

# Delete resources
model_predictor.delete_model()
model_predictor.delete_endpoint()

סיכום

חברות תרופות רבות היום רוצות להפוך את תהליך זיהוי תופעות לוואי מאינטראקציות עם הלקוחות שלהן באופן שיטתי על מנת לעזור לשפר את בטיחות הלקוח ואת התוצאות. כפי שהראינו בפוסט זה, ה-LLM BioBERT המכוונן עדין עם תופעות לוואי שנוצרו באופן סינתטי שנוספו לנתונים מסווג את תופעות הלוואי עם ציוני F1 גבוהים וניתן להשתמש בו כדי לבנות פתרון תואם HIPAA עבור הלקוחות שלנו.

כמו תמיד, AWS מברכת על המשוב שלך. אנא השאר את המחשבות והשאלות שלך בקטע ההערות.

על המחברים

פרוס מודלים של שפות גדולות עבור מקרה שימוש בתחום הבריאות ב-Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי. זאק פיטרסון הוא מדען נתונים בשירותים מקצועיים של AWS. הוא עוסק במתן פתרונות למידת מכונה ללקוחות כבר שנים רבות ובעל תואר שני בכלכלה.

פרוס מודלים של שפות גדולות עבור מקרה שימוש בתחום הבריאות ב-Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי. ד"ר אדוואלה אקינפדרין הוא מדען נתונים בכיר במדעי הבריאות והחיים ב-AWS. המומחיות שלו היא בשיטות AI/ML הניתנות לשחזור ומקצה לקצה, יישומים מעשיים וסיוע ללקוחות שירותי בריאות גלובליים לגבש ולפתח פתרונות ניתנים להרחבה לבעיות בינתחומיות. יש לו שני תארים מתקדמים בפיזיקה ותואר דוקטור בהנדסה.

פרוס מודלים של שפות גדולות עבור מקרה שימוש בתחום הבריאות ב-Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי. אקטה וואליה בהולאר, PhD, הוא יועץ בכיר בינה מלאכותית/ML ביחידה העסקית של שירותי הבריאות ומדעי החיים של AWS (HCLS). יש לה ניסיון רב ביישום AI/ML בתחום הבריאות, במיוחד ברדיולוגיה. מחוץ לעבודה, כשהיא לא דנה בבינה מלאכותית ברדיולוגיה, היא אוהבת לרוץ ולטייל.

פרוס מודלים של שפות גדולות עבור מקרה שימוש בתחום הבריאות ב-Amazon SageMaker | Amazon Web Services PlatoBlockchain Data Intelligence. חיפוש אנכי. איי. האן מן הוא מנהל בכיר למדעי נתונים ולמידת מכונה עם שירותים מקצועיים של AWS שבסיסו בסן דייגו, קליפורניה. יש לו דוקטורט בהנדסה מאוניברסיטת נורת'ווסטרן ויש לו ניסיון של מספר שנים כיועץ ניהולי בייעוץ ללקוחות בייצור, שירותים פיננסיים ואנרגיה. כיום, הוא עובד בלהט עם לקוחות מפתח ממגוון רחב של ענפים בתעשייה כדי לפתח ולהטמיע פתרונות ML ו-AI גנרטיביים ב-AWS.

הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
מקור: https://aws.amazon.com/blogs/machine-learning/deploy-large-language-models-for-a-healthtech-use-case-on-amazon-sagemaker/

בול זמן: פברואר 6, 2024

בול זמן: דצמבר 20, 2022

הועלה מחדש על ידי אפלטון

התחל את המסע המוצלח שלך עם חיזוי סדרות זמן עם Amazon Forecast

אימון והסקת AI בקנה מידה לגילוי תרופות באמצעות Amazon EKS ו-Karpenter | שירותי האינטרנט של אמזון

הכנת נתונים ואימון מודלים מאוחדים עם Amazon SageMaker Data Wrangler ו-Amazon SageMaker Autopilot

ניתוח נגיעות מכרסמים באמצעות יכולות גיאו-מרחביות של Amazon SageMaker | שירותי האינטרנט של אמזון

שיטות עבודה מומלצות לאימון האצה של TensorFlow 1.x ב-Amazon SageMaker

פריסת מודל ML משופרת באמצעות Amazon SageMaker Inference Recommender

המלצות כוח וחיפוש באמצעות גרף ידע IMDb - חלק 2

אודות

חיפוש אנכי ו- Ai

פלטפורמה

שמור על קשר

חֶשְׁבּוֹן