ארגונים מבקשים לנצל במהירות את הפוטנציאל של AI יצירתי על ידי מתן גישה למודלים של יסודות (FMs) לקווי עסקים שונים (LOBs). צוותי IT אחראים לסייע ל-LOB לחדש במהירות ובזריזות תוך מתן ניהול מרכזי וצפייה. לדוגמה, ייתכן שהם יצטרכו לעקוב אחר השימוש ב-FM בין צוותים, עלויות חיוב חוזר ולספק נראות למרכז העלויות הרלוונטי ב-LOB. בנוסף, ייתכן שהם יצטרכו להסדיר את הגישה לדגמים שונים לכל צוות. לדוגמה, אם רק FM ספציפיים יאושרו לשימוש.
סלע אמזון הוא שירות מנוהל במלואו המציע מבחר של דגמי יסוד בעלי ביצועים גבוהים מחברות בינה מלאכותית מובילות כמו AI21 Labs, Anthropic, Cohere, Meta, Stability AI ואמזון באמצעות API יחיד, יחד עם סט רחב של יכולות לבניית בינה מלאכותית יצירתית יישומים עם אבטחה, פרטיות ובינה מלאכותית אחראית. מכיוון ש-Amazon Bedrock היא ללא שרת, אינך צריך לנהל שום תשתית, ואתה יכול לשלב ולפרוס בצורה מאובטחת יכולות בינה מלאכותית באפליקציות שלך באמצעות שירותי AWS שאתה כבר מכיר.
שכבת תוכנה כשירות (SaaS) למודלים של בסיס יכולה לספק ממשק פשוט ועקבי למשתמשי הקצה, תוך שמירה על ממשל מרכזי של גישה וצריכה. שערים של API יכולים לספק צימוד רופף בין צרכני המודל לשירות נקודות הקצה של המודל, וגמישות להסתגלות למודלים, ארכיטקטורות ושיטות הפעלה משתנות.
בפוסט זה, אנו מראים לך כיצד לבנות שכבת SaaS פנימית כדי לגשת לדגמי יסוד עם Amazon Bedrock בארכיטקטורת ריבוי דיירים (צוותים). אנו מתמקדים במיוחד במעקב אחר שימוש ועלויות לכל דייר וגם בקרות כגון גזירת שימוש לכל דייר. אנו מתארים כיצד הפתרון ותוכניות הצריכה של Amazon Bedrock ממפות למסגרת המסע הכללית של SaaS. הקוד לפתרון ו- an ערכת פיתוח ענן AWS תבנית (AWS CDK) זמינה ב- מאגר GitHub.
אתגרים
מנהל פלטפורמת AI צריך לספק גישה סטנדרטית וקלה ל-FM למספר צוותי פיתוח.
להלן כמה מהאתגרים לספק גישה מבוקרת למודלים של יסודות:
- מעקב אחר עלויות ושימוש - עקוב ובקר עלויות דיירים בודדים ושימוש במודלים של בסיס, וספק עלויות חיוב חוזר למרכזי עלות ספציפיים
- בקרות תקציב ושימוש - ניהול מכסת API, תקציב ומגבלות שימוש לשימוש המותר במודלים של בסיס בתדירות מוגדרת לכל דייר
- בקרת גישה וניהול מודלים - הגדר בקרות גישה עבור דגמים ספציפיים של אישור רשומים לכל דייר
- API סטנדרטי מרובה דיירים - לספק גישה עקבית למודלים של בסיס עם OpenAPI תקנים
- ניהול מרכזי של API - ספק שכבה אחת לניהול מפתחות API לגישה למודלים
- גרסאות דגם ועדכונים - טפל בהשקת גרסת דגם חדשה ומעודכנת
סקירת פתרונות
בפתרון זה, אנו מתייחסים לא ריבוי דיירים גִישָׁה. א שׂוֹכֵר כאן יכול לנוע בין משתמש בודד, פרויקט ספציפי, צוות או אפילו מחלקה שלמה. כאשר אנו דנים בגישה, אנו משתמשים במונח נבחרת, כי זה הנפוץ ביותר. אנו משתמשים במפתחות API כדי להגביל ולנטר את גישת ה-API עבור צוותים. לכל צוות מוקצה מפתח API לגישה ל-FMs. יכולים להיות מנגנוני אימות והרשאה שונים של משתמשים הפרוסים בארגון. לשם הפשטות, איננו כוללים את אלה בפתרון זה. אתה יכול גם לשלב ספקי זהות קיימים עם פתרון זה.
התרשים הבא מסכם את ארכיטקטורת הפתרון ומרכיבי המפתח. צוותים (דיירים) שהוקצו למרכזי עלות נפרדים צורכים אמזון Bedrock FMs באמצעות שירות API. כדי לעקוב אחר הצריכה והעלות לצוות, הפתרון רושם נתונים עבור כל הזמנה בודדת, כולל המודל שהופעל, מספר האסימונים עבור מודלים של יצירת טקסט, וממדי תמונה עבור מודלים רב-מודאליים. בנוסף, הוא אוסף את הפניות לכל דגם ועלויות על ידי כל צוות.
אתה יכול לפרוס את הפתרון בחשבון שלך באמצעות AWS CDK. AWS CDK היא מסגרת לפיתוח תוכנה בקוד פתוח למודל ואספקת משאבי יישומי הענן שלך באמצעות שפות תכנות מוכרות. קוד AWS CDK זמין ב- מאגר GitHub.
בסעיפים הבאים, נדון במרכיבי המפתח של הפתרון ביתר פירוט.
לכידת השימוש במודל הבסיס לכל צוות
זרימת העבודה ללכידת השימוש ב-FM לכל צוות מורכבת מהשלבים הבאים (כפי שממוספרים בתרשים הקודם):
- יישום של צוות שולח בקשת POST אל שער API של אמזון עם המודל שיופעל ב-
model_id
פרמטר השאילתה ובקשת המשתמש בגוף הבקשה. - API Gateway מנתב את הבקשה ל- AWS למבדה פונקציה
bedrock_invoke_model
) שאחראי לכניסה לפרטי שימוש בצוות אמזון CloudWatch ומשתמש במודל אמזון בדראק. - Amazon Bedrock מספקת נקודת קצה VPC המופעלת על ידי AWS PrivateLink. בפתרון זה, פונקציית Lambda שולחת את הבקשה לאמזון Bedrock באמצעות PrivateLink כדי ליצור חיבור פרטי בין ה-VPC בחשבון שלך לבין חשבון השירות של Amazon Bedrock. למידע נוסף על PrivateLink, ראה השתמש ב-AWS PrivateLink כדי להגדיר גישה פרטית ל-Amazon Bedrock.
- לאחר קריאת הסלע של אמזון, Amazon CloudTrail מייצר א אירוע CloudTrail.
- אם השיחה של Amazon Bedrock מצליחה, פונקציית Lambda רושמת את המידע הבא בהתאם לסוג המודל המופעל ומחזירה את התגובה שנוצרה לאפליקציה:
- team_id – המזהה הייחודי לצוות המוציא את הבקשה.
- requestId – המזהה הייחודי של הבקשה.
- model_id - מזהה הדגם שיש להפעיל.
- inputTokens – מספר האסימונים שנשלחו לדגם כחלק מההנחיה (עבור דגמי יצירת טקסט והטמעות).
- outputTokens – המספר המרבי של אסימונים שייווצר על ידי המודל (עבור מודלים של יצירת טקסט).
- גובה – גובה התמונה המבוקשת (עבור דגמים מולטי-מודאליים ודגמי הטבעה מולטי-מודאליים).
- רוחב – רוחב התמונה המבוקשת (עבור דגמים מולטי-מודאליים בלבד).
- צעדים – השלבים המבוקשים (עבור דגמי AI Stability).
מעקב אחר עלויות לצוות
זרימה שונה אוספת את מידע השימוש, ואז מחשבת וחוסכת את העלויות לפי דרישה לצוות על בסיס יומי. על ידי קיום זרימה נפרדת, אנו מבטיחים שמעקב אחר עלויות לא ישפיע על זמן ההשהיה והתפוקה של זרימת הזמנת המודל. שלבי זרימת העבודה הם כדלקמן:
- An אמזון EventBridge כלל מפעיל פונקציית Lambda (
bedrock_cost_tracking
) יום יומי. - פונקציית Lambda מקבלת את מידע השימוש מ-CloudWatch עבור היום הקודם, מחשבת את העלויות הנלוות, ומאחסנת את הנתונים שנצברו על ידי
team_id
וmodel_id
in שירות אחסון פשוט של אמזון (Amazon S3) בפורמט CSV.
כדי לבצע שאילתה ולדמיין את הנתונים המאוחסנים באמזון S3, יש לך אפשרויות שונות, כולל S3 בחר, ו אמזון אתנה ואמזון קוויקסייט.
שליטה בשימוש לכל צוות
תוכנית שימוש מציינת מי יכול לגשת לממשק API פרוס אחד או יותר, ובאופן אופציונלי מגדירה את קצב בקשת היעד כדי להתחיל להצניע בקשות. התוכנית משתמשת במפתחות API כדי לזהות לקוחות API שיכולים לגשת ל-API המשויך לכל מפתח. אתה יכול להשתמש ב-API Gateway תוכניות שימוש למצערת בקשות החורגות מהסף שהוגדר מראש. אתה יכול גם להשתמש מפתחות API ומגבלות מכסה, המאפשרות לך להגדיר את המספר המרבי של בקשות לכל מפתח API שכל צוות רשאי להנפיק בתוך מרווח זמן מוגדר. זה בנוסף ל מכסות שירות של Amazon Bedrock שהוקצו רק ברמת החשבון.
תנאים מוקדמים
לפני פריסת הפתרון, ודא שיש לך את הדברים הבאים:
פרוס את ערימת AWS CDK
בצע את ההוראות בסעיף README קובץ של מאגר GitHub כדי להגדיר ולפרוס את ערימת ה-CDK של AWS.
המחסנית פורסת את המשאבים הבאים:
- סביבת רשת פרטית (VPC, רשתות משנה פרטיות, קבוצת אבטחה)
- תפקיד IAM לשליטה בגישה למודלים
- שכבות למבדה עבור מודולי Python הדרושים
- פונקציית למדה
invoke_model
- פונקציית למדה
list_foundation_models
- פונקציית למדה
cost_tracking
- Rest API (API Gateway)
- תוכנית שימוש ב-API Gateway
- מפתח API המשויך לתוכנית השימוש
על סיפון צוות חדש
כדי לספק גישה לצוותים חדשים, אתה יכול לשתף את אותו מפתח API על פני צוותים שונים ולעקוב אחר צריכת המודל על ידי אספקת מפתח שונה team_id
עבור הפעלת ה-API, או צור מפתחות API ייעודיים המשמשים לגישה למשאבי Amazon Bedrock על ידי ביצוע ההוראות המפורטות ב- README.
המחסנית פורסת את המשאבים הבאים:
- תוכנית שימוש ב-API Gateway המשויכת ל-REST API שנוצר בעבר
- מפתח API המשויך לתוכנית השימוש של הצוות החדש, עם תצורות מצערות ו-burst שמורות עבור ה-API
למידע נוסף על הצערת שער API ותצורות פרצים, עיין ב בקשות API של Throttle לתפוקה טובה יותר.
לאחר פריסת המחסנית, תוכל לראות שמפתח ה-API החדש עבור team-2
נוצר גם כן.
הגדר בקרת גישה לדגם
מנהל הפלטפורמה יכול לאפשר גישה לדגמי יסוד ספציפיים על ידי עריכת מדיניות IAM הקשורה לפונקציית Lambda invoke_model
. ה
הרשאות IAM מוגדרות בקובץ setup/stack_constructs/iam.py. ראה את הקוד הבא:
הפעל את השירות
לאחר שתפרוס את הפתרון, תוכל להפעיל את השירות ישירות מהקוד שלך. הבאים
הוא דוגמה ב-Python לצריכת ה- invoke_model
API ליצירת טקסט באמצעות בקשת POST:
תפוקה: Amazon Bedrock היא פלטפורמה טכנולוגית פנימית שפותחה על ידי אמזון כדי להפעיל ולתפעל רבים מהשירותים והמוצרים שלה. כמה דברים מרכזיים על Bedrock …
להלן דוגמה נוספת ב-Python לצריכת ה- invoke_model
API ליצירת הטמעות באמצעות בקשת POST:
model_id = "amazon.titan-embed-text-v1" #the model id for the Amazon Titan Embeddings Text model prompt = "What is Amazon Bedrock?" response = requests.post( f"{api_url}/invoke_model?model_id={model_id}", json={"inputs": prompt, "parameters": model_kwargs}, headers={ "x-api-key": api_key, #key for querying the API "team_id": team_id #unique tenant identifier, "embeddings": "true" #boolean value for the embeddings model }
) text = response.json()[0]["embedding"]
פלט: 0.91796875, 0.45117188, 0.52734375, -0.18652344, 0.06982422, 0.65234375, -0.13085938, 0.056884766, 0.092285156, 0.06982422. , 1.03125, 0.8515625, 0.16308594, 0.079589844, -0.033935547, 0.796875, -0.15429688, -0.29882812, -0.25585938, -0.45703125, 0.044921875, 0.34570312, XNUMX, XNUMX XNUMX, XNUMX …
נדחתה גישה למודלים של בסיס
להלן דוגמה ב-Python לצריכת ה- invoke_model
ממשק API ליצירת טקסט באמצעות בקשת POST עם תגובה נדחתה:
"Traceback (הקריאה האחרונה האחרונה):n File ”/var/task/index.py”, שורה 213, בתגובה lambda_handlern = _invoke_text(bedrock_client, model_id, body, model_kwargs)n File ”/var/task/index.py ”, שורה 146, ב-_invoke_textn raise en File ”/var/task/index.py”, שורה 131, ב-_invoke_textn response = bedrock_client.invoke_model(n File ”/opt/python/botocore/client.py”, שורה 535, ב-_api_calln return self._make_api_call(operation_name, kwargs)n File ”/opt/python/botocore/client.py”, שורה 980, ב-_make_api_calln להעלות error_class(parsed_response, operation_name)nbotocore.enroriedException.Access אירעה שגיאה (AccessDeniedException) בעת קריאה לפעולת InvokeModel: החשבון שלך אינו מורשה להפעיל את פעולת ה-API הזו.n"
דוגמה להערכת עלויות
בעת הפעלת מודלים של אמזון Bedrock עם תמחור לפי דרישה, העלות הכוללת מחושבת כסכום עלויות התשומה והפלט. עלויות הקלט מבוססות על מספר אסימוני הקלט הנשלחים למודל, ועלויות הפלט מבוססות על האסימונים שנוצרו. המחירים הם לכל 1,000 אסימוני קלט ולכל 1,000 אסימוני פלט. לפרטים נוספים ומחירי דגמים ספציפיים, עיין ב תמחור סלע אמזון.
בואו נסתכל על דוגמה שבה שני צוותים, team1 ו-team2, ניגשים ל- Amazon Bedrock דרך הפתרון בפוסט הזה. נתוני השימוש והעלות שנשמרו באמזון S3 ביום אחד מוצגים בטבלה הבאה.
העמודות input_tokens
ו output_tokens
אחסן את סך כל אסימוני הקלט והפלט על פני קריאות מודל לכל דגם ולכל צוות, בהתאמה, ליום נתון.
העמודות input_cost
ו output_cost
לאחסן את העלויות המתאימות לכל דגם ולכל צוות. אלה מחושבים באמצעות הנוסחאות הבאות:
input_cost = input_token_count * model_pricing["input_cost"] / 1000
output_cost = output_token_count * model_pricing["output_cost"] / 1000
team_id | model_id | input_tokens | output_tokens | קריאות | עלות_קלט | פלט_עלות |
Team1 | amazon.titan-tg1-large | 24000 | 2473 | 1000 | 0.0072 | 0.00099 |
Team1 | anthropic.claude-v2 | 2448 | 4800 | 24 | 0.02698 | 0.15686 |
Team2 | amazon.titan-tg1-large | 35000 | 52500 | 350 | 0.0105 | 0.021 |
Team2 | ai21.j2-grande-instruct | 4590 | 9000 | 45 | 0.05738 | 0.1125 |
Team2 | anthropic.claude-v2 | 1080 | 4400 | 20 | 0.0119 | 0.14379 |
תצוגה מקצה לקצה של סביבת SaaS פונקציונלית מרובת דיירים ללא שרתים
בואו נבין איך עשויה להיראות סביבת SaaS ללא שרת ללא שרתים מקצה לקצה. להלן תרשים ארכיטקטורת ייחוס.
דיאגרמת הארכיטקטורה הזו היא גרסה מוגדלת של דיאגרמת הארכיטקטורה הקודמת שהוסברה קודם לכן בפוסט, כאשר דיאגרמת הארכיטקטורה הקודמת מסבירה את הפרטים של אחד משירותי המיקרו שהוזכרו (שירות מודלים בסיסיים). תרשים זה מסביר שמלבד שירות המודל הבסיסי, אתה צריך שיהיו לך רכיבים אחרים גם בפלטפורמת ה-SaaS מרובת הדיירים שלך כדי ליישם פלטפורמה פונקציונלית וניתנת להרחבה.
בואו נעבור על הפרטים של הארכיטקטורה.
בקשות דיירים
אפליקציות הדיירים הן אפליקציות הקצה המקיימות אינטראקציה עם הסביבה. כאן, אנו מראים לדיירים מרובים גישה מסביבות מקומיות או AWS שונות. ניתן להרחיב את היישומים הקדמיים כך שיכללו דף רישום עבור דיירים חדשים שיירשמו בעצמם ומסוף ניהול למנהלי שכבת השירות של SaaS. אם יישומי הדיירים דורשים הטמעת לוגיקה מותאמת אישית הדורשת אינטראקציה עם סביבת ה-SaaS, הם יכולים ליישם את המפרטים של המיקרו-שירות של מתאם היישומים. תרחישים לדוגמה יכולים להיות הוספת לוגיקת הרשאות מותאמת אישית תוך כיבוד מפרטי ההרשאה של סביבת SaaS.
שירותים משותפים
השירותים הבאים הם שירותים משותפים:
- שירותי ניהול דיירים ומשתמשים – שירותים אלו אחראים על רישום וניהול הדיירים. הם מספקים את הפונקציונליות הרוחבית הנפרדת משירותי האפליקציות ומשותפת לכל הדיירים.
- שירות מודל קרן – דיאגרמת ארכיטקטורת הפתרון שהוסברה בתחילת פוסט זה מייצגת את המיקרו-שירות הזה, שבו האינטראקציה בין ה-API Gateway לפונקציות Lambda מתרחשת במסגרת המיקרו-שירות הזה. כל הדיירים משתמשים במיקרו-שירות זה כדי להפעיל את דגמי היסודות מ-Anthropic, AI21, Cohere, Stability, Meta ואמזון, כמו גם מודלים מכוונים. זה גם לוכד את המידע הדרוש למעקב אחר שימוש ביומני CloudWatch.
- שירות מעקב עלויות -שירות זה עוקב אחר העלות והשימוש עבור כל דייר. שירות מיקרו זה פועל לפי לוח זמנים כדי לבצע שאילתות ביומני CloudWatch ולהוציא את מעקב השימוש המצטבר והעלות המשוערת לאחסון הנתונים. ניתן להרחיב את שירות מעקב העלויות כדי לבנות דוחות נוספים והדמיה.
שירות מתאמי יישומים
שירות זה מציג קבוצה של מפרטים וממשקי API שדייר יכול ליישם על מנת לשלב את ההיגיון המותאם אישית שלו בסביבת SaaS. בהתבסס על כמות האינטגרציה המותאמת אישית הדרושה, רכיב זה יכול להיות אופציונלי עבור דיירים.
מאגר נתונים מרובה דיירים
השירותים המשותפים מאחסנים את הנתונים שלהם במאגר נתונים שיכול להיות משותף יחיד אמזון דינמו טבלה עם מפתח חלוקת דיירים שמשייך פריטי DynamoDB לדיירים בודדים. השירות המשותף למעקב אחר עלויות מוציא את נתוני השימוש המצטברים ומעקב עלויות לאמזון S3. בהתבסס על מקרה השימוש, יכול להיות גם מאגר נתונים ספציפי לאפליקציה.
סביבת SaaS מרובת דיירים יכולה לכלול הרבה יותר רכיבים. למידע נוסף, עיין ב בניית פתרון SaaS מרובה דיירים באמצעות שירותים ללא שרתים של AWS.
תמיכה במספר דגמי פריסה
מסגרות SaaS מתארות בדרך כלל שני מודלים של פריסה: מאגר וממגורה. עבור מודל הבריכה, כל הדיירים ניגשים ל-FM מסביבה משותפת עם תשתית אחסון ותשתית מחשוב משותפת. במודל הסילו, לכל דייר יש מערך משאבים ייעודי משלו. אתה יכול לקרוא על מודלים של בידוד ב- נייר לבן של אסטרטגיות בידוד דיירים של SaaS.
ניתן לאמץ את הפתרון המוצע עבור שני דגמי הפריסה של SaaS. בגישת המאגר, סביבת AWS מרכזית מארחת את משאבי ה-API, האחסון והמחשוב. במצב סילו, כל צוות ניגש לממשקי API, אחסון ומשאבי מחשוב בסביבת AWS ייעודית.
הפתרון מתאים גם לתוכניות הצריכה הזמינות שמספקת Amazon Bedrock. AWS מספקת בחירה בין שתי תוכנית צריכה להסקה:
- On-Demand - מצב זה מאפשר לך להשתמש במודלים של בסיס על בסיס תשלום לפי נסיעות ללא צורך בהתחייבויות לטווח זמן מבוסס-זמן
- תפוקה מסופקת - מצב זה מאפשר לך לספק תפוקה מספקת כדי לעמוד בדרישות הביצועים של האפליקציה שלך בתמורה להתחייבות לטווח זמן מבוסס-זמן
למידע נוסף על אפשרויות אלה, עיין ב תמחור סלע אמזון.
פתרון ההתייחסות SaaS ללא שרת המתואר בפוסט זה יכול ליישם את תוכניות הצריכה של Amazon Bedrock כדי לספק אפשרויות שכבות בסיסיות ופרמיות למשתמשי קצה. הבסיס יכול לכלול צריכת תפוקה לפי דרישה או מסופקת של Amazon Bedrock ויכול לכלול מגבלות ספציפיות על שימוש ותקציב. ניתן להפעיל מגבלות דיירים על ידי מניעת בקשות המבוססות על בקשות, גדלי אסימונים או הקצאת תקציב. לדיירי שכבת פרימיום יכולים להיות משאבים ייעודיים משלהם עם צריכת תפוקה מסודרת של Amazon Bedrock. דיירים אלה יהיו משויכים בדרך כלל לעומסי עבודה של ייצור הדורשים תפוקה גבוהה וגישה עם זמן אחזור נמוך למכשירי אמזון Bedrock FM.
סיכום
בפוסט זה, דנו כיצד לבנות פלטפורמת SaaS פנימית כדי לגשת לדגמי יסוד עם Amazon Bedrock במערך ריבוי דיירים עם התמקדות במעקב אחר עלויות ושימוש, ומגבלות מצערת עבור כל דייר. נושאים נוספים שיש לחקור כוללים שילוב פתרונות אימות והרשאה קיימים בארגון, שיפור שכבת ה-API כך שתכלול שקעי אינטרנט לאינטראקציות דו-כיווניות של שרת לקוח, הוספת סינון תוכן ומעקות בטיחות אחרים, עיצוב שכבות פריסה מרובות, שילוב מיקרו-שירותים אחרים ב-SaaS אדריכלות ועוד רבים.
הקוד כולו עבור פתרון זה זמין ב- מאגר GitHub.
למידע נוסף על מסגרות מבוססות SaaS, עיין ב מסגרת SaaS Journey: בניית פתרון SaaS חדש ב-AWS.
על הכותבים
חסן פונוואלה הוא ארכיטקט פתרונות מומחה בינה מלאכותית/ML בכיר ב-AWS, עובד עם לקוחות בריאות ומדעי החיים. Hasan עוזר לתכנן, לפרוס ולהתאים יישומי בינה מלאכותית ולמידת מכונה ב-AWS. יש לו למעלה מ-15 שנות ניסיון עבודה משולב בלמידת מכונה, פיתוח תוכנה ומדעי נתונים בענן. בזמנו הפנוי, חסן אוהב לחקור את הטבע ולבלות עם חברים ובני משפחה.
אנסטסיה צבלקה הוא ארכיטקט פתרונות מומחה בינה מלאכותית/ML בכיר ב-AWS. כחלק מעבודתה, היא עוזרת ללקוחות ברחבי EMEA לבנות מודלים בסיסיים וליצור פתרונות בינה מלאכותית ולמידת מכונה ניתנים להרחבה באמצעות שירותי AWS.
ברולא פיסטון הוא ארכיטקט פתרונות מומחה בינה מלאכותית ו-ML עבור AWS שבסיסו במילאנו. הוא עובד עם לקוחות גדולים ומסייע להם להבין לעומק את הצרכים הטכניים שלהם ולתכנן פתרונות בינה מלאכותית ו-Machine Learning שעושים את השימוש הטוב ביותר ב-AWS Cloud וב-Amazon Machine Learning. המומחיות שלו כוללת: למידת מכונה מקצה לקצה, תיעוש למידת מכונה ובינה מלאכותית גנרטיבית. הוא נהנה לבלות עם חבריו ולחקור מקומות חדשים, כמו גם לנסוע ליעדים חדשים.
ויקש פנדי הוא ארכיטקט Generative AI/ML Solutions, המתמחה בשירותים פיננסיים, שם הוא עוזר ללקוחות פיננסיים לבנות ולהרחיב פלטפורמות ופתרונות Generative AI/ML המתקדמים למאות עד אלפי משתמשים. בזמנו הפנוי, ויקש אוהב לכתוב בפורומים שונים בבלוג ולבנות לגו עם הילד שלו.
- הפצת תוכן ויחסי ציבור מופעל על ידי SEO. קבל הגברה היום.
- PlatoData.Network Vertical Generative Ai. העצים את עצמך. גישה כאן.
- PlatoAiStream. Web3 Intelligence. הידע מוגבר. גישה כאן.
- PlatoESG. פחמן, קלינטק, אנרגיה, סביבה, שמש, ניהול פסולת. גישה כאן.
- PlatoHealth. מודיעין ביוטכנולוגיה וניסויים קליניים. גישה כאן.
- מקור: https://aws.amazon.com/blogs/machine-learning/build-an-internal-saas-service-with-cost-and-usage-tracking-for-foundation-models-on-amazon-bedrock/
- :יש ל
- :הוא
- :לֹא
- :איפה
- $ למעלה
- 000
- 1
- 120
- שנים 15
- 15%
- 160
- 26%
- 500
- 7
- a
- אודות
- גישה
- גישה
- חֶשְׁבּוֹן
- לרוחב
- להסתגל
- מוסיף
- תוספת
- נוסף
- בנוסף
- מנהל
- מנהלים
- מאומץ
- אגרגטים
- AI
- דגמי AI
- פלטפורמת AI
- AI / ML
- תעשיות
- הַקצָאָה
- להתיר
- מאפשר
- לאורך
- כְּבָר
- גם
- אמזון בעברית
- למידת מכונת אמזון
- אמזון קוויקסייט
- אמזון שירותי אינטרנט
- an
- ו
- אחר
- אנתרופי
- כל
- בנפרד
- API
- גישה לממשק API
- מפתחות API
- ממשקי API
- בקשה
- יישומים
- החל
- גישה
- מאושר
- ארכיטקטורה
- ארכיטקטורות
- ARE
- AS
- שהוקצה
- המשויך
- מקורביו
- At
- בדיקה
- אימות
- אישור
- מורשה
- זמין
- AWS
- מבוסס
- בסיסי
- בסיס
- BE
- כי
- ההתחלה
- הטוב ביותר
- מוטב
- בֵּין
- בלוג
- גוּף
- שניהם
- רחב
- תקציב
- לִבנוֹת
- בִּניָן
- עסקים
- by
- מחושב
- מחשב
- שיחה
- קוראים
- CAN
- יכולות
- ללכוד
- לוכדת
- מקרה
- מרכז
- מרכזים
- מְרוּכָּז
- האתגרים
- משתנה
- בחירה
- לקוחות
- לקוחות
- ענן
- קוד
- עמודות
- משולב
- Common
- חברות
- רְכִיב
- רכיבים
- לחשב
- תְצוּרָה
- הקשר
- עִקבִי
- מורכב
- קונסול
- לצרוך
- צרכנים
- רב
- צְרִיכָה
- תוכן
- לִשְׁלוֹט
- שליטה
- בקרות
- עלות
- עלויות
- יכול
- לִיצוֹר
- נוצר
- מנהג
- לקוחות
- יומי
- נתונים
- מדע נתונים
- אחסון נתונים
- יְוֹם
- מוקדש
- באופן מעמיק
- לְהַגדִיר
- מוגדר
- נדחתה
- מַחלָקָה
- תלוי
- לפרוס
- פרס
- פריסה
- פורס
- לתאר
- מְתוּאָר
- עיצוב
- תכנון
- יעדים
- פרט
- פרטים
- מפותח
- צעצועי התפתחות
- צוותי פיתוח
- תרשים
- אחר
- ממדים
- ישירות
- לדון
- נָדוֹן
- do
- לא
- לא
- כל אחד
- מוקדם יותר
- קל
- השפעה
- או
- הטבעה
- EMEA
- לאפשר
- מופעל
- סוף
- מקצה לקצה
- נקודת קצה
- שיפור
- לְהַבטִיחַ
- שלם
- סביבה
- סביבות
- שגיאה
- להקים
- אֲפִילוּ
- אירוע
- דוגמה
- עולה על
- חליפין
- קיימים
- ניסיון
- מומחיות
- מוסבר
- מסביר
- לחקור
- היכרות
- אקספרס
- מוּרחָב
- מוכר
- משפחה
- שלח
- סינון
- כספי
- שירותים פיננסיים
- fits
- גמישות
- תזרים
- להתמקד
- הבא
- כדלקמן
- בעד
- פוּרמָט
- פורומים
- קרן
- היסוד
- יסודות
- מסגרת
- מסגרות
- תדר
- חברים
- החל מ-
- חזית
- חזיתי
- לגמרי
- פונקציה
- פונקציונלי
- פונקציונלי
- פונקציות
- נוסף
- שער כניסה
- שערים
- כללי
- נוצר
- מייצר
- דור
- גנרטטיבית
- AI Generative
- מקבל
- GitHub
- נתן
- Go
- ממשל
- נשלט
- קְבוּצָה
- לטפל
- מתרחש
- יש
- יש
- he
- בריאות
- גובה
- עזרה
- עוזר
- לה
- כאן
- גָבוֹהַ
- ביצועים גבוהים
- שֶׁלוֹ
- מארחים
- איך
- איך
- HTML
- http
- HTTPS
- מאות
- ID
- מזהה
- לזהות
- זהות
- if
- תמונה
- פְּגִיעָה
- ליישם
- יושם
- in
- לכלול
- כולל
- בנפרד
- מוּסָק
- מידע
- תשתית
- לחדש
- קלט
- תשומות
- הוראות
- לשלב
- שילוב
- השתלבות
- אינטראקציה
- אינטראקציה
- יחסי גומלין
- מִמְשָׁק
- פנימי
- אל תוך
- הופעל
- בדידות
- סוגיה
- הנפקת
- IT
- פריטים
- שֶׁלָה
- מסע
- jpg
- מפתח
- מפתחות
- יֶלֶד
- מעבדות
- שפות
- גָדוֹל
- אחרון
- חֶבִיוֹן
- שכבה
- שכבות
- מוביל
- לִלמוֹד
- למידה
- רמה
- החיים
- מדעי חיים
- כמו
- אוהב
- גבולות
- קו
- קווים
- ברשימה
- מקומי
- רישום
- הגיון
- נראה
- נראה כמו
- מגרש
- אוהב
- נמוך
- מכונה
- למידת מכונה
- שמירה
- לעשות
- לנהל
- הצליח
- ניהול
- ניהול
- רב
- מַפָּה
- מקסימום
- מאי..
- מנגנוני
- לִפְגוֹשׁ
- מוּזְכָּר
- meta
- שיטות
- שירות מיקרו
- מיקרו
- יכול
- מילאן
- ML
- מצב
- מודל
- מודלים
- צג
- יותר
- רוב
- הרבה
- מספר
- טבע
- הכרחי
- צורך
- נחוץ
- צרכי
- רשתות
- חדש
- מספר
- ממוספר
- התרחשה
- of
- המיוחדות שלנו
- on
- On-Demand
- ONE
- רק
- לפתוח
- קוד פתוח
- להפעיל
- מבצע
- אפשרויות
- or
- להזמין
- ארגון
- אחר
- מתווה
- תפוקה
- פלטים
- יותר
- שֶׁלוֹ
- עמוד
- פרמטר
- פרמטרים
- חלק
- עבור
- ביצועים
- הרשאות
- מקומות
- תכנית
- תוכניות
- פלטפורמה
- פלטפורמות
- אפלטון
- מודיעין אפלטון
- אפלטון נתונים
- מדיניות
- בריכה
- הודעה
- פוטנציאל
- מופעל
- קודם
- מוגדר מראש
- פּרֶמיָה
- מתנות
- קודם
- קוֹדֶם
- מחירים
- תמחור
- פְּרָטִיוּת
- פְּרָטִי
- הפקה
- מוצרים
- תכנות
- שפות תכנות
- פּרוֹיֶקט
- מוּצָע
- לספק
- ובלבד
- ספקים
- מספק
- מתן
- אַספָּקָה
- פיתון
- שאלה
- מהירות
- להעלות
- רכס
- ציון
- חומר עיוני
- לאחרונה
- להתייחס
- הפניה
- הירשם
- רישום
- הַרשָׁמָה
- להסדיר
- רלוונטי
- דוחות לדוגמא
- מאגר
- מייצג
- לבקש
- בקשות
- לדרוש
- דרישות
- שמור
- משאבים
- כיבוד
- אלה
- בהתאמה
- תגובה
- אחראי
- REST
- לְהַגבִּיל
- לַחֲזוֹר
- החזרות
- תפקיד
- נתיבים
- כלל
- הפעלה
- פועל
- SaaS
- אותו
- הציל
- להרחבה
- סולם
- מאזניים
- תרחישים
- לוח זמנים
- מדע
- מדעים
- היקף
- סעיפים
- מאובטח
- אבטחה
- לִרְאוֹת
- מחפשים
- עצמי
- שולח
- לחצני מצוקה לפנסיונרים
- נשלח
- נפרד
- שרת
- ללא שרת
- שרות
- שירותים
- סט
- סטים
- התקנה
- שיתוף
- משותף
- היא
- לְהַצִיג
- הראה
- פָּשׁוּט
- פשטות
- יחיד
- גדל
- תוכנה
- תוכנה כשירות
- פיתוח תוכנה
- פִּתָרוֹן
- פתרונות
- כמה
- מָקוֹר
- מתמחה
- מומחה
- ספציפי
- במיוחד
- מפרטים
- מפורט
- מְהִירוּת
- לבלות
- הוצאה
- יציבות
- לערום
- התחלה
- צעדים
- אחסון
- חנות
- מאוחסן
- חנויות
- אסטרטגיות
- רשתות משנה
- מוצלח
- כזה
- מספיק
- בטוח
- שולחן
- יעד
- נבחרת
- צוותי
- טכני
- טכנולוגיה
- תבנית
- שׂוֹכֵר
- טווח
- טֶקסט
- זֶה
- השמיים
- המידע
- שֶׁלָהֶם
- אותם
- עצמם
- אז
- שם.
- אלה
- הֵם
- דברים
- זֶה
- אלפים
- דרך
- תפוקה
- נִדבָּך
- זמן
- עֲנָק
- ל
- אסימון
- מטבעות
- נושאים
- סה"כ
- לעקוב
- מעקב
- מסלולים
- נָכוֹן
- שתיים
- סוג
- בדרך כלל
- להבין
- ייחודי
- לפתוח
- מְעוּדכָּן
- נוֹהָג
- להשתמש
- במקרה להשתמש
- מְשׁוּמָשׁ
- משתמש
- משתמשים
- שימושים
- באמצעות
- v1
- ערך
- שונים
- גרסה
- גירסאות
- באמצעות
- לצפיה
- ראות
- ראיה
- לחזות
- we
- אינטרנט
- שירותי אינטרנט
- שקעי אינטרנט
- טוֹב
- מה
- מה
- מתי
- אשר
- בזמן
- מי
- רוחב
- עם
- בתוך
- לְלֹא
- תיק עבודות
- זרימת עבודה
- עובד
- עובד
- היה
- לכתוב
- שנים
- אתה
- זפירנט