Databricks טוענת ש-LLM בקוד פתוח שלה מתחכם GPT-3.5

Databricks טוענת ש-LLM בקוד פתוח שלה מתחכם GPT-3.5

Databricks טוענת כי הקוד הפתוח LLM מתעלה על GPT-3.5 PlatoBlockchain Data Intelligence. חיפוש אנכי. איי.

פלטפורמת אנליטיקס Databricks השיקה מודל שפה בסיסי בקוד פתוח, בתקווה שארגונים יבחרו להשתמש בכלים שלה כדי לקפוץ על עגלת ה-LLM.

החברה, שנוסדה סביב Apache Spark, פרסמה שורה של מדדים בטענה שה-LLM שלה למטרות כלליות - המכונה DBRX - ניצחה את יריבי הקוד הפתוח בהבנת שפות, תכנות ומתמטיקה. המפתח גם טען שהוא גבר על ה-GPT-3.5 הקנייני של OpenAI באותם מדדים.

DBRX פותח על ידי Mosaic AI, אשר Databricks נרכשה תמורת 1.3 מיליארד דולר, והתאמן ב-Nvidia DGX Cloud. Databricks טוענת שהיא עשתה אופטימיזציה של DBRX ליעילות עם מה שהיא מכנה ארכיטקטורת תערובת של מומחים (MoE) - שבה מספר רשתות מומחים או לומדים מחלקים בעיה.

Databricks הסביר כי למודל יש 132 מיליארד פרמטרים, אך רק 36 מיליארד פעילים בכל קלט אחד.

ג'ואל מינניק, סגן נשיא השיווק של Databricks, אמר הקופה: "זו סיבה גדולה לכך שהדגם מסוגל לרוץ ביעילות כפי שהוא עושה, אבל גם רץ מהר להפליא. במונחים פרקטיים, אם אתה משתמש בכל סוג של צ'טבוטים מרכזיים שקיימים היום, כנראה שאתה רגיל לחכות ולראות את התשובה שנוצרת. עם DBRX זה כמעט מיידי."

אבל הביצועים של הדגם עצמו אינם העיקר עבור Databricks. העניין הוא, אחרי הכל, להפוך את DBRX זמין עבור בחינם ב-GitHub ו פנים מחבקות.

Databricks מקווה שלקוחות ישתמשו במודל כבסיס ללימודי LLM משלהם. אם זה יקרה זה עשוי לשפר צ'אטבוטים של לקוחות או מענה פנימי לשאלות, ובמקביל יראה כיצד DBRX נבנה באמצעות הכלים הקנייניים של Databricks.

Databricks הרכיב את מערך הנתונים שממנו פותח DBRX באמצעות מחברות Apache Spark ו-Databricks לעיבוד נתונים, Unity Catalog לניהול וממשל נתונים ו-MLflow למעקב אחר ניסויים.

Minnick חשף כי השקעה ארגונית ב-LLMs התעכבה בגלל חשש לגבי בעלות וממשל של צד שלישי. "הצורך להעביר נתונים לצדדים שלישיים, לא להיות בעל בעלות על משקלי המודל, לא להיות מסוגל לשלוט באופן מלא על הממשל של הנתונים מקצה לקצה - אלה דברים שמאטים אותם", הסביר.

"מה שיצאנו לבנות היה מודל יעיל ביותר שארגונים יכולים להשתמש בו כדי להביא יישומים משלהם למקרי שימוש ספציפיים משלהם."

היון פארק, מנכ"ל ואנליסט ראשי ב-Amalgam Insights, ראה שהמשמעות של DBRX היא ש-Databricks יכול להראות כיצד המודל נבנה, שלב אחר שלב, כתהליך עבור ארגונים אחרים לעקוב ולכוונן עדין.

"השילוב הזה של שושלת, נראות, חזרתיות ובעלות על מודל בכוונון, בדיקה ותפעול של מודל מקצה לקצה הוא חשוב."

פארק ציין שהוא הבין ש-Databricks כבר בנה למעלה מ-50,000 דגמים מותאמים אישית עבור לקוחות. "זה השילוב של ניסיון בבניית מודלים והיכולת לעשות זאת בקנה מידה עם מודל בעל ביצועים גבוהים בשוויון למאמצי הקוד הפרטי והפתוח הטובים ביותר, שהופך את ההכרזה הזו לבולטת בעיני מנקודת מבט של IT ארגונית."

חדשות DBRX מופיעות על רקע תחרותי משתנה עבור Databricks. ל-Biz יש שותפות אסטרטגית ארוכת טווח עם מיקרוסופט, שהביאה ל- Azure Databricks - שבה מובטחים למשתמשים שירותי נתונים משולבים הקשורים בקשר הדוק לפלטפורמת הענן של ענקית רדמונד.

אבל מאז ההצעה שהושקה ב-2017, מיקרוסופט עברה לשוק האגמים של Databricks - שבו מוצעים למשתמשים אחסון נתונים ואגמי נתונים בסביבה אחת - ומבטיחה למשתמשים LLMs ברמה ארגונית עם שלה 10 מיליארד דולר שותפות OpenAI. בסביבת הבד שלה, גם מיקרוסופט יכולה להציע "שיקוף" ממערכות מסדי הנתונים העסקיות שלה Azure Cosmos DB ו-Azure SQL DB, המציע גישה לשירותי ניתוח מבלי להעביר נתונים.

שאלה פתוחה העומדת על האסטרטגיות של Databricks ו-Microsoft היא מתי יגיע מבול ההשקעות הצפויות בטכנולוגיות LLM. בינואר, גרטנר חזה ההוצאה הארגונית על הטכנולוגיה לא תגיע השנה, ויהיה לה השפעה מועטה על השקעות IT אחרות. ®

בול זמן:

עוד מ הקופה