השקעה באצטרובל

השקעה באצטרובל

Investing in Pinecone PlatoBlockchain Data Intelligence. Vertical Search. Ai.

עם הטיית מודלים של שפה גדולה (LLMs), אנו עדים לשינוי פרדיגמה בפיתוח תוכנה ובתעשיית המחשוב כולה. בינה מלאכותית מתרחשת וערימה חדשה מתהווה לנגד עינינו. זה כמו האינטרנט כל פעם מחדש, שמכניס לשירות רכיבי תשתית חדשים שנבנו לדרך החדשה לעשות דברים.

יש הכרה גוברת בכך ש-LLMs הם למעשה צורה חדשה של מחשב, במובן מסוים. הם יכולים להריץ "תוכניות" הכתובות בשפה טבעית (כלומר, הנחיות), לבצע משימות מחשוב שרירותיות (למשל, כתיבת קוד Python או חיפוש בגוגל), ולהחזיר את התוצאות למשתמש בצורה הניתנת לקריאה אנושית. זה עניין גדול, משתי סיבות: 

  1. מחלקה חדשה של יישומים סביב סיכום ותוכן מחולל כעת אפשרי וכתוצאה מכך לשינוי בהתנהגות הצרכנים סביב צריכת תוכנה.
  2. סוג חדש של מפתחים מסוגל כעת לכתוב תוכנה. תכנות מחשבים דורש כעת רק שליטה באנגלית (או שפה אנושית אחרת), לא הכשרה בשפת תכנות מסורתית כמו Python או JavaScript. 

אחד מהעדיפויות העליונות שלנו באנדריסן הורוביץ הוא לזהות את החברות שבונות את מרכיבי המפתח של ערימת הבינה המלאכותית החדשה הזו. אנו שמחים להכריז שאנו מובילים סבב של 100 מיליון דולר בסדרה B צנובר, כדי לתמוך בחזון שלהם להפוך לשכבת הזיכרון עבור יישומי AI.

הבעיה: לימודי תואר שני הוזים וחסרי אזרחות

אתגר עצום עם לימודי LLM נוכחיים הוא הזיה. הם נותנים תשובות מאוד בטוחות שאינן נכונות עובדתית ולפעמים לוגית. לדוגמה, לבקש מ-LLM את הרווח הגולמי של אפל ברבעון האחרון יכול להביא לתשובה בטוחה של 63 מיליארד דולר. המודל אפילו יכול לגבות את תשובתו בכך שהוא מסביר שעל ידי הפחתת עלות הסחורה של 25 מיליארד דולר מהכנסות של 95 מיליארד דולר, אתה מקבל מרווח גולמי של 63 מיליארד דולר. כמובן, זה שגוי בכמה ממדים:

  • ראשית, מספר ההכנסות שגוי, מכיוון של-LLM אין נתונים בזמן אמת. זה עובד על נתוני אימונים מיושנים שהם חודשים או כנראה שנים.
  • שנית, היא אספה את מספרי ההכנסות והעלות של סחורות באופן אקראי מהדוחות הכספיים של חברת פירות אחרת.
  • שלישית, חישוב המרווח הגולמי שלו אינו נכון מבחינה מתמטית.

תארו לעצמכם לתת את התשובה הזו למנכ"ל א הון עתק חברת 500. 

כל זה קורה כי בסופו של יום, LLMs הם מכונות חיזוי מאומנות על כמויות אדירות של נתוני אינטרנט של צד שלישי. לעתים קרובות, המידע שהמשתמש צריך פשוט לא נמצא במערך ההדרכה. אז, המודל ייתן את התשובות הסבירות והמעוצבות היטב מבחינה לשונית בהתבסס על נתוני ההדרכה המעופשים שלו. אנחנו כבר יכולים להתחיל לראות פתרון פוטנציאלי לבעיה שלעיל - הזנת נתונים ארגוניים פרטיים רלוונטיים מבחינה הקשרית בזמן אמת ל-LLMs.

הצורה הכללית של בעיה זו היא שמנקודת מבט מערכתית, LLMs ורוב דגמי הבינה המלאכותית האחרים הם חסרי מדינה בשלב ההסקה. בכל פעם שאתה מבצע קריאה ל-GPT-4 API, הפלט תלוי רק על הנתונים והפרמטרים שאתה שולח במטען. למודל אין דרך מובנית לשלב נתונים הקשריים או לזכור את מה ששאלת בעבר. כוונון עדין של הדגם אפשרי, אך הוא יקר ויחסית לא גמיש (כלומר, המודל לא יכול להגיב לנתונים חדשים בזמן אמת). מכיוון שהמודלים אינם מנהלים מצב או זיכרון בעצמם, זה תלוי במפתחים למלא את החסר. 

הפתרון: מסדי נתונים וקטוריים הם שכבת האחסון עבור LLMs

זה המקום שבו אצטרובל נכנס לתמונה.

Pinecone הוא מסד נתונים חיצוני שבו מפתחים יכולים לאחסן נתונים הקשריים רלוונטיים עבור אפליקציות LLM. במקום לשלוח אוספי מסמכים גדולים הלוך ושוב עם כל קריאת API, מפתחים יכולים לאחסן אותם במסד נתונים של Pinecone, ולאחר מכן לבחור רק את המעט הרלוונטיים ביותר לכל שאילתה נתונה - גישה שנקראת למידה בתוך הקשר. זה חובה כדי שמקרי שימוש ארגוניים יפרחו באמת.

בפרט, Pinecone הוא א וקטור מסד נתונים, כלומר הנתונים מאוחסנים בצורה של משמעות סמנטית הטבעות. בעוד שהסבר טכני של הטבעות הוא מעבר לתחום של פוסט זה, החלק החשוב שיש להבין הוא ש-LLMs פועלים גם על הטבעות וקטוריות - כך שעל ידי אחסון נתונים ב- Pinecone בפורמט זה, חלק מעבודת הבינה המלאכותית עבר עיבוד מראש וביעילות הוצא למסד הנתונים.

שלא כמו מסדי נתונים קיימים, המיועדים לעומסי עבודה אנליטיים אטומיים או ממצים, מסד הנתונים הווקטוריים (Pinecone) מיועד לחיפוש שכנים עקבי בסופו של דבר, פרדיגמת מסד הנתונים הנכונה לוקטורים בעלי ממדים גבוהים יותר. הם גם מספקים ממשקי API למפתחים המשתלבים עם רכיבי מפתח אחרים של יישומי בינה מלאכותית, כגון OpenAI, Cohere, LangChain וכו'. עיצוב כזה מחושב מקל על חייהם של מפתחים בהרבה. משימות בינה מלאכותיות פשוטות כמו חיפוש סמנטי, המלצות מוצר או דירוג הזנות יכולות להיות גם מודליות ישירות כבעיות חיפוש וקטוריות ולהפעיל אותן על מסד הנתונים הווקטוריים ללא שלב מסקנות סופי של המודל - משהו שמסדי נתונים קיימים לא יכולים לעשות.

Pinecone הוא התקן המתפתח לניהול נתוני מדינה והקשרים ארגוניים ביישומי LLM. אנו חושבים שזהו רכיב תשתית חשוב, המספק את שכבת האחסון, או ה"זיכרון", לערימת יישומי AI חדשה לגמרי.

התקדמות מדהימה עבור Pinecone עד היום

Pinecone אינו מסד הנתונים הווקטוריים היחיד, אך אנו מאמינים שזהו מסד הנתונים הוקטוריים המוביל - מוכן כעת לאימוץ בעולם האמיתי - בהפרש משמעותי. Pinecone ראתה צמיחה פי 8 בלקוחות בתשלום (כ-1,600) תוך שלושה חודשים בלבד, כולל חברות טכנולוגיה צופות פני עתיד כמו Shopify, Gong, Zapier ועוד. נעשה בו שימוש במגוון רחב של תעשיות, כולל תוכנות ארגוניות, אפליקציות צרכנים, מסחר אלקטרוני, פינטק, ביטוח, מדיה ו-AI/ML.

אנו מייחסים את ההצלחה הזו לא רק להבנה העמוקה של הצוות לגבי המשתמש, השוק והטכנולוגיה, אלא גם - באופן קריטי - לגישת המוצר מקורי הענן שלהם מההתחלה. אחד החלקים הקשים ביותר בבניית שירות זה הוא אספקת קצה ענן אמין וזמין במיוחד, העומד במגוון רחב של יעדי ביצועי לקוחות ו-SLAs. עם איטרציות מרובות על ארכיטקטורת המוצר, וניהול לקוחות רבים בתשלום בקנה מידה גבוה בייצור, צוות זה הראה מצוינות תפעולית המצופה ממסד נתונים ייצור.

צנובר הוקמה על ידי אדו ליברטי, שהיה תומך מושבע ותיק בחשיבותם של מסדי נתונים וקטוריים בלמידת מכונה, כולל איך הם יכולים לאפשר לכל ארגון לבנות מקרי שימוש על גבי LLMs. כמתמטיקאי יישומי, הוא בילה את הקריירה שלו בלימוד ויישום אלגוריתמי חיפוש וקטורים חדישים. במקביל, הוא היה פרגמטי, בנה כלי ליבה של ML כמו Sagemaker ב-AWS, ותרגם מחקר ML יישומי למוצרים מעשיים שלקוחות יכולים להשתמש בהם. נדיר לראות שילוב כזה של מחקר מעמיק וחשיבת מוצר פרגמטית.

ל-Edo מצטרף בוב וידרהולד, מנכ"ל ומפעיל מנוסה (לשעבר של Couchbase), כשותף בצד התפעול כנשיא ו-COO. ל-Pinecone יש גם צוות פנטסטי של מנהלים ומהנדסים עם מומחיות עמוקה במערכות ענן ממקומות כמו AWS, Google ו-Databricks. אנו מתרשמים מהמומחיות ההנדסית העמוקה של הצוות, מתמקדים בחוויית מפתחים וביצוע יעיל של GTM, ואנו זוכים לשתף איתם פעולה כדי לבנות את שכבת הזיכרון עבור יישומי בינה מלאכותית.

* * *

הדעות המובעות כאן הן אלה של אנשי AH Capital Management, LLC ("a16z") המצוטטות ואינן הדעות של a16z או החברות הקשורות לה. מידע מסוים הכלול כאן התקבל ממקורות צד שלישי, כולל מחברות פורטפוליו של קרנות המנוהלות על ידי a16z. למרות שנלקחה ממקורות האמינים כאמינים, a16z לא אימתה מידע כזה באופן עצמאי ואינה מציגה מצגים לגבי הדיוק המתמשך של המידע או התאמתו למצב נתון. בנוסף, תוכן זה עשוי לכלול פרסומות של צד שלישי; a16z לא סקרה פרסומות כאלה ואינה תומכת בתוכן פרסומי כלשהו הכלול בהן.

תוכן זה מסופק למטרות מידע בלבד, ואין להסתמך עליו כייעוץ משפטי, עסקי, השקעות או מס. עליך להתייעץ עם היועצים שלך באשר לעניינים אלה. הפניות לניירות ערך או לנכסים דיגיטליים כלשהם נועדו למטרות המחשה בלבד, ואינן מהוות המלצת השקעה או הצעה לספק שירותי ייעוץ השקעות. יתר על כן, תוכן זה אינו מכוון ואינו מיועד לשימוש על ידי משקיעים או משקיעים פוטנציאליים כלשהם, ואין להסתמך עליו בשום פנים ואופן בעת ​​קבלת החלטה להשקיע בקרן כלשהי המנוהלת על ידי a16z. (הצעה להשקעה בקרן a16z תתבצע רק על ידי מזכר ההנפקה הפרטית, הסכם המנוי ותיעוד רלוונטי אחר של כל קרן כזו ויש לקרוא אותה במלואה). המתוארים אינם מייצגים את כל ההשקעות בכלי רכב המנוהלים על ידי a16z, ואין כל ודאות שההשקעות יהיו רווחיות או שלהשקעות אחרות שיבוצעו בעתיד יהיו מאפיינים או תוצאות דומות. רשימה של השקעות שבוצעו על ידי קרנות המנוהלות על ידי אנדריסן הורוביץ (למעט השקעות שעבורן המנפיק לא נתן אישור ל-a16z לחשוף בפומבי וכן השקעות בלתי מוקדמות בנכסים דיגיטליים הנסחרים בבורסה) זמינה בכתובת https://a16z.com/investments /.

תרשימים וגרפים המסופקים בתוכן הם למטרות מידע בלבד ואין להסתמך עליהם בעת קבלת החלטת השקעה כלשהי. ביצועי העבר אינם מעידים על תוצאות עתידיות. התוכן מדבר רק לתאריך המצוין. כל תחזיות, אומדנים, תחזיות, יעדים, סיכויים ו/או דעות המובעות בחומרים אלו כפופים לשינויים ללא הודעה מוקדמת ועשויים להיות שונים או מנוגדים לדעות שהובעו על ידי אחרים. אנא ראה https://a16z.com/disclosures למידע חשוב נוסף.

בול זמן:

עוד מ אנדריסן הורוביץ