سرمایه گذاری در کاج

سرمایه گذاری در کاج

سرمایه‌گذاری در هوش داده‌های PlatoBlockchain Pinecone. جستجوی عمودی Ai.

با عطف مدل‌های زبان بزرگ (LLM)، ما شاهد یک تغییر پارادایم در توسعه نرم‌افزار و در کل صنعت محاسبات هستیم. هوش مصنوعی در حال وقوع است و یک پشته جدید در برابر چشمان ما شکل می گیرد. دوباره مثل اینترنت است که اجزای زیرساخت جدیدی را که برای روش جدید انجام کارها ساخته شده اند، به خدمت می گیرد..

شناخت رو به رشدی وجود دارد که LLM ها در واقع هستند شکل جدیدی از کامپیوتر، به نوعی آن‌ها می‌توانند «برنامه‌هایی» را که به زبان طبیعی نوشته شده‌اند (یعنی درخواست‌ها) اجرا کنند، وظایف محاسباتی دلخواه (مثلاً نوشتن کد پایتون یا جستجوی Google) را اجرا کنند و نتایج را به شکل قابل خواندن توسط انسان به کاربر برگردانند. این یک مشکل بزرگ است، به دو دلیل: 

  1. دسته جدیدی از برنامه های کاربردی در مورد خلاصه سازی و محتوای تولیدی اکنون ممکن است منجر به تغییر رفتار مصرف کننده در مورد مصرف نرم افزار شود.
  2. گروه جدیدی از توسعه دهندگان اکنون قادر به نوشتن نرم افزار هستند. برنامه نویسی کامپیوتر در حال حاضر فقط به تسلط بر زبان انگلیسی (یا زبان انسانی دیگر) نیاز دارد، نه آموزش به زبان برنامه نویسی سنتی مانند پایتون یا جاوا اسکریپت. 

یکی از اولویت‌های اصلی ما در Andreessen Horowitz شناسایی شرکت‌هایی است که اجزای کلیدی این پشته هوش مصنوعی جدید را می‌سازند. ما بسیار هیجان زده هستیم که اعلام کنیم در یک دور سری B ۱۰۰ میلیون دلاری پیشرو هستیم پینکون، برای حمایت از دیدگاه آنها مبنی بر تبدیل شدن به لایه حافظه برای برنامه های کاربردی هوش مصنوعی.

مشکل: LLM ها توهم دارند و بی تابعیت هستند

یک چالش بزرگ با LLM های فعلی توهم است. آنها پاسخ های بسیار مطمئنی می دهند که از نظر واقعی و گاهی منطقی نادرست است. به عنوان مثال، درخواست از یک LLM برای حاشیه ناخالص اپل برای سه ماهه آخر می تواند به یک پاسخ مطمئن 63 میلیارد دلاری منجر شود. این مدل حتی می‌تواند با توضیح اینکه با کم کردن ۲۵ میلیارد دلار بهای تمام شده کالا از درآمد ۹۵ میلیارد دلاری، حاشیه ناخالص ۶۳ میلیارد دلاری را به دست می‌آورد. البته از چند بعد اشتباه است:

  • اولاً، شماره درآمد اشتباه است، زیرا LLM داده های بلادرنگ ندارد. این داده‌های آموزشی قدیمی که ماه‌ها یا احتمالاً سال‌ها قدمت دارند، کار می‌کند.
  • دوم، این اعداد درآمد و هزینه کالا را به‌طور تصادفی از صورت‌های مالی یک شرکت میوه‌فروشی دیگر انتخاب کرد.
  • سوم، محاسبه حاشیه ناخالص آن از نظر ریاضی درست نیست.

تصور کنید که این پاسخ را به مدیر عامل یک شرکت بدهید ثروت شرکت 500. 

همه اینها به این دلیل اتفاق می‌افتد که در پایان روز، LLM‌ها ماشین‌های پیش‌بینی هستند که بر روی حجم وسیعی از داده‌های اینترنتی شخص ثالث آموزش دیده‌اند. اغلب، اطلاعات مورد نیاز کاربر به سادگی در مجموعه آموزشی نیست. بنابراین، این مدل بر اساس داده‌های آموزشی قدیمی‌اش، محتمل‌ترین و از نظر زبانی با قالب‌بندی مناسب‌ترین پاسخ‌ها را خواهد داد. در حال حاضر می‌توانیم شروع به دیدن یک راه‌حل بالقوه برای مشکل فوق کنیم - تغذیه داده‌های شرکت خصوصی مرتبط با زمینه در زمان واقعی برای LLMs.

شکل کلی این مشکل این است که از دیدگاه سیستمی، LLMها و اکثر مدل‌های هوش مصنوعی دیگر در مرحله استنتاج فاقد حالت هستند. هر بار که با API GPT-4 تماس می گیرید، خروجی بستگی دارد فقط در مورد داده ها و پارامترهایی که در محموله ارسال می کنید. این مدل هیچ روش داخلی برای ترکیب داده های متنی یا یادآوری آنچه قبلاً پرسیده اید ندارد. تنظیم دقیق مدل ممکن است، اما گران و نسبتاً غیر قابل انعطاف است (یعنی مدل نمی تواند به داده های جدید در زمان واقعی پاسخ دهد). از آنجایی که مدل ها به تنهایی وضعیت یا حافظه را مدیریت نمی کنند، این بر عهده توسعه دهندگان است که این شکاف را پر کنند. 

راه حل: پایگاه های داده برداری لایه ذخیره سازی برای LLM ها هستند

اینجاست که Pinecone وارد می شود.

Pinecone یک پایگاه داده خارجی است که در آن توسعه دهندگان می توانند داده های متنی مرتبط را برای برنامه های LLM ذخیره کنند. به‌جای ارسال مجموعه‌های اسناد بزرگ با هر تماس API، توسعه‌دهندگان می‌توانند آن‌ها را در پایگاه داده Pinecone ذخیره کنند، سپس تنها چند مورد را که مرتبط‌تر با هر پرس‌وجو هستند انتخاب کنند – رویکردی به نام یادگیری درون متنی. برای شکوفایی واقعی کیس‌های استفاده سازمانی، ضروری است.

به طور خاص، کاج یک است بردار پایگاه داده، به این معنی که داده ها به شکل معنایی معنی دار ذخیره می شوند تعبیه ها. در حالی که توضیح فنی در مورد جاسازی ها فراتر از محدوده این پست است، بخش مهمی که باید درک کرد این است که LLM ها بر روی جاسازی های برداری نیز کار می کنند - بنابراین با ذخیره داده ها در Pinecone در این قالب، بخشی از کار هوش مصنوعی به طور موثر از قبل پردازش شده است و به پایگاه داده بارگذاری شده است.

بر خلاف پایگاه‌های داده موجود، که برای حجم‌های کاری تراکنشی اتمی یا تحلیلی جامع طراحی شده‌اند، پایگاه داده برداری (Pinecone) برای جستجوی نهایی همسایه تقریبی سازگار، الگوی پایگاه داده مناسب برای بردارهای با ابعاد بالاتر طراحی شده است. آنها همچنین API های توسعه دهنده را ارائه می دهند که با سایر اجزای کلیدی برنامه های کاربردی هوش مصنوعی، مانند OpenAI، Cohere، LangChain و غیره یکپارچه می شوند. چنین طراحی سنجیده ای زندگی توسعه دهندگان را بسیار آسان تر می کند. وظایف ساده هوش مصنوعی مانند جستجوی معنایی، توصیه‌های محصول یا رتبه‌بندی فید را می‌توان مستقیماً به‌عنوان مشکلات جستجوی برداری مدل‌سازی کرد و در پایگاه داده برداری بدون مرحله استنتاج نهایی مدل اجرا کرد. کاری که پایگاه های داده موجود نمی توانند انجام دهند.

Pinecone استاندارد در حال ظهور برای مدیریت داده های سازمانی وضعیت و زمینه در برنامه های LLM است. ما فکر می‌کنیم که این یک جزء مهم زیرساختی است که لایه ذخیره‌سازی یا «حافظه» را برای یک پشته اپلیکیشن جدید هوش مصنوعی فراهم می‌کند.

پیشرفت باورنکردنی برای Pinecone تا به امروز

Pinecone تنها پایگاه داده برداری نیست، اما ما معتقدیم که این پایگاه داده بردار پیشرو است - اکنون آماده پذیرش در دنیای واقعی - با اختلاف قابل توجهی. Pinecone تنها در سه ماه شاهد رشد 8 برابری در مشتریان پولی (تقریباً 1,600) بوده است، از جمله شرکت‌های فناوری آینده‌نگر مانند Shopify، Gong، Zapier و غیره. در طیف گسترده ای از صنایع، از جمله نرم افزار سازمانی، برنامه های مصرف کننده، تجارت الکترونیک، فین تک، بیمه، رسانه و هوش مصنوعی استفاده می شود.

ما این موفقیت را نه تنها به درک عمیق تیم از کاربر، بازار و فن‌آوری، بلکه - بطور انتقادی - به رویکرد محصول بومی ابری آنها از همان ابتدا نسبت می‌دهیم. یکی از سخت‌ترین بخش‌های ساخت این سرویس، ارائه یک پشتیبان ابری قابل اعتماد و بسیار در دسترس است که طیف وسیعی از اهداف عملکرد مشتری و SLA را برآورده می‌کند. این تیم با تکرارهای متعدد در معماری محصول، و مدیریت بسیاری از مشتریان در مقیاس بالا و پولی در تولید، برتری عملیاتی را نشان داده است که از یک پایگاه داده تولید انتظار می رود.

پینکون توسط Edo Liberty، که یک مدافع طولانی مدت و سرسخت برای اهمیت پایگاه‌های داده برداری در یادگیری ماشینی بوده است، تأسیس شد، از جمله اینکه چگونه می‌توانند هر شرکتی را قادر به ساخت موارد استفاده در بالای LLM ها کند. او به عنوان یک ریاضیدان کاربردی، کار خود را صرف مطالعه و اجرای الگوریتم های پیشرفته جستجوی برداری کرد. در همان زمان، او یک عمل‌گرا بود و ابزارهای اصلی ML مانند Sagemaker را در AWS می‌ساخت و تحقیقات کاربردی ML را به محصولات کاربردی ترجمه می‌کرد که مشتریان می‌توانند از آنها استفاده کنند. به ندرت می توان چنین ترکیبی از تحقیقات عمیق و تفکر عملگرایانه محصول را مشاهده کرد.

باب ویدرهولد، مدیر عامل و اپراتور باتجربه (که قبلاً Couchbase بود)، به عنوان یک شریک در سمت عملیات به عنوان رئیس و مدیر ارشد اجرایی به ادو پیوست. Pinecone همچنین دارای یک تیم فوق‌العاده از مدیران و مهندسان با تخصص عمیق سیستم‌های ابری از مکان‌هایی مانند AWS، Google و Databricks است. ما تحت تأثیر تخصص مهندسی عمیق تیم، تمرکز بر تجربه توسعه‌دهنده و اجرای کارآمد GTM هستیم، و مفتخریم که با آنها برای ایجاد لایه حافظه برای برنامه‌های هوش مصنوعی شریک شویم.

* * * *

نظرات بیان شده در اینجا نظرات پرسنل AH Capital Management, LLC ("a16z") نقل شده است و نظرات a16z یا شرکت های وابسته به آن نیست. برخی از اطلاعات موجود در اینجا از منابع شخص ثالث، از جمله از شرکت‌های سبد سرمایه‌ای که توسط a16z مدیریت می‌شوند، به‌دست آمده است. در حالی که a16z از منابعی گرفته شده است که معتقدند قابل اعتماد هستند، a16z به طور مستقل چنین اطلاعاتی را تأیید نکرده است و هیچ اظهارنظری در مورد صحت پایدار اطلاعات یا مناسب بودن آن برای یک موقعیت خاص ارائه نمی کند. علاوه بر این، این محتوا ممکن است شامل تبلیغات شخص ثالث باشد. aXNUMXz چنین تبلیغاتی را بررسی نکرده و محتوای تبلیغاتی موجود در آن را تایید نمی کند.

این محتوا فقط برای مقاصد اطلاعاتی ارائه شده است و نباید به عنوان مشاوره حقوقی، تجاری، سرمایه گذاری یا مالیاتی به آن اعتماد کرد. شما باید در مورد این موارد با مشاوران خود مشورت کنید. ارجاع به هر گونه اوراق بهادار یا دارایی دیجیتال فقط برای مقاصد توضیحی است و به منزله توصیه یا پیشنهاد سرمایه گذاری برای ارائه خدمات مشاوره سرمایه گذاری نیست. علاوه بر این، این محتوا برای هیچ سرمایه‌گذار یا سرمایه‌گذار بالقوه‌ای هدایت نشده و برای استفاده از آن در نظر گرفته نشده است، و تحت هیچ شرایطی نمی‌توان هنگام تصمیم‌گیری برای سرمایه‌گذاری در هر صندوقی که توسط a16z مدیریت می‌شود، به آن اعتماد کرد. (پیشنهاد سرمایه گذاری در یک صندوق a16z فقط توسط یادداشت قرار دادن خصوصی، قرارداد اشتراک و سایر اسناد مربوط به هر صندوق انجام می شود و باید به طور کامل خوانده شود.) هر گونه سرمایه گذاری یا شرکت پرتفوی ذکر شده، ارجاع شده، یا شرح داده شده نشان دهنده همه سرمایه گذاری ها در وسایل نقلیه تحت مدیریت a16z نیست، و نمی توان اطمینان داشت که سرمایه گذاری ها سودآور هستند یا سایر سرمایه گذاری های انجام شده در آینده ویژگی ها یا نتایج مشابهی خواهند داشت. فهرستی از سرمایه‌گذاری‌های انجام‌شده توسط صندوق‌های تحت مدیریت آندریسن هوروویتز (به استثنای سرمایه‌گذاری‌هایی که ناشر مجوز افشای عمومی a16z و همچنین سرمایه‌گذاری‌های اعلام‌نشده در دارایی‌های دیجیتالی عمومی را ارائه نکرده است) در https://a16z.com/investments موجود است. /.

نمودارها و نمودارهای ارائه شده در داخل صرفاً برای مقاصد اطلاعاتی هستند و هنگام تصمیم گیری برای سرمایه گذاری نباید به آنها اعتماد کرد. عملکرد گذشته نشان دهنده نتایج آینده نیست. محتوا فقط از تاریخ مشخص شده صحبت می کند. هر گونه پیش بینی، تخمین، پیش بینی، هدف، چشم انداز، و/یا نظرات بیان شده در این مطالب بدون اطلاع قبلی ممکن است تغییر کند و ممکن است متفاوت یا مغایر با نظرات بیان شده توسط دیگران باشد. لطفاً برای اطلاعات مهم بیشتر به https://a16z.com/disclosures مراجعه کنید.

تمبر زمان:

بیشتر از آندرسن هورویتز