با عطف مدلهای زبان بزرگ (LLM)، ما شاهد یک تغییر پارادایم در توسعه نرمافزار و در کل صنعت محاسبات هستیم. هوش مصنوعی در حال وقوع است و یک پشته جدید در برابر چشمان ما شکل می گیرد. دوباره مثل اینترنت است که اجزای زیرساخت جدیدی را که برای روش جدید انجام کارها ساخته شده اند، به خدمت می گیرد..
شناخت رو به رشدی وجود دارد که LLM ها در واقع هستند شکل جدیدی از کامپیوتر، به نوعی آنها میتوانند «برنامههایی» را که به زبان طبیعی نوشته شدهاند (یعنی درخواستها) اجرا کنند، وظایف محاسباتی دلخواه (مثلاً نوشتن کد پایتون یا جستجوی Google) را اجرا کنند و نتایج را به شکل قابل خواندن توسط انسان به کاربر برگردانند. این یک مشکل بزرگ است، به دو دلیل:
- دسته جدیدی از برنامه های کاربردی در مورد خلاصه سازی و محتوای تولیدی اکنون ممکن است منجر به تغییر رفتار مصرف کننده در مورد مصرف نرم افزار شود.
- گروه جدیدی از توسعه دهندگان اکنون قادر به نوشتن نرم افزار هستند. برنامه نویسی کامپیوتر در حال حاضر فقط به تسلط بر زبان انگلیسی (یا زبان انسانی دیگر) نیاز دارد، نه آموزش به زبان برنامه نویسی سنتی مانند پایتون یا جاوا اسکریپت.
یکی از اولویتهای اصلی ما در Andreessen Horowitz شناسایی شرکتهایی است که اجزای کلیدی این پشته هوش مصنوعی جدید را میسازند. ما بسیار هیجان زده هستیم که اعلام کنیم در یک دور سری B ۱۰۰ میلیون دلاری پیشرو هستیم پینکون، برای حمایت از دیدگاه آنها مبنی بر تبدیل شدن به لایه حافظه برای برنامه های کاربردی هوش مصنوعی.
مشکل: LLM ها توهم دارند و بی تابعیت هستند
یک چالش بزرگ با LLM های فعلی توهم است. آنها پاسخ های بسیار مطمئنی می دهند که از نظر واقعی و گاهی منطقی نادرست است. به عنوان مثال، درخواست از یک LLM برای حاشیه ناخالص اپل برای سه ماهه آخر می تواند به یک پاسخ مطمئن 63 میلیارد دلاری منجر شود. این مدل حتی میتواند با توضیح اینکه با کم کردن ۲۵ میلیارد دلار بهای تمام شده کالا از درآمد ۹۵ میلیارد دلاری، حاشیه ناخالص ۶۳ میلیارد دلاری را به دست میآورد. البته از چند بعد اشتباه است:
- اولاً، شماره درآمد اشتباه است، زیرا LLM داده های بلادرنگ ندارد. این دادههای آموزشی قدیمی که ماهها یا احتمالاً سالها قدمت دارند، کار میکند.
- دوم، این اعداد درآمد و هزینه کالا را بهطور تصادفی از صورتهای مالی یک شرکت میوهفروشی دیگر انتخاب کرد.
- سوم، محاسبه حاشیه ناخالص آن از نظر ریاضی درست نیست.
تصور کنید که این پاسخ را به مدیر عامل یک شرکت بدهید ثروت شرکت 500.
همه اینها به این دلیل اتفاق میافتد که در پایان روز، LLMها ماشینهای پیشبینی هستند که بر روی حجم وسیعی از دادههای اینترنتی شخص ثالث آموزش دیدهاند. اغلب، اطلاعات مورد نیاز کاربر به سادگی در مجموعه آموزشی نیست. بنابراین، این مدل بر اساس دادههای آموزشی قدیمیاش، محتملترین و از نظر زبانی با قالببندی مناسبترین پاسخها را خواهد داد. در حال حاضر میتوانیم شروع به دیدن یک راهحل بالقوه برای مشکل فوق کنیم - تغذیه دادههای شرکت خصوصی مرتبط با زمینه در زمان واقعی برای LLMs.
شکل کلی این مشکل این است که از دیدگاه سیستمی، LLMها و اکثر مدلهای هوش مصنوعی دیگر در مرحله استنتاج فاقد حالت هستند. هر بار که با API GPT-4 تماس می گیرید، خروجی بستگی دارد فقط در مورد داده ها و پارامترهایی که در محموله ارسال می کنید. این مدل هیچ روش داخلی برای ترکیب داده های متنی یا یادآوری آنچه قبلاً پرسیده اید ندارد. تنظیم دقیق مدل ممکن است، اما گران و نسبتاً غیر قابل انعطاف است (یعنی مدل نمی تواند به داده های جدید در زمان واقعی پاسخ دهد). از آنجایی که مدل ها به تنهایی وضعیت یا حافظه را مدیریت نمی کنند، این بر عهده توسعه دهندگان است که این شکاف را پر کنند.
راه حل: پایگاه های داده برداری لایه ذخیره سازی برای LLM ها هستند
اینجاست که Pinecone وارد می شود.
Pinecone یک پایگاه داده خارجی است که در آن توسعه دهندگان می توانند داده های متنی مرتبط را برای برنامه های LLM ذخیره کنند. بهجای ارسال مجموعههای اسناد بزرگ با هر تماس API، توسعهدهندگان میتوانند آنها را در پایگاه داده Pinecone ذخیره کنند، سپس تنها چند مورد را که مرتبطتر با هر پرسوجو هستند انتخاب کنند – رویکردی به نام یادگیری درون متنی. برای شکوفایی واقعی کیسهای استفاده سازمانی، ضروری است.
به طور خاص، کاج یک است بردار پایگاه داده، به این معنی که داده ها به شکل معنایی معنی دار ذخیره می شوند تعبیه ها. در حالی که توضیح فنی در مورد جاسازی ها فراتر از محدوده این پست است، بخش مهمی که باید درک کرد این است که LLM ها بر روی جاسازی های برداری نیز کار می کنند - بنابراین با ذخیره داده ها در Pinecone در این قالب، بخشی از کار هوش مصنوعی به طور موثر از قبل پردازش شده است و به پایگاه داده بارگذاری شده است.
بر خلاف پایگاههای داده موجود، که برای حجمهای کاری تراکنشی اتمی یا تحلیلی جامع طراحی شدهاند، پایگاه داده برداری (Pinecone) برای جستجوی نهایی همسایه تقریبی سازگار، الگوی پایگاه داده مناسب برای بردارهای با ابعاد بالاتر طراحی شده است. آنها همچنین API های توسعه دهنده را ارائه می دهند که با سایر اجزای کلیدی برنامه های کاربردی هوش مصنوعی، مانند OpenAI، Cohere، LangChain و غیره یکپارچه می شوند. چنین طراحی سنجیده ای زندگی توسعه دهندگان را بسیار آسان تر می کند. وظایف ساده هوش مصنوعی مانند جستجوی معنایی، توصیههای محصول یا رتبهبندی فید را میتوان مستقیماً بهعنوان مشکلات جستجوی برداری مدلسازی کرد و در پایگاه داده برداری بدون مرحله استنتاج نهایی مدل اجرا کرد. کاری که پایگاه های داده موجود نمی توانند انجام دهند.
Pinecone استاندارد در حال ظهور برای مدیریت داده های سازمانی وضعیت و زمینه در برنامه های LLM است. ما فکر میکنیم که این یک جزء مهم زیرساختی است که لایه ذخیرهسازی یا «حافظه» را برای یک پشته اپلیکیشن جدید هوش مصنوعی فراهم میکند.
پیشرفت باورنکردنی برای Pinecone تا به امروز
Pinecone تنها پایگاه داده برداری نیست، اما ما معتقدیم که این پایگاه داده بردار پیشرو است - اکنون آماده پذیرش در دنیای واقعی - با اختلاف قابل توجهی. Pinecone تنها در سه ماه شاهد رشد 8 برابری در مشتریان پولی (تقریباً 1,600) بوده است، از جمله شرکتهای فناوری آیندهنگر مانند Shopify، Gong، Zapier و غیره. در طیف گسترده ای از صنایع، از جمله نرم افزار سازمانی، برنامه های مصرف کننده، تجارت الکترونیک، فین تک، بیمه، رسانه و هوش مصنوعی استفاده می شود.
ما این موفقیت را نه تنها به درک عمیق تیم از کاربر، بازار و فنآوری، بلکه - بطور انتقادی - به رویکرد محصول بومی ابری آنها از همان ابتدا نسبت میدهیم. یکی از سختترین بخشهای ساخت این سرویس، ارائه یک پشتیبان ابری قابل اعتماد و بسیار در دسترس است که طیف وسیعی از اهداف عملکرد مشتری و SLA را برآورده میکند. این تیم با تکرارهای متعدد در معماری محصول، و مدیریت بسیاری از مشتریان در مقیاس بالا و پولی در تولید، برتری عملیاتی را نشان داده است که از یک پایگاه داده تولید انتظار می رود.
پینکون توسط Edo Liberty، که یک مدافع طولانی مدت و سرسخت برای اهمیت پایگاههای داده برداری در یادگیری ماشینی بوده است، تأسیس شد، از جمله اینکه چگونه میتوانند هر شرکتی را قادر به ساخت موارد استفاده در بالای LLM ها کند. او به عنوان یک ریاضیدان کاربردی، کار خود را صرف مطالعه و اجرای الگوریتم های پیشرفته جستجوی برداری کرد. در همان زمان، او یک عملگرا بود و ابزارهای اصلی ML مانند Sagemaker را در AWS میساخت و تحقیقات کاربردی ML را به محصولات کاربردی ترجمه میکرد که مشتریان میتوانند از آنها استفاده کنند. به ندرت می توان چنین ترکیبی از تحقیقات عمیق و تفکر عملگرایانه محصول را مشاهده کرد.
باب ویدرهولد، مدیر عامل و اپراتور باتجربه (که قبلاً Couchbase بود)، به عنوان یک شریک در سمت عملیات به عنوان رئیس و مدیر ارشد اجرایی به ادو پیوست. Pinecone همچنین دارای یک تیم فوقالعاده از مدیران و مهندسان با تخصص عمیق سیستمهای ابری از مکانهایی مانند AWS، Google و Databricks است. ما تحت تأثیر تخصص مهندسی عمیق تیم، تمرکز بر تجربه توسعهدهنده و اجرای کارآمد GTM هستیم، و مفتخریم که با آنها برای ایجاد لایه حافظه برای برنامههای هوش مصنوعی شریک شویم.
* * * *
نظرات بیان شده در اینجا نظرات پرسنل AH Capital Management, LLC ("a16z") نقل شده است و نظرات a16z یا شرکت های وابسته به آن نیست. برخی از اطلاعات موجود در اینجا از منابع شخص ثالث، از جمله از شرکتهای سبد سرمایهای که توسط a16z مدیریت میشوند، بهدست آمده است. در حالی که a16z از منابعی گرفته شده است که معتقدند قابل اعتماد هستند، a16z به طور مستقل چنین اطلاعاتی را تأیید نکرده است و هیچ اظهارنظری در مورد صحت پایدار اطلاعات یا مناسب بودن آن برای یک موقعیت خاص ارائه نمی کند. علاوه بر این، این محتوا ممکن است شامل تبلیغات شخص ثالث باشد. aXNUMXz چنین تبلیغاتی را بررسی نکرده و محتوای تبلیغاتی موجود در آن را تایید نمی کند.
این محتوا فقط برای مقاصد اطلاعاتی ارائه شده است و نباید به عنوان مشاوره حقوقی، تجاری، سرمایه گذاری یا مالیاتی به آن اعتماد کرد. شما باید در مورد این موارد با مشاوران خود مشورت کنید. ارجاع به هر گونه اوراق بهادار یا دارایی دیجیتال فقط برای مقاصد توضیحی است و به منزله توصیه یا پیشنهاد سرمایه گذاری برای ارائه خدمات مشاوره سرمایه گذاری نیست. علاوه بر این، این محتوا برای هیچ سرمایهگذار یا سرمایهگذار بالقوهای هدایت نشده و برای استفاده از آن در نظر گرفته نشده است، و تحت هیچ شرایطی نمیتوان هنگام تصمیمگیری برای سرمایهگذاری در هر صندوقی که توسط a16z مدیریت میشود، به آن اعتماد کرد. (پیشنهاد سرمایه گذاری در یک صندوق a16z فقط توسط یادداشت قرار دادن خصوصی، قرارداد اشتراک و سایر اسناد مربوط به هر صندوق انجام می شود و باید به طور کامل خوانده شود.) هر گونه سرمایه گذاری یا شرکت پرتفوی ذکر شده، ارجاع شده، یا شرح داده شده نشان دهنده همه سرمایه گذاری ها در وسایل نقلیه تحت مدیریت a16z نیست، و نمی توان اطمینان داشت که سرمایه گذاری ها سودآور هستند یا سایر سرمایه گذاری های انجام شده در آینده ویژگی ها یا نتایج مشابهی خواهند داشت. فهرستی از سرمایهگذاریهای انجامشده توسط صندوقهای تحت مدیریت آندریسن هوروویتز (به استثنای سرمایهگذاریهایی که ناشر مجوز افشای عمومی a16z و همچنین سرمایهگذاریهای اعلامنشده در داراییهای دیجیتالی عمومی را ارائه نکرده است) در https://a16z.com/investments موجود است. /.
نمودارها و نمودارهای ارائه شده در داخل صرفاً برای مقاصد اطلاعاتی هستند و هنگام تصمیم گیری برای سرمایه گذاری نباید به آنها اعتماد کرد. عملکرد گذشته نشان دهنده نتایج آینده نیست. محتوا فقط از تاریخ مشخص شده صحبت می کند. هر گونه پیش بینی، تخمین، پیش بینی، هدف، چشم انداز، و/یا نظرات بیان شده در این مطالب بدون اطلاع قبلی ممکن است تغییر کند و ممکن است متفاوت یا مغایر با نظرات بیان شده توسط دیگران باشد. لطفاً برای اطلاعات مهم بیشتر به https://a16z.com/disclosures مراجعه کنید.
- محتوای مبتنی بر SEO و توزیع روابط عمومی. امروز تقویت شوید.
- PlatoAiStream. Web3 Data Intelligence دانش تقویت شده دسترسی به اینجا.
- ضرب کردن آینده با آدرین اشلی. دسترسی به اینجا.
- منبع: https://a16z.com/2023/04/27/investing-in-pinecone/
- : دارد
- :است
- :نه
- :جایی که
- 100 میلیون دلار
- $UP
- 1
- 500
- a
- a16z
- قادر
- درباره ما
- بالاتر
- دقت
- در میان
- واقعا
- اضافه
- اضافی
- اتخاذ
- تبلیغات
- نصیحت
- مشاوره
- خدمات مشاوره ای
- مدافع
- وابستگان
- از نو
- توافق
- AI
- AI / ML
- الگوریتم
- معرفی
- قبلا
- همچنین
- مقدار
- an
- تحلیلی
- و
- آندرسن
- آندرسن هورویتز
- اعلام
- دیگر
- پاسخ
- پاسخ
- هر
- API
- رابط های برنامه کاربردی
- اپل
- کاربرد
- برنامه های کاربردی
- اعمال می شود
- روش
- تقریبا
- برنامه های
- معماری
- هستند
- دور و بر
- AS
- دارایی
- اطمینان
- At
- در دسترس
- AWS
- به عقب
- بخش مدیریت
- مستقر
- BE
- زیرا
- تبدیل شدن به
- بوده
- قبل از
- باور
- اعتقاد بر این
- خارج از
- بزرگ
- بیلیون
- شکوفه
- فریب
- نام تجاری
- نام تجاری جدید
- ساختن
- بنا
- ساخته
- ساخته شده در
- کسب و کار
- اما
- by
- صدا
- نام
- تماس ها
- CAN
- سرمایه
- کاریابی
- موارد
- مدیر عامل شرکت
- معین
- به چالش
- تغییر دادن
- مشخصات
- موقعیت
- کلاس
- ابر
- رمز
- مجموعه
- ترکیب
- می آید
- شرکت
- شرکت
- شرکت
- جزء
- اجزاء
- کامپیوتر
- محاسبه
- مطمئن
- استوار
- را تشکیل می دهند
- مصرف کننده
- مصرف
- محتوا
- متنی
- مخالف
- COO
- هسته
- هزینه
- کاناپه
- دوره
- جاری
- مشتری
- مشتریان
- لبه برش
- داده ها
- پایگاه داده
- پایگاه های داده
- تاریخ
- روز
- مقدار
- تصمیم
- عمیق
- بستگی دارد
- شرح داده شده
- طرح
- طراحی
- توسعه دهنده
- توسعه دهندگان
- پروژه
- متفاوت است
- دیجیتال
- دارایی های دیجیتال
- ابعاد
- مستقیما
- افشای
- do
- سند
- مستندات
- میکند
- نمی کند
- عمل
- آیا
- e
- تجارت الکترونیک
- هر
- آسان تر
- به طور موثر
- موثر
- سنگ سنباده
- قادر ساختن
- پایان
- تایید و امضا
- پایدار
- مهندسی
- مورد تأیید
- انگلیسی
- سرمایه گذاری
- نرمافزار سازمانی
- کل
- تخمین می زند
- و غیره
- حتی
- در نهایت
- هر
- مثال
- برتری
- به استثنای
- اجرا کردن
- اعدام
- مدیران
- موجود
- انتظار می رود
- گران
- تجربه
- با تجربه
- تخصص
- توضیح دادن
- توضیح
- بیان
- خارجی
- چشم ها
- خارق العاده
- تغذیه
- کمی از
- پر کردن
- نهایی
- مالی
- fintech
- تمرکز
- برای
- پیش بینی
- فرم
- قالب
- سابق
- چهارم
- آینده نگر
- تاسیس
- از جانب
- صندوق
- بودجه
- بعلاوه
- آینده
- شکاف
- سوالات عمومی
- مولد
- دریافت کنید
- دادن
- داده
- دادن
- مغازه
- گوگل
- نمودار ها
- درشت
- در حال رشد
- رشد
- اتفاق می افتد
- اتفاق می افتد
- آیا
- he
- اینجا کلیک نمایید
- خیلی
- خود را
- هوروویتس
- چگونه
- HTTPS
- بزرگ
- انسان
- قابل خواندن انسان است
- i
- شناسایی
- اجرای
- اهمیت
- مهم
- تحت تاثیر قرار
- in
- شامل
- از جمله
- ترکیب کردن
- به طور مستقل
- نشان داد
- فرد
- لوازم
- صنعت
- اطلاعات
- اطلاعاتی
- شالوده
- بیمه
- ادغام
- اینترنت
- به
- سرمایه گذاری
- سرمایه گذاری
- سرمایه گذاری
- مشاوره سرمایه گذاری
- سرمایه گذاری
- سرمایه گذاران
- صادر کننده
- IT
- تکرار
- ITS
- جاوا اسکریپت
- پیوست
- تنها
- کلید
- زبان
- بزرگ
- نام
- لایه
- برجسته
- یادگیری
- قانونی
- آزادی
- پسندیدن
- فهرست
- زندگی
- LLM
- دستگاه
- فراگیری ماشین
- ماشین آلات
- ساخته
- ساخت
- باعث می شود
- ساخت
- مدیریت
- اداره می شود
- مدیریت
- مدیریت
- بسیاری
- حاشیه
- بازار
- مصالح
- از نظر ریاضی
- مسائل
- ممکن است..
- معنی دار
- به معنی
- رسانه ها
- ملاقات
- یادداشت
- حافظه
- ذکر شده
- میلیون
- ML
- مدل
- مدل
- ماه
- بیش
- اکثر
- بسیار
- چندگانه
- باید در
- طبیعی
- نیازهای
- جدید
- نه
- اطلاع..
- اکنون
- عدد
- تعداد
- به دست آمده
- of
- خاموش
- ارائه
- ارائه
- غالبا
- قدیمی
- on
- ONE
- فقط
- OpenAI
- کار
- قابل استفاده
- عملیات
- اپراتور
- دیدگاه ها
- or
- دیگر
- دیگران
- ما
- تولید
- روی
- خود
- پرداخت
- نمونه
- پارامترهای
- بخش
- ویژه
- شریک
- بخش
- گذشته
- کارایی
- اجازه
- پرسنل
- چشم انداز
- انتخاب کنید
- برگزیده
- اماکن
- افلاطون
- هوش داده افلاطون
- PlatoData
- لطفا
- مقام
- ممکن
- پست
- پتانسیل
- عملی
- عملگرا
- پیش گویی
- رئيس جمهور
- خصوصی
- ممتاز
- شاید
- مشکل
- مشکلات
- محصول
- تولید
- محصولات
- مفید
- برنامه نويسي
- پیشرفت
- پیش بینی
- آینده نگر
- چشم انداز
- ارائه
- ارائه
- ارائه
- عمومی
- اهداف
- پــایتــون
- یک چهارم
- محدوده
- نادر
- نسبتا
- خواندن
- اماده
- واقعی
- دنیای واقعی
- زمان واقعی
- داده های زمان واقعی
- دلایل
- به رسمیت شناختن
- توصیه
- توصیه
- منابع
- اشاره
- نسبتا
- مربوط
- قابل اعتماد
- به یاد داشته باشید
- نماینده
- نیاز
- تحقیق
- پاسخ
- نتیجه
- نتیجه
- نتایج
- برگشت
- درامد
- بررسی
- دور
- دویدن
- حکیم ساز
- همان
- حوزه
- جستجو
- جستجو
- اوراق بهادار
- دیدن
- مشاهده گردید
- ارسال
- در حال ارسال
- حس
- سلسله
- سری B
- سرویس
- خدمات
- تنظیم
- چند
- تغییر
- باید
- نشان داده شده
- طرف
- قابل توجه
- مشابه
- به سادگی
- پس از
- وضعیت
- So
- نرم افزار
- توسعه نرم افزار
- راه حل
- برخی از
- چیزی
- منابع
- صحبت می کند
- صرف
- پشته
- استاندارد
- شروع
- دولت
- اظهارات
- گام
- ذخیره سازی
- opbevare
- ذخیره شده
- ذخیره سازی
- در حال مطالعه
- موضوع
- اشتراک، ابونمان
- موفقیت
- چنین
- پشتیبانی
- سیستم های
- اهداف
- وظایف
- مالیات
- تیم
- فن آوری
- شرکت های فن آوری
- فنی
- پیشرفته
- نسبت به
- که
- La
- آینده
- اطلاعات
- شان
- آنها
- سپس
- آنجا.
- در آن
- اینها
- آنها
- فکر می کنم
- تفکر
- شخص ثالث
- این
- کسانی که
- سه
- هیجان زده
- زمان
- به
- ابزار
- بالا
- داد و ستد
- سنتی
- آموزش دیده
- آموزش
- معامله ای
- صادقانه
- دو
- زیر
- فهمیدن
- درک
- بر
- استفاده کنید
- استفاده
- کاربر
- وسیع
- وسایل نقلیه
- تایید
- بسیار
- نمایش ها
- دید
- بود
- مسیر..
- we
- خوب
- چی
- چه زمانی
- که
- در حین
- WHO
- تمام
- وسیع
- دامنه گسترده
- اراده
- با
- در داخل
- بدون
- شاهد
- مهاجرت کاری
- کارگر
- نوشتن
- نوشته
- کتبی
- اشتباه
- سال
- شما
- شما
- زفیرنت