Pinecone میں سرمایہ کاری کرنا

Pinecone میں سرمایہ کاری کرنا

Investing in Pinecone PlatoBlockchain Data Intelligence. Vertical Search. Ai.

بڑے لینگویج ماڈلز (LLMs) کے انفلیکیشن کے ساتھ، ہم سافٹ ویئر ڈویلپمنٹ اور مجموعی طور پر کمپیوٹنگ انڈسٹری میں ایک مثالی تبدیلی کا مشاہدہ کر رہے ہیں۔ AI ہو رہا ہے اور ہماری آنکھوں کے سامنے ایک نیا ڈھیر بن رہا ہے۔ یہ ایک بار پھر انٹرنیٹ کی طرح ہے، جو کام کرنے کے نئے طریقے کے لیے بنائے گئے نئے بنیادی ڈھانچے کے اجزاء کو سروس میں بلاتا ہے۔.

اس بات کی پہچان بڑھ رہی ہے کہ ایل ایل ایم دراصل ہیں۔ کمپیوٹر کی ایک نئی شکل، کچھ معنوں میں۔ وہ فطری زبان میں لکھے گئے "پروگرامز" چلا سکتے ہیں (یعنی پرامپٹس)، صوابدیدی کمپیوٹنگ کاموں کو انجام دے سکتے ہیں (مثلاً، ازگر کوڈ لکھنا یا گوگل کو تلاش کرنا)، اور نتائج کو صارف کو انسانی پڑھنے کے قابل شکل میں واپس کر سکتے ہیں۔ یہ ایک بڑی بات ہے، دو وجوہات کی بنا پر: 

  1. خلاصہ اور تخلیقی مواد کے ارد گرد ایپلی کیشنز کی ایک نئی کلاس سافٹ ویئر کی کھپت کے ارد گرد صارفین کے رویے میں تبدیلی کے نتیجے میں اب ممکن ہے.
  2. ڈویلپرز کی ایک نئی کلاس اب سافٹ ویئر لکھنے کے قابل ہے۔ کمپیوٹر پروگرامنگ کے لیے اب صرف انگریزی (یا دوسری انسانی زبان) پر عبور درکار ہے، نہ کہ روایتی پروگرامنگ زبان جیسے Python یا JavaScript میں تربیت۔ 

Andreessen Horowitz میں ہماری اولین ترجیحات میں سے ایک اس نئے AI اسٹیک کے کلیدی اجزاء بنانے والی کمپنیوں کی نشاندہی کرنا ہے۔ ہمیں یہ اعلان کرتے ہوئے خوشی ہو رہی ہے کہ ہم $100 ملین سیریز B راؤنڈ میں آگے بڑھ رہے ہیں پنکون، AI ایپلی کیشنز کے لیے میموری لیئر بننے کے ان کے وژن کی حمایت کرنے کے لیے۔

مسئلہ: LLMs hallucinate اور بے وطن ہیں۔

موجودہ LLMs کے ساتھ ایک بہت بڑا چیلنج فریب ہے۔ وہ بہت پر اعتماد جوابات دیتے ہیں جو حقیقت میں اور بعض اوقات منطقی طور پر غلط ہوتے ہیں۔ مثال کے طور پر، پچھلی سہ ماہی کے لیے Apple کے مجموعی مارجن کے لیے LLM پوچھنے کے نتیجے میں $63 بلین کا پر اعتماد جواب مل سکتا ہے۔ ماڈل اپنے جواب کا بیک اپ یہ بتا کر بھی لے سکتا ہے کہ 25 بلین ڈالر کی آمدنی سے سامان کی قیمت میں $95 بلین کو گھٹا کر، آپ کو $63 بلین کا مجموعی مارجن ملتا ہے۔ یقینا، یہ کئی جہتوں پر غلط ہے:

  • سب سے پہلے، آمدنی کا نمبر غلط ہے، کیونکہ LLM کے پاس ریئل ٹائم ڈیٹا نہیں ہے۔ یہ باسی تربیتی ڈیٹا پر کام کر رہا ہے جو مہینوں یا شاید برسوں پرانا ہے۔
  • دوسرا، اس نے کسی اور فروٹ کمپنی کے مالی بیانات سے تصادفی طور پر ان محصولات اور سامان کی قیمتوں کو اٹھایا۔
  • تیسرا، اس کا مجموعی مارجن حساب حسابی طور پر درست نہیں ہے۔

ایک کے سی ای او کو یہ جواب دینے کا تصور کریں۔ فارچیون 500 کمپنی۔ 

یہ سب کچھ اس لیے ہوتا ہے کہ، دن کے اختتام پر، LLMs پیشین گوئی کرنے والی مشینیں ہیں جنہیں تھرڈ پارٹی انٹرنیٹ ڈیٹا کی وسیع مقدار پر تربیت دی جاتی ہے۔ اکثر، صارف کو جس معلومات کی ضرورت ہوتی ہے وہ ٹریننگ سیٹ میں نہیں ہوتی ہے۔ لہذا، ماڈل اپنے باسی تربیتی اعداد و شمار کی بنیاد پر سب سے زیادہ ممکنہ اور لسانی اعتبار سے اچھے فارمیٹ شدہ جوابات دے گا۔ ہم پہلے ہی مذکورہ مسئلے کا ممکنہ حل دیکھنا شروع کر سکتے ہیں — LLMs کو حقیقی وقت میں سیاق و سباق سے متعلقہ نجی انٹرپرائز ڈیٹا فیڈ کرنا۔

اس مسئلے کی عمومی شکل یہ ہے کہ، سسٹمز کے نقطہ نظر سے، LLMs اور زیادہ تر دیگر AI ماڈل تخمینہ کے مرحلے پر بے وطن ہیں۔ ہر بار جب آپ GPT-4 API پر کال کرتے ہیں، آؤٹ پٹ انحصار کرتا ہے۔ صرف ڈیٹا اور پیرامیٹرز پر جو آپ پے لوڈ میں بھیجتے ہیں۔ ماڈل کے پاس سیاق و سباق کے اعداد و شمار کو شامل کرنے یا یاد رکھنے کا کوئی اندرونی طریقہ نہیں ہے کہ آپ نے پہلے کیا پوچھا ہے۔ ماڈل فائن ٹیوننگ ممکن ہے، لیکن یہ مہنگا اور نسبتاً پیچیدہ ہے (یعنی، ماڈل حقیقی وقت میں نئے ڈیٹا کا جواب نہیں دے سکتا)۔ چونکہ ماڈل خود ریاست یا میموری کا انتظام نہیں کرتے ہیں، اس لیے یہ خلا کو پُر کرنا ڈیولپرز پر منحصر ہے۔ 

حل: ویکٹر ڈیٹا بیس LLMs کے لیے اسٹوریج لیئر ہیں۔

یہ وہ جگہ ہے جہاں پائنیکون آتا ہے۔

Pinecone ایک بیرونی ڈیٹا بیس ہے جہاں ڈویلپرز LLM ایپس کے لیے متعلقہ سیاق و سباق کا ڈیٹا محفوظ کر سکتے ہیں۔ ہر API کال کے ساتھ آگے پیچھے دستاویزات کے بڑے مجموعوں کو بھیجنے کے بجائے، ڈویلپرز انہیں Pinecone ڈیٹا بیس میں اسٹور کر سکتے ہیں، پھر کسی بھی سوال سے متعلق صرف چند کو منتخب کر سکتے ہیں - ایک نقطہ نظر جسے in-contact Learning کہا جاتا ہے۔ انٹرپرائز کے استعمال کے معاملات کو حقیقی معنوں میں کھلنے کے لیے یہ ضروری ہے۔

خاص طور پر، Pinecone a ویکٹر ڈیٹا بیس، جس کا مطلب ہے کہ ڈیٹا کو لفظی معنی کی شکل میں محفوظ کیا جاتا ہے۔ سرایت. اگرچہ ایمبیڈنگز کی تکنیکی وضاحت اس پوسٹ کے دائرہ کار سے باہر ہے، لیکن سمجھنے کے لیے اہم حصہ یہ ہے کہ LLMs ویکٹر ایمبیڈنگز پر بھی کام کرتے ہیں - اس لیے اس فارمیٹ میں Pinecone میں ڈیٹا اسٹور کرنے سے، AI کام کے کچھ حصے کو مؤثر طریقے سے پہلے سے پروسیس کیا گیا ہے اور ڈیٹا بیس پر آف لوڈ کیا گیا۔

موجودہ ڈیٹا بیس کے برعکس، جو کہ جوہری لین دین یا مکمل تجزیاتی کام کے بوجھ کے لیے ڈیزائن کیا گیا ہے، (پائنیکون) ویکٹر ڈیٹا بیس کو آخرکار ہم آہنگ قریب قریب پڑوسی کی تلاش کے لیے ڈیزائن کیا گیا ہے، جو اعلیٰ جہتی ویکٹرز کے لیے صحیح ڈیٹا بیس کا نمونہ ہے۔ وہ AI ایپلی کیشنز کے دیگر اہم اجزاء جیسے OpenAI، Cohere، LangChain، وغیرہ کے ساتھ مل کر ڈویلپر APIs بھی فراہم کرتے ہیں۔ اس طرح کا سوچا سمجھا ڈیزائن ڈویلپرز کی زندگی کو بہت آسان بنا دیتا ہے۔ سادہ AI ٹاسک جیسے سیمنٹک سرچ، پروڈکٹ کی سفارشات، یا فیڈ رینکنگ کو بھی براہ راست ویکٹر سرچ کے مسائل کے طور پر ماڈل بنایا جا سکتا ہے اور ویکٹر ڈیٹا بیس پر بغیر کسی حتمی ماڈل کے انفرنس سٹیپ کے چلایا جا سکتا ہے۔ کچھ موجودہ ڈیٹا بیس نہیں کر سکتے ہیں۔

LLM ایپلی کیشنز میں ریاست اور سیاق و سباق کے انٹرپرائز ڈیٹا کے انتظام کے لیے پائنیکون ابھرتا ہوا معیار ہے۔ ہمارے خیال میں یہ بنیادی ڈھانچے کا ایک اہم جزو ہے، جو ایک بالکل نئے AI ایپلیکیشن اسٹیک کو اسٹوریج، یا "میموری،" پرت فراہم کرتا ہے۔

Pinecone کے لیے آج تک ناقابل یقین پیش رفت

Pinecone واحد ویکٹر ڈیٹا بیس نہیں ہے، لیکن ہمیں یقین ہے کہ یہ ایک اہم ویکٹر ڈیٹا بیس ہے — جو اب حقیقی دنیا کو اپنانے کے لیے تیار ہے — ایک اہم مارجن سے۔ Pinecone نے صرف تین مہینوں میں ادائیگی کرنے والے صارفین (تقریباً 8) میں 1,600 گنا اضافہ دیکھا ہے، بشمول Shopify، Gong، Zapier، اور بہت کچھ جیسی آگے کی طرف دیکھنے والی ٹیک کمپنیاں۔ یہ صنعتوں کی وسیع رینج میں استعمال ہوتا ہے، بشمول انٹرپرائز سافٹ ویئر، صارف ایپس، ای کامرس، فنٹیک، انشورنس، میڈیا، اور AI/ML۔

ہم اس کامیابی کو نہ صرف ٹیم کی صارف، مارکیٹ اور ٹیکنالوجی کے بارے میں گہری سمجھ بوجھ سے منسوب کرتے ہیں بلکہ — تنقیدی طور پر — شروع سے ہی ان کے کلاؤڈ-مقامی مصنوعات کے نقطہ نظر کو بھی۔ اس سروس کی تعمیر کے سب سے مشکل حصوں میں سے ایک قابل اعتماد، انتہائی دستیاب کلاؤڈ بیک اینڈ فراہم کرنا ہے جو کسٹمر کی کارکردگی کے اہداف اور SLAs کی ایک وسیع رینج کو پورا کرتا ہے۔ پروڈکٹ کے فن تعمیر پر متعدد تکرار کے ساتھ، اور پیداوار میں بہت سے اعلیٰ درجے کے، ادا شدہ صارفین کو منظم کرنے کے ساتھ، اس ٹیم نے آپریشنل عمدگی کا مظاہرہ کیا ہے جس کی پیداوار ڈیٹا بیس سے توقع کی جاتی ہے۔

پنکون Edo Liberty کی طرف سے قائم کیا گیا تھا، جو مشین لرننگ میں ویکٹر ڈیٹا بیس کی اہمیت کے لیے ایک طویل عرصے سے سخت وکیل رہا ہے، جس میں یہ بھی شامل ہے کہ وہ کس طرح ہر انٹرپرائز کو LLMs کے اوپر استعمال کے کیسز بنانے کے قابل بنا سکتے ہیں۔ ایک لاگو ریاضی دان کے طور پر، اس نے اپنا کیریئر جدید ویکٹر سرچ الگورتھم کا مطالعہ کرنے اور ان پر عمل درآمد کرنے میں صرف کیا۔ ایک ہی وقت میں، وہ ایک عملیت پسند تھا، AWS میں Sagemaker جیسے بنیادی ML ٹولز بنا رہا تھا، اور اطلاق شدہ ML تحقیق کو عملی مصنوعات میں ترجمہ کر رہا تھا جسے گاہک استعمال کر سکتے ہیں۔ گہری تحقیق اور عملی مصنوعات کی سوچ کا ایسا امتزاج دیکھنے کے لئے بہت کم ہے۔

Edo کے ساتھ Bob Wiederhold، ایک تجربہ کار CEO اور آپریٹر (سابقہ ​​Couchbase کے)، صدر اور COO کے طور پر آپریشنز کی طرف ایک پارٹنر کے طور پر شامل ہوئے۔ Pinecone کے پاس AWS، Google، اور Databricks جیسی جگہوں سے گہرے کلاؤڈ سسٹم کی مہارت کے ساتھ ایگزیکٹوز اور انجینئرز کی ایک شاندار ٹیم بھی ہے۔ ہم ٹیم کی گہری انجینئرنگ کی مہارت، ڈویلپر کے تجربے پر توجہ، اور موثر GTM عمل سے متاثر ہیں، اور ہمیں AI ایپلیکیشنز کے لیے میموری کی تہہ بنانے کے لیے ان کے ساتھ شراکت کرنے کا اعزاز حاصل ہے۔

* * *

یہاں بیان کردہ خیالات انفرادی AH Capital Management, LLC ("a16z") کے اہلکاروں کے ہیں جن کا حوالہ دیا گیا ہے اور یہ a16z یا اس سے وابستہ افراد کے خیالات نہیں ہیں۔ یہاں پر موجود کچھ معلومات فریق ثالث کے ذرائع سے حاصل کی گئی ہیں، بشمول a16z کے زیر انتظام فنڈز کی پورٹ فولیو کمپنیوں سے۔ جب کہ معتبر مانے جانے والے ذرائع سے لیا گیا ہے، a16z نے آزادانہ طور پر ایسی معلومات کی تصدیق نہیں کی ہے اور معلومات کی پائیدار درستگی یا دی گئی صورت حال کے لیے اس کی مناسبیت کے بارے میں کوئی نمائندگی نہیں کی ہے۔ اس کے علاوہ، اس مواد میں فریق ثالث کے اشتہارات شامل ہو سکتے ہیں۔ a16z نے ایسے اشتہارات کا جائزہ نہیں لیا ہے اور اس میں موجود کسی بھی اشتہاری مواد کی توثیق نہیں کرتا ہے۔

یہ مواد صرف معلوماتی مقاصد کے لیے فراہم کیا گیا ہے، اور قانونی، کاروبار، سرمایہ کاری، یا ٹیکس کے مشورے کے طور پر اس پر انحصار نہیں کیا جانا چاہیے۔ آپ کو ان معاملات کے بارے میں اپنے مشیروں سے مشورہ کرنا چاہئے۔ کسی بھی سیکیورٹیز یا ڈیجیٹل اثاثوں کے حوالے صرف مثالی مقاصد کے لیے ہیں، اور سرمایہ کاری کی سفارش یا پیشکش کی تشکیل نہیں کرتے ہیں کہ سرمایہ کاری کی مشاورتی خدمات فراہم کریں۔ مزید برآں، یہ مواد کسی سرمایہ کار یا ممکنہ سرمایہ کاروں کی طرف سے استعمال کرنے کے لیے نہیں ہے اور نہ ہی اس کا مقصد ہے، اور کسی بھی صورت میں a16z کے زیر انتظام کسی بھی فنڈ میں سرمایہ کاری کرنے کا فیصلہ کرتے وقت اس پر انحصار نہیں کیا جا سکتا ہے۔ (a16z فنڈ میں سرمایہ کاری کرنے کی پیشکش صرف پرائیویٹ پلیسمنٹ میمورنڈم، سبسکرپشن ایگریمنٹ، اور اس طرح کے کسی بھی فنڈ کی دیگر متعلقہ دستاویزات کے ذریعے کی جائے گی اور ان کو مکمل طور پر پڑھا جانا چاہیے۔) کوئی بھی سرمایہ کاری یا پورٹ فولیو کمپنیوں کا ذکر کیا گیا، حوالہ دیا گیا، یا بیان کردہ A16z کے زیر انتظام گاڑیوں میں ہونے والی تمام سرمایہ کاری کے نمائندے نہیں ہیں، اور اس بات کی کوئی یقین دہانی نہیں ہو سکتی کہ سرمایہ کاری منافع بخش ہو گی یا مستقبل میں کی جانے والی دیگر سرمایہ کاری میں بھی ایسی ہی خصوصیات یا نتائج ہوں گے۔ Andreessen Horowitz کے زیر انتظام فنڈز کے ذریعے کی گئی سرمایہ کاری کی فہرست (ان سرمایہ کاری کو چھوڑ کر جن کے لیے جاری کنندہ نے a16z کو عوامی طور پر ظاہر کرنے کے ساتھ ساتھ عوامی طور پر تجارت کیے جانے والے ڈیجیٹل اثاثوں میں غیر اعلانیہ سرمایہ کاری کی اجازت فراہم نہیں کی ہے) https://a16z.com/investments پر دستیاب ہے۔ /.

اندر فراہم کردہ چارٹس اور گراف صرف معلوماتی مقاصد کے لیے ہیں اور سرمایہ کاری کا کوئی فیصلہ کرتے وقت ان پر انحصار نہیں کیا جانا چاہیے۔ ماضی کی کارکردگی مستقبل کے نتائج کا اشارہ نہیں ہے۔ مواد صرف اشارہ کردہ تاریخ کے مطابق بولتا ہے۔ کوئی بھی تخمینہ، تخمینہ، پیشن گوئی، اہداف، امکانات، اور/یا ان مواد میں بیان کیے گئے خیالات بغیر اطلاع کے تبدیل کیے جا سکتے ہیں اور دوسروں کی رائے سے مختلف یا اس کے برعکس ہو سکتے ہیں۔ اضافی اہم معلومات کے لیے براہ کرم https://a16z.com/disclosures دیکھیں۔

ٹائم اسٹیمپ:

سے زیادہ اندیسن Horowitz