الاستثمار في كوز الصنوبر

الاستثمار في كوز الصنوبر

الاستثمار في Pinecone PlatoBlockchain ذكاء البيانات. البحث العمودي. منظمة العفو الدولية.

مع انعكاس نماذج اللغات الكبيرة (LLMs) ، نشهد تحولًا نموذجيًا في تطوير البرمجيات وصناعة الحوسبة ككل. يحدث الذكاء الاصطناعي ويتشكل كومة جديدة أمام أعيننا. إنه مثل الإنترنت مرة أخرى ، والذي يستدعي مكونات البنية التحتية الجديدة للخدمة المصممة للطريقة الجديدة للقيام بالأشياء.

هناك اعتراف متزايد بأن LLMs هي في الواقع شكل جديد من الكمبيوتر، بمعنى ما. يمكنهم تشغيل "البرامج" المكتوبة بلغة طبيعية (أي ، المطالبات) ، وتنفيذ مهام الحوسبة التعسفية (على سبيل المثال ، كتابة كود Python أو البحث في Google) ، وإرجاع النتائج إلى المستخدم في شكل يمكن قراءته من قبل الإنسان. هذه مشكلة كبيرة لسببين: 

  1. فئة جديدة من التطبيقات حول التلخيص والمحتوى التوليدي أصبح الآن ممكنًا مما يؤدي إلى تغيير سلوك المستهلك فيما يتعلق باستهلاك البرامج.
  2. فئة جديدة من المطورين قادرة الآن على كتابة البرامج. تتطلب برمجة الكمبيوتر الآن إتقان اللغة الإنجليزية فقط (أو لغة بشرية أخرى) ، وليس التدريب على لغة برمجة تقليدية مثل Python أو JavaScript. 

تتمثل إحدى أهم أولوياتنا في Andreessen Horowitz في تحديد الشركات التي تبني المكونات الرئيسية لمجموعة الذكاء الاصطناعي الجديدة هذه. يسعدنا أن نعلن أننا نقود جولة بقيمة 100 مليون دولار من السلسلة B في كوز الصنوبر، لدعم رؤيتهم في أن تصبح طبقة الذاكرة لتطبيقات الذكاء الاصطناعي.

المشكلة: LLMs هلوسة وعديمة الجنسية

التحدي الكبير مع ماجستير في القانون الحالي هو الهلوسة. يعطون إجابات واثقة جدًا تكون غير صحيحة من الناحية الواقعية وفي بعض الأحيان منطقيًا. على سبيل المثال ، يمكن أن يؤدي طلب ماجستير في القانون عن الهامش الإجمالي لشركة Apple للربع الأخير إلى إجابة موثوقة قدرها 63 مليار دولار. يمكن للنموذج أيضًا دعم إجابته من خلال توضيح أنه بطرح 25 مليار دولار من تكلفة البضائع من 95 مليار دولار في الإيرادات ، فإنك تحصل على هامش إجمالي قدره 63 مليار دولار. بالطبع ، هذا خطأ في عدة أبعاد:

  • أولاً ، رقم الإيرادات خاطئ ، لأن LLM لا تملك بيانات في الوقت الفعلي. إنها تعمل على بيانات التدريب التي لا معنى لها والتي هي أشهر أو ربما سنوات.
  • ثانيًا ، التقطت هذه الإيرادات وتكلفة أرقام السلع بشكل عشوائي من البيانات المالية لشركة فاكهة أخرى.
  • ثالثًا ، حساب هامش الربح الإجمالي الخاص بها ليس صحيحًا من الناحية الحسابية.

تخيل إعطاء هذه الإجابة للرئيس التنفيذي لشركة Fortune 500 شركة. 

يحدث كل هذا لأنه ، في نهاية اليوم ، LLMs هي آلات تنبؤ مدربة على كميات هائلة من بيانات الإنترنت الخاصة بطرف ثالث. غالبًا ما تكون المعلومات التي يحتاجها المستخدم غير موجودة في مجموعة التدريب. لذلك ، سيعطي النموذج الإجابات الأكثر احتمالية وجيدة التنسيق لغويًا استنادًا إلى بيانات التدريب التي لا معنى لها. يمكننا بالفعل البدء في رؤية حل محتمل للمشكلة المذكورة أعلاه - تغذية بيانات المؤسسة الخاصة ذات الصلة بالسياق في الوقت الفعلي إلى LLM.

الشكل العام لهذه المشكلة هو أنه من منظور الأنظمة ، تكون نماذج LLM ومعظم نماذج الذكاء الاصطناعي الأخرى عديمة الحالة عند خطوة الاستدلال. في كل مرة تقوم فيها بإجراء مكالمة إلى GPT-4 API ، يعتمد الإخراج فقط على البيانات والمعلمات التي ترسلها في الحمولة. لا يحتوي النموذج على طريقة مضمنة لدمج البيانات السياقية أو تذكر ما طلبته من قبل. يمكن ضبط النموذج بدقة ، ولكنه مكلف وغير مرن نسبيًا (على سبيل المثال ، لا يمكن للنموذج الاستجابة للبيانات الجديدة في الوقت الفعلي). نظرًا لأن النماذج لا تدير الحالة أو الذاكرة من تلقاء نفسها ، فإن الأمر متروك للمطورين لملء الفراغ. 

الحل: قواعد بيانات المتجه هي طبقة التخزين لـ LLMs

هذا هو المكان الذي يأتي فيه Pinecone.

Pinecone هي قاعدة بيانات خارجية حيث يمكن للمطورين تخزين البيانات السياقية ذات الصلة لتطبيقات LLM. بدلاً من إرسال مجموعات مستندات كبيرة ذهابًا وإيابًا مع كل استدعاء لواجهة برمجة التطبيقات ، يمكن للمطورين تخزينها في قاعدة بيانات Pinecone ، ثم اختيار القليل منها فقط الأكثر صلة بأي استعلام معين - وهو نهج يسمى التعلم في السياق. من الضروري أن تزدهر حالات استخدام المؤسسات حقًا.

على وجه الخصوص ، Pinecone هو ملف ناقلات قاعدة البيانات ، مما يعني أن البيانات مخزنة في شكل ذي مغزى التضمين. في حين أن التفسير الفني لحفلات الزفاف خارج نطاق هذا المنشور ، فإن الجزء المهم الذي يجب فهمه هو أن LLM تعمل أيضًا على الزخارف المتجهات - لذلك من خلال تخزين البيانات في Pinecone بهذا التنسيق ، تمت معالجة جزء من عمل AI بشكل فعال و تفريغها إلى قاعدة البيانات.

على عكس قواعد البيانات الحالية ، المصممة للمعاملات الذرية أو أعباء العمل التحليلية الشاملة ، تم تصميم قاعدة بيانات المتجه (Pinecone) من أجل البحث المتسق التقريبي في نهاية المطاف عن الجيران ، وهو نموذج قاعدة البيانات الصحيح للمتجهات عالية الأبعاد. كما أنها توفر واجهات برمجة تطبيقات للمطورين تتكامل مع المكونات الرئيسية الأخرى لتطبيقات الذكاء الاصطناعي ، مثل OpenAI و Cohere و LangChain وما إلى ذلك. مثل هذا التصميم المدروس جيدًا يجعل حياة المطورين أسهل بكثير. يمكن أيضًا تصميم مهام AI البسيطة مثل البحث الدلالي أو توصيات المنتج أو ترتيب الخلاصة مباشرةً كمشكلات بحث متجه وتشغيلها على قاعدة بيانات المتجه دون خطوة استدلال نموذج نهائي - شيء لا تستطيع قواعد البيانات الموجودة فعله.

Pinecone هو المعيار الناشئ لإدارة بيانات المؤسسة السياقية والحالة في تطبيقات LLM. نعتقد أنه مكون مهم للبنية التحتية ، حيث يوفر طبقة التخزين أو "الذاكرة" لمجموعة تطبيقات الذكاء الاصطناعي الجديدة تمامًا.

تقدم لا يصدق ل Pinecone حتى الآن

Pinecone ليست قاعدة البيانات الموجهة الوحيدة ، لكننا نعتقد أنها قاعدة بيانات المتجهات الرائدة - جاهزة الآن للتبني في العالم الحقيقي - بهامش كبير. شهد Pinecone نموًا بمقدار 8 أضعاف في عدد العملاء المدفوعين (حوالي 1,600) في ثلاثة أشهر فقط ، بما في ذلك شركات التكنولوجيا التطلعية مثل Shopify و Gong و Zapier والمزيد. يتم استخدامه في مجموعة واسعة من الصناعات ، بما في ذلك برامج المؤسسات وتطبيقات المستهلك والتجارة الإلكترونية والتكنولوجيا المالية والتأمين والوسائط و AI / ML.

نعزو هذا النجاح ليس فقط إلى فهم الفريق العميق للمستخدم والسوق والتكنولوجيا ، ولكن أيضًا - بشكل حاسم - لنهج المنتج السحابي الأصلي من البداية. يتمثل أحد أصعب أجزاء بناء هذه الخدمة في توفير خلفية سحابية موثوقة ومتاحة للغاية تلبي مجموعة واسعة من أهداف أداء العملاء واتفاقيات مستوى الخدمة. من خلال التكرارات المتعددة حول بنية المنتج ، وإدارة العديد من العملاء البارزين في الإنتاج ، أظهر هذا الفريق تميزًا تشغيليًا متوقعًا من قاعدة بيانات الإنتاج.

كوز الصنوبر تم تأسيسها من قبل Edo Liberty ، الذي كان منذ فترة طويلة مدافعًا قويًا عن أهمية قواعد بيانات المتجهات في التعلم الآلي ، بما في ذلك كيفية تمكين كل مؤسسة من إنشاء حالات استخدام فوق LLMs. كعالم رياضيات تطبيقية ، أمضى حياته المهنية في دراسة وتنفيذ خوارزميات البحث المتجه المتطورة. في الوقت نفسه ، كان براغماتيًا ، بنى أدوات ML الأساسية مثل Sagemaker في AWS ، وقام بترجمة أبحاث ML التطبيقية إلى منتجات عملية يمكن للعملاء استخدامها. من النادر رؤية مثل هذا المزيج من البحث العميق والتفكير العملي في المنتج.

ينضم إلى Edo بوب ويدرهولد ، الرئيس التنفيذي والمشغل ذو الخبرة (المعروف سابقًا باسم Couchbase) ، كشريك في جانب العمليات كرئيس ومدير تنفيذي للعمليات. لدى Pinecone أيضًا فريق رائع من المديرين التنفيذيين والمهندسين ذوي الخبرة العميقة في أنظمة السحابة من أماكن مثل AWS و Google و Databricks. نحن معجبون بالخبرة الهندسية العميقة للفريق ، والتركيز على تجربة المطور ، والتنفيذ الفعال لـ GTM ، ويسعدنا أن نتشارك معهم لبناء طبقة الذاكرة لتطبيقات الذكاء الاصطناعي.

* * *

الآراء المعبر عنها هنا هي آراء أفراد AH Capital Management، LLC ("a16z") المقتبس منهم وليست آراء a16z أو الشركات التابعة لها. تم الحصول على بعض المعلومات الواردة هنا من مصادر خارجية ، بما في ذلك من شركات محافظ الصناديق التي تديرها a16z. على الرغم من أنه مأخوذ من مصادر يُعتقد أنها موثوقة ، لم تتحقق a16z بشكل مستقل من هذه المعلومات ولا تقدم أي تعهدات حول الدقة الدائمة للمعلومات أو ملاءمتها لموقف معين. بالإضافة إلى ذلك ، قد يتضمن هذا المحتوى إعلانات جهات خارجية ؛ لم تقم a16z بمراجعة مثل هذه الإعلانات ولا تصادق على أي محتوى إعلاني وارد فيها.

يتم توفير هذا المحتوى لأغراض إعلامية فقط ، ولا ينبغي الاعتماد عليه كمشورة قانونية أو تجارية أو استثمارية أو ضريبية. يجب عليك استشارة مستشاريك بخصوص هذه الأمور. الإشارات إلى أي أوراق مالية أو أصول رقمية هي لأغراض توضيحية فقط ، ولا تشكل توصية استثمارية أو عرضًا لتقديم خدمات استشارية استثمارية. علاوة على ذلك ، هذا المحتوى غير موجه أو مخصص للاستخدام من قبل أي مستثمرين أو مستثمرين محتملين ، ولا يجوز الاعتماد عليه تحت أي ظرف من الظروف عند اتخاذ قرار بالاستثمار في أي صندوق تديره a16z. (سيتم تقديم عرض للاستثمار في صندوق a16z فقط من خلال مذكرة الاكتتاب الخاص واتفاقية الاشتراك والوثائق الأخرى ذات الصلة لأي صندوق من هذا القبيل ويجب قراءتها بالكامل.) أي استثمارات أو شركات محفظة مذكورة ، يشار إليها ، أو الموصوفة لا تمثل جميع الاستثمارات في السيارات التي تديرها a16z ، ولا يمكن أن يكون هناك ضمان بأن الاستثمارات ستكون مربحة أو أن الاستثمارات الأخرى التي تتم في المستقبل سيكون لها خصائص أو نتائج مماثلة. قائمة الاستثمارات التي أجرتها الصناديق التي يديرها Andreessen Horowitz (باستثناء الاستثمارات التي لم يمنحها المُصدر إذنًا لـ a16z للإفصاح علنًا عن الاستثمارات غير المعلنة في الأصول الرقمية المتداولة علنًا) على https://a16z.com/investments /.

الرسوم البيانية والرسوم البيانية المقدمة في الداخل هي لأغراض إعلامية فقط ولا ينبغي الاعتماد عليها عند اتخاذ أي قرار استثماري. الأداء السابق ليس مؤشرا على النتائج المستقبلية. المحتوى يتحدث فقط اعتبارًا من التاريخ المشار إليه. أي توقعات وتقديرات وتنبؤات وأهداف وآفاق و / أو آراء معبر عنها في هذه المواد عرضة للتغيير دون إشعار وقد تختلف أو تتعارض مع الآراء التي يعبر عنها الآخرون. يرجى الاطلاع على https://a16z.com/disclosures للحصول على معلومات إضافية مهمة.

الطابع الزمني:

اكثر من أندرسن هورويتز