مع انعكاس نماذج اللغات الكبيرة (LLMs) ، نشهد تحولًا نموذجيًا في تطوير البرمجيات وصناعة الحوسبة ككل. يحدث الذكاء الاصطناعي ويتشكل كومة جديدة أمام أعيننا. إنه مثل الإنترنت مرة أخرى ، والذي يستدعي مكونات البنية التحتية الجديدة للخدمة المصممة للطريقة الجديدة للقيام بالأشياء.
هناك اعتراف متزايد بأن LLMs هي في الواقع شكل جديد من الكمبيوتر، بمعنى ما. يمكنهم تشغيل "البرامج" المكتوبة بلغة طبيعية (أي ، المطالبات) ، وتنفيذ مهام الحوسبة التعسفية (على سبيل المثال ، كتابة كود Python أو البحث في Google) ، وإرجاع النتائج إلى المستخدم في شكل يمكن قراءته من قبل الإنسان. هذه مشكلة كبيرة لسببين:
- فئة جديدة من التطبيقات حول التلخيص والمحتوى التوليدي أصبح الآن ممكنًا مما يؤدي إلى تغيير سلوك المستهلك فيما يتعلق باستهلاك البرامج.
- فئة جديدة من المطورين قادرة الآن على كتابة البرامج. تتطلب برمجة الكمبيوتر الآن إتقان اللغة الإنجليزية فقط (أو لغة بشرية أخرى) ، وليس التدريب على لغة برمجة تقليدية مثل Python أو JavaScript.
تتمثل إحدى أهم أولوياتنا في Andreessen Horowitz في تحديد الشركات التي تبني المكونات الرئيسية لمجموعة الذكاء الاصطناعي الجديدة هذه. يسعدنا أن نعلن أننا نقود جولة بقيمة 100 مليون دولار من السلسلة B في كوز الصنوبر، لدعم رؤيتهم في أن تصبح طبقة الذاكرة لتطبيقات الذكاء الاصطناعي.
المشكلة: LLMs هلوسة وعديمة الجنسية
التحدي الكبير مع ماجستير في القانون الحالي هو الهلوسة. يعطون إجابات واثقة جدًا تكون غير صحيحة من الناحية الواقعية وفي بعض الأحيان منطقيًا. على سبيل المثال ، يمكن أن يؤدي طلب ماجستير في القانون عن الهامش الإجمالي لشركة Apple للربع الأخير إلى إجابة موثوقة قدرها 63 مليار دولار. يمكن للنموذج أيضًا دعم إجابته من خلال توضيح أنه بطرح 25 مليار دولار من تكلفة البضائع من 95 مليار دولار في الإيرادات ، فإنك تحصل على هامش إجمالي قدره 63 مليار دولار. بالطبع ، هذا خطأ في عدة أبعاد:
- أولاً ، رقم الإيرادات خاطئ ، لأن LLM لا تملك بيانات في الوقت الفعلي. إنها تعمل على بيانات التدريب التي لا معنى لها والتي هي أشهر أو ربما سنوات.
- ثانيًا ، التقطت هذه الإيرادات وتكلفة أرقام السلع بشكل عشوائي من البيانات المالية لشركة فاكهة أخرى.
- ثالثًا ، حساب هامش الربح الإجمالي الخاص بها ليس صحيحًا من الناحية الحسابية.
تخيل إعطاء هذه الإجابة للرئيس التنفيذي لشركة Fortune 500 شركة.
يحدث كل هذا لأنه ، في نهاية اليوم ، LLMs هي آلات تنبؤ مدربة على كميات هائلة من بيانات الإنترنت الخاصة بطرف ثالث. غالبًا ما تكون المعلومات التي يحتاجها المستخدم غير موجودة في مجموعة التدريب. لذلك ، سيعطي النموذج الإجابات الأكثر احتمالية وجيدة التنسيق لغويًا استنادًا إلى بيانات التدريب التي لا معنى لها. يمكننا بالفعل البدء في رؤية حل محتمل للمشكلة المذكورة أعلاه - تغذية بيانات المؤسسة الخاصة ذات الصلة بالسياق في الوقت الفعلي إلى LLM.
الشكل العام لهذه المشكلة هو أنه من منظور الأنظمة ، تكون نماذج LLM ومعظم نماذج الذكاء الاصطناعي الأخرى عديمة الحالة عند خطوة الاستدلال. في كل مرة تقوم فيها بإجراء مكالمة إلى GPT-4 API ، يعتمد الإخراج فقط على البيانات والمعلمات التي ترسلها في الحمولة. لا يحتوي النموذج على طريقة مضمنة لدمج البيانات السياقية أو تذكر ما طلبته من قبل. يمكن ضبط النموذج بدقة ، ولكنه مكلف وغير مرن نسبيًا (على سبيل المثال ، لا يمكن للنموذج الاستجابة للبيانات الجديدة في الوقت الفعلي). نظرًا لأن النماذج لا تدير الحالة أو الذاكرة من تلقاء نفسها ، فإن الأمر متروك للمطورين لملء الفراغ.
الحل: قواعد بيانات المتجه هي طبقة التخزين لـ LLMs
هذا هو المكان الذي يأتي فيه Pinecone.
Pinecone هي قاعدة بيانات خارجية حيث يمكن للمطورين تخزين البيانات السياقية ذات الصلة لتطبيقات LLM. بدلاً من إرسال مجموعات مستندات كبيرة ذهابًا وإيابًا مع كل استدعاء لواجهة برمجة التطبيقات ، يمكن للمطورين تخزينها في قاعدة بيانات Pinecone ، ثم اختيار القليل منها فقط الأكثر صلة بأي استعلام معين - وهو نهج يسمى التعلم في السياق. من الضروري أن تزدهر حالات استخدام المؤسسات حقًا.
على وجه الخصوص ، Pinecone هو ملف ناقلات قاعدة البيانات ، مما يعني أن البيانات مخزنة في شكل ذي مغزى التضمين. في حين أن التفسير الفني لحفلات الزفاف خارج نطاق هذا المنشور ، فإن الجزء المهم الذي يجب فهمه هو أن LLM تعمل أيضًا على الزخارف المتجهات - لذلك من خلال تخزين البيانات في Pinecone بهذا التنسيق ، تمت معالجة جزء من عمل AI بشكل فعال و تفريغها إلى قاعدة البيانات.
على عكس قواعد البيانات الحالية ، المصممة للمعاملات الذرية أو أعباء العمل التحليلية الشاملة ، تم تصميم قاعدة بيانات المتجه (Pinecone) من أجل البحث المتسق التقريبي في نهاية المطاف عن الجيران ، وهو نموذج قاعدة البيانات الصحيح للمتجهات عالية الأبعاد. كما أنها توفر واجهات برمجة تطبيقات للمطورين تتكامل مع المكونات الرئيسية الأخرى لتطبيقات الذكاء الاصطناعي ، مثل OpenAI و Cohere و LangChain وما إلى ذلك. مثل هذا التصميم المدروس جيدًا يجعل حياة المطورين أسهل بكثير. يمكن أيضًا تصميم مهام AI البسيطة مثل البحث الدلالي أو توصيات المنتج أو ترتيب الخلاصة مباشرةً كمشكلات بحث متجه وتشغيلها على قاعدة بيانات المتجه دون خطوة استدلال نموذج نهائي - شيء لا تستطيع قواعد البيانات الموجودة فعله.
Pinecone هو المعيار الناشئ لإدارة بيانات المؤسسة السياقية والحالة في تطبيقات LLM. نعتقد أنه مكون مهم للبنية التحتية ، حيث يوفر طبقة التخزين أو "الذاكرة" لمجموعة تطبيقات الذكاء الاصطناعي الجديدة تمامًا.
تقدم لا يصدق ل Pinecone حتى الآن
Pinecone ليست قاعدة البيانات الموجهة الوحيدة ، لكننا نعتقد أنها قاعدة بيانات المتجهات الرائدة - جاهزة الآن للتبني في العالم الحقيقي - بهامش كبير. شهد Pinecone نموًا بمقدار 8 أضعاف في عدد العملاء المدفوعين (حوالي 1,600) في ثلاثة أشهر فقط ، بما في ذلك شركات التكنولوجيا التطلعية مثل Shopify و Gong و Zapier والمزيد. يتم استخدامه في مجموعة واسعة من الصناعات ، بما في ذلك برامج المؤسسات وتطبيقات المستهلك والتجارة الإلكترونية والتكنولوجيا المالية والتأمين والوسائط و AI / ML.
نعزو هذا النجاح ليس فقط إلى فهم الفريق العميق للمستخدم والسوق والتكنولوجيا ، ولكن أيضًا - بشكل حاسم - لنهج المنتج السحابي الأصلي من البداية. يتمثل أحد أصعب أجزاء بناء هذه الخدمة في توفير خلفية سحابية موثوقة ومتاحة للغاية تلبي مجموعة واسعة من أهداف أداء العملاء واتفاقيات مستوى الخدمة. من خلال التكرارات المتعددة حول بنية المنتج ، وإدارة العديد من العملاء البارزين في الإنتاج ، أظهر هذا الفريق تميزًا تشغيليًا متوقعًا من قاعدة بيانات الإنتاج.
كوز الصنوبر تم تأسيسها من قبل Edo Liberty ، الذي كان منذ فترة طويلة مدافعًا قويًا عن أهمية قواعد بيانات المتجهات في التعلم الآلي ، بما في ذلك كيفية تمكين كل مؤسسة من إنشاء حالات استخدام فوق LLMs. كعالم رياضيات تطبيقية ، أمضى حياته المهنية في دراسة وتنفيذ خوارزميات البحث المتجه المتطورة. في الوقت نفسه ، كان براغماتيًا ، بنى أدوات ML الأساسية مثل Sagemaker في AWS ، وقام بترجمة أبحاث ML التطبيقية إلى منتجات عملية يمكن للعملاء استخدامها. من النادر رؤية مثل هذا المزيج من البحث العميق والتفكير العملي في المنتج.
ينضم إلى Edo بوب ويدرهولد ، الرئيس التنفيذي والمشغل ذو الخبرة (المعروف سابقًا باسم Couchbase) ، كشريك في جانب العمليات كرئيس ومدير تنفيذي للعمليات. لدى Pinecone أيضًا فريق رائع من المديرين التنفيذيين والمهندسين ذوي الخبرة العميقة في أنظمة السحابة من أماكن مثل AWS و Google و Databricks. نحن معجبون بالخبرة الهندسية العميقة للفريق ، والتركيز على تجربة المطور ، والتنفيذ الفعال لـ GTM ، ويسعدنا أن نتشارك معهم لبناء طبقة الذاكرة لتطبيقات الذكاء الاصطناعي.
* * *
الآراء المعبر عنها هنا هي آراء أفراد AH Capital Management، LLC ("a16z") المقتبس منهم وليست آراء a16z أو الشركات التابعة لها. تم الحصول على بعض المعلومات الواردة هنا من مصادر خارجية ، بما في ذلك من شركات محافظ الصناديق التي تديرها a16z. على الرغم من أنه مأخوذ من مصادر يُعتقد أنها موثوقة ، لم تتحقق a16z بشكل مستقل من هذه المعلومات ولا تقدم أي تعهدات حول الدقة الدائمة للمعلومات أو ملاءمتها لموقف معين. بالإضافة إلى ذلك ، قد يتضمن هذا المحتوى إعلانات جهات خارجية ؛ لم تقم a16z بمراجعة مثل هذه الإعلانات ولا تصادق على أي محتوى إعلاني وارد فيها.
يتم توفير هذا المحتوى لأغراض إعلامية فقط ، ولا ينبغي الاعتماد عليه كمشورة قانونية أو تجارية أو استثمارية أو ضريبية. يجب عليك استشارة مستشاريك بخصوص هذه الأمور. الإشارات إلى أي أوراق مالية أو أصول رقمية هي لأغراض توضيحية فقط ، ولا تشكل توصية استثمارية أو عرضًا لتقديم خدمات استشارية استثمارية. علاوة على ذلك ، هذا المحتوى غير موجه أو مخصص للاستخدام من قبل أي مستثمرين أو مستثمرين محتملين ، ولا يجوز الاعتماد عليه تحت أي ظرف من الظروف عند اتخاذ قرار بالاستثمار في أي صندوق تديره a16z. (سيتم تقديم عرض للاستثمار في صندوق a16z فقط من خلال مذكرة الاكتتاب الخاص واتفاقية الاشتراك والوثائق الأخرى ذات الصلة لأي صندوق من هذا القبيل ويجب قراءتها بالكامل.) أي استثمارات أو شركات محفظة مذكورة ، يشار إليها ، أو الموصوفة لا تمثل جميع الاستثمارات في السيارات التي تديرها a16z ، ولا يمكن أن يكون هناك ضمان بأن الاستثمارات ستكون مربحة أو أن الاستثمارات الأخرى التي تتم في المستقبل سيكون لها خصائص أو نتائج مماثلة. قائمة الاستثمارات التي أجرتها الصناديق التي يديرها Andreessen Horowitz (باستثناء الاستثمارات التي لم يمنحها المُصدر إذنًا لـ a16z للإفصاح علنًا عن الاستثمارات غير المعلنة في الأصول الرقمية المتداولة علنًا) على https://a16z.com/investments /.
الرسوم البيانية والرسوم البيانية المقدمة في الداخل هي لأغراض إعلامية فقط ولا ينبغي الاعتماد عليها عند اتخاذ أي قرار استثماري. الأداء السابق ليس مؤشرا على النتائج المستقبلية. المحتوى يتحدث فقط اعتبارًا من التاريخ المشار إليه. أي توقعات وتقديرات وتنبؤات وأهداف وآفاق و / أو آراء معبر عنها في هذه المواد عرضة للتغيير دون إشعار وقد تختلف أو تتعارض مع الآراء التي يعبر عنها الآخرون. يرجى الاطلاع على https://a16z.com/disclosures للحصول على معلومات إضافية مهمة.
- محتوى مدعوم من تحسين محركات البحث وتوزيع العلاقات العامة. تضخيم اليوم.
- أفلاطونايستريم. ذكاء بيانات Web3. تضخيم المعرفة. الوصول هنا.
- سك المستقبل مع أدرين أشلي. الوصول هنا.
- المصدر https://a16z.com/2023/04/27/investing-in-pinecone/
- :لديها
- :يكون
- :ليس
- :أين
- 100 مليون دولار
- $ UP
- 1
- 500
- a
- a16z
- ماهرون
- من نحن
- فوق
- دقة
- في
- في الواقع
- إضافة
- إضافي
- تبني
- دعاية
- نصيحة
- استشاري
- الخدمات الاستشارية
- محام
- الشركات التابعة
- مرة أخرى
- اتفاقية
- AI
- AI / ML
- خوارزميات
- الكل
- سابقا
- أيضا
- المبالغ
- an
- تحليلي
- و
- آندرسن
- أندرسن هورويتز
- أعلن
- آخر
- إجابة
- الأجوبة
- أي وقت
- API
- واجهات برمجة التطبيقات
- تفاح
- تطبيق
- التطبيقات
- تطبيقي
- نهج
- ما يقرب من
- التطبيقات
- هندسة معمارية
- هي
- حول
- AS
- ممتلكات
- توكيد
- At
- متاح
- AWS
- الى الخلف
- الخلفية
- على أساس
- BE
- لان
- أن تصبح
- كان
- قبل
- اعتقد
- يعتقد
- Beyond
- كبير
- مليار
- إزهار
- بوب
- العلامة تجارية
- جديدة
- نساعدك في بناء
- ابني
- بنيت
- مدمج
- الأعمال
- لكن
- by
- دعوة
- تسمى
- دعوات
- CAN
- الموارد
- التوظيف
- الحالات
- الرئيس التنفيذي
- معين
- تحدى
- تغيير
- الخصائص
- ظروف
- فئة
- سحابة
- الكود
- مجموعات
- مجموعة
- يأتي
- الشركات
- حول الشركة
- الشركة
- عنصر
- مكونات
- الكمبيوتر
- الحوسبة
- واثق
- ثابتة
- شكل
- مستهلك
- استهلاك
- محتوى
- قريني
- عكس
- سجع
- جوهر
- التكلفة
- قاعدة الأريكة
- الدورة
- حالياًّ
- زبون
- العملاء
- المتطور والحديث
- البيانات
- قاعدة البيانات
- قواعد البيانات
- التاريخ
- يوم
- صفقة
- القرار
- عميق
- يعتمد
- وصف
- تصميم
- تصميم
- المطور
- المطورين
- التطوير التجاري
- اختلف
- رقمي
- الأصول الرقمية
- الأبعاد
- مباشرة
- كشف
- do
- وثيقة
- توثيق
- هل
- لا
- فعل
- لا
- e
- التجارة الإلكترونية
- كل
- أسهل
- على نحو فعال
- فعال
- الناشئة
- تمكين
- النهاية
- تأييد
- مستمر
- الهندسة
- المهندسين
- انجليزي
- مشروع
- المشاريع والبرامج
- كلية
- تقديرات
- إلخ
- حتى
- في النهاية
- كل
- مثال
- التشغيلي
- ازالة
- تنفيذ
- مُديرين تنفيذيين
- القائمة
- متوقع
- ذو تكلفة باهظة
- الخبره في مجال الغطس
- تمكنت
- خبرة
- شرح
- تفسير
- أعربت
- خارجي
- العيون
- خيالي
- تغذية
- قليل
- شغل
- نهائي
- مالي
- FINTECH
- تركز
- في حالة
- التوقعات
- النموذج المرفق
- شكل
- سابقا
- عليها
- تطلعي
- تاسست
- تبدأ من
- صندوق
- أموال
- علاوة على ذلك
- مستقبل
- فجوة
- العلاجات العامة
- توليدي
- دولار فقط واحصل على خصم XNUMX% على جميع
- منح
- معطى
- إعطاء
- بضائع
- شراء مراجعات جوجل
- الرسوم البيانية
- إجمالي
- متزايد
- التسويق
- حدث
- يحدث
- يملك
- he
- هنا
- جدا
- له
- هورويتز
- كيفية
- HTTPS
- ضخم
- الانسان
- انسان قارئ
- i
- تحديد
- تحقيق
- أهمية
- أهمية
- تأثرت
- in
- تتضمن
- بما فيه
- دمج
- بشكل مستقل
- وأشار
- فرد
- الصناعات
- العالمية
- معلومات
- معلوماتية
- البنية التحتية
- التأمين
- دمج
- Internet
- إلى
- استثمر
- الاستثمار
- استثمار
- استشارات الاستثمار
- الاستثمارات
- المستثمرين
- المصدر
- IT
- التكرارات
- انها
- جافا سكريبت
- انضم
- م
- القفل
- لغة
- كبير
- اسم العائلة
- طبقة
- قيادة
- تعلم
- شروط وأحكام
- حرية
- مثل
- قائمة
- حياة
- LLM
- آلة
- آلة التعلم
- الآلات
- صنع
- جعل
- يصنع
- القيام ب
- إدارة
- تمكن
- إدارة
- إدارة
- كثير
- هامش
- تجارة
- المواد
- رياضيا
- المسائل
- مايو..
- ذات مغزى
- يعني
- الوسائط
- يجتمع
- مذكرة
- مكبر الصوت : يدعم، مع دعم ميكروفون مدمج لمنع الضوضاء
- المذكورة
- مليون
- ML
- نموذج
- عارضات ازياء
- المقبلة.
- الأكثر من ذلك
- أكثر
- كثيرا
- متعدد
- يجب أن يكون
- طبيعي
- إحتياجات
- جديد
- لا
- يلاحظ..
- الآن
- عدد
- أرقام
- تم الحصول عليها
- of
- خصم
- عرض
- الوهب
- غالبا
- قديم
- on
- ONE
- فقط
- OpenAI
- طريقة التوسع
- تشغيل
- عمليات
- عامل
- آراء
- or
- أخرى
- أخرى
- لنا
- الناتج
- على مدى
- الخاصة
- مدفوع
- نموذج
- المعلمات
- جزء
- خاص
- الشريكة
- أجزاء
- الماضي
- أداء
- إذن
- فردي
- منظور
- اختيار
- التقطت
- وجهات
- أفلاطون
- الذكاء افلاطون البيانات
- أفلاطون داتا
- من فضلك
- محفظة
- ممكن
- منشور
- محتمل
- عملية
- واقعي
- تنبؤ
- رئيس
- خاص
- متميز
- المحتمل
- المشكلة
- مشاكل
- المنتج
- الإنتــاج
- المنتجات
- مربح
- برمجة وتطوير
- التقدّم
- توقعات
- محتمل
- آفاق
- تزود
- المقدمة
- توفير
- علانية
- أغراض
- بايثون
- ربع
- نطاق
- نادر
- بدلا
- عرض
- استعداد
- حقيقي
- العالم الحقيقي
- في الوقت الحقيقي
- معلومات الوقت الحقيقي
- الأسباب
- اعتراف
- توصية مجاناً
- ساندي خ. ميليك
- المراجع
- يشار
- نسبيا
- ذات الصلة
- الخدمة الموثوقة
- تذكر
- ممثل
- يتطلب
- بحث
- الرد
- نتيجة
- مما أدى
- النتائج
- عائد أعلى
- إيرادات
- استعرض
- دائري
- يجري
- sagemaker
- نفسه
- نطاق
- بحث
- البحث
- ضمانات
- انظر تعريف
- رأيت
- إرسال
- إرسال
- إحساس
- مسلسلات
- سلسلة ب
- الخدمة
- خدماتنا
- طقم
- عدة
- نقل
- ينبغي
- أظهرت
- جانب
- هام
- مماثل
- ببساطة
- منذ
- حالة
- So
- تطبيقات الكمبيوتر
- تطوير البرمجيات
- حل
- بعض
- شيء
- مصادر
- يتحدث
- قضى
- كومة
- معيار
- بداية
- الولايه او المحافظه
- البيانات
- خطوة
- تخزين
- متجر
- تخزين
- تخزين
- دراسة
- موضوع
- اشتراك
- تحقيق النجاح
- هذه
- الدعم
- أنظمة
- الأهداف
- المهام
- ضريبة
- فريق
- التكنولوجيا
- شركات التكنولوجيا
- تقني
- تكنولوجيا
- من
- أن
- •
- المستقبل
- المعلومات
- من مشاركة
- منهم
- then
- هناك.
- في ذلك
- تشبه
- هم
- اعتقد
- تفكير
- طرف ثالث
- هؤلاء
- ثلاثة
- بسعادة غامرة
- الوقت
- إلى
- أدوات
- تيشرت
- تداول
- تقليدي
- متدرب
- قادة الإيمان
- المعاملات
- حقا
- اثنان
- مع
- فهم
- فهم
- بناء على
- تستخدم
- مستعمل
- مستخدم
- كبير
- السيارات
- التحقق
- جدا
- الرؤى
- رؤيتنا
- وكان
- طريق..
- we
- حسن
- ابحث عن
- متى
- التي
- في حين
- من الذى
- كامل
- واسع
- مدى واسع
- سوف
- مع
- في غضون
- بدون
- تشهد
- للعمل
- عامل
- اكتب
- جاري الكتابة
- مكتوب
- خاطئ
- سنوات
- أنت
- حل متجر العقارات الشامل الخاص بك في جورجيا
- زفيرنت