पाइनकोन में निवेश

पाइनकोन में निवेश

पाइनकोन प्लेटोब्लॉकचेन डेटा इंटेलिजेंस में निवेश। लंबवत खोज. ऐ.

बड़े भाषा मॉडल (एलएलएम) के परिवर्तन के साथ, हम समग्र रूप से सॉफ्टवेयर विकास और कंप्यूटिंग उद्योग में एक आदर्श बदलाव देख रहे हैं। एआई हो रहा है और हमारी आंखों के सामने एक नया स्टैक बन रहा है। यह फिर से इंटरनेट की तरह है, जो काम करने के नए तरीके के लिए बनाए गए नए बुनियादी ढांचे के घटकों को सेवा में लाता है.

इस बात की मान्यता बढ़ रही है कि एलएलएम वास्तव में हैं कंप्यूटर का एक नया रूप, किसी अर्थ में। वे प्राकृतिक भाषा में लिखे गए "प्रोग्राम" चला सकते हैं (यानी, संकेत), मनमाने कंप्यूटिंग कार्यों को निष्पादित कर सकते हैं (उदाहरण के लिए, पायथन कोड लिखना या Google पर खोज करना), और परिणामों को मानव-पठनीय रूप में उपयोगकर्ता को वापस लौटा सकते हैं। यह दो कारणों से एक बड़ी बात है: 

  1. सारांशीकरण और सृजनात्मक सामग्री से संबंधित अनुप्रयोगों का एक नया वर्ग अब यह संभव है जिसके परिणामस्वरूप सॉफ्टवेयर खपत के आसपास उपभोक्ता व्यवहार में बदलाव आएगा।
  2. डेवलपर्स का एक नया वर्ग अब सॉफ्टवेयर लिखने में सक्षम है। कंप्यूटर प्रोग्रामिंग के लिए अब केवल अंग्रेजी (या किसी अन्य मानव भाषा) में महारत की आवश्यकता है, न कि पायथन या जावास्क्रिप्ट जैसी पारंपरिक प्रोग्रामिंग भाषा में प्रशिक्षण की। 

आंद्रेसेन होरोविट्ज़ में हमारी सर्वोच्च प्राथमिकताओं में से एक इस नए एआई स्टैक के प्रमुख घटकों का निर्माण करने वाली कंपनियों की पहचान करना है। हमें यह घोषणा करते हुए खुशी हो रही है कि हम $100 मिलियन सीरीज़ बी राउंड में अग्रणी हैं सनोबर की चिलग़ोज़ाएआई अनुप्रयोगों के लिए मेमोरी लेयर बनने के उनके दृष्टिकोण का समर्थन करने के लिए।

समस्या: एलएलएम मतिभ्रम करते हैं और राज्यविहीन हैं

वर्तमान एलएलएम के साथ एक बड़ी चुनौती मतिभ्रम है। वे बहुत आत्मविश्वासपूर्ण उत्तर देते हैं जो तथ्यात्मक रूप से और कभी-कभी तार्किक रूप से गलत होते हैं। उदाहरण के लिए, एलएलएम से पिछली तिमाही के लिए ऐप्पल के सकल मार्जिन के बारे में पूछने पर 63 बिलियन डॉलर का आत्मविश्वासपूर्ण उत्तर मिल सकता है। मॉडल यह समझाकर भी अपने उत्तर का समर्थन कर सकता है कि राजस्व में $25 बिलियन से माल की लागत में $95 बिलियन घटाकर, आपको $63 बिलियन का सकल मार्जिन मिलता है। बेशक, यह कई आयामों पर गलत है:

  • सबसे पहले, राजस्व संख्या गलत है, क्योंकि एलएलएम में वास्तविक समय डेटा नहीं है। यह महीनों या शायद वर्षों पुराने बासी प्रशिक्षण डेटा पर काम कर रहा है।
  • दूसरा, इसने किसी अन्य फल कंपनी के वित्तीय विवरणों से उन राजस्व और वस्तुओं की लागत को बेतरतीब ढंग से उठाया।
  • तीसरा, इसकी सकल मार्जिन गणना गणितीय रूप से सही नहीं है।

के सीईओ को वह उत्तर देने की कल्पना करें धन 500 कंपनी. 

यह सब इसलिए होता है, क्योंकि आख़िरकार, एलएलएम बड़ी मात्रा में तृतीय-पक्ष इंटरनेट डेटा पर प्रशिक्षित भविष्यवाणी मशीनें हैं। अक्सर, उपयोगकर्ता को जो जानकारी चाहिए वह प्रशिक्षण सेट में नहीं होती है। इसलिए, मॉडल अपने पुराने प्रशिक्षण डेटा के आधार पर सबसे संभावित और भाषाई रूप से अच्छी तरह से प्रारूपित उत्तर देगा। हम पहले से ही उपरोक्त समस्या का एक संभावित समाधान देखना शुरू कर सकते हैं - एलएलएम को वास्तविक समय में प्रासंगिक रूप से प्रासंगिक निजी उद्यम डेटा खिलाना।

इस समस्या का सामान्य रूप यह है कि, सिस्टम परिप्रेक्ष्य से, एलएलएम और अधिकांश अन्य एआई मॉडल अनुमान चरण में स्टेटलेस हैं। हर बार जब आप GPT-4 API पर कॉल करते हैं, तो आउटपुट निर्भर करता है केवल पेलोड में आपके द्वारा भेजे गए डेटा और पैरामीटर पर। मॉडल में प्रासंगिक डेटा को शामिल करने या आपने पहले जो पूछा है उसे याद रखने का कोई अंतर्निहित तरीका नहीं है। मॉडल फाइन-ट्यूनिंग संभव है, लेकिन यह महंगा और अपेक्षाकृत अनम्य है (यानी, मॉडल वास्तविक समय में नए डेटा का जवाब नहीं दे सकता है)। चूँकि मॉडल स्वयं स्थिति या मेमोरी का प्रबंधन नहीं करते हैं, इसलिए यह अंतर भरना डेवलपर्स पर निर्भर है। 

समाधान: वेक्टर डेटाबेस एलएलएम के लिए भंडारण परत हैं

यहीं पर पाइनकोन आता है।

पाइनकोन एक बाहरी डेटाबेस है जहां डेवलपर्स एलएलएम ऐप्स के लिए प्रासंगिक प्रासंगिक डेटा संग्रहीत कर सकते हैं। प्रत्येक एपीआई कॉल के साथ बड़े दस्तावेज़ संग्रह को आगे और पीछे भेजने के बजाय, डेवलपर्स उन्हें पाइनकोन डेटाबेस में संग्रहीत कर सकते हैं, फिर किसी भी दिए गए क्वेरी के लिए केवल कुछ सबसे प्रासंगिक चुन सकते हैं - एक दृष्टिकोण जिसे संदर्भ में सीखना कहा जाता है। उद्यम उपयोग के मामलों को वास्तव में फलने-फूलने के लिए यह बहुत जरूरी है।

विशेष रूप से, पाइनकोन एक है वेक्टर डेटाबेस, जिसका अर्थ है कि डेटा को अर्थपूर्ण रूप में संग्रहीत किया जाता है घात लगाना. जबकि एम्बेडिंग की तकनीकी व्याख्या इस पोस्ट के दायरे से परे है, समझने वाली महत्वपूर्ण बात यह है कि एलएलएम वेक्टर एम्बेडिंग पर भी काम करते हैं - इसलिए इस प्रारूप में पाइनकोन में डेटा संग्रहीत करके, एआई कार्य का हिस्सा प्रभावी रूप से पूर्व-संसाधित किया गया है और डेटाबेस में अपलोड किया गया।

मौजूदा डेटाबेस के विपरीत, जो परमाणु लेनदेन या संपूर्ण विश्लेषणात्मक कार्यभार के लिए डिज़ाइन किए गए हैं, (पाइनकोन) वेक्टर डेटाबेस अंततः लगातार अनुमानित पड़ोसी खोज के लिए डिज़ाइन किया गया है, जो उच्च-आयामी वैक्टर के लिए सही डेटाबेस प्रतिमान है। वे डेवलपर एपीआई भी प्रदान करते हैं जो एआई अनुप्रयोगों के अन्य प्रमुख घटकों, जैसे ओपनएआई, कोहेयर, लैंगचैन इत्यादि के साथ एकीकृत होते हैं। इस तरह का एक सुविचारित डिज़ाइन डेवलपर्स के जीवन को बहुत आसान बनाता है। सिमेंटिक खोज, उत्पाद अनुशंसाएं, या फ़ीड-रैंकिंग जैसे सरल एआई कार्यों को सीधे वेक्टर खोज समस्याओं के रूप में मॉडल किया जा सकता है और अंतिम मॉडल अनुमान चरण के बिना वेक्टर डेटाबेस पर चलाया जा सकता है - कुछ ऐसा जो मौजूदा डेटाबेस नहीं कर सकते।

एलएलएम अनुप्रयोगों में राज्य और प्रासंगिक उद्यम डेटा के प्रबंधन के लिए पाइनकोन उभरता हुआ मानक है। हमारा मानना ​​है कि यह एक महत्वपूर्ण बुनियादी ढांचा घटक है, जो बिल्कुल नए एआई एप्लिकेशन स्टैक को भंडारण, या "मेमोरी" परत प्रदान करता है।

आज तक पाइनकोन की अविश्वसनीय प्रगति

पाइनकोन एकमात्र वेक्टर डेटाबेस नहीं है, लेकिन हमारा मानना ​​है कि यह अग्रणी वेक्टर डेटाबेस है - वास्तविक दुनिया में अपनाने के लिए अब तैयार है - एक महत्वपूर्ण अंतर से। पाइनकोन ने केवल तीन महीनों में भुगतान करने वाले ग्राहकों (लगभग 8) में 1,600 गुना वृद्धि देखी है, जिसमें शॉपिफाई, गोंग, जैपियर और अन्य जैसी दूरंदेशी तकनीकी कंपनियां शामिल हैं। इसका उपयोग एंटरप्राइज़ सॉफ़्टवेयर, उपभोक्ता ऐप्स, ई-कॉमर्स, फिनटेक, बीमा, मीडिया और एआई/एमएल सहित उद्योगों की एक विस्तृत श्रृंखला में किया जाता है।

हम इस सफलता का श्रेय न केवल उपयोगकर्ता, बाजार और प्रौद्योगिकी के बारे में टीम की गहरी समझ को देते हैं, बल्कि शुरू से ही उनके क्लाउड-नेटिव उत्पाद दृष्टिकोण को भी देते हैं। इस सेवा के निर्माण का सबसे कठिन हिस्सा एक विश्वसनीय, अत्यधिक उपलब्ध क्लाउड बैकएंड प्रदान करना है जो ग्राहक प्रदर्शन लक्ष्यों और एसएलए की एक विस्तृत श्रृंखला को पूरा करता है। उत्पाद वास्तुकला पर कई पुनरावृत्तियों के साथ, और उत्पादन में कई उच्च-स्तरीय, भुगतान वाले ग्राहकों को प्रबंधित करने के साथ, इस टीम ने परिचालन उत्कृष्टता दिखाई है जो एक उत्पादन डेटाबेस से अपेक्षित है।

सनोबर की चिलग़ोज़ा एडो लिबर्टी द्वारा स्थापित किया गया था, जो लंबे समय से मशीन लर्निंग में वेक्टर डेटाबेस के महत्व के कट्टर समर्थक रहे हैं, जिसमें यह भी शामिल है कि कैसे वे हर उद्यम को एलएलएम के शीर्ष पर उपयोग के मामले बनाने में सक्षम बना सकते हैं। एक व्यावहारिक गणितज्ञ के रूप में, उन्होंने अपना करियर अत्याधुनिक वेक्टर खोज एल्गोरिदम का अध्ययन और कार्यान्वयन करने में बिताया। साथ ही, वह एक व्यावहारिक व्यक्ति थे, उन्होंने एडब्ल्यूएस में सेजमेकर जैसे मुख्य एमएल टूल का निर्माण किया और व्यावहारिक एमएल अनुसंधान को व्यावहारिक उत्पादों में अनुवादित किया, जिनका ग्राहक उपयोग कर सकते हैं। गहन शोध और व्यावहारिक उत्पाद सोच का ऐसा संयोजन देखना दुर्लभ है।

एडो के साथ एक अनुभवी सीईओ और ऑपरेटर (पूर्व में काउचबेस) बॉब विडरहोल्ड, अध्यक्ष और सीओओ के रूप में परिचालन पक्ष में भागीदार के रूप में शामिल हुए हैं। पाइनकोन के पास AWS, Google और Databricks जैसी जगहों से गहन क्लाउड-सिस्टम विशेषज्ञता वाले अधिकारियों और इंजीनियरों की एक शानदार टीम भी है। हम टीम की गहरी इंजीनियरिंग विशेषज्ञता, डेवलपर अनुभव पर ध्यान और कुशल जीटीएम निष्पादन से प्रभावित हैं, और हमें एआई अनुप्रयोगों के लिए मेमोरी लेयर बनाने के लिए उनके साथ साझेदारी करने का सौभाग्य मिला है।

* * *

यहां व्यक्त किए गए विचार व्यक्तिगत एएच कैपिटल मैनेजमेंट, एलएलसी ("a16z") कर्मियों के हैं जिन्हें उद्धृत किया गया है और यह a16z या इसके सहयोगियों के विचार नहीं हैं। यहां निहित कुछ जानकारी तृतीय-पक्ष स्रोतों से प्राप्त की गई है, जिसमें a16z द्वारा प्रबंधित निधियों की पोर्टफोलियो कंपनियों से भी शामिल है। जबकि विश्वसनीय माने जाने वाले स्रोतों से लिया गया, a16z ने स्वतंत्र रूप से ऐसी जानकारी को सत्यापित नहीं किया है और किसी भी स्थिति के लिए सूचना की स्थायी सटीकता या इसकी उपयुक्तता के बारे में कोई प्रतिनिधित्व नहीं करता है। इसके अतिरिक्त, इस सामग्री में तृतीय-पक्ष विज्ञापन शामिल हो सकते हैं; a16z ने ऐसे विज्ञापनों की समीक्षा नहीं की है और उनमें निहित किसी भी विज्ञापन सामग्री का समर्थन नहीं करता है।

यह सामग्री केवल सूचना के उद्देश्यों के लिए प्रदान की जाती है, और कानूनी, व्यापार, निवेश या कर सलाह के रूप में इस पर भरोसा नहीं किया जाना चाहिए। आपको उन मामलों में अपने स्वयं के सलाहकारों से परामर्श लेना चाहिए। किसी भी प्रतिभूति या डिजिटल संपत्ति के संदर्भ केवल दृष्टांत उद्देश्यों के लिए हैं, और निवेश सलाहकार सेवाएं प्रदान करने के लिए एक निवेश अनुशंसा या प्रस्ताव का गठन नहीं करते हैं। इसके अलावा, यह सामग्री किसी भी निवेशक या संभावित निवेशकों द्वारा उपयोग के लिए निर्देशित नहीं है और न ही इसका इरादा है, और किसी भी परिस्थिति में a16z द्वारा प्रबंधित किसी भी फंड में निवेश करने का निर्णय लेते समय इस पर भरोसा नहीं किया जा सकता है। (a16z फंड में निवेश करने की पेशकश केवल निजी प्लेसमेंट मेमोरेंडम, सब्सक्रिप्शन एग्रीमेंट, और ऐसे किसी भी फंड के अन्य प्रासंगिक दस्तावेज द्वारा की जाएगी और इसे पूरी तरह से पढ़ा जाना चाहिए।) किसी भी निवेश या पोर्टफोलियो कंपनियों का उल्लेख, संदर्भित, या वर्णित a16z द्वारा प्रबंधित वाहनों में सभी निवेशों के प्रतिनिधि नहीं हैं, और इस बात का कोई आश्वासन नहीं दिया जा सकता है कि निवेश लाभदायक होगा या भविष्य में किए गए अन्य निवेशों में समान विशेषताएं या परिणाम होंगे। आंद्रेसेन होरोविट्ज़ द्वारा प्रबंधित निधियों द्वारा किए गए निवेशों की सूची (उन निवेशों को छोड़कर जिनके लिए जारीकर्ता ने सार्वजनिक रूप से कारोबार की गई डिजिटल संपत्ति में सार्वजनिक रूप से और साथ ही अघोषित निवेशों का खुलासा करने के लिए a16z की अनुमति नहीं दी है) https://a16z.com/investments पर उपलब्ध है। /.

इसमें दिए गए चार्ट और ग्राफ़ केवल सूचना के उद्देश्यों के लिए हैं और निवेश का कोई भी निर्णय लेते समय उन पर भरोसा नहीं किया जाना चाहिए। पूर्व प्रदर्शन भविष्य के परिणाम का संकेत नहीं है। सामग्री केवल इंगित तिथि के अनुसार बोलती है। इन सामग्रियों में व्यक्त किए गए किसी भी अनुमान, अनुमान, पूर्वानुमान, लक्ष्य, संभावनाएं और/या राय बिना किसी सूचना के परिवर्तन के अधीन हैं और दूसरों द्वारा व्यक्त की गई राय के विपरीत या भिन्न हो सकते हैं। अतिरिक्त महत्वपूर्ण जानकारी के लिए कृपया https://a16z.com/disclosures देखें।

समय टिकट:

से अधिक आंद्रेसेन होरोविट्ज़