Pineconesse investeerimine

Pineconesse investeerimine

Investing in Pinecone PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Suurte keelemudelite (LLM) muutumisega oleme tunnistajaks paradigma muutumisele tarkvaraarenduses ja andmetöötluses tervikuna. AI toimub ja meie silme all moodustub uus virn. See on nagu Internet ikka ja jälle, mis kutsub teenistusse uusi taristukomponente, mis on loodud asjade uueks ajamiseks.

Üha enam tunnistatakse, et LLM-id tegelikult on arvuti uus vorm, mõnes mõttes. Nad saavad käivitada loomulikus keeles kirjutatud "programme" (st viipasid), täita suvalisi arvutusülesandeid (nt Pythoni koodi kirjutamine või Google'i otsimine) ja tagastada tulemused kasutajale inimloetaval kujul. See on suur asi kahel põhjusel: 

  1. Uus rakenduste klass kokkuvõtete ja generatiivse sisu kohta on nüüd võimalik, mille tulemuseks on tarbijakäitumise muutumine tarkvara tarbimise suhtes.
  2. Uus klass arendajaid suudab nüüd tarkvara kirjutada. Arvutiprogrammeerimine nõuab nüüd ainult inglise keele (või mõne muu inimkeele) valdamist, mitte traditsioonilise programmeerimiskeele, nagu Python või JavaScript, õpetamist. 

Üks meie peamisi prioriteete Andreessen Horowitzis on tuvastada ettevõtted, kes loovad selle uue tehisintellekti virna põhikomponente. Meil on hea meel teatada, et juhime 100 miljoni dollari suuruse B-seeria vooru Käbikäpp, et toetada nende nägemust saada AI rakenduste mälukihiks.

Probleem: LLM-id hallutsineerivad ja on kodakondsuseta

Praeguste LLM-ide suur väljakutse on hallutsinatsioonid. Nad annavad väga enesekindlaid vastuseid, mis on faktiliselt ja mõnikord loogiliselt valed. Näiteks Apple'i viimase kvartali brutomarginaali küsimine LLM-ilt võib anda kindla vastuse 63 miljardit dollarit. Mudel võib isegi oma vastust toetada, selgitades, et kui lahutada 25 miljardi dollari suurusest tulust 95 miljardit dollarit kaupade maksumust, saate brutomarginaaliks 63 miljardit dollarit. Muidugi on see mitmes mõõtmes vale:

  • Esiteks on tulude arv vale, kuna LLM-il pole reaalajas andmeid. See töötab välja aegunud treeningandmeid, mis on kuid või tõenäoliselt aastaid vanad.
  • Teiseks võttis ta need tulud ja kaubakulud juhuslikult teise puuviljaettevõtte finantsaruannetest.
  • Kolmandaks ei ole selle brutomarginaali arvutamine matemaatiliselt õige.

Kujutage ette, et annaksite selle vastuse ettevõtte a tegevjuhile heaolu 500 ettevõtet. 

Kõik see juhtub seetõttu, et lõppude lõpuks on LLM-id ennustusmasinad, mis on treenitud suurel hulgal kolmandate osapoolte Interneti-andmetega. Sageli pole kasutajale vajalikku teavet koolituskomplektis lihtsalt olemas. Seega annab mudel oma aegunud koolitusandmete põhjal kõige tõenäolisemad ja keeleliselt kõige paremini vormindatud vastused. Võime juba nägema ülaltoodud probleemi võimalikku lahendust – kontekstipõhiste eraettevõtete andmete edastamist reaalajas LLM-idele.

Selle probleemi üldine vorm seisneb selles, et süsteemi vaatenurgast on LLM-id ja enamik teisi tehisintellekti mudeleid järelduse tegemise etapis kodakondsuseta. Iga kord, kui helistate GPT-4 API-le, sõltub väljund ainult andmed ja parameetrid, mida saadate kasulikus koormas. Mudelil pole sisseehitatud võimalust kontekstuaalsete andmete lisamiseks või varem küsitu meeldejätmiseks. Mudeli peenhäälestus on võimalik, kuid see on kallis ja suhteliselt paindumatu (st mudel ei suuda uutele andmetele reaalajas reageerida). Kuna mudelid ei halda olekut ega mälu üksinda, peavad arendajad selle tühimiku täitma. 

Lahendus: vektorandmebaasid on LLM-ide salvestuskiht

See on koht, kus männikäpp tuleb sisse.

Pinecone on väline andmebaas, kuhu arendajad saavad LLM-i rakenduste jaoks asjakohaseid kontekstiandmeid salvestada. Selle asemel, et saata suuri dokumendikogusid iga API-kõnega edasi-tagasi, saavad arendajad need salvestada Pinecone'i andmebaasi ja seejärel valida ainult mõned konkreetse päringu jaoks kõige asjakohasemad – seda lähenemisviisi nimetatakse kontekstisiseseks õppimiseks. See on kohustuslik, et ettevõtted saaksid tõeliselt õitseda.

Eelkõige on käbipuu a vektor andmebaas, mis tähendab, et andmeid säilitatakse semantiliselt tähenduslikuna manused. Kuigi manuste tehniline seletus ei jää selle postituse ulatusse, on oluline mõista, et LLM-id töötavad ka vektormanustuste abil – nii et Pinecone'i selles vormingus andmeid salvestades on osa AI tööst tõhusalt eeltöödeldud ja andmebaasi maha laaditud.

Erinevalt olemasolevatest andmebaasidest, mis on loodud aatomitehingute või ammendavate analüütiliste töökoormuste jaoks, on (Pinecone) vektorandmebaas mõeldud lõpuks järjepidevaks ligikaudseks naabriotsinguks, mis on õige andmebaasi paradigma kõrgema mõõtmega vektorite jaoks. Need pakuvad ka arendaja API-sid, mis on integreeritud AI-rakenduste muude põhikomponentidega, nagu OpenAI, Cohere, LangChain jne. Selline hästi läbimõeldud disain muudab arendajate elu palju lihtsamaks. Lihtsaid tehisintellekti ülesandeid, nagu semantiline otsing, tootesoovitused või voo järjestamine, saab samuti modelleerida otse vektorotsingu probleemidena ja käivitada vektorite andmebaasis ilma viimase mudeli järelduseta. midagi, mida olemasolevad andmebaasid teha ei suuda.

Pinecone on arenev standard oleku- ja kontekstuaalsete ettevõtteandmete haldamiseks LLM-rakendustes. Arvame, et see on oluline infrastruktuuri komponent, mis pakub uhiuuele tehisintellekti rakenduste virnale salvestusruumi ehk "mälu" kihti.

Uskumatu edu Pinecone jaoks tänaseks

Pinecone ei ole ainus vektorandmebaas, kuid usume, et see on märkimisväärse varuga juhtiv vektorandmebaas – mis on nüüd valmis reaalseks kasutuselevõtuks. Pinecone'i tasuliste klientide arv on vaid kolme kuuga 8 korda kasvanud (umbes 1,600), sealhulgas tulevikku vaatavad tehnoloogiaettevõtted, nagu Shopify, Gong, Zapier ja palju muud. Seda kasutatakse paljudes tööstusharudes, sealhulgas ettevõtte tarkvara, tarbijarakendused, e-kaubandus, fintech, kindlustus, meedia ja AI/ML.

Me ei omista seda edu mitte ainult meeskonna sügavale arusaamisele kasutajast, turust ja tehnoloogiast, vaid ka – kriitiliselt – nende pilvepõhiste toodete lähenemisviisist algusest peale. Selle teenuse loomise üks raskemaid osi on pakkuda usaldusväärset ja hästi kättesaadavat pilvetausta, mis vastab paljudele klientide jõudluseesmärkidele ja SLA-dele. Tootearhitektuuri mitme iteratsiooniga ja paljude suuremahuliste tasuliste klientide haldamisega tootmises on see meeskond näidanud üles suurepäraseid toiminguid, mida tootmisandmebaasilt oodatakse.

Käbikäpp asutas Edo Liberty, kes on pikka aega ja kõvasti propageerinud vektorandmebaaside tähtsust masinõppes, sealhulgas seda, kuidas need võimaldavad igal ettevõttel luua kasutusjuhtumeid LLM-ide peale. Rakendusmatemaatikuna veetis ta oma karjääri tipptasemel vektorotsingu algoritme uurides ja juurutades. Samal ajal oli ta pragmaatik, ehitades AWS-is põhilisi ML-tööriistu, nagu Sagemaker, ja tõlkides rakenduslikud ML-uuringud praktilisteks toodeteks, mida kliendid saavad kasutada. On haruldane näha nii sügava uurimistöö ja pragmaatilise tootemõtlemise kombinatsiooni.

Edoga liitub Bob Wiederhold, kogenud tegevjuht ja operaator (endine Couchbase), operatiivpartnerina presidendi ja tegevjuhina. Pinecone'il on ka fantastiline juhtide ja inseneride meeskond, kellel on sügavad pilvesüsteemide teadmised sellistest kohtadest nagu AWS, Google ja Databricks. Meile avaldavad muljet meeskonna sügavad inseneriteadmised, keskendumine arendajakogemusele ja tõhus GTM-i täitmine ning meil on au teha nendega koostööd tehisintellekti rakenduste mälukihi loomisel.

* * *

Siin väljendatud seisukohad on tsiteeritud AH Capital Management, LLC (“a16z”) üksikute töötajate seisukohad, mitte a16z ega tema sidusettevõtete seisukohad. Teatud siin sisalduv teave on saadud kolmandate osapoolte allikatest, sealhulgas a16z hallatavate fondide portfelliettevõtetelt. Kuigi a16z on võetud usaldusväärsetest allikatest, ei ole a16z sellist teavet sõltumatult kontrollinud ega kinnita teabe püsivat täpsust ega selle sobivust antud olukorras. Lisaks võib see sisu sisaldada kolmandate isikute reklaame; aXNUMXz ei ole selliseid reklaame üle vaadanud ega toeta neis sisalduvat reklaamisisu.

See sisu on esitatud ainult informatiivsel eesmärgil ja sellele ei tohiks tugineda kui juriidilisele, äri-, investeerimis- ega maksunõustamisele. Nendes küsimustes peaksite konsulteerima oma nõustajatega. Viited mis tahes väärtpaberitele või digitaalsetele varadele on illustratiivse tähendusega ega kujuta endast investeerimissoovitust ega investeerimisnõustamisteenuste pakkumist. Lisaks ei ole see sisu suunatud ega mõeldud kasutamiseks ühelegi investorile ega potentsiaalsetele investoritele ning sellele ei tohi mingil juhul tugineda, kui tehakse otsus investeerida a16z hallatavasse fondi. (A16z fondi investeerimise pakkumine tehakse ainult sellise fondi erainvesteeringute memorandumi, märkimislepingu ja muu asjakohase dokumentatsiooni alusel ning neid tuleks lugeda tervikuna.) Kõik mainitud, viidatud investeeringud või portfelliettevõtted või kirjeldatud ei esinda kõiki a16z hallatavatesse sõidukitesse tehtud investeeringuid ning ei saa olla kindlust, et investeeringud on tulusad või et teised tulevikus tehtavad investeeringud on sarnaste omaduste või tulemustega. Andreessen Horowitzi hallatavate fondide tehtud investeeringute loend (v.a investeeringud, mille kohta emitent ei ole andnud A16z-le luba avalikustada, samuti etteteatamata investeeringud avalikult kaubeldavatesse digitaalvaradesse) on saadaval aadressil https://a16z.com/investments /.

Siin esitatud diagrammid ja graafikud on üksnes informatiivsel eesmärgil ja neile ei tohiks investeerimisotsuse tegemisel tugineda. Varasemad tulemused ei näita tulevasi tulemusi. Sisu räägib ainult märgitud kuupäeva seisuga. Kõik nendes materjalides väljendatud prognoosid, hinnangud, prognoosid, eesmärgid, väljavaated ja/või arvamused võivad muutuda ilma ette teatamata ning võivad erineda või olla vastuolus teiste väljendatud arvamustega. Olulist lisateavet leiate aadressilt https://a16z.com/disclosures.

Ajatempel:

Veel alates Andreessen Horowitz