Pineconiin sijoittaminen

Pineconiin sijoittaminen

Investointi Pinecone PlatoBlockchain Data Intelligenceen. Pystysuuntainen haku. Ai.

Suurten kielimallien (LLM) taivutuksen myötä olemme todistamassa paradigman muutosta ohjelmistokehityksessä ja koko tietojenkäsittelyteollisuudessa. AI tapahtuu ja uusi pino muodostuu silmiemme edessä. Se on kuin Internet uudestaan, joka ottaa käyttöön uusia infrastruktuurikomponentteja, jotka on rakennettu uutta tapaa tehdä asioita.

Yhä enemmän tunnustetaan, että LLM:t todella ovat uusi tietokonemuoto, jossain määrin. He voivat ajaa luonnollisella kielellä kirjoitettuja "ohjelmia" (eli kehotteita), suorittaa mielivaltaisia ​​laskentatehtäviä (esim. kirjoittaa Python-koodia tai etsiä Googlesta) ja palauttaa tulokset takaisin käyttäjälle ihmisen luettavassa muodossa. Tämä on iso juttu kahdesta syystä: 

  1. Uusi sovellusluokka yhteenvedon ja luovan sisällön ympärillä on nyt mahdollista, mikä johtaa kuluttajakäyttäytymiseen ohjelmiston kulutuksen suhteen.
  2. Uusi kehittäjäluokka pystyy nyt kirjoittamaan ohjelmistoja. Tietokoneohjelmointi vaatii nyt vain englannin (tai muun ihmiskielen) hallintaa, ei perinteisen ohjelmointikielen, kuten Pythonin tai JavaScriptin, harjoittelua. 

Yksi tärkeimmistä prioriteeteistamme Andreessen Horowitzissa on tunnistaa yritykset, jotka rakentavat tämän uuden tekoälypinon avainkomponentteja. Meillä on ilo ilmoittaa, että johdamme 100 miljoonan dollarin sarjan B kierrosta Käpy, jotka tukevat heidän visiotaan tulla AI-sovellusten muistikerrokseksi.

Ongelma: LLM:t hallusinoivat ja ovat valtiottomia

Valtava haaste nykyisille LLM:ille on hallusinaatiot. He antavat erittäin luottavaisia ​​vastauksia, jotka ovat tosiasiallisesti ja joskus loogisesti vääriä. Esimerkiksi Applen viimeisen vuosineljänneksen bruttokatteen kysyminen LLM:ltä voi johtaa 63 miljardin dollarin varmaan vastaukseen. Malli voi jopa tukea vastaustaan ​​selittämällä, että kun vähennät 25 miljardia dollaria tavaroiden kustannuksista 95 miljardin dollarin tuloista, saat 63 miljardin dollarin bruttomarginaalin. Tietysti se on väärin monessa suhteessa:

  • Ensinnäkin tulonumero on väärä, koska LLM:llä ei ole reaaliaikaista tietoa. Se käsittelee vanhentuneita harjoitustietoja, jotka ovat kuukausia tai todennäköisesti vuosia vanhoja.
  • Toiseksi se poimi nämä tulot ja tavarakustannukset satunnaisesti toisen hedelmäyhtiön tilinpäätöksestä.
  • Kolmanneksi sen bruttokate ei ole matemaattisesti oikein.

Kuvittele, että annat vastauksen a:n toimitusjohtajalle rikkaus 500 yritystä. 

Kaikki tämä tapahtuu, koska loppujen lopuksi LLM:t ovat ennustuskoneita, jotka on koulutettu käyttämään suuria määriä kolmannen osapuolen Internet-dataa. Usein käyttäjän tarvitsemat tiedot eivät yksinkertaisesti ole koulutuspaketissa. Joten malli antaa todennäköisimpiä ja kielellisesti hyvin muotoiltuja vastauksia vanhentuneiden koulutustietojensa perusteella. Voimme jo alkaa nähdä mahdollista ratkaisua yllä olevaan ongelmaan – asiayhteyteen liittyvien yksityisyritystietojen syöttäminen reaaliajassa LLM:ille.

Tämän ongelman yleinen muoto on, että järjestelmän näkökulmasta LLM:t ja useimmat muut tekoälymallit ovat valtiottomia päättelyvaiheessa. Aina kun soitat GPT-4 API:lle, tulos riippuu vain hyötykuormassa lähettämiesi tietojen ja parametrien perusteella. Mallissa ei ole sisäänrakennettua tapaa sisällyttää kontekstuaalista tietoa tai muistaa, mitä olet kysynyt aiemmin. Mallin hienosäätö on mahdollista, mutta se on kallista ja suhteellisen joustamatonta (eli malli ei pysty reagoimaan uuteen dataan reaaliajassa). Koska mallit eivät hallitse tilaa tai muistia yksinään, on kehittäjien tehtävä täyttää aukko. 

Ratkaisu: Vektoritietokannat ovat LLM:ien tallennuskerros

Tässä Pinecone tulee mukaan.

Pinecone on ulkoinen tietokanta, johon kehittäjät voivat tallentaa relevantteja kontekstuaalisia tietoja LLM-sovelluksista. Sen sijaan, että lähettäisivät suuria dokumenttikokoelmia edestakaisin jokaisen API-kutsun yhteydessä, kehittäjät voivat tallentaa ne Pinecone-tietokantaan ja valita sitten vain muutamat kyselyn kannalta oleellisimmat – tätä lähestymistapaa kutsutaan kontekstin sisäiseksi oppimiseksi. Se on välttämätön yrityskäyttöön, jotta se kukoistaa.

Erityisesti Pinecone on a vektori tietokanta, mikä tarkoittaa, että tiedot tallennetaan semanttisesti merkityksellisenä upotukset. Vaikka tekninen selitys upotuksille ei kuulu tämän postauksen piiriin, on tärkeää ymmärtää, että LLM:t toimivat myös vektoriupotusten avulla – joten tallentamalla tiedot Pineconeen tässä muodossa osa tekoälytyöstä on esikäsitelty tehokkaasti ja ladattu tietokantaan.

Toisin kuin olemassa olevat tietokannat, jotka on suunniteltu atomitransaktiota tai tyhjentävää analyyttistä työmäärää varten, (Pinecone)-vektoritietokanta on suunniteltu lopulta johdonmukaiseen likimääräiseen naapurihakuun, mikä on oikea tietokantaparadigma korkeampiulotteisille vektoreille. Ne tarjoavat myös kehittäjäsovellusliittymiä, jotka integroituvat muihin tekoälysovellusten avainkomponentteihin, kuten OpenAI, Cohere, LangChain jne. Tällainen hyvin harkittu suunnittelu helpottaa kehittäjien elämää huomattavasti. Yksinkertaiset tekoälytehtävät, kuten semanttinen haku, tuotesuositukset tai syötejärjestys, voidaan myös mallintaa suoraan vektorihakuongelmina ja suorittaa vektoritietokannassa ilman lopullista mallin päättelyvaihetta. jotain, jota olemassa olevat tietokannat eivät voi tehdä.

Pinecone on nouseva standardi tila- ja kontekstuaalisten yritystietojen hallintaan LLM-sovelluksissa. Mielestämme se on tärkeä infrastruktuurikomponentti, joka tarjoaa tallennus- tai "muisti"-kerroksen upouudelle tekoälysovelluspinolle.

Uskomatonta edistystä Pineconelle tähän mennessä

Pinecone ei ole ainoa vektoritietokanta, mutta uskomme sen olevan merkittävällä marginaalilla johtava vektoritietokanta – nyt valmis käytettäväksi reaalimaailmassa. Pineconen maksullisten asiakkaiden määrä on kasvanut kahdeksan kertaa (noin 8 1,600) vain kolmessa kuukaudessa, mukaan lukien tulevaisuuteen suuntautuvat teknologiayritykset, kuten Shopify, Gong, Zapier ja muut. Sitä käytetään useilla toimialoilla, mukaan lukien yritysohjelmistot, kuluttajasovellukset, sähköinen kaupankäynti, fintech, vakuutus, media ja AI/ML.

Tämä menestys ei johdu pelkästään tiimin syvästä käyttäjän, markkinoiden ja teknologian ymmärtämisestä, vaan myös – kriittisesti – heidän pilvipohjaisen tuotteen lähestymistavasta alusta alkaen. Yksi tämän palvelun rakentamisen vaikeimmista osista on tarjota luotettava, erittäin saatavilla oleva pilvitausta, joka täyttää laajan valikoiman asiakkaiden suorituskykytavoitteita ja SLA-sopimuksia. Useiden iteraatioiden avulla tuotearkkitehtuurissa ja monien korkean mittakaavan maksullisten asiakkaiden hallinnassa tuotannossa tämä tiimi on osoittanut toiminnallista erinomaisuutta, jota tuotantotietokannasta odotetaan.

Käpy perusti Edo Liberty, joka on ollut pitkäaikainen ja sitkeä vektoritietokantojen tärkeyden puolestapuhuja koneoppimisessa, mukaan lukien kuinka ne voivat antaa jokaiselle yritykselle mahdollisuuden rakentaa käyttötapauksia LLM:ien päälle. Soveltavana matemaatikona hän vietti uransa opiskellessaan ja toteuttaessaan huippuluokan vektorihakualgoritmeja. Samaan aikaan hän oli pragmaatikko, joka rakensi AWS:n Sagemakerin kaltaisia ​​ydintyökaluja ja muunsi sovellettua ML-tutkimusta käytännön tuotteiksi, joita asiakkaat voivat käyttää. On harvinaista nähdä näin syvällisen tutkimuksen ja pragmaattisen tuoteajattelun yhdistelmä.

Edoon liittyy Bob Wiederhold, kokenut toimitusjohtaja ja operaattori (entinen Couchbase), kumppaniksi operatiivisella puolella toimitusjohtajana ja COO:na. Pineconella on myös fantastinen tiimi johtajia ja insinöörejä, joilla on syvällistä pilvijärjestelmien asiantuntemusta sellaisista paikoista kuin AWS, Google ja Databricks. Olemme vaikuttuneita tiimin syvästä suunnitteluosaamisesta, keskittymisestä kehittäjäkokemukseen ja tehokkaaseen GTM-suoritukseen, ja meillä on etuoikeus tehdä yhteistyötä heidän kanssaan rakentaaksemme muistikerroksen tekoälysovelluksille.

* * *

Tässä esitetyt näkemykset ovat yksittäisen AH Capital Management, LLC:n ("a16z") lainaaman henkilöstön näkemyksiä, eivätkä ne ole a16z:n tai sen tytäryhtiöiden näkemyksiä. Tietyt tähän sisältyvät tiedot on saatu kolmansien osapuolien lähteistä, mukaan lukien a16z:n hallinnoimien rahastojen kohdeyrityksiltä. Vaikka a16z on otettu luotettaviksi uskotuista lähteistä, se ei ole itsenäisesti tarkistanut tällaisia ​​tietoja eikä esitä tietojen pysyvää tarkkuutta tai sen soveltuvuutta tiettyyn tilanteeseen. Lisäksi tämä sisältö voi sisältää kolmannen osapuolen mainoksia; a16z ei ole tarkistanut tällaisia ​​mainoksia eikä tue mitään niiden sisältämää mainossisältöä.

Tämä sisältö on tarkoitettu vain tiedoksi, eikä siihen tule luottaa lainopillisena, liike-, sijoitus- tai veroneuvona. Näissä asioissa kannattaa kysyä neuvojanne. Viittaukset arvopapereihin tai digitaaliseen omaisuuteen ovat vain havainnollistavia, eivätkä ne ole sijoitussuositus tai tarjous tarjota sijoitusneuvontapalveluita. Lisäksi tämä sisältö ei ole suunnattu eikä tarkoitettu sijoittajien tai mahdollisten sijoittajien käytettäväksi, eikä siihen voida missään olosuhteissa luottaa tehdessään sijoituspäätöstä mihinkään a16z:n hallinnoimaan rahastoon. (A16z-rahastoon sijoitustarjous tehdään vain minkä tahansa tällaisen rahaston suunnatun osakeannin muistion, merkintäsopimuksen ja muiden asiaankuuluvien asiakirjojen perusteella, ja ne tulee lukea kokonaisuudessaan.) Kaikki mainitut sijoitukset tai kohdeyritykset, joihin viitataan, tai kuvatut eivät edusta kaikkia investointeja a16z:n hallinnoimiin ajoneuvoihin, eikä voi olla varmuutta siitä, että investoinnit ovat kannattavia tai että muilla tulevaisuudessa tehtävillä investoinneilla on samanlaisia ​​ominaisuuksia tai tuloksia. Luettelo Andreessen Horowitzin hallinnoimien rahastojen tekemistä sijoituksista (lukuun ottamatta sijoituksia, joiden osalta liikkeeseenlaskija ei ole antanut a16z:lle lupaa julkistaa, sekä ennalta ilmoittamattomat sijoitukset julkisesti noteerattuihin digitaalisiin omaisuuseriin) on saatavilla osoitteessa https://a16z.com/investments /.

Kaaviot ja kaaviot ovat vain tiedoksi, eikä niihin tule luottaa sijoituspäätöstä tehtäessä. Aiempi kehitys ei kerro tulevista tuloksista. Sisältö puhuu vain ilmoitetun päivämäärän mukaan. Kaikki näissä materiaaleissa esitetyt ennusteet, arviot, ennusteet, tavoitteet, näkymät ja/tai mielipiteet voivat muuttua ilman erillistä ilmoitusta ja voivat poiketa tai olla ristiriidassa muiden ilmaisemien mielipiteiden kanssa. Tärkeitä lisätietoja on osoitteessa https://a16z.com/disclosures.

Aikaleima:

Lisää aiheesta Andreessen Horowitz