Investering i Pinecone

Investering i Pinecone

Investing in Pinecone PlatoBlockchain Data Intelligence. Vertical Search. Ai.

Med bøjningen af ​​store sprogmodeller (LLM'er) er vi vidne til et paradigmeskifte inden for softwareudvikling og computerindustrien som helhed. AI sker, og en ny stak dannes foran vores øjne. Det er ligesom internettet forfra, der tager nye infrastrukturkomponenter i brug, bygget til den nye måde at gøre tingene på.

Der er voksende erkendelse af, at LLM'er faktisk er det en ny form for computer, i en eller anden forstand. De kan køre "programmer" skrevet i naturligt sprog (dvs. prompter), udføre vilkårlige computeropgaver (f.eks. skrive Python-kode eller søge på Google) og returnere resultaterne tilbage til brugeren i en menneskelig læsbar form. Dette er en stor sag af to grunde: 

  1. En ny klasse af applikationer omkring opsummering og generativt indhold er nu muligt, hvilket resulterer i en ændring af forbrugeradfærd omkring softwareforbrug.
  2. En ny klasse af udviklere er nu i stand til at skrive software. Computerprogrammering kræver nu kun beherskelse af engelsk (eller et andet menneskeligt sprog), ikke træning i et traditionelt programmeringssprog som Python eller JavaScript. 

En af vores topprioriteter hos Andreessen Horowitz er at identificere de virksomheder, der bygger nøglekomponenterne i denne nye AI-stak. Vi er glade for at kunne meddele, at vi fører en serie B-runde på $100 millioner Grankogle, for at understøtte deres vision om at blive hukommelseslaget for AI-applikationer.

Problemet: LLM'er hallucinerer og er statsløse

En kæmpe udfordring med nuværende LLM'er er hallucination. De giver meget sikre svar, der er faktuelt og nogle gange logisk forkerte. For eksempel kan det resultere i et sikkert svar på 63 milliarder dollars at spørge en LLM om Apples bruttomargin for det sidste kvartal. Modellen kan endda bakke sit svar op ved at forklare, at ved at trække 25 milliarder dollars i vareomkostningerne fra 95 milliarder dollars i omsætning, får man en bruttomargin på 63 milliarder dollars. Selvfølgelig er det forkert på flere dimensioner:

  • For det første er indtægtstallet forkert, da LLM ikke har realtidsdata. Det arbejder ud fra forældede træningsdata, der er måneder eller sandsynligvis år gamle.
  • For det andet hentede den disse indtægter og vareomkostninger tilfældigt fra en anden frugtvirksomheds regnskaber.
  • For det tredje er dens bruttomarginberegning ikke matematisk korrekt.

Forestil dig at give det svar til den administrerende direktør for en rigdom 500 virksomhed. 

Det hele sker, fordi LLM'er i sidste ende er forudsigelsesmaskiner, der er trænet på enorme mængder tredjeparts internetdata. Ofte er den information, brugeren har brug for, simpelthen ikke i træningssættet. Så modellen vil give de mest sandsynlige og sprogligt velformaterede svar baseret på dens uaktuelle træningsdata. Vi kan allerede begynde at se en potentiel løsning på ovenstående problem - at tilføre kontekstuelt relevante private virksomhedsdata i realtid til LLM'erne.

Den generelle form for dette problem er, at fra et systemperspektiv er LLM'er og de fleste andre AI-modeller statsløse ved slutningstrinnet. Hver gang du foretager et opkald til GPT-4 API, afhænger outputtet kun på de data og parametre, du sender i nyttelasten. Modellen har ingen indbygget måde at inkorporere kontekstuelle data på eller huske, hvad du har spurgt før. Modelfinjustering er mulig, men det er dyrt og relativt ufleksibelt (dvs. modellen kan ikke reagere på nye data i realtid). Da modellerne ikke administrerer tilstand eller hukommelse på egen hånd, er det op til udviklerne at udfylde hullet. 

Løsningen: Vektordatabaser er lagerlaget for LLM'er

Det er her Pinecone kommer ind.

Pinecone er en ekstern database, hvor udviklere kan gemme relevante kontekstuelle data til LLM-apps. I stedet for at sende store dokumentsamlinger frem og tilbage med hvert API-kald, kan udviklere gemme dem i en Pinecone-database og derefter kun vælge de få, der er mest relevante for en given forespørgsel - en tilgang, der kaldes in-context learning. Det er et must-have, for at virksomhedens use cases virkelig kan blomstre.

Især Pinecone er en vektor database, hvilket betyder, at data gemmes i form af semantisk meningsfuld indlejringer. Selvom en teknisk forklaring af indlejringer ligger uden for rammerne af dette indlæg, er den vigtige del at forstå, at LLM'er også opererer på vektorindlejringer - så ved at gemme data i Pinecone i dette format er en del af AI-arbejdet effektivt blevet forbehandlet og overført til databasen.

I modsætning til eksisterende databaser, som er designet til atomare transaktionelle eller udtømmende analytiske arbejdsbelastninger, er (Pinecone) vektordatabasen designet til efterhånden konsistent tilnærmet nabosøgning, det rigtige databaseparadigme for højere-dimensionelle vektorer. De leverer også udvikler-API'er, der integrerer med andre nøglekomponenter i AI-applikationer, såsom OpenAI, Cohere, LangChain, osv. Et sådant gennemtænkt design gør udviklernes liv meget lettere. Simple AI-opgaver som semantisk søgning, produktanbefalinger eller feed-rangering kan også modelleres direkte som vektorsøgningsproblemer og køre på vektordatabasen uden et endeligt modelslutningstrin — noget eksisterende databaser ikke kan.

Pinecone er den nye standard til styring af statslige og kontekstuelle virksomhedsdata i LLM-applikationer. Vi tror, ​​det er en vigtig infrastrukturkomponent, der giver lageret eller "hukommelsen"-laget til en helt ny AI-applikationsstabel.

Utrolige fremskridt for Pinecone til dato

Pinecone er ikke den eneste vektordatabase, men vi mener, at det er den førende vektordatabase - klar nu til brug i den virkelige verden - med en betydelig margin. Pinecone har oplevet en 8x vækst i betalte kunder (ca. 1,600) på bare tre måneder, herunder fremadskuende teknologivirksomheder som Shopify, Gong, Zapier og mere. Det bruges på tværs af en lang række industrier, herunder virksomhedssoftware, forbrugerapps, e-handel, fintech, forsikring, medier og AI/ML.

Vi tilskriver denne succes ikke kun teamets dybe forståelse af brugeren, markedet og teknologien, men også - kritisk - til deres cloud-native produkttilgang fra starten. En af de sværeste dele af opbygningen af ​​denne service er at levere en pålidelig, meget tilgængelig cloud-backend, der opfylder en bred vifte af kundepræstationsmål og SLA'er. Med flere gentagelser over produktarkitektur og styring af mange betalte kunder i høj skala i produktionen, har dette team vist operationel ekspertise, der forventes af en produktionsdatabase.

Grankogle blev grundlagt af Edo Liberty, som har været en langvarig, dybt fortaler for vigtigheden af ​​vektordatabaser i maskinlæring, herunder hvordan de kan sætte enhver virksomhed i stand til at bygge use cases oven på LLM'er. Som anvendt matematiker brugte han sin karriere på at studere og implementere banebrydende vektorsøgningsalgoritmer. Samtidig var han pragmatiker, der byggede kerne-ML-værktøjer som Sagemaker hos AWS og oversatte anvendt ML-forskning til praktiske produkter, som kunderne kan bruge. Det er sjældent at se sådan en kombination af dyb research og pragmatisk produkttænkning.

Edo får selskab af Bob Wiederhold, en erfaren CEO og operatør (tidligere Couchbase), som partner på driftssiden som President og COO. Pinecone har også et fantastisk team af ledere og ingeniører med dyb cloud-systemekspertise fra steder som AWS, Google og Databricks. Vi er imponerede over holdets dybe tekniske ekspertise, fokus på udvikleroplevelse og effektive GTM-udførelse, og vi er privilegerede at samarbejde med dem om at bygge hukommelseslaget til AI-applikationer.

* * *

De synspunkter, der er udtrykt her, er dem fra det enkelte AH Capital Management, LLC ("a16z") personale, der er citeret, og er ikke synspunkter fra a16z eller dets tilknyttede selskaber. Visse oplysninger indeholdt heri er indhentet fra tredjepartskilder, herunder fra porteføljeselskaber af fonde forvaltet af a16z. Selvom det er taget fra kilder, der menes at være pålidelige, har a16z ikke uafhængigt verificeret sådanne oplysninger og fremsætter ingen erklæringer om informationernes vedvarende nøjagtighed eller deres passende for en given situation. Derudover kan dette indhold omfatte tredjepartsreklamer; a16z har ikke gennemgået sådanne annoncer og støtter ikke noget reklameindhold indeholdt deri.

Dette indhold er kun givet til informationsformål og bør ikke påberåbes som juridisk, forretningsmæssig, investerings- eller skatterådgivning. Du bør rådføre dig med dine egne rådgivere om disse spørgsmål. Henvisninger til værdipapirer eller digitale aktiver er kun til illustrationsformål og udgør ikke en investeringsanbefaling eller tilbud om at levere investeringsrådgivningstjenester. Ydermere er dette indhold ikke rettet mod eller beregnet til brug af nogen investorer eller potentielle investorer og kan under ingen omstændigheder stoles på, når der træffes en beslutning om at investere i en fond, der administreres af a16z. (Et tilbud om at investere i en a16z-fond vil kun blive givet af private placement-memorandummet, tegningsaftalen og anden relevant dokumentation for en sådan fond og bør læses i deres helhed.) Eventuelle investeringer eller porteføljeselskaber nævnt, refereret til eller beskrevne er ikke repræsentative for alle investeringer i køretøjer, der administreres af a16z, og der kan ikke gives sikkerhed for, at investeringerne vil være rentable, eller at andre investeringer foretaget i fremtiden vil have lignende karakteristika eller resultater. En liste over investeringer foretaget af fonde forvaltet af Andreessen Horowitz (undtagen investeringer, hvortil udstederen ikke har givet tilladelse til, at a16z offentliggør såvel som uanmeldte investeringer i offentligt handlede digitale aktiver) er tilgængelig på https://a16z.com/investments /.

Diagrammer og grafer, der er angivet i, er udelukkende til informationsformål og bør ikke stoles på, når der træffes nogen investeringsbeslutning. Tidligere resultater er ikke vejledende for fremtidige resultater. Indholdet taler kun fra den angivne dato. Alle fremskrivninger, estimater, prognoser, mål, udsigter og/eller meninger udtrykt i disse materialer kan ændres uden varsel og kan afvige fra eller være i modstrid med andres meninger. Se venligst https://a16z.com/disclosures for yderligere vigtige oplysninger.

Tidsstempel:

Mere fra Andreessen Horowitz