Befektetés a fenyőtobozba

Befektetés a fenyőtobozba

Investing in Pinecone PlatoBlockchain Data Intelligence. Vertical Search. Ai.

A nagy nyelvi modellek (LLM) inflexiójával paradigmaváltásnak lehetünk tanúi a szoftverfejlesztésben és a számítástechnikai ipar egészében. A mesterséges intelligencia történik, és egy új verem formálódik a szemünk előtt. Olyan ez, mint az internet újra, amely új infrastruktúra-összetevőket hív szolgálatba, amelyeket a dolgok új módjára építettek.

Egyre nagyobb a felismerés, hogy az LLM-ek valójában azok a számítógép új formája, bizonyos értelemben. Futtathatnak természetes nyelven írt „programokat” (pl. promptokat), tetszőleges számítási feladatokat hajthatnak végre (pl. Python kód írása vagy Google keresés), és az eredményeket visszaküldhetik a felhasználónak ember által olvasható formában. Ez két okból is nagy dolog: 

  1. Az alkalmazások új osztálya az összegzés és a generatív tartalom körül ma már lehetséges, ami a fogyasztói magatartás megváltozását eredményezi a szoftverfogyasztás körül.
  2. A fejlesztők új osztálya már képes szoftvereket írni. A számítógépes programozáshoz ma már csak angol (vagy más emberi nyelv) ismerete szükséges, nem pedig olyan hagyományos programozási nyelvek oktatása, mint a Python vagy a JavaScript. 

Az Andreessen Horowitznál az egyik legfontosabb feladatunk az, hogy azonosítsuk az új AI-verem kulcsfontosságú összetevőit felépítő vállalatokat. Örömmel jelentjük be, hogy a 100 millió dolláros B sorozatban vezetünk Fenyőtoboz, hogy támogassák elképzelésüket arról, hogy az AI-alkalmazások memóriarétegévé váljanak.

A probléma: az LLM-ek hallucinálnak és hontalanok

A jelenlegi LLM-ek számára óriási kihívás a hallucináció. Nagyon magabiztos válaszokat adnak, amelyek tényszerűen és néha logikailag helytelenek. Például, ha egy LLM-től megkérdezik az Apple bruttó árrését az utolsó negyedévre, magabiztos választ kaphat, 63 milliárd dollárra. A modell akár azzal is alátámaszthatja válaszát, hogy elmagyarázza, hogy ha a 25 milliárd dolláros bevételből levonjuk az áruk 95 milliárd dolláros költségét, akkor 63 milliárd dolláros bruttó árrést kapunk. Természetesen ez több szempontból is hibás:

  • Először is, a bevételi szám rossz, mivel az LLM nem rendelkezik valós idejű adatokkal. Az elavult edzési adatokat dolgozza fel, amelyek hónapok vagy valószínűleg évesek.
  • Másodszor, ezeket a bevételeket és az áruk költségét véletlenszerűen szedte ki egy másik gyümölcscég pénzügyi kimutatásaiból.
  • Harmadszor, a bruttó fedezet számítása matematikailag nem helyes.

Képzelje el, hogy ezt a választ adja a vezérigazgatójának Szerencse 500 cég. 

Mindez azért történik, mert a nap végén az LLM-ek olyan előrejelző gépek, amelyek hatalmas mennyiségű, harmadik féltől származó internetes adatra vannak kiképezve. Gyakran előfordul, hogy a felhasználónak szüksége információ egyszerűen nem szerepel a képzési készletben. Tehát a modell a legvalószínűbb és nyelvileg legjól formázott válaszokat adja az elavult képzési adatai alapján. Már látjuk a lehetséges megoldást a fenti problémára – a kontextuálisan releváns magánvállalati adatok valós idejű betáplálását az LLM-ekhez.

A probléma általános formája az, hogy rendszerszempontból az LLM-ek és a legtöbb más mesterséges intelligencia modell hontalanok a következtetési lépésben. Minden alkalommal, amikor hívja a GPT-4 API-t, a kimenet attól függ csak a rakományban elküldött adatokon és paramétereken. A modellnek nincs beépített módja a kontextuális adatok beépítésére, vagy arra, hogy emlékezzen arra, amit korábban kérdezett. A modell finomhangolása lehetséges, de ez drága és viszonylag rugalmatlan (azaz a modell nem tud valós időben reagálni az új adatokra). Mivel a modellek önmagukban nem kezelik az állapotot vagy a memóriát, a fejlesztők feladata, hogy pótolják a hiányt. 

A megoldás: A vektoradatbázisok jelentik az LLM-ek tárolási rétegét

Itt jön be a fenyőtoboz.

A Pinecone egy külső adatbázis, amelyben a fejlesztők tárolhatják a releváns kontextuális adatokat az LLM-alkalmazásokhoz. Ahelyett, hogy nagy dokumentumgyűjteményeket küldenének oda-vissza minden API-hívásnál, a fejlesztők eltárolhatják azokat egy Pinecone adatbázisban, majd kiválaszthatják az adott lekérdezés szempontjából legrelevánsabb néhányat – ezt a megközelítést kontextuson belüli tanulásnak nevezik. A vállalati felhasználáshoz elengedhetetlen, hogy valóban virágozhasson.

Különösen a fenyőtoboz a vektor adatbázis, ami azt jelenti, hogy az adatokat szemantikailag értelmes formában tárolják beágyazások. Noha a beágyazások technikai magyarázata túlmutat e bejegyzés keretein, fontos megérteni, hogy az LLM-ek vektoros beágyazásokkal is működnek – így az adatok Pinecone-ban való tárolásával ebben a formátumban az AI-munka egy része hatékonyan előfeldolgozásra került, és feltöltve az adatbázisba.

Ellentétben a meglévő adatbázisokkal, amelyeket atomi tranzakciós vagy kimerítő analitikai munkaterhelésekre terveztek, a (Pinecone) vektoradatbázist végső soron következetes közelítő szomszédkeresésre tervezték, ami a megfelelő adatbázis-paradigma a magasabb dimenziós vektorok számára. Emellett olyan fejlesztői API-kat is biztosítanak, amelyek integrálhatók az AI-alkalmazások más kulcsfontosságú összetevőivel, mint például az OpenAI, a Cohere, a LangChain stb. Egy ilyen jól átgondolt kialakítás nagyban megkönnyíti a fejlesztők életét. Az egyszerű mesterséges intelligencia feladatok, mint például a szemantikus keresés, a termékajánlások vagy a feed-rangsorolás közvetlenül is modellezhetők vektorkeresési problémaként, és a vektoros adatbázison futhatnak végső modellkövetkeztetési lépés nélkül – valamire a meglévő adatbázisok nem képesek.

A Pinecone az állapot- és kontextuális vállalati adatok kezelésének új szabványa az LLM alkalmazásokban. Úgy gondoljuk, hogy ez egy fontos infrastruktúra-elem, amely egy vadonatúj mesterséges intelligencia-alkalmazás-verem tárhelyét vagy „memória” rétegét biztosítja.

Hihetetlen előrelépés a Pinecone számára a mai napig

A Pinecone nem az egyetlen vektoros adatbázis, de úgy gondoljuk, hogy jelentős különbséggel a vezető vektoradatbázis – amely már készen áll a valós alkalmazásra. A Pinecone fizetős ügyfelek száma nyolcszorosára nőtt (körülbelül 8) mindössze három hónap alatt, beleértve az olyan előretekintő technológiai cégeket, mint a Shopify, Gong, Zapier és még sok más. Számos iparágban használják, beleértve a vállalati szoftvereket, a fogyasztói alkalmazásokat, az e-kereskedelmet, a fintech-et, a biztosítást, a médiát és az AI/ML-t.

Ezt a sikert nem csak a felhasználó, a piac és a technológia alapos megértésének tulajdonítjuk, hanem – kritikusan – a kezdetektől fogva a felhőalapú termékszemléletüknek is. A szolgáltatás felépítésének egyik legnehezebb része egy megbízható, magas rendelkezésre állású felhő-háttér biztosítása, amely megfelel az ügyfélteljesítmény-célok és SLA-k széles skálájának. A termékarchitektúrán átívelő többszöri iterációval és a termelésben számos nagyszabású, fizetős ügyfél kezelésével ez a csapat olyan kiváló működést mutatott be, amelyet egy termelési adatbázistól elvárnak.

Fenyőtoboz Edo Liberty alapította, aki régóta és keményen szószólója volt a vektoros adatbázisok fontosságának a gépi tanulásban, beleértve azt is, hogy ezek hogyan tehetik lehetővé minden vállalat számára, hogy használati eseteket építsenek az LLM-ekre. Alkalmazott matematikusként a legmodernebb vektorkereső algoritmusok tanulmányozásával és megvalósításával töltötte pályafutását. Ugyanakkor pragmatikus volt, olyan alapvető ML-eszközöket épített, mint a Sagemaker az AWS-nél, és az alkalmazott ML-kutatást gyakorlati termékekké alakította át, amelyeket az ügyfelek használhatnak. Ritkán látni a mélyreható kutatás és a pragmatikus termékgondolkodás ilyen kombinációját.

Edo-hoz Bob Wiederhold, egy tapasztalt vezérigazgató és operátor (korábban a Couchbase-nél) csatlakozik, mint partner az operatív oldalon, mint elnök és vezérigazgató. A Pinecone fantasztikus vezetőkből és mérnökökből álló csapattal rendelkezik, akik mély felhőrendszerekkel rendelkeznek olyan helyekről, mint az AWS, a Google és a Databricks. Lenyűgözött bennünket a csapat mély mérnöki szakértelme, a fejlesztői tapasztalatra való összpontosítás és a hatékony GTM-végrehajtás, és kiváltságosak vagyunk, hogy velük együttműködhetünk az AI-alkalmazások memóriarétegének kialakításában.

* * *

Az itt kifejtett nézetek az AH Capital Management, LLC („a16z”) egyes alkalmazottainak nézetei, és nem az a16z vagy leányvállalatai nézetei. Az itt található bizonyos információk harmadik féltől származnak, többek között az a16z által kezelt alapok portfólióvállalataitól. Noha megbízhatónak vélt forrásokból származnak, az a16z nem ellenőrizte önállóan ezeket az információkat, és nem nyilatkozik az információk tartós pontosságáról vagy adott helyzetre való megfelelőségéről. Ezenkívül ez a tartalom harmadik féltől származó hirdetéseket is tartalmazhat; az a16z nem vizsgálta át az ilyen hirdetéseket, és nem támogatja az abban található reklámtartalmat.

Ez a tartalom csak tájékoztatási célokat szolgál, és nem támaszkodhat rá jogi, üzleti, befektetési vagy adótanácsadásként. Ezekkel a kérdésekkel kapcsolatban konzultáljon saját tanácsadójával. Bármely értékpapírra vagy digitális eszközre történő hivatkozások csak illusztrációs célt szolgálnak, és nem minősülnek befektetési ajánlásnak vagy ajánlatnak befektetési tanácsadási szolgáltatások nyújtására. Ezen túlmenően ez a tartalom nem befektetőknek vagy leendő befektetőknek szól, és nem is szánható felhasználásra, és semmilyen körülmények között nem támaszkodhat rá az a16z által kezelt alapokba történő befektetésről szóló döntés meghozatalakor. (A16z alapba történő befektetésre vonatkozó ajánlatot csak az ilyen alap zártkörű kibocsátási memoranduma, jegyzési szerződése és egyéb vonatkozó dokumentációja tesz, és azokat teljes egészében el kell olvasni.) Minden említett, hivatkozott befektetés vagy portfóliótársaság, ill. A leírtak nem reprezentatívak az a16z által kezelt járművekbe történő összes befektetésre, és nem garantálható, hogy a befektetések nyereségesek lesznek, vagy a jövőben végrehajtott egyéb beruházások hasonló tulajdonságokkal vagy eredménnyel járnak. Az Andreessen Horowitz által kezelt alapok befektetéseinek listája (kivéve azokat a befektetéseket, amelyek esetében a kibocsátó nem adott engedélyt az a16z számára a nyilvánosságra hozatalra, valamint a nyilvánosan forgalmazott digitális eszközökbe történő be nem jelentett befektetéseket) a https://a16z.com/investments oldalon érhető el. /.

A benne található diagramok és grafikonok kizárólag tájékoztató jellegűek, és nem szabad rájuk hagyatkozni befektetési döntések meghozatalakor. A múltbeli teljesítmény nem jelzi a jövőbeli eredményeket. A tartalom csak a feltüntetett dátum szerint beszél. Az ezekben az anyagokban megfogalmazott előrejelzések, becslések, előrejelzések, célok, kilátások és/vagy vélemények előzetes értesítés nélkül változhatnak, és mások véleményétől eltérhetnek vagy ellentétesek lehetnek. További fontos információkért látogasson el a https://a16z.com/disclosures oldalra.

Időbélyeg:

Még több Andreessen Horowitz