Інвестування в Pinecone

Інвестування в Pinecone

Інвестиції в Pinecone PlatoBlockchain Data Intelligence. Вертикальний пошук. Ai.

Зі зміною великих мовних моделей (LLM) ми спостерігаємо зміну парадигми розробки програмного забезпечення та обчислювальної галузі в цілому. ШІ відбувається, і на наших очах формується нова купа. Це схоже на те, що Інтернет все заново, який викликає в роботу нові компоненти інфраструктури, створені для нового способу роботи.

Зростає визнання того, що LLM насправді є нова форма комп'ютера, в якомусь сенсі. Вони можуть запускати «програми», написані природною мовою (тобто підказки), виконувати довільні обчислювальні завдання (наприклад, написання коду Python або пошук у Google) і повертати результати назад користувачеві у формі, зрозумілій людині. Це велика справа з двох причин: 

  1. Новий клас програм для узагальнення та створення вмісту тепер це можливо, що призводить до зміни поведінки споживачів щодо використання програмного забезпечення.
  2. Новий клас розробників тепер може писати програмне забезпечення. Зараз комп’ютерне програмування вимагає лише володіння англійською (або іншою людською мовою), а не навчання традиційній мові програмування, як-от Python або JavaScript. 

Одним із наших головних пріоритетів у Andreessen Horowitz є визначення компаній, які розробляють ключові компоненти цього нового стеку ШІ. Ми раді повідомити, що ведемо раунд серії B на 100 мільйонів доларів США Соснова шишка, щоб підтримати їх бачення стати рівнем пам’яті для додатків ШІ.

Проблема: LLM галюцинують і не мають громадянства

Величезною проблемою для сучасних LLM є галюцинації. Вони дають дуже впевнені відповіді, які фактично, а іноді й логічно неправильні. Наприклад, запит у LLM про валову маржу Apple за останній квартал може привести до впевненої відповіді в 63 мільярди доларів. Модель може навіть підтвердити свою відповідь, пояснивши, що, віднявши 25 мільярдів доларів вартості товарів із 95 мільярдів доларів доходу, ви отримаєте валову маржу в 63 мільярди доларів. Звичайно, це неправильно в кількох аспектах:

  • По-перше, цифра доходу неправильна, оскільки LLM не має даних у реальному часі. Він відпрацьовує застарілі навчальні дані, яким місяці або, можливо, роки.
  • По-друге, ці дані про дохід і вартість товарів випадковим чином взяли з фінансової звітності іншої фруктової компанії.
  • По-третє, розрахунок валової прибутковості є математично невірним.

Уявіть собі, що ви даєте цю відповідь генеральному директору a стан 500 компанія. 

Усе це відбувається тому, що, зрештою, LLM — це машини прогнозування, навчені на величезних обсягах сторонніх інтернет-даних. Часто необхідної користувачеві інформації просто немає в навчальному наборі. Таким чином, модель дасть найбільш ймовірні та лінгвістично добре відформатовані відповіді на основі своїх застарілих навчальних даних. Ми вже можемо побачити потенційне вирішення вищезазначеної проблеми — передавати LLM-ам у реальному часі контекстно релевантні дані приватних підприємств.

Загальна форма цієї проблеми полягає в тому, що з системної точки зору LLM та більшість інших моделей ШІ не мають стану на етапі висновку. Щоразу, коли ви робите виклик GPT-4 API, результат залежить тільки даних і параметрів, які ви надсилаєте в корисному навантаженні. Модель не має вбудованого способу включення контекстних даних або запам’ятовування того, про що ви запитували раніше. Тонка настройка моделі можлива, але вона дорога і відносно негнучка (тобто модель не може реагувати на нові дані в реальному часі). Оскільки моделі не керують станом або пам’яттю самостійно, розробники повинні заповнити цю прогалину. 

Рішення: векторні бази даних є рівнем зберігання для LLM

Ось тут і з’являється шишка.

Pinecone — це зовнішня база даних, де розробники можуть зберігати відповідні контекстні дані для програм LLM. Замість того, щоб надсилати великі колекції документів з кожним викликом API, розробники можуть зберігати їх у базі даних Pinecone, а потім вибирати лише кілька найбільш релевантних для будь-якого запиту — підхід називається навчанням у контексті. Це обов’язкова умова для справжнього розквіту корпоративних випадків.

Зокрема, шишка є a вектор база даних, що означає, що дані зберігаються у формі семантично значущої вбудовування. Хоча технічне пояснення вбудовування виходить за рамки цієї публікації, важливо розуміти, що LLM також працюють з векторними вбудовуваннями, тому, зберігаючи дані в Pinecone у цьому форматі, частина роботи штучного інтелекту фактично була попередньо оброблена та вивантажено в базу даних.

На відміну від існуючих баз даних, які розроблені для атомарних транзакцій або вичерпних аналітичних навантажень, векторна база даних (Pinecone) розроблена для кінцевого узгодженого приблизного пошуку сусідів, правильної парадигми бази даних для векторів вищої розмірності. Вони також надають API розробників, які інтегруються з іншими ключовими компонентами додатків ШІ, такими як OpenAI, Cohere, LangChain тощо. Такий добре продуманий дизайн значно полегшує життя розробників. Прості завдання штучного інтелекту, як-от семантичний пошук, рекомендації продукту чи ранжування каналів, також можна змоделювати безпосередньо як задачі векторного пошуку та виконати у векторній базі даних без остаточного етапу висновку моделі — те, що існуючі бази даних не можуть зробити.

Pinecone — це новий стандарт для керування корпоративними даними стану та контексту в програмах LLM. Ми вважаємо, що це важливий компонент інфраструктури, який забезпечує рівень зберігання або «пам’яті» для абсолютно нового стеку програм ШІ.

Неймовірний прогрес для Pinecone на сьогоднішній день

Pinecone — не єдина векторна база даних, але ми вважаємо, що це провідна векторна база даних — готова для впровадження в реальному світі — зі значним відривом. Лише за три місяці кількість платних клієнтів Pinecone зросла у 8 разів (приблизно 1,600), включаючи такі перспективні технологічні компанії, як Shopify, Gong, Zapier тощо. Він використовується в багатьох галузях, включаючи корпоративне програмне забезпечення, споживчі програми, електронну комерцію, фінансові технології, страхування, медіа та AI/ML.

Ми пов’язуємо цей успіх не лише з глибоким розумінням командою користувачів, ринку та технологій, а й — що важливо — з їх підходом до хмарних продуктів із самого початку. Однією з найскладніших частин створення цієї служби є забезпечення надійного, високодоступного хмарного серверу, який відповідає широкому спектру цільових показників клієнта та SLA. Завдяки численним ітераціям архітектури продукту та керуючи багатьма високомасштабними оплачуваними клієнтами у виробництві ця команда продемонструвала операційну досконалість, яка очікується від виробничої бази даних.

Соснова шишка була заснована Едо Ліберті, який тривалий час був твердим прихильником важливості векторних баз даних у машинному навчанні, зокрема того, як вони можуть дозволити кожному підприємству створювати сценарії використання на основі LLM. Як прикладний математик, він присвятив свою кар’єру вивченню та впровадженню передових алгоритмів векторного пошуку. Водночас він був прагматиком, розробляючи основні інструменти ML, такі як Sagemaker в AWS, і перетворюючи прикладні дослідження ML у практичні продукти, якими можуть користуватися клієнти. Рідко можна побачити таке поєднання глибоких досліджень і прагматичного мислення про продукт.

До Едо приєднався Боб Відерхолд, досвідчений генеральний директор і оператор (раніше Couchbase), як партнер з операційної сторони як президент і головний операційний директор. Pinecone також має фантастичну команду керівників та інженерів із глибоким досвідом хмарних систем із таких місць, як AWS, Google і Databricks. Ми вражені глибоким інженерним досвідом команди, зосередженістю на досвіді розробника та ефективним виконанням GTM, і ми маємо честь співпрацювати з ними для створення рівня пам’яті для програм ШІ.

* * *

Погляди, висловлені тут, є поглядами окремих співробітників AH Capital Management, LLC («a16z»), які цитуються, і не є поглядами a16z або його філій. Певна інформація, що міститься тут, була отримана зі сторонніх джерел, зокрема від портфельних компаній фондів, якими керує a16z. Хоча отримано з джерел, які вважаються надійними, a16z не перевіряв таку інформацію незалежно та не робить жодних заяв щодо тривалої точності інформації чи її відповідності певній ситуації. Крім того, цей вміст може містити рекламу третіх сторін; a16z не переглядав такі оголошення та не схвалює будь-який рекламний вміст, що міститься в них.

Цей вміст надається лише в інформаційних цілях, і на нього не можна покладатися як на юридичну, ділову, інвестиційну чи податкову консультацію. Ви повинні проконсультуватися з власними радниками щодо цих питань. Посилання на будь-які цінні папери чи цифрові активи наведено лише з метою ілюстрації та не є інвестиційною рекомендацією чи пропозицією надати інвестиційні консультаційні послуги. Крім того, цей вміст не призначений для будь-яких інвесторів чи потенційних інвесторів і не призначений для використання ними, і за жодних обставин на нього не можна покладатися при прийнятті рішення інвестувати в будь-який фонд, яким керує a16z. (Пропозиція інвестувати у фонд a16z буде зроблена лише на підставі меморандуму про приватне розміщення, угоди про підписку та іншої відповідної документації будь-якого такого фонду, і її слід читати повністю.) Будь-які інвестиційні чи портфельні компанії, згадані, згадані або описані не є репрезентативними для всіх інвестицій у транспортні засоби, якими керує a16z, і не може бути гарантії, що інвестиції будуть прибутковими або що інші інвестиції, здійснені в майбутньому, матимуть подібні характеристики чи результати. Список інвестицій, здійснених фондами під управлінням Andreessen Horowitz (за винятком інвестицій, щодо яких емітент не надав дозволу a16z на оприлюднення, а також неоголошених інвестицій у публічні цифрові активи) доступний за адресою https://a16z.com/investments /.

Наведені в ньому діаграми та графіки призначені виключно для інформаційних цілей, і на них не слід покладатися під час прийняття інвестиційних рішень. Минулі результати не вказують на майбутні результати. Зміст відповідає лише вказаній даті. Будь-які прогнози, оцінки, прогнози, цілі, перспективи та/або думки, висловлені в цих матеріалах, можуть бути змінені без попередження та можуть відрізнятися або суперечити думкам, висловленим іншими. Додаткову важливу інформацію можна знайти на сторінці https://a16z.com/disclosures.

Часова мітка:

Більше від Андреессен Горовиц