솔방울에 투자

솔방울에 투자

Pinecone PlatoBlockchain 데이터 인텔리전스에 투자합니다. 수직 검색. 일체 포함.

대규모 언어 모델(LLM)의 활용으로 우리는 소프트웨어 개발과 컴퓨팅 산업 전반에서 패러다임 변화를 목격하고 있습니다. AI가 일어나고 있고 우리 눈앞에서 새로운 스택이 형성되고 있습니다. 새로운 작업 방식을 위해 구축된 새로운 인프라 구성 요소를 서비스에 호출하는 인터넷이 다시 시작되는 것과 같습니다..

LLM이 실제로 새로운 형태의 컴퓨터, 어떤 의미에서. 그들은 자연어로 작성된 "프로그램"(예: 프롬프트)을 실행하고 임의의 컴퓨팅 작업(예: Python 코드 작성 또는 Google 검색)을 실행하고 결과를 사람이 읽을 수 있는 형식으로 사용자에게 반환할 수 있습니다. 이것은 두 가지 이유로 큰 문제입니다. 

  1. 요약 및 생성 콘텐츠와 관련된 새로운 종류의 애플리케이션 이제 소프트웨어 소비에 대한 소비자 행동의 변화를 가져올 수 있습니다.
  2. 이제 새로운 계층의 개발자가 소프트웨어를 작성할 수 있습니다. 컴퓨터 프로그래밍은 이제 Python이나 JavaScript와 같은 전통적인 프로그래밍 언어 교육이 아닌 영어(또는 다른 인간 언어)의 숙달만 필요합니다. 

Andreessen Horowitz의 최우선 순위 중 하나는 이 새로운 AI 스택의 핵심 구성 요소를 구축하는 회사를 식별하는 것입니다. 100억 달러 규모의 시리즈 B 라운드를 주도하고 있음을 발표하게 되어 기쁩니다. 솔방울, AI 애플리케이션의 메모리 계층이 되겠다는 그들의 비전을 지원합니다.

문제: LLM은 환각을 일으키고 무국적자입니다.

현재 LLM의 큰 문제는 환각입니다. 그들은 사실에 근거하고 때로는 논리적으로 잘못된 매우 자신 있는 답변을 제공합니다. 예를 들어 지난 분기 Apple의 총 마진에 대해 LLM에 문의하면 63억 달러라는 자신 있는 답변을 얻을 수 있습니다. 이 모델은 25억 달러의 수익에서 95억 달러의 상품 비용을 빼면 63억 달러의 총 마진을 얻는다고 설명함으로써 답을 뒷받침할 수도 있습니다. 물론 여러 차원에서 잘못되었습니다.

  • 첫째, LLM에 실시간 데이터가 없기 때문에 수익 수치가 잘못되었습니다. 몇 달 또는 몇 년 된 부실한 훈련 데이터를 처리하고 있습니다.
  • 둘째, 다른 과일 회사의 재무제표에서 임의로 수익과 상품 비용을 선택했습니다.
  • 셋째, 총 마진 계산이 수학적으로 정확하지 않습니다.

CEO에게 그 대답을 한다고 상상해 보십시오. 500 회사. 

결국 LLM은 방대한 양의 타사 인터넷 데이터로 훈련된 예측 기계이기 때문에 모든 일이 발생합니다. 사용자가 필요로 하는 정보가 훈련 세트에 없는 경우가 많습니다. 따라서 모델은 오래된 학습 데이터를 기반으로 가장 가능성 있고 언어적으로 올바른 형식의 답변을 제공합니다. 우리는 이미 위의 문제에 대한 잠재적인 해결책을 보기 시작할 수 있습니다. 상황에 맞는 관련 민간 기업 데이터를 LLM에 실시간으로 공급하는 것입니다.

이 문제의 일반적인 형태는 시스템 관점에서 LLM 및 대부분의 다른 AI 모델이 추론 단계에서 상태 비저장이라는 것입니다. GPT-4 API를 호출할 때마다 출력이 달라집니다. 페이로드에서 보내는 데이터 및 매개변수에 대해. 모델에는 컨텍스트 데이터를 통합하거나 이전에 요청한 내용을 기억하는 기본 제공 방법이 없습니다. 모델 미세 조정이 가능하지만 비용이 많이 들고 상대적으로 융통성이 없습니다(즉, 모델이 새로운 데이터에 실시간으로 응답할 수 없음). 모델이 자체적으로 상태나 메모리를 관리하지 않기 때문에 그 차이를 메우는 것은 개발자의 몫입니다. 

솔루션: 벡터 데이터베이스는 LLM의 스토리지 계층입니다.

이것은 Pinecone이 들어오는 곳입니다.

Pinecone은 개발자가 LLM 앱에 대한 관련 컨텍스트 데이터를 저장할 수 있는 외부 데이터베이스입니다. 모든 API 호출과 함께 대규모 문서 모음을 주고 받는 대신 개발자는 이를 Pinecone 데이터베이스에 저장한 다음 주어진 쿼리와 가장 관련성이 높은 몇 가지만 선택할 수 있습니다. 이는 상황 내 학습이라고 하는 접근 방식입니다. 엔터프라이즈 사용 사례가 진정으로 개화하려면 반드시 있어야 합니다.

특히 솔방울은 벡터 데이터가 의미적으로 의미있는 형식으로 저장됨을 의미하는 데이터베이스 임베딩. 임베딩에 대한 기술적인 설명은 이 게시물의 범위를 벗어나지만 이해해야 할 중요한 부분은 LLM이 벡터 임베딩에서도 작동한다는 것입니다. 데이터베이스로 오프로드됩니다.

원자 트랜잭션 또는 철저한 분석 워크로드용으로 설계된 기존 데이터베이스와 달리 (Pinecone) 벡터 데이터베이스는 고차원 벡터에 적합한 데이터베이스 패러다임인 최종적으로 일관된 대략적인 이웃 검색을 위해 설계되었습니다. 또한 OpenAI, Cohere, LangChain 등과 같은 AI 응용 프로그램의 다른 주요 구성 요소와 통합되는 개발자 API를 제공합니다. 이러한 면밀한 설계는 개발자의 삶을 훨씬 쉽게 만듭니다. 시맨틱 검색, 제품 추천 또는 피드 순위와 같은 간단한 AI 작업도 벡터 검색 문제로 직접 모델링할 수 있으며 최종 모델 추론 단계 없이 벡터 데이터베이스에서 실행할 수 있습니다. 기존 데이터베이스로는 할 수 없는 일.

Pinecone은 LLM 애플리케이션에서 상태 및 컨텍스트 엔터프라이즈 데이터를 관리하기 위한 새로운 표준입니다. 새로운 AI 애플리케이션 스택에 스토리지 또는 "메모리" 계층을 제공하는 중요한 인프라 구성 요소라고 생각합니다.

현재까지 Pinecone의 놀라운 발전

Pinecone은 유일한 벡터 데이터베이스는 아니지만 상당한 마진으로 실제 채택을 위해 준비된 선도적인 벡터 데이터베이스라고 생각합니다. Pinecone은 Shopify, Gong, Zapier 등과 같은 미래 지향적인 기술 회사를 포함하여 단 8개월 만에 유료 고객(약 1,600명)이 XNUMX배 증가했습니다. 엔터프라이즈 소프트웨어, 소비자 앱, 전자 상거래, 핀테크, 보험, 미디어 및 AI/ML을 포함한 광범위한 산업에서 사용됩니다.

우리는 이러한 성공이 사용자, 시장 및 기술에 대한 팀의 깊은 이해뿐만 아니라 비판적으로는 처음부터 클라우드 네이티브 제품 접근 방식 덕분이라고 생각합니다. 이 서비스 구축에서 가장 어려운 부분 중 하나는 광범위한 고객 성능 목표 및 SLA를 충족하는 안정적이고 가용성이 높은 클라우드 백엔드를 제공하는 것입니다. 제품 아키텍처에 대한 여러 번의 반복과 프로덕션에서 많은 대규모 유료 고객을 관리하면서 이 팀은 프로덕션 데이터베이스에서 기대되는 운영 우수성을 보여주었습니다.

솔방울 모든 기업이 LLM을 기반으로 사용 사례를 구축할 수 있도록 지원하는 방법을 포함하여 머신 러닝에서 벡터 데이터베이스의 중요성을 오랫동안 완고하게 옹호해 온 Edo Liberty에 의해 설립되었습니다. 응용 수학자로서 그는 최첨단 벡터 검색 알고리즘을 연구하고 구현하는 데 경력을 쌓았습니다. 동시에 그는 AWS에서 Sagemaker와 같은 핵심 ML 도구를 구축하고 응용 ML 연구를 고객이 사용할 수 있는 실용적인 제품으로 변환하는 실용주의자였습니다. 심도 있는 연구와 실용적인 제품 사고의 결합을 보는 것은 드문 일입니다.

Edo는 경험이 풍부한 CEO이자 운영자(이전 Couchbase)인 Bob Wiederhold가 사장 겸 COO로서 운영 측면의 파트너로 합류했습니다. 또한 Pinecone에는 AWS, Google 및 Databricks와 같은 곳에서 심도 있는 클라우드 시스템 전문 지식을 갖춘 환상적인 경영진 및 엔지니어 팀이 있습니다. 우리는 팀의 심도 있는 엔지니어링 전문성, 개발자 경험에 대한 집중, 효율적인 GTM 실행에 깊은 인상을 받았으며, AI 애플리케이션을 위한 메모리 계층을 구축하기 위해 그들과 협력할 수 있는 특권을 누리게 되었습니다.

* * *

여기에 표현된 견해는 인용된 개별 AH Capital Management, LLC("a16z") 직원의 견해이며 16z 또는 그 계열사의 견해가 아닙니다. 여기에 포함된 특정 정보는 16z가 관리하는 펀드의 포트폴리오 회사를 포함하여 제16자 출처에서 얻은 것입니다. 신뢰할 수 있다고 여겨지는 출처에서 가져왔지만 16z는 그러한 정보를 독립적으로 검증하지 않았으며 정보의 지속적인 정확성이나 주어진 상황에 대한 적절성에 대해 어떠한 진술도 하지 않습니다. 또한 이 콘텐츠에는 타사 광고가 포함될 수 있습니다. XNUMXz는 그러한 광고를 검토하지 않았으며 여기에 포함된 광고 콘텐츠를 보증하지 않습니다.

이 콘텐츠는 정보 제공의 목적으로만 제공되며 법률, 비즈니스, 투자 또는 세금 관련 조언에 의존해서는 안 됩니다. 그러한 문제에 관해서는 자신의 고문과 상의해야 합니다. 증권 또는 디지털 자산에 대한 언급은 설명을 위한 것일 뿐이며 투자 추천이나 투자 자문 서비스 제공을 의미하지 않습니다. 또한, 이 콘텐츠는 투자자 또는 예비 투자자를 대상으로 하거나 사용하도록 의도되지 않았으며, 어떤 상황에서도 a16z가 관리하는 펀드에 투자하기로 결정할 때 의존할 수 없습니다. (16z 펀드에 대한 투자 제안은 사모 투자 각서, 청약 계약서 및 해당 펀드의 기타 관련 문서에 의해서만 이루어지며 전체 내용을 읽어야 합니다.) 언급되거나 언급된 모든 투자 또는 포트폴리오 회사 설명된 내용은 16z가 관리하는 차량에 대한 모든 투자를 대표하는 것은 아니며 투자가 수익성이 있거나 미래에 수행되는 다른 투자가 유사한 특성 또는 결과를 가질 것이라는 보장이 없습니다. Andreessen Horowitz가 관리하는 펀드의 투자 목록(발행자가 16z가 공개적으로 공개하도록 허가하지 않은 투자 및 공개적으로 거래되는 디지털 자산에 대한 미고지 투자 제외)은 https://a16z.com/investments에서 볼 수 있습니다. /.

내부에 제공된 차트와 그래프는 정보 제공의 목적으로만 사용되며 투자 결정을 내릴 때 의존해서는 안 됩니다. 과거의 성과는 미래의 결과를 나타내지 않습니다. 내용은 표시된 날짜 현재만 말합니다. 이 자료에 표현된 모든 예측, 추정, 예측, 목표, 전망 및/또는 의견은 예고 없이 변경될 수 있으며 다른 사람이 표현한 의견과 다르거나 반대될 수 있습니다. 추가 중요 정보는 https://a16z.com/disclosures를 참조하십시오.

타임 스탬프 :

더보기 안드레 센 호로비츠