Berinvestasi dalam biji pinus

Berinvestasi dalam biji pinus

Berinvestasi dalam Kecerdasan Data Pinecone PlatoBlockchain. Pencarian Vertikal. Ai.

Dengan perubahan model bahasa besar (LLM), kami menyaksikan perubahan paradigma dalam pengembangan perangkat lunak dan industri komputasi secara keseluruhan. AI sedang terjadi dan tumpukan baru terbentuk di depan mata kita. Ini seperti Internet lagi, yang memanggil layanan komponen infrastruktur baru yang dibangun untuk cara baru dalam melakukan sesuatu.

Ada pengakuan yang berkembang bahwa LLM sebenarnya bentuk baru dari komputer, dalam arti. Mereka dapat menjalankan "program" yang ditulis dalam bahasa alami (yaitu, perintah), menjalankan tugas komputasi arbitrer (misalnya, menulis kode Python atau mencari di Google), dan mengembalikan hasilnya kembali ke pengguna dalam bentuk yang dapat dibaca manusia. Ini masalah besar, karena dua alasan: 

  1. Kelas aplikasi baru seputar peringkasan dan konten generatif sekarang mungkin menghasilkan perubahan perilaku konsumen seputar konsumsi perangkat lunak.
  2. Kelas pengembang baru sekarang dapat menulis perangkat lunak. Pemrograman komputer sekarang hanya membutuhkan penguasaan bahasa Inggris (atau bahasa manusia lainnya), bukan pelatihan dalam bahasa pemrograman tradisional seperti Python atau JavaScript. 

Salah satu prioritas utama kami di Andreessen Horowitz adalah mengidentifikasi perusahaan yang membangun komponen utama tumpukan AI baru ini. Kami sangat senang mengumumkan bahwa kami memimpin putaran Seri B senilai $100 juta biji pinus, untuk mendukung visi mereka menjadi lapisan memori untuk aplikasi AI.

Masalahnya: LLM berhalusinasi dan tidak memiliki kewarganegaraan

Tantangan besar dengan LLM saat ini adalah halusinasi. Mereka memberikan jawaban yang sangat percaya diri yang secara faktual dan terkadang salah secara logis. Misalnya, meminta LLM untuk margin kotor Apple untuk kuartal terakhir dapat menghasilkan jawaban meyakinkan sebesar $63 miliar. Model tersebut bahkan dapat mendukung jawabannya dengan menjelaskan bahwa dengan mengurangkan $25 miliar biaya barang dari $95 miliar pendapatan, Anda mendapatkan margin kotor sebesar $63 miliar. Tentu saja, itu salah dalam beberapa dimensi:

  • Pertama, angka pendapatannya salah, karena LLM tidak memiliki data real-time. Ini sedang mengerjakan data pelatihan basi yang berumur berbulan-bulan atau mungkin bertahun-tahun.
  • Kedua, ia mengambil angka pendapatan dan harga pokok secara acak dari laporan keuangan perusahaan buah lain.
  • Ketiga, perhitungan margin kotornya tidak benar secara matematis.

Bayangkan memberikan jawaban itu kepada CEO a Nasib 500 perusahaan. 

Semua itu terjadi karena, pada akhirnya, LLM adalah mesin prediksi yang dilatih untuk data internet pihak ketiga dalam jumlah besar. Seringkali, informasi yang dibutuhkan pengguna tidak ada dalam set pelatihan. Jadi, model tersebut akan memberikan jawaban yang paling mungkin dan diformat dengan baik secara linguistik berdasarkan data pelatihan yang sudah basi. Kami sudah dapat mulai melihat solusi potensial untuk masalah di atas โ€” memasukkan data perusahaan swasta yang relevan secara kontekstual secara real-time ke LLM.

Bentuk umum dari masalah ini adalah, dari perspektif sistem, LLM dan sebagian besar model AI lainnya tidak memiliki kewarganegaraan pada langkah inferensi. Setiap kali Anda melakukan panggilan ke API GPT-4, hasilnya bergantung hanya pada data dan parameter yang Anda kirimkan dalam payload. Model tidak memiliki cara bawaan untuk memasukkan data kontekstual atau mengingat apa yang telah Anda tanyakan sebelumnya. Penyempurnaan model dimungkinkan, tetapi mahal dan relatif tidak fleksibel (yaitu, model tidak dapat merespons data baru secara real time). Karena model tidak mengelola status atau memorinya sendiri, terserah pengembang untuk mengisi celah tersebut. 

Solusinya: Database vektor adalah lapisan penyimpanan untuk LLM

Di sinilah biji pinus masuk.

Pinecone adalah database eksternal tempat pengembang dapat menyimpan data kontekstual yang relevan untuk aplikasi LLM. Daripada mengirim kumpulan dokumen besar bolak-balik dengan setiap panggilan API, pengembang dapat menyimpannya di database Pinecone, lalu memilih hanya beberapa yang paling relevan dengan kueri yang diberikan โ€” sebuah pendekatan yang disebut pembelajaran dalam konteks. Kasus penggunaan perusahaan harus benar-benar berkembang.

Secara khusus, Biji Pinus adalah a vektor database, yang berarti data disimpan dalam bentuk yang bermakna secara semantik pernikahan. Sementara penjelasan teknis tentang penyematan berada di luar cakupan posting ini, bagian penting untuk dipahami adalah bahwa LLM juga beroperasi pada penyematan vektor โ€” jadi dengan menyimpan data di Pinecone dalam format ini, bagian dari pekerjaan AI telah diproses sebelumnya secara efektif dan di-offload ke database.

Tidak seperti database yang ada, yang dirancang untuk beban kerja analitik transaksional atau lengkap atomik, database vektor (biji pinus) dirancang untuk pencarian tetangga perkiraan yang konsisten pada akhirnya, paradigma database yang tepat untuk vektor dimensi yang lebih tinggi. Mereka juga menyediakan API pengembang yang terintegrasi dengan komponen utama aplikasi AI lainnya, seperti OpenAI, Cohere, LangChain, dll. Desain yang dipikirkan dengan matang membuat hidup pengembang jauh lebih mudah. Tugas AI sederhana seperti pencarian semantik, rekomendasi produk, atau peringkat feed juga dapat dimodelkan secara langsung sebagai masalah pencarian vektor dan dijalankan pada database vektor tanpa langkah inferensi model akhir โ€” sesuatu yang tidak bisa dilakukan oleh database yang ada.

Pinecone adalah standar yang muncul untuk mengelola data perusahaan negara dan kontekstual dalam aplikasi LLM. Menurut kami, ini adalah komponen infrastruktur yang penting, menyediakan lapisan penyimpanan, atau "memori", ke tumpukan aplikasi AI baru.

Kemajuan luar biasa untuk Pinecone hingga saat ini

Pinecone bukan satu-satunya basis data vektor, tetapi kami yakin ini adalah basis data vektor terkemuka โ€” sekarang siap untuk diadopsi di dunia nyata โ€” dengan selisih yang signifikan. Pinecone telah melihat 8x pertumbuhan pelanggan berbayar (sekitar 1,600) hanya dalam tiga bulan, termasuk perusahaan teknologi berwawasan ke depan seperti Shopify, Gong, Zapier, dan banyak lagi. Ini digunakan di berbagai industri, termasuk perangkat lunak perusahaan, aplikasi konsumen, e-commerce, fintech, asuransi, media, dan AI/ML.

Kami mengaitkan kesuksesan ini tidak hanya dengan pemahaman mendalam tim tentang pengguna, pasar, dan teknologi, tetapi juga โ€” secara kritis โ€” dengan pendekatan produk cloud-native mereka sejak awal. Salah satu bagian tersulit dalam membangun layanan ini adalah menyediakan backend cloud yang andal dan sangat tersedia yang memenuhi berbagai target kinerja pelanggan dan SLA. Dengan beberapa iterasi pada arsitektur produk, dan mengelola banyak pelanggan berbayar skala tinggi dalam produksi, tim ini telah menunjukkan keunggulan operasional yang diharapkan dari database produksi.

biji pinus didirikan oleh Edo Liberty, yang telah lama mendukung pentingnya database vektor dalam pembelajaran mesin, termasuk bagaimana mereka dapat memungkinkan setiap perusahaan membangun kasus penggunaan di atas LLM. Sebagai ahli matematika terapan, dia menghabiskan karirnya mempelajari dan menerapkan algoritma pencarian vektor mutakhir. Pada saat yang sama, dia adalah seorang pragmatis, membangun alat inti ML seperti Sagemaker di AWS, dan menerjemahkan riset ML terapan menjadi produk praktis yang dapat digunakan pelanggan. Jarang melihat kombinasi penelitian mendalam dan pemikiran produk pragmatis.

Edo bergabung dengan Bob Wiederhold, CEO dan operator berpengalaman (sebelumnya dari Couchbase), sebagai mitra di sisi operasi sebagai Presiden dan COO. Pinecone juga memiliki tim eksekutif dan insinyur yang luar biasa dengan keahlian sistem cloud yang mendalam dari tempat-tempat seperti AWS, Google, dan Databricks. Kami terkesan dengan keahlian teknik tim yang mendalam, fokus pada pengalaman developer, dan eksekusi GTM yang efisien, dan kami merasa terhormat dapat bermitra dengan mereka untuk membangun lapisan memori untuk aplikasi AI.

* * *

Pandangan yang diungkapkan di sini adalah pandangan individu AH Capital Management, LLC (โ€œa16zโ€) yang dikutip dan bukan pandangan a16z atau afiliasinya. Informasi tertentu yang terkandung di sini telah diperoleh dari sumber pihak ketiga, termasuk dari perusahaan portofolio dana yang dikelola oleh a16z. Meskipun diambil dari sumber yang dipercaya dapat dipercaya, a16z belum memverifikasi informasi tersebut secara independen dan tidak membuat pernyataan tentang keakuratan informasi yang bertahan lama atau kesesuaiannya untuk situasi tertentu. Selain itu, konten ini mungkin termasuk iklan pihak ketiga; a16z belum meninjau iklan tersebut dan tidak mendukung konten iklan apa pun yang terkandung di dalamnya.

Konten ini disediakan untuk tujuan informasi saja, dan tidak boleh diandalkan sebagai nasihat hukum, bisnis, investasi, atau pajak. Anda harus berkonsultasi dengan penasihat Anda sendiri mengenai hal-hal itu. Referensi ke sekuritas atau aset digital apa pun hanya untuk tujuan ilustrasi, dan bukan merupakan rekomendasi investasi atau penawaran untuk menyediakan layanan konsultasi investasi. Selanjutnya, konten ini tidak ditujukan atau dimaksudkan untuk digunakan oleh investor atau calon investor mana pun, dan dalam keadaan apa pun tidak dapat diandalkan saat membuat keputusan untuk berinvestasi dalam dana yang dikelola oleh a16z. (Penawaran untuk berinvestasi dalam dana a16z hanya akan dilakukan dengan memorandum penempatan pribadi, perjanjian berlangganan, dan dokumentasi lain yang relevan dari dana tersebut dan harus dibaca secara keseluruhan.) Setiap investasi atau perusahaan portofolio yang disebutkan, dirujuk, atau dijelaskan tidak mewakili semua investasi dalam kendaraan yang dikelola oleh a16z, dan tidak ada jaminan bahwa investasi tersebut akan menguntungkan atau bahwa investasi lain yang dilakukan di masa depan akan memiliki karakteristik atau hasil yang serupa. Daftar investasi yang dilakukan oleh dana yang dikelola oleh Andreessen Horowitz (tidak termasuk investasi yang penerbitnya tidak memberikan izin kepada a16z untuk mengungkapkan secara publik serta investasi yang tidak diumumkan dalam aset digital yang diperdagangkan secara publik) tersedia di https://a16z.com/investments /.

Bagan dan grafik yang disediakan di dalamnya hanya untuk tujuan informasi dan tidak boleh diandalkan saat membuat keputusan investasi apa pun. Kinerja masa lalu tidak menunjukkan hasil di masa depan. Konten berbicara hanya pada tanggal yang ditunjukkan. Setiap proyeksi, perkiraan, prakiraan, target, prospek, dan/atau pendapat yang diungkapkan dalam materi ini dapat berubah tanpa pemberitahuan dan mungkin berbeda atau bertentangan dengan pendapat yang diungkapkan oleh orang lain. Silakan lihat https://a16z.com/disclosures untuk informasi penting tambahan.

Stempel Waktu:

Lebih dari Andreessen Horowitz