การลงทุนในไพน์โคเน

การลงทุนในไพน์โคเน

การลงทุนใน Pinecone PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ด้วยการผันแปรของโมเดลภาษาขนาดใหญ่ (LLM) เรากำลังเห็นการเปลี่ยนแปลงกระบวนทัศน์ในการพัฒนาซอฟต์แวร์และอุตสาหกรรมคอมพิวเตอร์โดยรวม AI กำลังเกิดขึ้นและกลุ่มใหม่กำลังก่อตัวขึ้นต่อหน้าต่อตาเรา มันเหมือนกับอินเทอร์เน็ตอีกครั้ง ซึ่งเรียกใช้บริการส่วนประกอบโครงสร้างพื้นฐานใหม่ที่สร้างขึ้นสำหรับวิธีใหม่ในการทำสิ่งต่างๆ.

มีการรับรู้เพิ่มมากขึ้นว่า LLMs เป็นความจริง รูปแบบใหม่ของคอมพิวเตอร์ในแง่หนึ่ง พวกเขาสามารถเรียกใช้ "โปรแกรม" ที่เขียนด้วยภาษาธรรมชาติ (เช่น ข้อความแจ้ง) ดำเนินการตามอำเภอใจ (เช่น การเขียนโค้ด Python หรือการค้นหาใน Google) และส่งคืนผลลัพธ์กลับไปยังผู้ใช้ในรูปแบบที่มนุษย์อ่านได้ นี่เป็นเรื่องใหญ่ด้วยเหตุผลสองประการ: 

  1. แอปพลิเคชันประเภทใหม่เกี่ยวกับการสรุปเนื้อหาและการสร้างเนื้อหา เป็นไปได้ในขณะนี้ส่งผลให้พฤติกรรมผู้บริโภคเปลี่ยนไปเกี่ยวกับการใช้ซอฟต์แวร์
  2. นักพัฒนากลุ่มใหม่สามารถเขียนซอฟต์แวร์ได้แล้ว การเขียนโปรแกรมคอมพิวเตอร์ในปัจจุบันต้องการเพียงความเชี่ยวชาญภาษาอังกฤษ (หรือภาษามนุษย์อื่นๆ) เท่านั้น ไม่ต้องฝึกฝนในภาษาโปรแกรมดั้งเดิม เช่น Python หรือ JavaScript 

หนึ่งในลำดับความสำคัญสูงสุดของเราที่ Andreessen Horowitz คือการระบุบริษัทที่สร้างองค์ประกอบหลักของกลุ่ม AI ใหม่นี้ เราตื่นเต้นที่จะประกาศว่าเรากำลังเป็นผู้นำในรอบ Series B มูลค่า 100 ล้านดอลลาร์ ไพน์โคนเพื่อสนับสนุนวิสัยทัศน์ในการเป็นเลเยอร์หน่วยความจำสำหรับแอปพลิเคชัน AI

ปัญหา: LLMs ทำให้ประสาทหลอนและไร้สัญชาติ

ความท้าทายอย่างมากกับ LLM ในปัจจุบันคือภาพหลอน พวกเขาให้คำตอบที่มั่นใจมากซึ่งไม่ถูกต้องตามความเป็นจริงและบางครั้งก็มีเหตุผล ตัวอย่างเช่น การขอ LLM สำหรับอัตรากำไรขั้นต้นของ Apple สำหรับไตรมาสที่แล้วอาจได้คำตอบที่มั่นใจถึง 63 พันล้านดอลลาร์ แบบจำลองสามารถสำรองคำตอบได้โดยอธิบายว่าการหักต้นทุนสินค้า 25 พันล้านดอลลาร์ออกจากรายรับ 95 พันล้านดอลลาร์ คุณจะได้รับอัตรากำไรขั้นต้น 63 พันล้านดอลลาร์ แน่นอนว่ามันผิดในหลายมิติ:

  • ประการแรก ตัวเลขรายได้ไม่ถูกต้อง เนื่องจาก LLM ไม่มีข้อมูลตามเวลาจริง กำลังทำงานกับข้อมูลการฝึกอบรมเก่าที่มีอายุหลายเดือนหรือหลายปี
  • ประการที่สอง มันเลือกตัวเลขรายได้และต้นทุนสินค้าเหล่านั้นแบบสุ่มจากงบการเงินของบริษัทผลไม้อื่น
  • ประการที่สาม การคำนวณอัตรากำไรขั้นต้นไม่ถูกต้องตามหลักคณิตศาสตร์

ลองนึกภาพว่าให้คำตอบกับ CEO ของ โชคลาภ 500 บริษัท 

ทั้งหมดนี้เกิดขึ้นเพราะท้ายที่สุดแล้ว LLM เป็นเครื่องคาดการณ์ที่ได้รับการฝึกฝนจากข้อมูลอินเทอร์เน็ตของบุคคลที่สามจำนวนมหาศาล บ่อยครั้งที่ข้อมูลที่ผู้ใช้ต้องการไม่ได้อยู่ในชุดการฝึกอบรม ดังนั้น แบบจำลองจะให้คำตอบที่เป็นไปได้มากที่สุดและมีรูปแบบภาษาที่ดีโดยอิงตามข้อมูลการฝึกอบรมเก่า เราสามารถเริ่มเห็นแนวทางแก้ไขที่เป็นไปได้สำหรับปัญหาข้างต้นแล้ว นั่นคือการป้อนข้อมูลองค์กรส่วนตัวที่เกี่ยวข้องตามบริบทแบบเรียลไทม์ไปยัง LLM

รูปแบบทั่วไปของปัญหานี้คือ จากมุมมองของระบบ LLM และโมเดล AI อื่นๆ ส่วนใหญ่จะไร้สถานะในขั้นตอนการอนุมาน แต่ละครั้งที่คุณเรียก GPT-4 API ผลลัพธ์จะขึ้นอยู่กับ เพียง ข้อมูลและพารามิเตอร์ที่คุณส่งในเพย์โหลด โมเดลไม่มีวิธีในตัวในการรวมข้อมูลตามบริบทหรือจดจำสิ่งที่คุณเคยถามมาก่อน การปรับโมเดลอย่างละเอียดเป็นไปได้ แต่มีราคาแพงและค่อนข้างไม่ยืดหยุ่น (เช่น โมเดลไม่สามารถตอบสนองกับข้อมูลใหม่แบบเรียลไทม์) เนื่องจากโมเดลไม่ได้จัดการสถานะหรือหน่วยความจำด้วยตัวเอง จึงขึ้นอยู่กับนักพัฒนาที่จะเติมเต็มช่องว่าง 

วิธีแก้ปัญหา: ฐานข้อมูลเวกเตอร์เป็นชั้นจัดเก็บข้อมูลสำหรับ LLM

นี่คือที่มาของ Pinecone

Pinecone เป็นฐานข้อมูลภายนอกที่นักพัฒนาสามารถจัดเก็บข้อมูลตามบริบทที่เกี่ยวข้องสำหรับแอป LLM แทนที่จะส่งคอลเลคชันเอกสารขนาดใหญ่กลับไปกลับมาในการเรียก API ทุกครั้ง นักพัฒนาสามารถจัดเก็บไว้ในฐานข้อมูล Pinecone จากนั้นเลือกเฉพาะส่วนที่เกี่ยวข้องกับการสืบค้นใดๆ มากที่สุด ซึ่งเป็นแนวทางที่เรียกว่าการเรียนรู้ในบริบท เป็นสิ่งจำเป็นสำหรับกรณีการใช้งานระดับองค์กรเพื่อผลิดอกออกผลอย่างแท้จริง

โดยเฉพาะอย่างยิ่ง Pinecone เป็น เวกเตอร์ ฐานข้อมูล ซึ่งหมายถึงข้อมูลถูกจัดเก็บในรูปแบบของความหมายเชิงความหมาย ฝัง. ในขณะที่คำอธิบายทางเทคนิคของการฝังอยู่นอกเหนือขอบเขตของโพสต์นี้ ส่วนสำคัญที่ต้องทำความเข้าใจก็คือ LLMs ทำงานบนเวกเตอร์การฝังด้วย ดังนั้นด้วยการจัดเก็บข้อมูลใน Pinecone ในรูปแบบนี้ ส่วนหนึ่งของงาน AI ได้รับการประมวลผลล่วงหน้าอย่างมีประสิทธิภาพและ ถ่ายลงฐานข้อมูลแล้ว

ซึ่งแตกต่างจากฐานข้อมูลที่มีอยู่ ซึ่งออกแบบมาสำหรับปริมาณงานเชิงธุรกรรมเชิงอะตอมหรือการวิเคราะห์แบบละเอียด ฐานข้อมูลเวกเตอร์ (Pinecone) ได้รับการออกแบบมาสำหรับการค้นหาเพื่อนบ้านโดยประมาณที่สอดคล้องกันในที่สุด ซึ่งเป็นกระบวนทัศน์ฐานข้อมูลที่ถูกต้องสำหรับเวกเตอร์ที่มีมิติสูงกว่า พวกเขายังมี API สำหรับนักพัฒนาที่ผสานรวมเข้ากับองค์ประกอบหลักอื่นๆ ของแอปพลิเคชัน AI เช่น OpenAI, Cohere, LangChain เป็นต้น การออกแบบที่คิดมาอย่างดีเช่นนี้ทำให้ชีวิตของนักพัฒนาง่ายขึ้นมาก งาน AI ง่ายๆ เช่น การค้นหาความหมาย คำแนะนำผลิตภัณฑ์ หรือการจัดอันดับฟีดยังสามารถจำลองโดยตรงเป็นปัญหาการค้นหาเวกเตอร์และเรียกใช้บนฐานข้อมูลเวกเตอร์โดยไม่ต้องมีขั้นตอนการอนุมานแบบจำลองขั้นสุดท้าย — สิ่งที่ฐานข้อมูลที่มีอยู่ไม่สามารถทำได้

Pinecone เป็นมาตรฐานที่เกิดขึ้นใหม่สำหรับการจัดการสถานะและข้อมูลองค์กรตามบริบทในแอปพลิเคชัน LLM เราคิดว่ามันเป็นองค์ประกอบโครงสร้างพื้นฐานที่สำคัญ มอบพื้นที่จัดเก็บหรือเลเยอร์ "หน่วยความจำ" ให้กับแอปพลิเคชัน AI ใหม่ล่าสุด

ความคืบหน้าที่น่าทึ่งสำหรับ Pinecone จนถึงปัจจุบัน

Pinecone ไม่ใช่ฐานข้อมูลเวกเตอร์เพียงอย่างเดียว แต่เราเชื่อว่าเป็นฐานข้อมูลเวกเตอร์ชั้นนำ — พร้อมแล้วสำหรับการนำไปใช้ในโลกแห่งความเป็นจริง — โดยมีส่วนต่างที่สำคัญ Pinecone มีลูกค้าที่ชำระเงินเพิ่มขึ้น 8 เท่า (ประมาณ 1,600 ราย) ในเวลาเพียงสามเดือน ซึ่งรวมถึงบริษัทเทคโนโลยีที่คาดการณ์ล่วงหน้าอย่าง Shopify, Gong, Zapier และอีกมากมาย มันถูกนำไปใช้ในหลากหลายอุตสาหกรรม รวมถึงซอฟต์แวร์สำหรับองค์กร แอปสำหรับผู้บริโภค อีคอมเมิร์ซ ฟินเทค ประกันภัย สื่อ และ AI/ML

เราระบุว่าความสำเร็จนี้ไม่เพียงแต่มาจากความเข้าใจอย่างลึกซึ้งของผู้ใช้ ตลาด และเทคโนโลยีของทีมเท่านั้น แต่ยังรวมถึงแนวทางผลิตภัณฑ์แบบเนทีฟบนคลาวด์ตั้งแต่เริ่มต้นอีกด้วย หนึ่งในส่วนที่ยากที่สุดในการสร้างบริการนี้คือการให้บริการแบ็คเอนด์บนคลาวด์ที่เชื่อถือได้และมีความพร้อมใช้งานสูง ซึ่งตรงตามเป้าหมายประสิทธิภาพและ SLA ของลูกค้าที่หลากหลาย ด้วยการทำซ้ำหลายครั้งในสถาปัตยกรรมของผลิตภัณฑ์ และการจัดการลูกค้าจำนวนมากที่ชำระเงินในการผลิต ทีมนี้ได้แสดงให้เห็นถึงความเป็นเลิศในการดำเนินงานที่คาดหวังจากฐานข้อมูลการผลิต

ไพน์โคน ก่อตั้งโดยเอโดะ ลิเบอร์ตี ซึ่งเป็นผู้สนับสนุนอย่างจริงจังมาช้านานสำหรับความสำคัญของฐานข้อมูลเวกเตอร์ในแมชชีนเลิร์นนิง รวมถึงวิธีที่พวกเขาช่วยให้ทุกองค์กรสร้างกรณีการใช้งานนอกเหนือจาก LLM ได้ ในฐานะนักคณิตศาสตร์ประยุกต์ เขาใช้เวลาในอาชีพของเขาศึกษาและนำอัลกอริทึมการค้นหาเวกเตอร์ที่ล้ำสมัยไปใช้ ในเวลาเดียวกัน เขาเป็นนักปฏิบัตินิยม สร้างเครื่องมือ ML หลัก เช่น Sagemaker ที่ AWS และแปลงานวิจัย ML ที่ประยุกต์เป็นผลิตภัณฑ์ที่ใช้งานได้จริงซึ่งลูกค้าสามารถใช้ได้ เป็นเรื่องยากที่จะเห็นการผสมผสานระหว่างการวิจัยเชิงลึกและการคิดผลิตภัณฑ์ที่เน้นการปฏิบัติ

Edo เข้าร่วมโดย Bob Wiederhold ซึ่งเป็น CEO และผู้ดำเนินการที่มีประสบการณ์ (เดิมคือ Couchbase) ในฐานะหุ้นส่วนในฝั่งปฏิบัติการในฐานะประธานและ COO นอกจากนี้ Pinecone ยังมีทีมผู้บริหารและวิศวกรที่ยอดเยี่ยมซึ่งมีความเชี่ยวชาญด้านระบบคลาวด์อย่างลึกซึ้งจากที่ต่างๆ เช่น AWS, Google และ Databricks เราประทับใจในความเชี่ยวชาญด้านวิศวกรรมเชิงลึกของทีม การมุ่งเน้นที่ประสบการณ์ของนักพัฒนา และการดำเนินการ GTM ที่มีประสิทธิภาพ และเราได้รับสิทธิพิเศษในการเป็นพันธมิตรกับพวกเขาเพื่อสร้างเลเยอร์หน่วยความจำสำหรับแอปพลิเคชัน AI

* * * * * * * * * * * *

ความคิดเห็นที่แสดงในที่นี้เป็นความคิดเห็นของบุคลากร AH Capital Management, LLC (“a16z”) ที่ยกมาและไม่ใช่ความคิดเห็นของ a16z หรือบริษัทในเครือ ข้อมูลบางอย่างในที่นี้ได้รับมาจากแหล่งบุคคลที่สาม รวมถึงจากบริษัทพอร์ตโฟลิโอของกองทุนที่จัดการโดย a16z ในขณะที่นำมาจากแหล่งที่เชื่อว่าเชื่อถือได้ a16z ไม่ได้ตรวจสอบข้อมูลดังกล่าวอย่างอิสระและไม่รับรองความถูกต้องของข้อมูลหรือความเหมาะสมสำหรับสถานการณ์ที่กำหนด นอกจากนี้ เนื้อหานี้อาจรวมถึงโฆษณาของบุคคลที่สาม a16z ไม่ได้ตรวจทานโฆษณาดังกล่าวและไม่ได้รับรองเนื้อหาโฆษณาใด ๆ ที่อยู่ในนั้น

เนื้อหานี้จัดทำขึ้นเพื่อวัตถุประสงค์ในการให้ข้อมูลเท่านั้น และไม่ควรใช้เป็นคำแนะนำทางกฎหมาย ธุรกิจ การลงทุน หรือภาษี คุณควรปรึกษาที่ปรึกษาของคุณเองในเรื่องเหล่านั้น การอ้างอิงถึงหลักทรัพย์หรือสินทรัพย์ดิจิทัลใดๆ มีวัตถุประสงค์เพื่อเป็นตัวอย่างเท่านั้น และไม่ถือเป็นการแนะนำการลงทุนหรือข้อเสนอเพื่อให้บริการที่ปรึกษาการลงทุน นอกจากนี้ เนื้อหานี้ไม่ได้มุ่งไปที่หรือมีไว้สำหรับการใช้งานโดยนักลงทุนหรือนักลงทุนที่คาดหวัง และไม่อาจเชื่อถือได้ไม่ว่าในกรณีใดๆ เมื่อตัดสินใจลงทุนในกองทุนใดๆ ที่จัดการโดย a16z (การเสนอให้ลงทุนในกองทุน a16z จะกระทำโดยบันทึกเฉพาะบุคคล ข้อตกลงจองซื้อ และเอกสารที่เกี่ยวข้องอื่นๆ ของกองทุนดังกล่าว และควรอ่านให้ครบถ้วน) การลงทุนหรือบริษัทพอร์ตการลงทุนใดๆ ที่กล่าวถึง อ้างถึง หรือ ที่อธิบายไว้ไม่ได้เป็นตัวแทนของการลงทุนทั้งหมดในยานพาหนะที่จัดการโดย a16z และไม่สามารถรับประกันได้ว่าการลงทุนนั้นจะให้ผลกำไรหรือการลงทุนอื่น ๆ ในอนาคตจะมีลักษณะหรือผลลัพธ์ที่คล้ายคลึงกัน รายการการลงทุนที่ทำโดยกองทุนที่จัดการโดย Andreessen Horowitz (ไม่รวมการลงทุนที่ผู้ออกไม่อนุญาตให้ a16z เปิดเผยต่อสาธารณะและการลงทุนที่ไม่ได้ประกาศในสินทรัพย์ดิจิทัลที่ซื้อขายในตลาดหลักทรัพย์) มีอยู่ที่ https://a16z.com/investments /.

แผนภูมิและกราฟที่ให้ไว้ภายในมีวัตถุประสงค์เพื่อให้ข้อมูลเท่านั้น และไม่ควรใช้ในการตัดสินใจลงทุนใดๆ ผลการดำเนินงานในอดีตไม่ได้บ่งบอกถึงผลลัพธ์ในอนาคต เนื้อหาพูดตามวันที่ระบุเท่านั้น การคาดการณ์ การประมาณการ การคาดการณ์ เป้าหมาย โอกาส และ/หรือความคิดเห็นใดๆ ที่แสดงในเอกสารเหล่านี้อาจเปลี่ยนแปลงได้โดยไม่ต้องแจ้งให้ทราบและอาจแตกต่างหรือขัดแย้งกับความคิดเห็นที่แสดงโดยผู้อื่น โปรดดู https://a16z.com/disclosures สำหรับข้อมูลสำคัญเพิ่มเติม

ประทับเวลา:

เพิ่มเติมจาก Andreessen Horowitz