পাইনকোনে বিনিয়োগ

পাইনকোনে বিনিয়োগ

Pinecone PlatoBlockchain ডেটা ইন্টেলিজেন্সে বিনিয়োগ করা। উল্লম্ব অনুসন্ধান. আ.

বৃহৎ ভাষা মডেলের (LLMs) পরিবর্তনের সাথে, আমরা সফ্টওয়্যার বিকাশ এবং সামগ্রিকভাবে কম্পিউটিং শিল্পে একটি দৃষ্টান্ত পরিবর্তনের সাক্ষী হচ্ছি। এআই ঘটছে এবং আমাদের চোখের সামনে একটি নতুন স্ট্যাক তৈরি হচ্ছে। এটি আবার ইন্টারনেটের মতো, যা নতুন উপায়ে কাজ করার জন্য নির্মিত পরিষেবার নতুন পরিকাঠামো উপাদানগুলিকে কল করে.

এলএলএম আসলে ক্রমবর্ধমান স্বীকৃতি কম্পিউটারের একটি নতুন রূপ, কিছু অর্থে. তারা প্রাকৃতিক ভাষায় লিখিত "প্রোগ্রাম" চালাতে পারে (যেমন, প্রম্পট), নির্বিচারে কম্পিউটিং কাজগুলি চালাতে পারে (যেমন, পাইথন কোড লেখা বা Google অনুসন্ধান করা), এবং ফলাফলগুলি ব্যবহারকারীর কাছে একটি মানব-পাঠযোগ্য আকারে ফেরত দিতে পারে। এটি একটি বড় চুক্তি, দুটি কারণে: 

  1. সংক্ষিপ্তকরণ এবং জেনারেটিভ কন্টেন্টের চারপাশে অ্যাপ্লিকেশনের একটি নতুন শ্রেণি সফ্টওয়্যার ব্যবহারের আশেপাশে ভোক্তাদের আচরণের পরিবর্তনের ফলে এখন সম্ভব।
  2. একটি নতুন শ্রেণীর বিকাশকারীরা এখন সফ্টওয়্যার লিখতে সক্ষম। কম্পিউটার প্রোগ্রামিং-এর জন্য এখন শুধুমাত্র ইংরেজি (বা অন্য কোনো মানুষের ভাষা) আয়ত্তের প্রয়োজন, পাইথন বা জাভাস্ক্রিপ্টের মতো প্রথাগত প্রোগ্রামিং ভাষায় প্রশিক্ষণ নয়। 

Andreessen Horowitz-এ আমাদের শীর্ষ অগ্রাধিকারগুলির মধ্যে একটি হল এই নতুন AI স্ট্যাকের মূল উপাদানগুলি তৈরিকারী সংস্থাগুলিকে চিহ্নিত করা৷ আমরা ঘোষণা করতে পেরে রোমাঞ্চিত যে আমরা $100 মিলিয়ন সিরিজ B রাউন্ডে নেতৃত্ব দিচ্ছি পাইন গাছের ফল, AI অ্যাপ্লিকেশনগুলির জন্য মেমরি স্তর হয়ে ওঠার তাদের দৃষ্টিভঙ্গি সমর্থন করতে।

সমস্যা: এলএলএম হ্যালুসিনেট এবং রাষ্ট্রহীন

বর্তমান এলএলএম-এর সাথে একটি বড় চ্যালেঞ্জ হল হ্যালুসিনেশন। তারা খুব আত্মবিশ্বাসী উত্তর দেয় যা বাস্তবিক এবং কখনও কখনও যৌক্তিকভাবে ভুল। উদাহরণস্বরূপ, গত ত্রৈমাসিকের জন্য অ্যাপলের গ্রস মার্জিনের জন্য একটি LLM জিজ্ঞাসা করলে $63 বিলিয়ন এর একটি আত্মবিশ্বাসী উত্তর হতে পারে। মডেলটি এমনকি তার উত্তর ব্যাক আপ করতে পারে ব্যাখ্যা করে যে $25 বিলিয়ন পণ্যের মূল্য $95 বিলিয়ন রাজস্ব থেকে বিয়োগ করে, আপনি $63 বিলিয়নের মোট মার্জিন পাবেন। অবশ্যই, এটি বিভিন্ন মাত্রায় ভুল:

  • প্রথমত, রাজস্ব নম্বর ভুল, কারণ LLM-এর রিয়েল-টাইম ডেটা নেই৷ এটি বাসি প্রশিক্ষণ ডেটা বন্ধ করে কাজ করছে যা মাস বা সম্ভবত বছরের পুরনো।
  • দ্বিতীয়ত, এটি অন্য ফলের কোম্পানির আর্থিক বিবৃতি থেকে এলোমেলোভাবে সেই রাজস্ব এবং পণ্যের খরচ সংগ্রহ করে।
  • তৃতীয়ত, এর গ্রস মার্জিন গণনা গাণিতিকভাবে সঠিক নয়।

একটি সিইও যে উত্তর দিতে কল্পনা করুন ভাগ্য 500 কোম্পানি। 

এটি সবই ঘটে কারণ, দিনের শেষে, এলএলএম হল ভবিষ্যদ্বাণী করার মেশিন যা প্রচুর পরিমাণে তৃতীয় পক্ষের ইন্টারনেট ডেটার উপর প্রশিক্ষিত। প্রায়শই, ব্যবহারকারীর প্রয়োজনীয় তথ্য প্রশিক্ষণ সেটে থাকে না। সুতরাং, মডেলটি তার বাসি প্রশিক্ষণ ডেটার উপর ভিত্তি করে সবচেয়ে সম্ভাব্য এবং ভাষাগতভাবে ভাল-ফরম্যাট করা উত্তর দেবে। আমরা ইতিমধ্যেই উপরের সমস্যার একটি সম্ভাব্য সমাধান দেখতে শুরু করতে পারি — প্রাসঙ্গিকভাবে প্রাসঙ্গিক প্রাইভেট এন্টারপ্রাইজ ডেটা রিয়েল-টাইমে এলএলএম-কে খাওয়ানো।

এই সমস্যার সাধারণ রূপ হল যে, একটি সিস্টেমের দৃষ্টিকোণ থেকে, LLM এবং অন্যান্য বেশিরভাগ AI মডেল অনুমান ধাপে রাষ্ট্রহীন। প্রতিবার আপনি GPT-4 API-তে কল করলে আউটপুট নির্ভর করে কেবল আপনি পেলোডে যে ডেটা এবং প্যারামিটার পাঠান তার উপর। মডেলটিতে প্রাসঙ্গিক ডেটা অন্তর্ভুক্ত করার বা আপনি আগে যা জিজ্ঞাসা করেছেন তা মনে রাখার কোনও অন্তর্নির্মিত উপায় নেই৷ মডেল ফাইন-টিউনিং সম্ভব, তবে এটি ব্যয়বহুল এবং তুলনামূলকভাবে অনমনীয় (অর্থাৎ, মডেলটি রিয়েল টাইমে নতুন ডেটাতে সাড়া দিতে পারে না)। যেহেতু মডেলগুলি নিজেরাই স্টেট বা মেমরি পরিচালনা করে না, তাই শূন্যস্থান পূরণ করা ডেভেলপারদের উপর নির্ভর করে। 

সমাধান: ভেক্টর ডাটাবেস হল LLM-এর স্টোরেজ লেয়ার

এখানেই পাইনেকোন আসে।

Pinecone হল একটি বাহ্যিক ডাটাবেস যেখানে বিকাশকারীরা LLM অ্যাপগুলির জন্য প্রাসঙ্গিক প্রাসঙ্গিক ডেটা সঞ্চয় করতে পারে। প্রতিটি API কলের সাথে বৃহত্তর নথি সংগ্রহগুলিকে সামনে পিছনে পাঠানোর পরিবর্তে, বিকাশকারীরা সেগুলিকে একটি Pinecone ডাটাবেসে সংরক্ষণ করতে পারে, তারপরে যেকোন প্রশ্নের সাথে সবচেয়ে প্রাসঙ্গিক কয়েকটি বেছে নিতে পারে - একটি পদ্ধতি যা ইন-কনটেক্সট লার্নিং নামে পরিচিত। এন্টারপ্রাইজ ব্যবহারের ক্ষেত্রে সত্যিকার অর্থে প্রস্ফুটিত হওয়ার জন্য এটি একটি আবশ্যক।

বিশেষ করে, পাইনকোন একটি ভেক্টর ডাটাবেস, যার মানে ডেটা শব্দার্থগতভাবে অর্থপূর্ণ আকারে সংরক্ষণ করা হয় এমবেডিং. যদিও এম্বেডিংয়ের প্রযুক্তিগত ব্যাখ্যা এই পোস্টের সুযোগের বাইরে, তবে বোঝার গুরুত্বপূর্ণ অংশটি হল যে এলএলএমগুলি ভেক্টর এম্বেডিংয়ের উপরও কাজ করে — তাই এই বিন্যাসে পাইনকোনে ডেটা সংরক্ষণ করার মাধ্যমে, এআই কাজের কিছু অংশ কার্যকরভাবে পূর্ব-প্রক্রিয়া করা হয়েছে এবং ডাটাবেসে অফলোড করা হয়েছে।

বিদ্যমান ডাটাবেসের বিপরীতে, যা পারমাণবিক লেনদেন বা সম্পূর্ণ বিশ্লেষণমূলক কাজের চাপের জন্য ডিজাইন করা হয়েছে, (Pinecone) ভেক্টর ডাটাবেসটি শেষ পর্যন্ত সামঞ্জস্যপূর্ণ আনুমানিক প্রতিবেশী অনুসন্ধানের জন্য ডিজাইন করা হয়েছে, উচ্চ-মাত্রিক ভেক্টরের জন্য সঠিক ডাটাবেস দৃষ্টান্ত। তারা এআই অ্যাপ্লিকেশনের অন্যান্য মূল উপাদান যেমন OpenAI, Cohere, LangChain, ইত্যাদির সাথে একীভূত ডেভেলপার API প্রদান করে। এই ধরনের একটি সুচিন্তিত ডিজাইন ডেভেলপারদের জীবনকে অনেক সহজ করে তোলে। সিমেন্টিক সার্চ, প্রোডাক্ট রিকমেন্ডেশন বা ফিড-র‌্যাঙ্কিংয়ের মতো সাধারণ AI কাজগুলিকে সরাসরি ভেক্টর সার্চ সমস্যা হিসেবে মডেল করা যেতে পারে এবং কোনও চূড়ান্ত মডেল ইনফরেন্স স্টেপ ছাড়াই ভেক্টর ডাটাবেসে চালানো যেতে পারে — বিদ্যমান ডাটাবেস কিছু করতে পারে না।

LLM অ্যাপ্লিকেশনগুলিতে রাজ্য এবং প্রাসঙ্গিক এন্টারপ্রাইজ ডেটা পরিচালনার জন্য পাইনকোন হল উদীয়মান মান। আমরা মনে করি এটি একটি গুরুত্বপূর্ণ অবকাঠামো উপাদান, যা একটি নতুন এআই অ্যাপ্লিকেশন স্ট্যাকে স্টোরেজ বা "মেমরি" স্তর প্রদান করে।

পিনেকোনের জন্য অবিশ্বাস্য অগ্রগতি

পাইনকোনই একমাত্র ভেক্টর ডাটাবেস নয়, তবে আমরা বিশ্বাস করি এটি একটি অগ্রণী ভেক্টর ডাটাবেস — এখন বাস্তব-বিশ্ব গ্রহণের জন্য প্রস্তুত — উল্লেখযোগ্য ব্যবধানে। শপিফাই, গং, জ্যাপিয়ার এবং আরও অনেক কিছুর মতো অগ্রগামী প্রযুক্তি কোম্পানিগুলি সহ Pinecone মাত্র তিন মাসে অর্থপ্রদানকারী গ্রাহকদের (প্রায় 8) 1,600 গুণ বৃদ্ধি পেয়েছে। এটি এন্টারপ্রাইজ সফ্টওয়্যার, ভোক্তা অ্যাপস, ই-কমার্স, ফিনটেক, বীমা, মিডিয়া এবং AI/ML সহ বিস্তৃত শিল্পে ব্যবহৃত হয়।

আমরা এই সাফল্যের কৃতিত্ব শুধুমাত্র দলের ব্যবহারকারী, বাজার এবং প্রযুক্তি সম্পর্কে গভীর বোঝার জন্যই নয়, বরং — সমালোচনামূলকভাবে — শুরু থেকেই তাদের ক্লাউড-নেটিভ প্রোডাক্ট পদ্ধতির জন্য। এই পরিষেবাটি তৈরির সবচেয়ে কঠিন অংশগুলির মধ্যে একটি হল একটি নির্ভরযোগ্য, অত্যন্ত উপলব্ধ ক্লাউড ব্যাকএন্ড যা গ্রাহকের কর্মক্ষমতা লক্ষ্য এবং SLAগুলির একটি বিস্তৃত পরিসর পূরণ করে৷ পণ্যের স্থাপত্যের উপর একাধিক পুনরাবৃত্তির সাথে, এবং উত্পাদনে অনেক উচ্চ-স্কেল, অর্থপ্রদানকারী গ্রাহকদের পরিচালনা করে, এই দলটি একটি উত্পাদন ডাটাবেসের জন্য প্রত্যাশিত কর্মক্ষমতা দেখিয়েছে।

পাইন গাছের ফল Edo Liberty দ্বারা প্রতিষ্ঠিত, যিনি মেশিন লার্নিং-এ ভেক্টর ডাটাবেসের গুরুত্বের জন্য দীর্ঘকাল ধরে কঠোর প্রবক্তা ছিলেন, যার মধ্যে তারা কীভাবে প্রতিটি এন্টারপ্রাইজকে এলএলএম-এর উপরে ব্যবহারের কেস তৈরি করতে সক্ষম করতে পারে। একজন ফলিত গণিতবিদ হিসাবে, তিনি তার কর্মজীবন অধ্যয়ন এবং অত্যাধুনিক ভেক্টর অনুসন্ধান অ্যালগরিদম বাস্তবায়নে ব্যয় করেছেন। একই সময়ে, তিনি একজন বাস্তববাদী ছিলেন, AWS-এ Sagemaker-এর মতো মূল ML টুল তৈরি করতেন, এবং গ্রাহকরা ব্যবহার করতে পারেন এমন ব্যবহারিক পণ্যগুলিতে ফলিত ML গবেষণা অনুবাদ করতেন। গভীর গবেষণা এবং বাস্তবসম্মত পণ্য চিন্তার এই ধরনের সমন্বয় দেখতে বিরল।

ইডোর সাথে বব উইডারহোল্ড যোগ দিয়েছেন, একজন অভিজ্ঞ সিইও এবং অপারেটর (পূর্বে কাউচবেসের), প্রেসিডেন্ট এবং সিওও হিসাবে অপারেশনের অংশীদার হিসাবে। AWS, Google, এবং Databricks এর মতো জায়গা থেকে গভীর ক্লাউড-সিস্টেম দক্ষতার সাথে Pinecone-এর এক্সিকিউটিভ এবং ইঞ্জিনিয়ারদের একটি দুর্দান্ত দল রয়েছে। আমরা টিমের গভীর প্রকৌশল দক্ষতা, বিকাশকারীর অভিজ্ঞতা এবং দক্ষ GTM সম্পাদনের উপর দৃষ্টি নিবদ্ধ করে মুগ্ধ এবং আমরা AI অ্যাপ্লিকেশনের জন্য মেমরি স্তর তৈরি করতে তাদের সাথে অংশীদার হওয়ার সুবিধা পেয়েছি।

* * * *

এখানে যে মতামত প্রকাশ করা হয়েছে তা হল স্বতন্ত্র AH Capital Management, LLC (“a16z”) কর্মীদের উদ্ধৃত এবং a16z বা এর সহযোগীদের মতামত নয়। এখানে থাকা কিছু তথ্য তৃতীয় পক্ষের উত্স থেকে প্রাপ্ত হয়েছে, যার মধ্যে a16z দ্বারা পরিচালিত তহবিলের পোর্টফোলিও কোম্পানিগুলি থেকে। নির্ভরযোগ্য বলে বিশ্বাস করা উৎস থেকে নেওয়া হলেও, a16z এই ধরনের তথ্য স্বাধীনভাবে যাচাই করেনি এবং তথ্যের স্থায়ী নির্ভুলতা বা প্রদত্ত পরিস্থিতির জন্য এর উপযুক্ততা সম্পর্কে কোনো উপস্থাপনা করেনি। উপরন্তু, এই বিষয়বস্তু তৃতীয় পক্ষের বিজ্ঞাপন অন্তর্ভুক্ত করতে পারে; a16z এই ধরনের বিজ্ঞাপন পর্যালোচনা করেনি এবং এতে থাকা কোনো বিজ্ঞাপন সামগ্রীকে সমর্থন করে না।

এই বিষয়বস্তু শুধুমাত্র তথ্যগত উদ্দেশ্যে প্রদান করা হয়, এবং আইনি, ব্যবসা, বিনিয়োগ, বা ট্যাক্স পরামর্শ হিসাবে নির্ভর করা উচিত নয়। এই বিষয়গুলি সম্পর্কে আপনার নিজের উপদেষ্টাদের সাথে পরামর্শ করা উচিত। যেকোন সিকিউরিটিজ বা ডিজিটাল সম্পদের রেফারেন্স শুধুমাত্র দৃষ্টান্তমূলক উদ্দেশ্যে, এবং বিনিয়োগের পরামর্শ বা বিনিয়োগ উপদেষ্টা পরিষেবা প্রদানের প্রস্তাব গঠন করে না। তদ্ব্যতীত, এই বিষয়বস্তু কোন বিনিয়োগকারী বা সম্ভাব্য বিনিয়োগকারীদের দ্বারা নির্দেশিত বা ব্যবহারের উদ্দেশ্যে নয় এবং a16z দ্বারা পরিচালিত যেকোন তহবিলে বিনিয়োগ করার সিদ্ধান্ত নেওয়ার সময় কোনও পরিস্থিতিতে নির্ভর করা যাবে না৷ (একটি a16z তহবিলে বিনিয়োগের প্রস্তাব শুধুমাত্র প্রাইভেট প্লেসমেন্ট মেমোরেন্ডাম, সাবস্ক্রিপশন চুক্তি, এবং এই ধরনের যেকোন তহবিলের অন্যান্য প্রাসঙ্গিক ডকুমেন্টেশন দ্বারা তৈরি করা হবে এবং তাদের সম্পূর্ণরূপে পড়া উচিত।) উল্লেখ করা যেকোন বিনিয়োগ বা পোর্টফোলিও কোম্পানিগুলি, বা বর্ণিতগুলি a16z দ্বারা পরিচালিত যানবাহনে সমস্ত বিনিয়োগের প্রতিনিধি নয়, এবং বিনিয়োগগুলি লাভজনক হবে বা ভবিষ্যতে করা অন্যান্য বিনিয়োগের একই বৈশিষ্ট্য বা ফলাফল থাকবে এমন কোনও নিশ্চয়তা থাকতে পারে না। Andreessen Horowitz দ্বারা পরিচালিত তহবিল দ্বারা করা বিনিয়োগের একটি তালিকা (যেসব বিনিয়োগের জন্য ইস্যুকারী a16z-এর জন্য সর্বজনীনভাবে প্রকাশ করার অনুমতি দেয়নি এবং সেইসাথে সর্বজনীনভাবে ব্যবসা করা ডিজিটাল সম্পদগুলিতে অঘোষিত বিনিয়োগগুলি ব্যতীত) https://a16z.com/investments-এ উপলব্ধ /।

এর মধ্যে প্রদত্ত চার্ট এবং গ্রাফগুলি শুধুমাত্র তথ্যের উদ্দেশ্যে এবং কোন বিনিয়োগ সিদ্ধান্ত নেওয়ার সময় তার উপর নির্ভর করা উচিত নয়। বিগত কর্মক্ষমতা ভবিষ্যতের ফলাফল পরিচায়ক হয় না। বিষয়বস্তু শুধুমাত্র নির্দেশিত তারিখ হিসাবে কথা বলে. এই উপকরণগুলিতে প্রকাশিত যেকোন অনুমান, অনুমান, পূর্বাভাস, লক্ষ্য, সম্ভাবনা এবং/অথবা মতামত বিজ্ঞপ্তি ছাড়াই পরিবর্তন সাপেক্ষে এবং অন্যদের দ্বারা প্রকাশিত মতামতের সাথে ভিন্ন বা বিপরীত হতে পারে। অতিরিক্ত গুরুত্বপূর্ণ তথ্যের জন্য দয়া করে https://a16z.com/disclosures দেখুন।

সময় স্ট্যাম্প:

থেকে আরো আন্দ্রেসেন হরোয়েজ্জ