কোড লিখতে সাহায্য করার জন্য বড় ভাষা মডেল (LLMs) ব্যবহার করবেন না, এনভিডিয়ার সিইও জেনসেন হুয়াং বিশ্বাস করেন যে ভবিষ্যতে, এন্টারপ্রাইজ সফ্টওয়্যার কাজটি সম্পূর্ণ করার জন্য একসাথে চ্যাট বটগুলির একটি সংগ্রহ হবে৷
"এটা অসম্ভাব্য যে আপনি এটি স্ক্র্যাচ থেকে লিখবেন বা পাইথন কোডের পুরো গুচ্ছ বা এই জাতীয় কিছু লিখবেন," তিনি তার জিটিসি চলাকালীন মঞ্চে বলেছিলেন। তান সোমবার। "এটি খুব সম্ভবত আপনি AI এর একটি দলকে একত্রিত করবেন।"
এই এআই দল, জেনসেন ব্যাখ্যা করে, এমন একটি মডেল অন্তর্ভুক্ত থাকতে পারে যা ভেঙে ফেলার জন্য ডিজাইন করা হয়েছে এবং অন্যান্য বিভিন্ন মডেলের কাছে একটি অনুরোধ অর্পণ করতে পারে। এই মডেলগুলির মধ্যে কিছু SAP বা Service Now এর মতো ব্যবসায়িক পরিষেবাগুলি বোঝার জন্য প্রশিক্ষিত হতে পারে, অন্যরা একটি ভেক্টর ডাটাবেসে সংরক্ষিত ডেটার সংখ্যাগত বিশ্লেষণ করতে পারে। তারপরে এই ডেটা একত্রিত করা যেতে পারে এবং অন্য মডেলের মাধ্যমে শেষ ব্যবহারকারীর কাছে উপস্থাপন করা যেতে পারে।
"আমরা প্রতিদিন একটি প্রতিবেদন পেতে পারি বা আপনি জানেন যে ঘন্টার শীর্ষে যা একটি বিল্ড প্ল্যান, বা কিছু পূর্বাভাস, বা কিছু গ্রাহক সতর্কতা, বা কিছু বাগ ডাটাবেস বা যা কিছু ঘটতে পারে তার সাথে কিছু করার আছে," তিনি ব্যাখ্যা করেছিলেন
এই সমস্ত মডেলগুলিকে একসাথে চেইন করার জন্য, এনভিডিয়া ডকারের বই থেকে একটি পৃষ্ঠা নিচ্ছে এবং AI এর জন্য একটি কন্টেইনার রানটাইম তৈরি করেছে।
এনভিডিয়া ইনফারেন্স মাইক্রোসার্ভিসেস, বা সংক্ষেপে এনআইএম ডাব করা, এগুলি মূলত কন্টেইনার ইমেজ যা উভয় মডেলকে ধারণ করে, তা ওপেন সোর্স হোক বা মালিকানাধীন, এবং এটি চালানোর জন্য প্রয়োজনীয় সমস্ত নির্ভরতা সহ। এই কন্টেইনারাইজড মডেলগুলি তারপর Nvidia-এক্সিলারেটেড Kubernetes নোড সহ যেকোন সংখ্যক রানটাইম জুড়ে স্থাপন করা যেতে পারে।
“আপনি এটিকে ডিজিএক্স ক্লাউড নামক আমাদের অবকাঠামোতে স্থাপন করতে পারেন, অথবা আপনি এটিকে প্রিম-এ স্থাপন করতে পারেন, অথবা আপনি যে কোনো জায়গায় এটি স্থাপন করতে পারেন। একবার আপনি এটি বিকাশ করলে, এটি আপনার যে কোনও জায়গায় নিয়ে যাওয়া,” জেনসেন বলেছিলেন।
অবশ্যই, আপনাকে প্রথমে এনভিডিয়ার এআই এন্টারপ্রাইজ স্যুটে সাবস্ক্রিপশনের প্রয়োজন হবে, যা প্রতি GPU $4,500/বছরে বা ক্লাউডে প্রতি GPU-এ $1/ঘণ্টাতে একেবারে সস্তা নয়। এই মূল্য নির্ধারণের কৌশলটি সাধারণভাবে ঘন উচ্চ কর্মক্ষমতা সিস্টেমকে উত্সাহিত করবে বলে মনে হবে কারণ আপনি L40 এ চালাচ্ছেন কিনা তা নির্বিশেষে এটির দাম একই। B100s.
GPU ত্বরান্বিত ওয়ার্কলোডগুলিকে কন্টেনারাইজ করার ধারণাটি পরিচিত মনে হলে, এটি এনভিডিয়ার জন্য একেবারে নতুন ধারণা নয়। চুদার ত্বরণ হয়েছে সমর্থিত ডকার, পডম্যান, কনটেইনারড, বা সিআরআই-ও সহ বিভিন্ন ধরণের কন্টেইনার রানটাইমে বছরের পর বছর ধরে, এবং দেখে মনে হচ্ছে না যে এনভিডিয়ার কন্টেইনার রানটাইম কোথাও যাচ্ছে।
এনআইএম-এর পিছনে মান প্রস্তাবটি মনে হচ্ছে যে এনভিডিয়া এই মডেলগুলির প্যাকেজিং এবং অপ্টিমাইজেশন পরিচালনা করবে যাতে তাদের মধ্যে সেরা পারফরম্যান্স পাওয়ার জন্য প্রয়োজনীয় CUDA, Triton Inference Server, বা TensorRT LLM-এর সঠিক সংস্করণ থাকে।
যুক্তি হল যে যদি এনভিডিয়া এমন একটি আপডেট প্রকাশ করে যা নাটকীয়ভাবে নির্দিষ্ট মডেলের ধরনগুলির অনুমান কার্যক্ষমতা বাড়ায়, সেই কার্যকারিতার সুবিধা গ্রহণের জন্য কেবলমাত্র সর্বশেষ এনআইএম ইমেজটি টানতে হবে।
হার্ডওয়্যার নির্দিষ্ট মডেল অপ্টিমাইজেশন ছাড়াও, এনভিডিয়া কনটেইনারগুলির মধ্যে সামঞ্জস্যপূর্ণ যোগাযোগ সক্ষম করার জন্যও কাজ করছে, যাতে তারা API কলের মাধ্যমে একে অপরের সাথে চ্যাট করতে পারে।
আমরা এটি বুঝতে পেরেছি, বর্তমানে বাজারে বিভিন্ন এআই মডেলের দ্বারা ব্যবহৃত API কলগুলি সর্বদা সামঞ্জস্যপূর্ণ নয় যার ফলে কিছু মডেলকে একসাথে স্ট্রিং করা সহজ হয় এবং অন্যদের জন্য অতিরিক্ত কাজের প্রয়োজন হতে পারে।
সাধারণ উদ্দেশ্য মডেলগুলিতে প্রাতিষ্ঠানিক জ্ঞান ধার দেওয়া
যে কেউ একটি AI চ্যাটবট ব্যবহার করেছে তারা জানবে যে যদিও তারা সাধারণত সাধারণ জ্ঞানের প্রশ্নগুলির সাথে বেশ ভাল থাকে, তবে তারা সবসময় অস্পষ্ট বা প্রযুক্তিগত অনুরোধগুলির সাথে সবচেয়ে নির্ভরযোগ্য হয় না।
জেনসেন তার মূল বক্তব্যের সময় এই সত্যটি তুলে ধরেন। Nvidia-এর মধ্যে ব্যবহৃত একটি অভ্যন্তরীণ প্রোগ্রাম সম্পর্কে জিজ্ঞাসা করা হলে, Meta's Llama 2 70B বড় ভাষার মডেলটি আশ্চর্যজনকভাবে একটি সম্পর্কহীন শব্দের সংজ্ঞা প্রদান করেছে।
এন্টারপ্রাইজগুলিকে তাদের নিজস্ব মডেলগুলিকে প্রশিক্ষিত করার চেষ্টা করার পরিবর্তে - এমন কিছু যা প্রচুর GPU বিক্রি করবে কিন্তু অ্যাড্রেসযোগ্য বাজারকে যথেষ্ট পরিমাণে সীমিত করবে — Nvidia গ্রাহক ডেটা এবং প্রক্রিয়াগুলির সাথে তার NIMগুলিকে সূক্ষ্ম সুর করার জন্য সরঞ্জামগুলি তৈরি করেছে৷
“আমাদের NeMo Microservices নামে একটি পরিষেবা রয়েছে যা আপনাকে ডেটা কিউরেট করতে, ডেটা প্রস্তুত করতে সাহায্য করে যাতে আপনি এই AI-তে যেতে পারেন৷ আপনি এটি ভাল সুর এবং তারপর আপনি এটি পাহার; তারপরে আপনি মূল্যায়ন করতে পারেন... অন্যান্য অন্যান্য উদাহরণের বিপরীতে এর কর্মক্ষমতা,” হুয়াং ব্যাখ্যা করেছেন।
তিনি Nvidia-এর NeMo Retriever পরিষেবা নিয়েও কথা বলেছেন যা মডেলটিকে বিশেষভাবে প্রশিক্ষিত করা হয়নি এমন তথ্যের উপর ভিত্তি করে পুনরুদ্ধার অগমেন্টেড জেনারেশন (RAG) ব্যবহার করার ধারণার উপর ভিত্তি করে।
এখানে ধারণাটি হল নথি, প্রক্রিয়া এবং অন্যান্য ডেটা মডেলের সাথে সংযুক্ত একটি ভেক্টর ডাটাবেসে লোড করা যেতে পারে। একটি প্রশ্নের উপর ভিত্তি করে, মডেলটি তারপর সেই ডাটাবেসটি অনুসন্ধান করতে পারে, পুনরুদ্ধার করতে পারে এবং প্রাসঙ্গিক তথ্য সংক্ষিপ্ত করতে পারে।
NIM মডেল এবং NeMo Retriever একত্রিত করার জন্য RAGs এখন উপলব্ধ, যখন NeMo Microservices প্রাথমিক অ্যাক্সেসে রয়েছে। ®
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- PlatoData.Network উল্লম্ব জেনারেটিভ Ai. নিজেকে ক্ষমতায়িত করুন। এখানে প্রবেশ করুন.
- প্লেটোএআইস্ট্রিম। Web3 ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- প্লেটোইএসজি। কার্বন, ক্লিনটেক, শক্তি, পরিবেশ সৌর, বর্জ্য ব্যবস্থাপনা. এখানে প্রবেশ করুন.
- প্লেটো হেলথ। বায়োটেক এবং ক্লিনিক্যাল ট্রায়াল ইন্টেলিজেন্স। এখানে প্রবেশ করুন.
- উত্স: https://go.theregister.com/feed/www.theregister.com/2024/03/19/nvidia_why_write_code_when/
- : আছে
- : হয়
- $ ইউপি
- 7
- a
- সম্পর্কে
- দ্রুততর
- ত্বরণ
- প্রবেশ
- দিয়ে
- যোগ
- অতিরিক্ত
- সম্বোধনযোগ্য
- সুবিধা
- বিরুদ্ধে
- AI
- এআই চ্যাটবট
- এআই মডেল
- সতর্ক
- সব
- বরাবর
- এছাড়াও
- সর্বদা
- an
- বিশ্লেষণ
- এবং
- অন্য
- কোন
- কিছু
- কোথাও
- API
- মনে হচ্ছে,
- রয়েছি
- যুক্তি
- কাছাকাছি
- AS
- At
- উদ্দীপিত
- সহজলভ্য
- ভিত্তি
- BE
- হয়েছে
- পিছনে
- হচ্ছে
- বিশ্বাস
- সর্বোত্তম
- মধ্যে
- বই
- উত্সাহ
- উভয়
- বট
- বিরতি
- বাগ
- নির্মাণ করা
- গুচ্ছ
- ব্যবসায়
- কিন্তু
- by
- নামক
- কল
- CAN
- পেতে পারি
- সিইও
- কিছু
- চেন
- চ্যাট
- chatbot
- সস্তা
- মেঘ
- CO
- কোড
- সংগ্রহ
- মিলিত
- যোগাযোগমন্ত্রী
- সম্পূর্ণ
- ধারণা
- সংযুক্ত
- সঙ্গত
- আধার
- কন্টেনারগুলি
- খরচ
- পথ
- নির্মিত
- সহকারী যাজক
- ক্রেতা
- গ্রাহক তথ্য
- উপাত্ত
- ডেটাবেস
- দিন
- সংজ্ঞা
- নির্ভরতা
- স্থাপন
- মোতায়েন
- পরিকল্পিত
- বিকাশ
- উন্নত
- do
- ডকশ্রমিক
- কাগজপত্র
- doesn
- নিচে
- নাটকীয়ভাবে
- সময়
- প্রতি
- গোড়ার দিকে
- সহজ
- সক্রিয়
- শেষ
- উদ্যোগ
- এন্টারপ্রাইজ সফটওয়্যার
- উদ্যোগ
- মূলত
- প্রতি
- ঠিক
- উদাহরণ
- ব্যাখ্যা
- ব্যাখ্যা
- সত্য
- পরিচিত
- জরিমানা
- প্রথম
- জন্য
- পূর্বাভাস
- থেকে
- কার্যকারিতা
- ভবিষ্যৎ
- সাধারণ
- প্রজন্ম
- পাওয়া
- চালু
- ভাল
- জিপিইউ
- জিপিইউ
- হাতল
- এরকম
- হার্ডওয়্যারের
- আছে
- he
- সাহায্য
- সাহায্য
- এখানে
- ঊর্ধ্বতন
- হাইলাইট করা
- তার
- ঘন্টা
- HTTPS দ্বারা
- হুয়াং
- ধারণা
- if
- ভাবমূর্তি
- চিত্র
- in
- incentivize
- অন্তর্ভুক্ত করা
- সুদ্ধ
- তথ্য
- পরিকাঠামো
- প্রাতিষ্ঠানিক
- একীভূত
- অভ্যন্তরীণ
- মধ্যে
- আইএসএন
- IT
- এর
- জেনসেন হুয়াং
- JPG
- মাত্র
- তান
- জানা
- জ্ঞান
- ভাষা
- বড়
- সর্বশেষ
- মত
- সম্ভবত
- LIMIT টি
- ll
- শিখা
- LLM
- দেখুন
- মত চেহারা
- অনেক
- বাজার
- মে..
- মেটা
- microservices
- হতে পারে
- মডেল
- মডেল
- সোমবার
- সেতু
- প্রয়োজনীয়
- প্রয়োজন
- নতুন
- নোড
- এখন
- সংখ্যা
- এনভিডিয়া
- of
- on
- অনবোর্ড
- একদা
- খোলা
- ওপেন সোর্স
- অপ্টিমাইজেশান
- অপ্টিমাইজেশন
- or
- অন্যান্য
- অন্যরা
- আমাদের
- বাইরে
- নিজের
- প্যাকেজিং
- পৃষ্ঠা
- প্রতি
- সম্পাদন করা
- কর্মক্ষমতা
- পরিকল্পনা
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- প্রেম
- প্রস্তুত করা
- উপস্থাপন
- চমত্কার
- মূল্য
- প্রসেস
- কার্যক্রম
- প্রস্তাব
- মালিকানা
- প্রদত্ত
- কাছে
- উদ্দেশ্য
- পাইথন
- প্রশ্ন
- প্রশ্ন
- টেনা
- RE
- তথাপি
- রিলিজ
- প্রাসঙ্গিক
- বিশ্বাসযোগ্য
- রিপোর্ট
- অনুরোধ
- অনুরোধ
- প্রয়োজন
- ফলে এবং
- উদ্ধার
- অধিকার
- দৌড়
- রানটাইম
- s
- বলেছেন
- একই
- প্রাণরস
- আঁচড়ের দাগ
- সার্চ
- মনে
- বিক্রি করা
- সার্ভার
- সেবা
- সেবা
- সংক্ষিপ্ত
- একক
- So
- সফটওয়্যার
- কিছু
- কিছু
- শব্দসমূহ
- উৎস
- নির্দিষ্ট
- বিশেষভাবে
- পর্যায়
- সঞ্চিত
- কৌশল
- স্ট্রিং
- চাঁদা
- অনুসরণ
- সংক্ষিপ্ত করা
- পৃষ্ঠতল
- সিস্টেম
- গ্রহণ করা
- গ্রহণ
- কার্য
- টীম
- কারিগরী
- মেয়াদ
- যে
- সার্জারির
- ভবিষ্যৎ
- তাদের
- তাহাদিগকে
- তারপর
- এইগুলো
- তারা
- এই
- থেকে
- আজ
- একসঙ্গে
- সরঞ্জাম
- শীর্ষ
- রেলগাড়ি
- প্রশিক্ষিত
- Triton,
- চেষ্টা
- সুর
- ধরনের
- বোঝা
- অসম্ভাব্য
- আপডেট
- ব্যবহৃত
- ব্যবহারকারী
- ব্যবহার
- সাধারণত
- মূল্য
- বৈচিত্র্য
- বিভিন্ন
- সংস্করণ
- খুব
- মাধ্যমে
- we
- যাই হোক
- কিনা
- যে
- যখন
- হু
- সমগ্র
- ব্যাপক
- ইচ্ছা
- সঙ্গে
- মধ্যে
- হয়া যাই ?
- কাজ
- would
- লেখা
- কোড লিখুন
- বছর
- এখনো
- আপনি
- আপনার
- ইউটিউব
- zephyrnet