বিল্ডিং ফাউন্ডেশন মডেল (FMs) তৈরি করতে, রক্ষণাবেক্ষণ এবং অপ্টিমাইজ করার জন্য বৃহৎ ক্লাস্টারগুলিকে প্রচুর পরিমাণে ডেটার উপর শত শত বিলিয়ন প্যারামিটার সহ মডেলগুলিকে প্রশিক্ষণ দিতে হবে। মডেল প্রশিক্ষণের অগ্রগতির দিন বা সপ্তাহ না হারিয়ে ব্যর্থতা এবং পরিবেশগত পরিবর্তনগুলি পরিচালনা করতে পারে এমন একটি স্থিতিস্থাপক পরিবেশ তৈরি করা একটি অপারেশনাল চ্যালেঞ্জ যার জন্য আপনাকে ক্লাস্টার স্কেলিং, সক্রিয় স্বাস্থ্য পর্যবেক্ষণ, কাজের চেকপয়েন্টিং, এবং ব্যর্থতা বা সমস্যা দেখা দিলে স্বয়ংক্রিয়ভাবে প্রশিক্ষণ পুনরায় শুরু করার ক্ষমতা প্রয়োগ করতে হবে। .
আমরা যে ভাগ উত্তেজিত অ্যামাজন সেজমেকার হাইপারপড বৃহৎ-স্কেল প্রশিক্ষণ ক্লাস্টার পরিচালনার সাথে জড়িত অভেদহীন ভারী উত্তোলনকে বাদ দিয়ে একটি অত্যন্ত স্থিতিস্থাপক প্রশিক্ষণ পরিবেশ প্রদান করে 40% পর্যন্ত দ্রুত হাজার হাজার এক্সিলারেটর সহ প্রশিক্ষণ ফাউন্ডেশন মডেলগুলিকে সক্ষম করার জন্য এখন সাধারণভাবে উপলব্ধ। সেজমেকার হাইপারপডের সাহায্যে, মেশিন লার্নিং (এমএল) অনুশীলনকারীরা কোনো বাধা ছাড়াই এবং হার্ডওয়্যার ব্যর্থতার সমস্যা মোকাবেলা না করেই সপ্তাহ ও মাস ধরে FM-কে প্রশিক্ষণ দিতে পারে।
স্টেবিলিটি এআই-এর মতো গ্রাহকরা স্টেবল ডিফিউশন সহ তাদের ফাউন্ডেশন মডেলগুলিকে প্রশিক্ষণ দিতে সেজমেকার হাইপারপড ব্যবহার করে।
“নেতৃস্থানীয় ওপেন সোর্স জেনারেটিভ AI কোম্পানি হিসাবে, আমাদের লক্ষ্য হল আধুনিক AI-এর অ্যাক্সেসযোগ্যতা সর্বাধিক করা। আমরা কয়েক বিলিয়ন প্যারামিটার সহ ফাউন্ডেশন মডেল তৈরি করছি, যার জন্য প্রশিক্ষণের পারফরম্যান্সকে সর্বোত্তমভাবে মাপতে পরিকাঠামোর প্রয়োজন। SageMaker HyperPod-এর পরিচালিত পরিকাঠামো এবং অপ্টিমাইজেশান লাইব্রেরিগুলির সাহায্যে, আমরা প্রশিক্ষণের সময় এবং খরচ 50% কম করতে পারি। এটি অত্যাধুনিক মডেলগুলি দ্রুত তৈরি করতে আমাদের মডেল প্রশিক্ষণকে আরও স্থিতিস্থাপক এবং কার্যকরী করে তোলে।"
- এমাদ মোস্তাক, স্টেবিলিটি এআই প্রতিষ্ঠাতা এবং সিইও।
হার্ডওয়্যার ব্যর্থতার জন্য এফএম বিকাশের সম্পূর্ণ চক্রকে স্থিতিস্থাপক করতে, সেজমেকার হাইপারপড আপনাকে ক্লাস্টার তৈরি করতে, ক্লাস্টারের স্বাস্থ্য পর্যবেক্ষণ করতে, ত্রুটিপূর্ণ নোডগুলি মেরামত এবং প্রতিস্থাপন করতে, ঘন ঘন চেকপয়েন্ট সংরক্ষণ করতে এবং অগ্রগতি না হারিয়ে স্বয়ংক্রিয়ভাবে প্রশিক্ষণ পুনরায় শুরু করতে সহায়তা করে। উপরন্তু, SageMaker HyperPod এর সাথে প্রি-কনফিগার করা আছে আমাজন সেজমেকার বিতরণ প্রশিক্ষণ লাইব্রেরি, সহ সেজমেকার ডেটা প্যারালেলিজম লাইব্রেরি (এসএমডিডিপি) এবং সেজমেকার মডেল প্যারালেলিজম লাইব্রেরি (এসএমপি), ক্লাস্টারের কম্পিউট এবং নেটওয়ার্ক পরিকাঠামো সম্পূর্ণরূপে ব্যবহার করার সময়, প্রশিক্ষণের ডেটা এবং মডেলগুলিকে ছোট খণ্ডে বিভক্ত করা এবং ক্লাস্টার নোড জুড়ে সমান্তরালভাবে সেগুলি প্রক্রিয়াকরণের মাধ্যমে এফএম প্রশিক্ষণের কার্যকারিতা উন্নত করা। সেজমেকার হাইপারপড ক্লাস্টার এবং প্রশিক্ষণ কাজের অর্কেস্ট্রেশনের জন্য স্লার্ম ওয়ার্কলোড ম্যানেজারকে সংহত করে।
স্লার্ম ওয়ার্কলোড ম্যানেজার ওভারভিউ
গ্লানি, পূর্বে রিসোর্স ম্যানেজমেন্টের জন্য সিম্পল লিনাক্স ইউটিলিটি নামে পরিচিত, একটি ডিস্ট্রিবিউটেড কম্পিউটিং ক্লাস্টারে কাজ চালানোর জন্য একটি কাজের সময়সূচী। এটি ব্যবহার করে সমান্তরাল কাজ চালানোর জন্য একটি কাঠামো প্রদান করে NVIDIA কালেক্টিভ কমিউনিকেশন লাইব্রেরি (NCCL) or মেসেজ পাসিং ইন্টারফেস (MPI) মান স্লার্ম হল একটি জনপ্রিয় ওপেন সোর্স ক্লাস্টার রিসোর্স ম্যানেজমেন্ট সিস্টেম যা ব্যাপকভাবে উচ্চ কর্মক্ষমতা কম্পিউটিং (HPC) এবং জেনারেটিভ এআই এবং এফএম প্রশিক্ষণ কাজের চাপ দ্বারা ব্যবহৃত হয়। সেজমেকার হাইপারপড কয়েক মিনিটের মধ্যে একটি স্লার্ম ক্লাস্টারের সাথে উঠতে এবং চালানোর একটি সহজ উপায় প্রদান করে।
ব্যবহারকারীরা সেজমেকার হাইপারপডের সাথে কীভাবে যোগাযোগ করে এবং কীভাবে বিভিন্ন ক্লাস্টার উপাদান একে অপরের সাথে এবং অন্যান্য AWS পরিষেবাগুলির সাথে যোগাযোগ করে তার একটি উচ্চ-স্তরের স্থাপত্য চিত্র নিচে দেওয়া হয়েছে, যেমন দীপ্তি জন্য Amazon FSx এবং আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3)।
Slurm কাজ কমান্ড লাইনে কমান্ড দ্বারা জমা দেওয়া হয়. Slurm কাজ চালানোর কমান্ড হয় srun
এবং sbatch
. দ্য srun
কমান্ড ইন্টারেক্টিভ এবং ব্লকিং মোডে প্রশিক্ষণ কাজ চালায়, এবং sbatch
ব্যাচ প্রসেসিং এবং নন-ব্লকিং মোডে চলে। srun
বেশিরভাগ তাৎক্ষণিক কাজ চালানোর জন্য ব্যবহৃত হয়, যখন sbatch
পরবর্তী কাজের জন্য ব্যবহার করা যেতে পারে।
অতিরিক্ত স্লার্ম কমান্ড এবং কনফিগারেশন সম্পর্কে তথ্যের জন্য, দেখুন স্লার্ম ওয়ার্কলোড ম্যানেজার ডকুমেন্টেশন.
স্বয়ংক্রিয় সারসংকলন এবং নিরাময় ক্ষমতা
SageMaker HyperPod-এর নতুন বৈশিষ্ট্যগুলির মধ্যে একটি হল আপনার চাকরিতে অটো-রিজুম করার ক্ষমতা। পূর্বে, যখন একটি কর্মী নোড একটি প্রশিক্ষণ বা ফাইন-টিউনিং কাজ চালানোর সময় ব্যর্থ হয়, তখন এটি ব্যবহারকারীর উপর নির্ভর করে কাজের অবস্থা পরীক্ষা করা, সর্বশেষ চেকপয়েন্ট থেকে কাজটি পুনরায় চালু করা এবং পুরো রান জুড়ে কাজটি পর্যবেক্ষণ করা চালিয়ে যাওয়া। প্রশিক্ষণের কাজ বা ফাইন-টিউনিং কাজের জন্য এক সময়ে কয়েক দিন, সপ্তাহ বা এমনকি মাস চালানোর প্রয়োজন হয়, এটি ব্যয়বহুল হয়ে ওঠে কারণ ব্যবহারকারীর অতিরিক্ত প্রশাসনিক ওভারহেডের কারণে কাজটি নিরীক্ষণ ও বজায় রাখার জন্য চক্র ব্যয় করতে হয় যে ঘটনাটি নোড ক্র্যাশ, সেইসাথে ব্যয়বহুল ত্বরিত গণনা দৃষ্টান্তের নিষ্ক্রিয় সময়ের খরচ।
সেজমেকার হাইপারপড স্বয়ংক্রিয় স্বাস্থ্য পরীক্ষা, নোড প্রতিস্থাপন এবং চাকরি পুনরুদ্ধার ব্যবহার করে চাকরির স্থিতিস্থাপকতাকে সম্বোধন করে। সেজমেকার হাইপারপডে স্লার্ম কাজগুলি একটি সেজমেকার কাস্টম স্লার্ম প্লাগইন ব্যবহার করে পর্যবেক্ষণ করা হয় SPANK ফ্রেমওয়ার্ক. যখন একটি প্রশিক্ষণের কাজ ব্যর্থ হয়, সেজমেকার হাইপারপড স্বাস্থ্য পরীক্ষার একটি স্যুটের মাধ্যমে ক্লাস্টার স্বাস্থ্য পরিদর্শন করবে। যদি ক্লাস্টারে একটি ত্রুটিপূর্ণ নোড পাওয়া যায়, সেজমেকার হাইপারপড স্বয়ংক্রিয়ভাবে ক্লাস্টার থেকে নোডটিকে সরিয়ে ফেলবে, এটিকে একটি সুস্থ নোড দিয়ে প্রতিস্থাপন করবে এবং প্রশিক্ষণের কাজটি পুনরায় চালু করবে। প্রশিক্ষণের চাকরিতে চেকপয়েন্টিং ব্যবহার করার সময়, যে কোনো বাধাগ্রস্ত বা ব্যর্থ কাজ সর্বশেষ চেকপয়েন্ট থেকে পুনরায় শুরু হতে পারে।
সমাধান ওভারভিউ
আপনার সেজমেকার হাইপারপড স্থাপন করতে, আপনি প্রথমে কনফিগার করে আপনার পরিবেশ প্রস্তুত করুন আমাজন ভার্চুয়াল প্রাইভেট ক্লাউড (Amazon VPC) নেটওয়ার্ক এবং নিরাপত্তা গোষ্ঠীগুলি, আপনার VPC-তে FSx-এর জন্য FSx-এর মতো সহায়ক পরিষেবাগুলি স্থাপন করে এবং আপনার Slurm জীবনচক্রের স্ক্রিপ্টগুলিকে S3 বালতিতে প্রকাশ করে৷ তারপরে আপনি আপনার সেজমেকার হাইপারপড স্থাপন এবং কনফিগার করুন এবং আপনার প্রশিক্ষণের কাজ শুরু করতে হেড নোডের সাথে সংযোগ করুন।
পূর্বশর্ত
আপনি আপনার সেজমেকার হাইপারপড তৈরি করার আগে, আপনাকে প্রথমে আপনার VPC কনফিগার করতে হবে, Luster ফাইল সিস্টেমের জন্য একটি FSx তৈরি করতে হবে এবং আপনার পছন্দসই ক্লাস্টার লাইফসাইকেল স্ক্রিপ্টগুলির সাথে একটি S3 বাকেট স্থাপন করতে হবে। আপনি এর সর্বশেষ সংস্করণ প্রয়োজন এডাব্লুএস কমান্ড লাইন ইন্টারফেস (AWS CLI) এবং CLI প্লাগইন এর জন্য ইনস্টল করা হয়েছে AWS সেশন ম্যানেজার, একটি ক্ষমতা এডাব্লুএস সিস্টেম ম্যানেজার.
সেজমেকার হাইপারপড সম্পূর্ণরূপে আপনার ভিপিসির সাথে একত্রিত। একটি নতুন ভিপিসি তৈরি সম্পর্কে তথ্যের জন্য, দেখুন একটি ডিফল্ট ভিপিসি তৈরি করুন or একটি ভিপিসি তৈরি করুন. সংস্থানগুলির মধ্যে সর্বোচ্চ পারফরম্যান্সের সাথে একটি বিরামবিহীন সংযোগের অনুমতি দেওয়ার জন্য, আপনার একই অঞ্চল এবং উপলব্ধতা অঞ্চলে আপনার সমস্ত সংস্থান তৈরি করা উচিত এবং সেইসাথে সংযুক্ত সুরক্ষা গোষ্ঠীর নিয়মগুলি ক্লাস্টার সংস্থানগুলির মধ্যে সংযোগের অনুমতি দেয় তা নিশ্চিত করুন৷
এরপরে তুমি Luster ফাইল সিস্টেমের জন্য একটি FSx তৈরি করুন. এটি আমাদের মডেল প্রশিক্ষণ জুড়ে ব্যবহারের জন্য উচ্চ-পারফরম্যান্স ফাইল সিস্টেম হিসাবে কাজ করবে। নিশ্চিত করুন যে লুস্টার এবং ক্লাস্টার সুরক্ষা গোষ্ঠীগুলির জন্য FSx ক্লাস্টার সংস্থান এবং লুস্টার ফাইল সিস্টেমের জন্য FSx এর মধ্যে অন্তর্মুখী এবং বহির্মুখী যোগাযোগের অনুমতি দেয়৷
আপনার ক্লাস্টার লাইফসাইকেল স্ক্রিপ্টগুলি সেট আপ করতে, যেগুলি চালানো হয় যখন একটি নতুন ক্লাস্টার উদাহরণের মতো ঘটনা ঘটে, আপনি একটি S3 বাকেট তৈরি করুন এবং তারপরে ডিফল্ট লাইফসাইকেল স্ক্রিপ্টগুলি অনুলিপি করুন এবং ঐচ্ছিকভাবে কাস্টমাইজ করুন৷ এই উদাহরণের জন্য, আমরা একটি বালতি প্রিফিক্সে সমস্ত জীবনচক্র স্ক্রিপ্ট সংরক্ষণ করি lifecycle-scripts
.
প্রথমে, আপনি থেকে নমুনা জীবনচক্র স্ক্রিপ্ট ডাউনলোড করুন গিটহুব রেপো. আপনার পছন্দসই ক্লাস্টার আচরণ অনুসারে আপনার এগুলি কাস্টমাইজ করা উচিত।
এরপরে, কাস্টমাইজড লাইফসাইকেল স্ক্রিপ্টগুলি সংরক্ষণ করতে একটি S3 বালতি তৈরি করুন৷
এরপরে, আপনার স্থানীয় ডিরেক্টরি থেকে আপনার পছন্দসই বালতি এবং উপসর্গ ব্যবহার করে ডিফল্ট জীবনচক্র স্ক্রিপ্টগুলি অনুলিপি করুন aws s3 sync
:
অবশেষে, ক্লাস্টারের হেড নোডের সাথে সরলীকৃত সংযোগের জন্য ক্লায়েন্ট সেট আপ করতে, আপনার উচিত AWS CLI ইনস্টল বা আপডেট করুন এবং ইনস্টল করুন AWS সেশন ম্যানেজার CLI প্লাগইন ইন্টারেক্টিভ টার্মিনাল সংযোগগুলিকে ক্লাস্টার পরিচালনা করতে এবং প্রশিক্ষণের কাজ চালানোর অনুমতি দিতে।
আপনি একটি সেজমেকার হাইপারপড ক্লাস্টার তৈরি করতে পারেন যা হয় উপলব্ধ অন-ডিমান্ড সংস্থানগুলির সাথে বা সেজমেকারের সাথে একটি ক্ষমতা সংরক্ষণের অনুরোধ করে। একটি ক্যাপাসিটি রিজার্ভেশন তৈরি করতে, আপনি সার্ভিস কোটা ড্যাশবোর্ডে নির্দিষ্ট কম্পিউট ইনস্ট্যান্সের ধরন এবং ক্ষমতা বরাদ্দ রাখার জন্য একটি কোটা বৃদ্ধির অনুরোধ তৈরি করেন।
আপনার প্রশিক্ষণ ক্লাস্টার সেট আপ করুন
আপনার সেজমেকার হাইপারপড ক্লাস্টার তৈরি করতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- সেজমেকার কনসোলে, নির্বাচন করুন ক্লাস্টার ব্যবস্থাপনা অধীনে হাইপারপড ক্লাস্টার নেভিগেশন ফলকে।
- বেছে নিন একটি গুচ্ছ তৈরি করুন.
- ক্লাস্টার সংস্থানগুলিতে প্রয়োগ করার জন্য একটি ক্লাস্টার নাম এবং ঐচ্ছিকভাবে যে কোনও ট্যাগ সরবরাহ করুন, তারপর চয়ন করুন পরবর্তী.
- নির্বাচন করা উদাহরণ গ্রুপ তৈরি করুন এবং ইনস্ট্যান্স গ্রুপের নাম, ইনস্ট্যান্স টাইপ প্রয়োজনীয়, ইন্সট্যান্সের পরিমাণ এবং S3 বাকেট এবং প্রিফিক্স পাথ উল্লেখ করুন যেখানে আপনি আগে আপনার ক্লাস্টার লাইফসাইকেল স্ক্রিপ্ট কপি করেছেন।
ক্লাস্টার পরিচালনা এবং কাজ জমা দেওয়ার জন্য ব্যবহৃত কন্ট্রোলার নোডগুলির জন্য বিভিন্ন ইনস্ট্যান্স গ্রুপ থাকার সুপারিশ করা হয় এবং ত্বরিত গণনা দৃষ্টান্ত ব্যবহার করে প্রশিক্ষণের কাজ চালানোর জন্য ব্যবহৃত কর্মী নোডগুলি। লগইন নোডের জন্য আপনি ঐচ্ছিকভাবে একটি অতিরিক্ত ইনস্ট্যান্স গ্রুপ কনফিগার করতে পারেন।
- আপনি প্রথমে কন্ট্রোলার ইনস্ট্যান্স গ্রুপ তৈরি করুন, যা ক্লাস্টার হেড নোড অন্তর্ভুক্ত করবে।
- এই উদাহরণ গ্রুপ এর জন্য এডাব্লুএস আইডেন্টিটি এবং অ্যাক্সেস ম্যানেজমেন্ট (IAM) ভূমিকা, নির্বাচন করুন একটি নতুন ভূমিকা তৈরি করুন এবং যেকোন S3 বালতি নির্দিষ্ট করুন যা আপনি ইনস্ট্যান্স গ্রুপের ক্লাস্টার ইনস্ট্যান্সে অ্যাক্সেস পেতে চান।
উত্পন্ন ভূমিকা ডিফল্টরূপে নির্দিষ্ট বালতিতে শুধুমাত্র পঠন অ্যাক্সেস মঞ্জুর করা হবে।
- বেছে নিন ভূমিকা তৈরি করুন.
- অন-ক্রিয়েট স্ক্রিপ্ট প্রম্পটে প্রতিটি ইনস্ট্যান্স সৃষ্টিতে চালানোর জন্য স্ক্রিপ্টের নাম লিখুন। এই উদাহরণে, অন-তৈরি স্ক্রিপ্ট বলা হয়
on_create.sh
. - বেছে নিন সংরক্ষণ করুন.
- বেছে নিন উদাহরণ গ্রুপ তৈরি করুন আপনার কর্মী উদাহরণ গ্রুপ তৈরি করতে।
- ইন্সট্যান্সের ধরন এবং কাঙ্খিত পরিমাণ সহ সমস্ত অনুরোধকৃত বিবরণ প্রদান করুন।
এই উদাহরণটি আমাদের প্রশিক্ষণের কাজ সম্পাদন করতে চারটি ml.trn1.32xl ত্বরিত উদাহরণ ব্যবহার করে। আপনি আগের মতো একই IAM ভূমিকা ব্যবহার করতে পারেন বা কর্মী দৃষ্টান্তগুলির জন্য ভূমিকাটি কাস্টমাইজ করতে পারেন। একইভাবে, আপনি আগের ইনস্ট্যান্স গ্রুপের তুলনায় এই কর্মী দৃষ্টান্ত গোষ্ঠীর জন্য বিভিন্ন অন-তৈরি জীবনচক্র স্ক্রিপ্ট ব্যবহার করতে পারেন।
- বেছে নিন পরবর্তী এগিয়ে যেতে.
- আপনার ক্লাস্টার দৃষ্টান্তগুলির জন্য পছন্দসই VPC, সাবনেট এবং নিরাপত্তা গোষ্ঠীগুলি চয়ন করুন৷
কম লেটেন্সি নিশ্চিত করার জন্য আমরা একটি একক প্রাপ্যতা অঞ্চল এবং সাবনেটে ক্লাস্টার দৃষ্টান্তগুলি হোস্ট করি।
মনে রাখবেন যে আপনি যদি ঘন ঘন S3 ডেটা অ্যাক্সেস করেন, তবে সম্ভাব্য ডেটা স্থানান্তর খরচ কমাতে ব্যক্তিগত সাবনেটের রাউটিং টেবিলের সাথে যুক্ত একটি VPC এন্ডপয়েন্ট তৈরি করার পরামর্শ দেওয়া হয়।
- বেছে নিন পরবর্তী.
- ক্লাস্টারের বিবরণের সারাংশ পর্যালোচনা করুন, তারপর বেছে নিন জমা দিন.
বিকল্পভাবে, AWS CLI ব্যবহার করে আপনার SageMaker হাইপারপড তৈরি করতে, প্রথমে ক্লাস্টার তৈরি করতে ব্যবহৃত JSON প্যারামিটারগুলি কাস্টমাইজ করুন:
তারপরে প্রদত্ত ইনপুটগুলি ব্যবহার করে ক্লাস্টার তৈরি করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন:
Llama 2 এর সাথে আপনার প্রথম প্রশিক্ষণের কাজ চালান
উল্লেখ্য যে Llama 2 মডেলের ব্যবহার মেটা লাইসেন্স দ্বারা পরিচালিত হয়। মডেল ওজন এবং টোকেনাইজার ডাউনলোড করতে, দেখুন ওয়েবসাইট এবং অ্যাক্সেসের অনুরোধ করার আগে লাইসেন্স গ্রহণ করুন মেটার আলিঙ্গন মুখ ওয়েবসাইট.
ক্লাস্টার চালু হওয়ার পরে, ক্লাস্টার আইডি, ইনস্ট্যান্স গ্রুপের নাম এবং ইনস্ট্যান্স আইডি ব্যবহার করে সেশন ম্যানেজারের সাথে লগইন করুন। আপনার ক্লাস্টার বিবরণ দেখতে নিম্নলিখিত কমান্ড ব্যবহার করুন:
প্রতিক্রিয়াতে ক্লাস্টার এআরএন-এর মধ্যে অন্তর্ভুক্ত ক্লাস্টার আইডি নোট করুন।
ক্লাস্টারে লগইন করার জন্য প্রয়োজনীয় ইনস্ট্যান্স গ্রুপের নাম এবং ইনস্ট্যান্স আইডি পুনরুদ্ধার করতে নিম্নলিখিত কমান্ডটি ব্যবহার করুন।
নোট করুন InstanceGroupName
এবং InstanceId
প্রতিক্রিয়া হিসাবে এগুলি সেশন ম্যানেজারের সাথে উদাহরণের সাথে সংযোগ করতে ব্যবহৃত হবে।
এখন আপনি হেড নোড বা লগইন নোডগুলির একটিতে লগ ইন করতে সেশন ম্যানেজার ব্যবহার করুন এবং আপনার প্রশিক্ষণের কাজ চালান:
এর পরে, আমরা পরিবেশ প্রস্তুত করতে যাচ্ছি এবং লামা 2 এবং রেডপাজামা ডেটাসেট ডাউনলোড করতে যাচ্ছি। সম্পূর্ণ কোড এবং এটির একটি ধাপে ধাপে ওয়াকথ্রু-এর জন্য, এর নির্দেশাবলী অনুসরণ করুন AWSome বিতরণকৃত প্রশিক্ষণ GitHub রেপো।
বিস্তারিত ধাপ অনুসরণ করুন 2.test_cases/8.neuronx-nemo-megatron/README.md
ফাইল পরিবেশ প্রস্তুত করার পদক্ষেপগুলি অনুসরণ করার পরে, মডেলটি প্রস্তুত করুন, ডেটাসেট ডাউনলোড করুন এবং টোকেনাইজ করুন এবং মডেলটি প্রাক-কম্পাইল করুন, আপনাকে সম্পাদনা করা উচিত 6.pretrain-model.sh
স্ক্রিপ্ট এবং sbatch
একটি পরামিতি অন্তর্ভুক্ত করার জন্য জব জমা দেওয়ার কমান্ড যা আপনাকে সেজমেকার হাইপারপডের স্বয়ংক্রিয়-রিজুমে বৈশিষ্ট্যের সুবিধা নিতে দেয়।
সম্পাদনা করুন sbatch
নিচের মত দেখতে লাইন:
কাজ জমা দেওয়ার পরে, আপনি একটি পাবেন JobID
যা আপনি নিম্নলিখিত কোড ব্যবহার করে কাজের স্থিতি পরীক্ষা করতে ব্যবহার করতে পারেন:
উপরন্তু, আপনি নিম্নলিখিত কোড ব্যবহার করে কাজের আউটপুট লগ অনুসরণ করে কাজ নিরীক্ষণ করতে পারেন:
পরিষ্কার কর
আপনার সেজমেকার হাইপারপড ক্লাস্টার মুছতে, হয় সেজমেকার কনসোল বা নিম্নলিখিত AWS CLI কমান্ডটি ব্যবহার করুন:
উপসংহার
এই পোস্টটি আপনাকে দেখিয়েছে কিভাবে আপনার AWS পরিবেশ প্রস্তুত করবেন, আপনার প্রথম SageMaker HyperPod ক্লাস্টার স্থাপন করবেন এবং একটি 7-বিলিয়ন প্যারামিটার Llama 2 মডেলকে প্রশিক্ষণ দেবেন। সেজমেকার হাইপারপড আজ সাধারণত আমেরিকা (এন. ভার্জিনিয়া, ওহিও এবং ওরেগন), এশিয়া প্যাসিফিক (সিঙ্গাপুর, সিডনি এবং টোকিও) এবং ইউরোপ (ফ্রাঙ্কফুর্ট, আয়ারল্যান্ড এবং স্টকহোম) অঞ্চলে পাওয়া যায়। সেজমেকার কনসোল, AWS CLI, এবং AWS SDK-এর মাধ্যমে তাদের মোতায়েন করা যেতে পারে এবং তারা p4d, p4de, p5, trn1, inf2, g5, c5, c5n, m5 এবং t3 উদাহরণ পরিবারকে সমর্থন করে।
সেজমেকার হাইপারপড সম্পর্কে আরও জানতে, দেখুন অ্যামাজন সেজমেকার হাইপারপড.
লেখক সম্পর্কে
ব্র্যাড ডোরান আমাজন ওয়েব সার্ভিসেস-এর একজন সিনিয়র টেকনিক্যাল অ্যাকাউন্ট ম্যানেজার, জেনারেটিভ এআই-এর উপর দৃষ্টি নিবদ্ধ করে। ডিজিটাল নেটিভ বিজনেস মার্কেট সেগমেন্টে জেনারেটিভ এআই গ্রাহকদের জন্য ইঞ্জিনিয়ারিং চ্যালেঞ্জ সমাধানের জন্য তিনি দায়ী। তিনি একটি অবকাঠামো এবং সফ্টওয়্যার বিকাশের পটভূমি থেকে এসেছেন এবং বর্তমানে কৃত্রিম বুদ্ধিমত্তা এবং মেশিন লার্নিং বিষয়ে ডক্টরাল অধ্যয়ন এবং গবেষণা চালিয়ে যাচ্ছেন।
কেইটা ওয়াতানাবে আমাজন ওয়েব সার্ভিসেসের একজন সিনিয়র জেনাআই স্পেশালিস্ট সলিউশন আর্কিটেক্ট, যেখানে তিনি স্লার্ম এবং কুবারনেটসের মতো ওএসএস প্রকল্পগুলি ব্যবহার করে মেশিন লার্নিং সমাধানগুলি বিকাশে সহায়তা করেন। তার পটভূমি মেশিন লার্নিং গবেষণা এবং উন্নয়ন. AWS-এ যোগদানের আগে, Keita ই-কমার্স শিল্পে একজন গবেষণা বিজ্ঞানী হিসাবে কাজ করেছিলেন যা পণ্য অনুসন্ধানের জন্য ইমেজ পুনরুদ্ধার সিস্টেম তৈরি করে। কেইটা টোকিও বিশ্ববিদ্যালয় থেকে বিজ্ঞানে পিএইচডি করেছেন।
জাস্টিন পির্টল অ্যামাজন ওয়েব সার্ভিসেসের একজন প্রধান সমাধান স্থপতি। তিনি নিয়মিতভাবে জেনারেটিভ AI গ্রাহকদের তাদের পরিকাঠামো ডিজাইন, স্থাপন এবং স্কেল করার পরামর্শ দেন। তিনি এডব্লিউএস কনফারেন্সে একজন নিয়মিত বক্তা, যার মধ্যে রয়েছে re:Invent, পাশাপাশি অন্যান্য AWS ইভেন্ট। জাস্টিন অস্টিনের ইউনিভার্সিটি অফ টেক্সাস থেকে ম্যানেজমেন্ট ইনফরমেশন সিস্টেমে স্নাতক এবং সিয়াটল ইউনিভার্সিটি থেকে সফ্টওয়্যার ইঞ্জিনিয়ারিংয়ে স্নাতকোত্তর ডিগ্রি অর্জন করেছেন।
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- PlatoData.Network উল্লম্ব জেনারেটিভ Ai. নিজেকে ক্ষমতায়িত করুন। এখানে প্রবেশ করুন.
- প্লেটোএআইস্ট্রিম। Web3 ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- প্লেটোইএসজি। কার্বন, ক্লিনটেক, শক্তি, পরিবেশ সৌর, বর্জ্য ব্যবস্থাপনা. এখানে প্রবেশ করুন.
- প্লেটো হেলথ। বায়োটেক এবং ক্লিনিক্যাল ট্রায়াল ইন্টেলিজেন্স। এখানে প্রবেশ করুন.
- উত্স: https://aws.amazon.com/blogs/machine-learning/introducing-amazon-sagemaker-hyperpod-to-train-foundation-models-at-scale/
- : হয়
- :কোথায়
- $ ইউপি
- 1
- 100
- 12
- 14
- 24
- 7
- a
- ক্ষমতা
- সম্পর্কে
- দ্রুততর
- ত্বক
- সমর্থন দিন
- প্রবেশ
- অভিগম্যতা
- অ্যাক্সেস করা
- হিসাব
- দিয়ে
- যোগ
- অতিরিক্ত
- ঠিকানাগুলি
- প্রশাসক
- প্রশাসনিক
- সুবিধা
- পর
- AI
- সব
- বণ্টন
- অনুমতি
- অনুমতি
- এছাড়াও
- মর্দানী স্ত্রীলোক
- আমাজন সেজমেকার
- অ্যামাজন ওয়েব সার্ভিসেস
- আমেরিকা
- পরিমাণে
- an
- এবং
- কোন
- প্রয়োগ করা
- স্থাপত্য
- রয়েছি
- উঠা
- কৃত্রিম
- কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম গোয়েন্দা এবং মেশিন লার্নিং
- AS
- এশিয়া
- এশিয়া প্যাসিফিক
- যুক্ত
- At
- অস্টিন
- অটোমেটেড
- স্বয়ংক্রিয়ভাবে
- উপস্থিতি
- সহজলভ্য
- ডেস্কটপ AWS
- পটভূমি
- BE
- হয়ে
- আগে
- আচরণে
- মধ্যে
- কোটি কোটি
- রোধক
- নির্মাণ করা
- ভবন
- ব্যবসায়
- by
- নামক
- CAN
- ক্ষমতা
- সামর্থ্য
- ধারণক্ষমতা
- সিইও
- চ্যালেঞ্জ
- চ্যালেঞ্জ
- পরিবর্তন
- চেক
- চেক
- বেছে নিন
- মক্কেল
- গুচ্ছ
- কোড
- সমষ্টিগত
- আসে
- যোগাযোগ
- যোগাযোগমন্ত্রী
- কোম্পানি
- সম্পূর্ণ
- উপাদান
- গনা
- কম্পিউটিং
- সম্মেলন
- কনফিগারেশন
- কনফিগার করার
- সংযোগ করা
- সংযোগ
- সংযোগ
- কনসোল
- অবিরত
- নিয়ামক
- মূল্য
- ব্যয়বহুল
- খরচ
- সৃষ্টি
- তৈরি করা হচ্ছে
- সৃষ্টি
- এখন
- প্রথা
- গ্রাহকদের
- কাস্টমাইজ
- কাস্টমাইজড
- চক্র
- চক্র
- ড্যাশবোর্ড
- উপাত্ত
- দিন
- লেনদেন
- ডিফল্ট
- ডিগ্রী
- স্থাপন
- মোতায়েন
- মোতায়েন
- ফন্দিবাজ
- আকাঙ্ক্ষিত
- বিশদ
- বিস্তারিত
- বিকাশ
- উন্নয়নশীল
- উন্নয়ন
- বিভিন্ন
- আশ্লেষ
- ডিজিটাল
- ভাঙ্গন
- বণ্টিত
- ডিস্ট্রিবিউটেড কম্পিউটিং
- বিতরণ করা প্রশিক্ষণ
- ডাউনলোড
- কারণে
- সময়
- প্রতি
- ইকমার্স
- পারেন
- দূর
- সক্ষম করা
- শেষপ্রান্ত
- প্রকৌশল
- নিশ্চিত করা
- সমগ্র
- পরিবেশ
- পরিবেশ
- স্থাপন করা
- ইউরোপ
- এমন কি
- ঘটনা
- ঘটনাবলী
- উদাহরণ
- উত্তেজিত
- ব্যয়বহুল
- অতিরিক্ত
- মুখ
- ব্যর্থ
- ব্যর্থ
- ব্যর্থতা
- ব্যর্থতা
- পরিবারের
- দ্রুত
- ত্রুটিপূর্ণ
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- ফাইল
- প্রথম
- দৃষ্টি নিবদ্ধ করা
- অনুসরণ করা
- অনুসরণ
- জন্য
- পূর্বে
- পাওয়া
- ভিত
- প্রতিষ্ঠাতা
- প্রতিষ্ঠাতা ও প্রধান নির্বাহী কর্মকর্তা
- চার
- ফ্রেমওয়ার্ক
- ফ্রাংকফুর্ট
- ঘন
- ঘনঘন
- থেকে
- সম্পূর্ণ
- সম্পূর্ণরূপে
- সাধারণত
- উত্পন্ন
- সৃজক
- জেনারেটিভ এআই
- পাওয়া
- GitHub
- লক্ষ্য
- চালু
- পরিচালিত
- মঞ্জুর
- গ্রুপ
- গ্রুপের
- হাতল
- হার্ডওয়্যারের
- আছে
- জমিদারি
- he
- মাথা
- আরোগ্য
- স্বাস্থ্য
- সুস্থ
- ভারী
- ভারী উত্তোলন
- সাহায্য
- উচ্চ
- উচ্চস্তর
- উচ্চ পারদর্শিতা
- সর্বোচ্চ
- অত্যন্ত
- তার
- ঝুলিতে
- নিমন্ত্রণকর্তা
- কিভাবে
- কিভাবে
- এইচপিসি
- এইচটিএমএল
- HTTP
- HTTPS দ্বারা
- শত শত
- ID
- পরিচয়
- অলস
- if
- ভাবমূর্তি
- আশু
- বাস্তবায়ন
- উন্নত করা
- in
- অন্তর্ভুক্ত করা
- অন্তর্ভুক্ত
- সুদ্ধ
- বৃদ্ধি
- শিল্প
- তথ্য
- তথ্য ব্যবস্থা
- পরিকাঠামো
- ইনপুট
- ইনস্টল
- ইনস্টল
- উদাহরণ
- নির্দেশাবলী
- সংহত
- সংহত
- বুদ্ধিমত্তা
- গর্ভনাটিকা
- ইন্টারেক্টিভ
- ইন্টারফেস
- বিঘ্নিত
- মধ্যে
- উপস্থাপক
- জড়িত
- আয়ারল্যাণ্ড
- সমস্যা
- IT
- কাজ
- জবস
- যোগদান
- JPG
- JSON
- জাস্টিন
- পরিচিত
- বড়
- বড় আকারের
- অদৃশ্যতা
- পরে
- সর্বশেষ
- নেতৃত্ব
- শিখতে
- শিক্ষা
- লাইব্রেরি
- লাইব্রেরি
- লাইসেন্স
- জীবনচক্র
- উদ্ধরণ
- মত
- লাইন
- লিনাক্স
- শিখা
- স্থানীয়
- লগ ইন করুন
- লগইন
- দেখুন
- মত চেহারা
- হারানো
- কম
- মেশিন
- মেশিন লার্নিং
- বজায় রাখা
- নিয়ন্ত্রণের
- করা
- তৈরি করে
- মেকিং
- পরিচালিত
- ব্যবস্থাপনা
- পরিচালক
- বাজার
- মাস্টার্স
- ব্যাপার
- চরমে তোলা
- মেটা
- মিনিট
- ML
- মোড
- মডেল
- মডেল
- আধুনিক
- মনিটর
- পর্যবেক্ষণ করা
- পর্যবেক্ষণ
- মাসের
- অধিক
- অধিকাংশ ক্ষেত্রে
- নাম
- স্থানীয়
- ন্যাভিগেশন
- প্রয়োজন
- প্রয়োজন
- প্রয়োজন
- নেটওয়ার্ক
- নতুন
- নতুন বৈশিষ্ট
- নোড
- নোড
- বিঃদ্রঃ
- এখন
- এনভিডিয়া
- of
- ওহিও
- on
- চাহিদা সাপেক্ষে
- ONE
- খোলা
- ওপেন সোর্স
- অপারেটিং
- কর্মক্ষম
- অপ্টিমাইজেশান
- সর্বোচ্চকরন
- or
- অর্কেস্ট্রারচনা
- অরেগন
- OSS
- অন্যান্য
- আমাদের
- আউটপুট
- শেষ
- শান্তিপ্রয়াসী
- শার্সি
- সমান্তরাল
- স্থিতিমাপ
- পরামিতি
- পাসিং
- পথ
- সম্পাদন করা
- কর্মক্ষমতা
- পিএইচডি
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- প্লাগ লাগানো
- জনপ্রিয়
- পোস্ট
- সম্ভাব্য
- প্রস্তুত করা
- আগে
- পূর্বে
- অধ্যক্ষ
- পূর্বে
- ব্যক্তিগত
- প্ররোচক
- এগিয়ে
- প্রক্রিয়াজাতকরণ
- পণ্য
- উন্নতি
- প্রকল্প
- প্রদত্ত
- উপলব্ধ
- প্রদানের
- প্রকাশক
- পরিমাণ
- RE
- সুপারিশ করা
- আরোগ্য
- হ্রাস করা
- পড়ুন
- এলাকা
- অঞ্চল
- নিয়মিত
- নিয়মিতভাবে
- অপসারণ
- মেরামত
- প্রতিস্থাপন করা
- প্রতিস্থাপন
- অনুরোধ
- প্রয়োজন
- প্রয়োজন
- গবেষণা
- গবেষণা ও উন্নয়ন
- বুকিং
- সংচিতি
- স্থিতিস্থাপক
- সংস্থান
- Resources
- প্রতিক্রিয়া
- দায়ী
- জীবনবৃত্তান্ত
- ভূমিকা
- প্রমাথী
- নিয়ম
- চালান
- দৌড়
- রান
- ঋষি নির্মাতা
- একই
- সংরক্ষণ করুন
- স্কেল
- আরোহী
- বিজ্ঞান
- বিজ্ঞানী
- লিপি
- স্ক্রিপ্ট
- sdks
- নির্বিঘ্ন
- সার্চ
- সিয়াটেল
- নিরাপত্তা
- দেখ
- রেখাংশ
- জ্যেষ্ঠ
- পরিবেশন করা
- সেবা
- সেবা
- সেশন
- সেট
- শেয়ার
- উচিত
- দেখিয়েছেন
- একভাবে
- সহজ
- সরলীকৃত
- সিঙ্গাপুর
- একক
- ক্ষুদ্রতর
- সফটওয়্যার
- সফটওয়্যার উন্নয়ন
- সফ্টওয়্যার প্রকৌশল
- সলিউশন
- সমাধানে
- উৎস
- বক্তা
- বিশেষজ্ঞ
- নির্দিষ্ট
- নিদিষ্ট
- ব্যয় করা
- বিভক্ত করা
- স্থায়িত্ব
- স্থিতিশীল
- মান
- শুরু
- রাষ্ট্র-এর-শিল্প
- অবস্থা
- প্রারম্ভিক ব্যবহারের নির্দেশাবলী
- স্টোরেজ
- দোকান
- অকপট
- গবেষণায়
- নমন
- জমা
- পেশ
- সাবনেট
- এমন
- মামলা
- অনুসরণ
- সংক্ষিপ্তসার
- সমর্থন
- সমর্থক
- নিশ্চিত
- সিডনি
- সুসংগত.
- পদ্ধতি
- সিস্টেম
- টেবিল
- গ্রহণ করা
- কারিগরী
- দশ
- প্রান্তিক
- টেক্সাস
- চেয়ে
- যে
- সার্জারির
- তাদের
- তাহাদিগকে
- তারপর
- এইগুলো
- তারা
- এই
- হাজার হাজার
- দ্বারা
- সর্বত্র
- সময়
- থেকে
- আজ
- টোকেনাইজ
- টোকিও
- রেলগাড়ি
- প্রশিক্ষণ
- হস্তান্তর
- আদর্শ
- ধরনের
- অধীনে
- বিশ্ববিদ্যালয়
- টোকিও বিশ্ববিদ্যালয়
- আপডেট
- ব্যবহার
- ব্যবহৃত
- ব্যবহারকারী
- ব্যবহারকারী
- ব্যবহারসমূহ
- ব্যবহার
- উপযোগ
- ব্যবহার
- বিভিন্ন
- সুবিশাল
- সংস্করণ
- মাধ্যমে
- চেক
- ভার্জিনিয়া
- ভার্চুয়াল
- দেখুন
- , walkthrough
- ছিল
- উপায়..
- we
- ওয়েব
- ওয়েব সার্ভিস
- সপ্তাহ
- আমরা একটি
- কখন
- যে
- যখন
- ব্যাপকভাবে
- উইকিপিডিয়া
- ইচ্ছা
- সঙ্গে
- মধ্যে
- ছাড়া
- কাজ করছে
- কর্মী
- would
- আপনি
- আপনার
- zephyrnet