অ্যামাজন সেজমেকার পাইপলাইন ডেটা সায়েন্টিস্ট এবং মেশিন লার্নিং (ML) ইঞ্জিনিয়ারদের প্রশিক্ষণ কর্মপ্রবাহ স্বয়ংক্রিয় করার অনুমতি দেয়, যা আপনাকে দ্রুত পরীক্ষা-নিরীক্ষা এবং মডেল পুনঃপ্রশিক্ষণের জন্য মডেল ডেভেলপমেন্ট ধাপগুলি সাজানোর জন্য একটি পুনরাবৃত্তিযোগ্য প্রক্রিয়া তৈরি করতে সাহায্য করে। আপনি ডেটা প্রস্তুতি, বৈশিষ্ট্য প্রকৌশল, মডেল প্রশিক্ষণ, মডেল টিউনিং এবং মডেল যাচাইকরণ সহ সম্পূর্ণ মডেল বিল্ড ওয়ার্কফ্লো স্বয়ংক্রিয় করতে পারেন এবং মডেল রেজিস্ট্রিতে এটি ক্যাটালগ করতে পারেন। আপনি নিয়মিত বিরতিতে স্বয়ংক্রিয়ভাবে চালানোর জন্য পাইপলাইনগুলি কনফিগার করতে পারেন বা যখন নির্দিষ্ট ইভেন্টগুলি ট্রিগার হয়, অথবা আপনি প্রয়োজন অনুসারে সেগুলি নিজে চালাতে পারেন।
এই পোস্টে, আমরা কিছু বর্ধিতকরণ হাইলাইট করি আমাজন সেজমেকার SDK এবং Amazon SageMaker Pipelines-এর নতুন বৈশিষ্ট্যগুলি প্রবর্তন করে যা ML অনুশীলনকারীদের ML মডেলগুলি তৈরি এবং প্রশিক্ষণ দেওয়া সহজ করে তোলে৷
পাইপলাইনগুলি তার বিকাশকারীর অভিজ্ঞতাকে উদ্ভাবন করে চলেছে, এবং এই সাম্প্রতিক প্রকাশগুলির সাথে, আপনি এখন আরও কাস্টমাইজড উপায়ে পরিষেবাটি ব্যবহার করতে পারেন:
- 2.99.0, 2.101.1, 2.102.0, 2.104.0 - আপডেট ডকুমেন্টেশন চালু
PipelineVariable
অনুমানকারী, প্রসেসর, টিউনার, ট্রান্সফরমার এবং মডেল বেস ক্লাস, অ্যামাজন মডেল এবং ফ্রেমওয়ার্ক মডেলের জন্য ব্যবহার। এস্টিমেটর এবং প্রসেসরের সমস্ত সাবক্লাস সমর্থন করার জন্য SDK-এর নতুন সংস্করণগুলির সাথে অতিরিক্ত পরিবর্তন আসবে। - 2.90.0 - এর প্রাপ্যতা মডেল স্টেপ ইন্টিগ্রেটেড মডেল রিসোর্স তৈরি এবং রেজিস্ট্রেশন কাজের জন্য।
- 2.88.2 - এর প্রাপ্যতা পাইপলাইন সেশন SageMaker সত্তা এবং সম্পদের সাথে পরিচালিত মিথস্ক্রিয়া জন্য।
- 2.88.2 - এর জন্য সাবক্লাস সামঞ্জস্য ওয়ার্কফ্লো পাইপলাইন কাজের ধাপ তাই আপনি কাজের বিমূর্ততা তৈরি করতে পারেন এবং প্রক্রিয়াকরণ, প্রশিক্ষণ, রূপান্তর এবং টিউনিং কাজগুলি কনফিগার এবং চালাতে পারেন যেমন আপনি পাইপলাইন ছাড়াই করতে পারেন।
- 2.76.0 - এর প্রাপ্যতা ব্যর্থ পদক্ষেপ শর্তসাপেক্ষে একটি ব্যর্থতার অবস্থা সহ একটি পাইপলাইন বন্ধ করতে।
এই পোস্টে, আমরা পাইপলাইনের নতুন বৈশিষ্ট্যগুলি কীভাবে বাস্তবায়ন করতে হয় তা প্রদর্শন করতে মডেল বিল্ডিং এবং স্থাপনার উপর ফোকাস সহ একটি নমুনা ডেটাসেট ব্যবহার করে একটি কর্মপ্রবাহের মধ্য দিয়ে আপনাকে নিয়ে চলেছি। শেষ পর্যন্ত, এই নতুন বৈশিষ্ট্যগুলি সফলভাবে ব্যবহার করতে এবং আপনার ML কাজের চাপগুলিকে সহজ করার জন্য আপনার কাছে পর্যাপ্ত তথ্য থাকা উচিত।
বৈশিষ্ট্য ওভারভিউ
পাইপলাইনগুলি নিম্নলিখিত নতুন বৈশিষ্ট্যগুলি অফার করে:
- পাইপলাইন পরিবর্তনশীল টীকা - নির্দিষ্ট পদ্ধতির পরামিতি একাধিক ইনপুট প্রকার গ্রহণ করে, সহ
PipelineVariables
, এবং অতিরিক্ত ডকুমেন্টেশন যোগ করা হয়েছে যেখানে স্পষ্ট করার জন্যPipelineVariables
SageMaker SDK ডকুমেন্টেশনের সর্বশেষ স্থিতিশীল সংস্করণ এবং ফাংশনগুলির init স্বাক্ষর উভয়েই সমর্থিত। উদাহরণস্বরূপ, নিম্নলিখিত TensorFlow অনুমানকারীতে, init স্বাক্ষর এখন তা দেখায়model_dir
এবংimage_uri
সমর্থনPipelineVariables
, অন্য পরামিতি না যেখানে. আরো তথ্যের জন্য, পড়ুন টেনসরফ্লো এস্টিমেটর.- আগে:
- পরে:
- পাইপলাইন সেশন - পাইপলাইন সেশন SageMaker SDK জুড়ে একতা আনতে একটি নতুন ধারণা চালু করা হয়েছে এবং পাইপলাইন সংস্থানগুলির অলস প্রাথমিককরণের প্রবর্তন করে (রান কলগুলি ক্যাপচার করা হয় কিন্তু পাইপলাইন তৈরি না হওয়া পর্যন্ত চালানো হয় না)৷ দ্য
PipelineSession
প্রসঙ্গ উত্তরাধিকারসূত্রে প্রাপ্তSageMakerSession
এবং আপনার জন্য অন্যান্য সেজমেকার সত্তা এবং সংস্থানগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য সুবিধাজনক পদ্ধতি প্রয়োগ করে, যেমন প্রশিক্ষণের কাজ, এন্ডপয়েন্ট এবং ইনপুট ডেটাসেট সংরক্ষিত আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3)। - ওয়ার্কফ্লো পাইপলাইন কাজের ধাপের সাথে সাবক্লাস সামঞ্জস্য - আপনি এখন কাজের বিমূর্ততা তৈরি করতে পারেন এবং পাইপলাইন ছাড়াই আপনার মতো করে প্রক্রিয়াকরণ, প্রশিক্ষণ, রূপান্তর এবং টিউনিং কাজগুলি কনফিগার এবং চালাতে পারেন।
- উদাহরণস্বরূপ, এর সাথে একটি প্রক্রিয়াকরণ পদক্ষেপ তৈরি করা
SKLearnProcessor
পূর্বে নিম্নলিখিত প্রয়োজন: - আমরা আগের কোডে দেখতে পাই,
ProcessingStep
মূলত একই প্রিপ্রসেসিং লজিক করতে হবে.run
, কাজ শুরু করার জন্য API কল শুরু না করেই। কিন্তু সাবক্লাস সামঞ্জস্যের সাথে এখন ওয়ার্কফ্লো পাইপলাইন কাজের পদক্ষেপের সাথে সক্ষম করা হয়েছে, আমরা ঘোষণা করিstep_args
আর্গুমেন্ট যা .run এর সাথে প্রিপ্রসেসিং লজিক নেয় যাতে আপনি একটি কাজের বিমূর্ততা তৈরি করতে পারেন এবং এটিকে কনফিগার করতে পারেন যেভাবে আপনি এটি পাইপলাইন ছাড়াই ব্যবহার করবেন। আমরাও পাস করিpipeline_session
যা একটিPipelineSession
বস্তুর পরিবর্তেsagemaker_session
রান কলগুলি ক্যাপচার করা হয়েছে তা নিশ্চিত করতে কিন্তু পাইপলাইন তৈরি না হওয়া পর্যন্ত কল করা হয়নি। নিম্নলিখিত কোড দেখুন:
- উদাহরণস্বরূপ, এর সাথে একটি প্রক্রিয়াকরণ পদক্ষেপ তৈরি করা
- মডেল স্টেপ (মডেল তৈরি এবং রেজিস্ট্রেশন ধাপের সাথে একটি সুবিন্যস্ত পদ্ধতি) -পাইপলাইনগুলি সেজমেকার মডেলগুলির সাথে একীভূত করার জন্য দুটি ধাপের ধরন অফার করে:
CreateModelStep
এবংRegisterModel
. আপনি এখন শুধুমাত্র ব্যবহার করে উভয় অর্জন করতে পারেনModelStep
প্রকার উল্লেখ্য যে কPipelineSession
এটি অর্জনের জন্য প্রয়োজন। এটি পাইপলাইনের ধাপ এবং SDK-এর মধ্যে মিল নিয়ে আসে।- আগে:
-
- পরে:
- ব্যর্থ পদক্ষেপ (পাইপলাইন চালানোর শর্তসাপেক্ষ স্টপ) -
FailStep
যদি একটি শর্ত পূরণ করা হয়, যেমন মডেল স্কোর একটি নির্দিষ্ট থ্রেশহোল্ডের নিচে হলে একটি পাইপলাইন একটি ব্যর্থতার স্থিতি সহ বন্ধ করার অনুমতি দেয়৷
সমাধান ওভারভিউ
এই সমাধান, আপনার এন্ট্রি পয়েন্ট হল অ্যামাজন সেজমেকার স্টুডিও দ্রুত পরীক্ষার জন্য সমন্বিত উন্নয়ন পরিবেশ (IDE)। স্টুডিও এন্ড-টু-এন্ড পাইপলাইন অভিজ্ঞতা পরিচালনা করার জন্য একটি পরিবেশ সরবরাহ করে। স্টুডিও দিয়ে, আপনি বাইপাস করতে পারেন এডাব্লুএস ম্যানেজমেন্ট কনসোল আপনার সম্পূর্ণ কর্মপ্রবাহ ব্যবস্থাপনার জন্য। স্টুডিওর মধ্যে থেকে পাইপলাইন পরিচালনার বিষয়ে আরও তথ্যের জন্য, পড়ুন সেজমেকার স্টুডিওতে সেজমেকার পাইপলাইনগুলি দেখুন, ট্র্যাক করুন এবং কার্যকর করুন৷.
নিম্নলিখিত চিত্রটি নতুন বৈশিষ্ট্যগুলি ব্যবহার করে প্রশিক্ষণ এবং অনুমান তৈরি করার বিভিন্ন পদক্ষেপ সহ ML কর্মপ্রবাহের উচ্চ-স্তরের আর্কিটেকচারকে চিত্রিত করে।
পাইপলাইনে নিম্নলিখিত পদক্ষেপগুলি অন্তর্ভুক্ত রয়েছে:
- প্রয়োজনীয় বৈশিষ্ট্যগুলি তৈরি করতে এবং ট্রেন, বৈধতা এবং পরীক্ষার ডেটাসেটে ডেটা বিভক্ত করার জন্য ডেটা প্রিপ্রসেস করুন।
- SageMaker XGBoost ফ্রেমওয়ার্কের সাথে একটি প্রশিক্ষণের কাজ তৈরি করুন।
- পরীক্ষার ডেটাসেট ব্যবহার করে প্রশিক্ষিত মডেলের মূল্যায়ন করুন।
- AUC স্কোর পূর্বনির্ধারিত থ্রেশহোল্ডের উপরে কিনা তা পরীক্ষা করুন।
- AUC স্কোর থ্রেশহোল্ডের চেয়ে কম হলে, পাইপলাইন চালানো বন্ধ করুন এবং এটি ব্যর্থ হিসাবে চিহ্নিত করুন।
- যদি AUC স্কোর থ্রেশহোল্ডের চেয়ে বেশি হয়, একটি SageMaker মডেল তৈরি করুন এবং SageMaker মডেল রেজিস্ট্রিতে এটি নিবন্ধন করুন।
- পূর্ববর্তী ধাপে তৈরি মডেল ব্যবহার করে প্রদত্ত ডেটাসেটে ব্যাচ রূপান্তর প্রয়োগ করুন।
পূর্বশর্ত
এই পোস্টটি অনুসরণ করার জন্য, আপনার একটি AWS অ্যাকাউন্ট প্রয়োজন স্টুডিও ডোমেইন.
পাইপলাইনগুলি সরাসরি সেজমেকার সত্তা এবং সংস্থানগুলির সাথে একত্রিত করা হয়েছে, তাই আপনাকে অন্য কোনও AWS পরিষেবাগুলির সাথে ইন্টারঅ্যাক্ট করতে হবে না৷ আপনাকে কোনো সংস্থান পরিচালনা করতে হবে না কারণ এটি একটি সম্পূর্ণরূপে পরিচালিত পরিষেবা, যার অর্থ এটি আপনার জন্য সংস্থান তৈরি এবং পরিচালনা করে৷ স্টুডিওর ইন্টিগ্রেটেড কম্পোনেন্ট সহ বিভিন্ন সেজমেকার উপাদানগুলির বিষয়ে আরও তথ্যের জন্য দেখুন SageMaker পণ্য পাতা.
শুরু করার আগে, নিম্নলিখিত কোড স্নিপেট ব্যবহার করে স্টুডিও নোটবুকের মধ্যে SageMaker SDK সংস্করণ >= 2.104.0 এবং xlrd >=1.0.0 ইনস্টল করুন:
এমএল কর্মপ্রবাহ
এই পোস্টের জন্য, আপনি নিম্নলিখিত উপাদান ব্যবহার করুন:
- ডেটা প্রস্তুতি
- সেজমেকার প্রসেসিং - সেজমেকার প্রসেসিং একটি সম্পূর্ণরূপে পরিচালিত পরিষেবা যা আপনাকে ML কাজের চাপের জন্য কাস্টম ডেটা ট্রান্সফরমেশন এবং ফিচার ইঞ্জিনিয়ারিং চালানোর অনুমতি দেয়।
- মডেল ভবন
- মডেল প্রশিক্ষণ এবং মূল্যায়ন
- এক-ক্লিক প্রশিক্ষণ - সেজমেকার প্রশিক্ষণ বৈশিষ্ট্য বিতরণ করেছে। SageMaker ডেটা সমান্তরালতা এবং মডেল সমান্তরালতার জন্য বিতরণ করা প্রশিক্ষণ লাইব্রেরি প্রদান করে। লাইব্রেরিগুলি সেজমেকার প্রশিক্ষণ পরিবেশের জন্য অপ্টিমাইজ করা হয়েছে, আপনার বিতরণকৃত প্রশিক্ষণের কাজগুলিকে সেজমেকারের সাথে মানিয়ে নিতে এবং প্রশিক্ষণের গতি এবং থ্রুপুট উন্নত করতে সহায়তা করে৷
- সেজমেকার পরীক্ষা-নিরীক্ষা - পরীক্ষাগুলি হল সেজমেকারের একটি ক্ষমতা যা আপনাকে আপনার ML পুনরাবৃত্তিগুলি সংগঠিত করতে, ট্র্যাক করতে, তুলনা করতে এবং মূল্যায়ন করতে দেয়৷
- সেজমেকার ব্যাচের রূপান্তর - ব্যাচ ট্রান্সফর্ম বা অফলাইন স্কোরিং হল সেজমেকারে একটি পরিচালিত পরিষেবা যা আপনাকে আপনার এমএল মডেলগুলি ব্যবহার করে একটি বড় ডেটাসেটের পূর্বাভাস দিতে দেয়৷
- ওয়ার্কফ্লো অর্কেস্ট্রেশন
একটি সেজমেকার পাইপলাইন হল একটি JSON পাইপলাইন সংজ্ঞা দ্বারা সংজ্ঞায়িত আন্তঃসংযুক্ত পদক্ষেপগুলির একটি সিরিজ। এটি একটি নির্দেশিত অ্যাসাইক্লিক গ্রাফ (DAG) ব্যবহার করে একটি পাইপলাইন এনকোড করে। DAG পাইপলাইনের প্রতিটি ধাপের জন্য প্রয়োজনীয়তা এবং সম্পর্কের তথ্য দেয় এবং এর গঠন ধাপগুলির মধ্যে ডেটা নির্ভরতা দ্বারা নির্ধারিত হয়। এই নির্ভরতাগুলি তৈরি হয় যখন একটি ধাপের আউটপুটের বৈশিষ্ট্যগুলি অন্য ধাপে ইনপুট হিসাবে পাস করা হয়।
নিচের চিত্রটি সেজমেকার পাইপলাইনের বিভিন্ন ধাপকে চিত্রিত করে (একটি মন্থন পূর্বাভাস ব্যবহারের ক্ষেত্রে) যেখানে ধাপগুলির মধ্যে সংযোগগুলি সেজমেকার দ্বারা অনুমান করা হয় ধাপের সংজ্ঞা দ্বারা সংজ্ঞায়িত ইনপুট এবং আউটপুটগুলির উপর ভিত্তি করে৷
পরবর্তী বিভাগগুলি পাইপলাইনের প্রতিটি ধাপ তৈরি করে এবং একবার তৈরি হয়ে গেলে পুরো পাইপলাইনটি চালানোর মধ্য দিয়ে চলে।
প্রকল্পের কাঠামো
প্রকল্পের কাঠামো দিয়ে শুরু করা যাক:
- /sm-পাইপলাইন-এন্ড-টু-এন্ড-উদাহরণ - প্রকল্পের নাম
- / তথ্য - ডেটাসেট
- /পাইপলাইন - পাইপলাইনের উপাদানগুলির জন্য কোড ফাইল
- /গ্রাহক মন্থন
- preprocess.py
- evaluate.py
- /গ্রাহক মন্থন
- sagemaker-pipelines-project.ipynb - পাইপলাইনের নতুন বৈশিষ্ট্যগুলি ব্যবহার করে মডেলিং কর্মপ্রবাহের মধ্য দিয়ে চলা একটি নোটবুক৷
ডেটাসেট ডাউনলোড করুন
এই পোস্টটি অনুসরণ করতে, আপনাকে ডাউনলোড করে সংরক্ষণ করতে হবে নমুনা ডেটাসেট প্রকল্প হোম ডিরেক্টরির মধ্যে ডেটা ফোল্ডারের অধীনে, যা ফাইলটিকে সংরক্ষণ করে আমাজন ইলাস্টিক ফাইল সিস্টেম (Amazon EFS) স্টুডিও পরিবেশের মধ্যে।
পাইপলাইনের উপাদানগুলি তৈরি করুন
এখন আপনি পাইপলাইনের উপাদানগুলি তৈরি করতে প্রস্তুত৷
বিবৃতি আমদানি করুন এবং প্যারামিটার এবং ধ্রুবক ঘোষণা করুন
নামে একটি স্টুডিও নোটবুক তৈরি করুন sagemaker-pipelines-project.ipynb
প্রোজেক্ট হোম ডিরেক্টরির মধ্যে। একটি কক্ষে নিম্নলিখিত কোড ব্লক লিখুন, এবং সেজমেকার এবং S3 ক্লায়েন্ট অবজেক্ট সেট আপ করতে সেলটি চালান, তৈরি করুন PipelineSession
, এবং সেজমেকার সেশনের সাথে আসা ডিফল্ট বালতি ব্যবহার করে S3 বালতি অবস্থান সেট আপ করুন:
পাইপলাইন প্যারামিটারাইজেশন সমর্থন করে, যা আপনাকে আপনার পাইপলাইন কোড পরিবর্তন না করে রানটাইমে ইনপুট পরামিতি নির্দিষ্ট করতে দেয়। আপনি অধীনে উপলব্ধ মডিউল ব্যবহার করতে পারেন sagemaker.workflow.parameters
মডিউল, যেমন ParameterInteger
, ParameterFloat
, এবং ParameterString
, বিভিন্ন ধরনের ডেটার পাইপলাইন পরামিতি নির্দিষ্ট করতে। একাধিক ইনপুট পরামিতি সেট আপ করতে নিম্নলিখিত কোড চালান:
একটি ব্যাচ ডেটাসেট তৈরি করুন
ব্যাচ ডেটাসেট তৈরি করুন, যা আপনি পরে ব্যাচ ট্রান্সফর্ম ধাপে ব্যবহার করবেন:
একটি S3 বালতিতে ডেটা আপলোড করুন
Amazon S3 এ ডেটাসেট আপলোড করুন:
একটি প্রক্রিয়াকরণ স্ক্রিপ্ট এবং প্রক্রিয়াকরণ পদক্ষেপ সংজ্ঞায়িত করুন
এই ধাপে, আপনি বৈশিষ্ট্য ইঞ্জিনিয়ারিং, একটি হট এনকোডিং করার জন্য একটি পাইথন স্ক্রিপ্ট প্রস্তুত করেন এবং মডেল বিল্ডিংয়ের জন্য ব্যবহার করা প্রশিক্ষণ, বৈধতা এবং পরীক্ষা বিভাজনগুলিকে কিউরেট করেন। আপনার প্রসেসিং স্ক্রিপ্ট তৈরি করতে নিম্নলিখিত কোডটি চালান:
এর পরে, প্রসেসরকে ইনস্ট্যান্টিয়েট করতে নিম্নলিখিত কোড ব্লকটি চালান এবং প্রক্রিয়াকরণ স্ক্রিপ্ট চালানোর জন্য পাইপলাইন ধাপটি চালান। কারণ প্রক্রিয়াকরণ স্ক্রিপ্টটি পান্ডাসে লেখা হয়, আপনি একটি ব্যবহার করেন SKLearnProcessor. পাইপলাইন ProcessingStep
ফাংশন নিম্নলিখিত আর্গুমেন্টগুলি নেয়: প্রসেসর, কাঁচা ডেটাসেটের জন্য ইনপুট S3 অবস্থান এবং প্রক্রিয়াকৃত ডেটাসেটগুলি সংরক্ষণ করতে আউটপুট S3 অবস্থানগুলি।
একটি প্রশিক্ষণ পদক্ষেপ সংজ্ঞায়িত করুন
একটি SageMaker XGBoost অনুমানকারী এবং পাইপলাইন ব্যবহার করে মডেল প্রশিক্ষণ সেট আপ করুন৷ TrainingStep
ফাংশন:
মূল্যায়ন স্ক্রিপ্ট এবং মডেল মূল্যায়ন ধাপ সংজ্ঞায়িত করুন
প্রশিক্ষিত হয়ে গেলে মডেলটি মূল্যায়ন করতে নিম্নলিখিত কোড ব্লকটি চালান। AUC স্কোর নির্দিষ্ট থ্রেশহোল্ড পূরণ করে কিনা তা পরীক্ষা করার জন্য এই স্ক্রিপ্টটি যুক্তিকে এনক্যাপসুলেট করে।
এরপরে, প্রসেসরকে ইনস্ট্যান্টিয়েট করতে নিম্নলিখিত কোড ব্লকটি চালান এবং মূল্যায়ন স্ক্রিপ্ট চালানোর জন্য পাইপলাইন ধাপটি চালান। কারণ মূল্যায়ন স্ক্রিপ্ট XGBoost প্যাকেজ ব্যবহার করে, আপনি একটি ব্যবহার করেন ScriptProcessor
XGBoost ইমেজ সহ। পাইপলাইন ProcessingStep
ফাংশন নিম্নলিখিত আর্গুমেন্টগুলি নেয়: প্রসেসর, কাঁচা ডেটাসেটের জন্য ইনপুট S3 অবস্থান এবং প্রক্রিয়াকৃত ডেটাসেটগুলি সংরক্ষণ করতে আউটপুট S3 অবস্থানগুলি।
একটি তৈরি মডেল ধাপ সংজ্ঞায়িত করুন
পাইপলাইন মডেল ধাপ ব্যবহার করে একটি সেজমেকার মডেল তৈরি করতে নিম্নলিখিত কোড ব্লকটি চালান। এই ধাপটি প্রশিক্ষণ ধাপের আউটপুট ব্যবহার করে স্থাপনার জন্য মডেল প্যাকেজ করে। নোট করুন যে ইনস্ট্যান্স টাইপ আর্গুমেন্টের মানটি আপনার পোস্টে আগে সংজ্ঞায়িত পাইপলাইন প্যারামিটার ব্যবহার করে পাস করা হয়েছে।
একটি ব্যাচ রূপান্তর পদক্ষেপ সংজ্ঞায়িত করুন
প্রথম ধাপে তৈরি ব্যাচ ইনপুট সহ প্রশিক্ষিত মডেল ব্যবহার করে ব্যাচ রূপান্তর চালানোর জন্য নিম্নলিখিত কোড ব্লকটি চালান:
একটি রেজিস্টার মডেল ধাপ সংজ্ঞায়িত করুন
নিম্নলিখিত কোডটি পাইপলাইন মডেল ধাপ ব্যবহার করে সেজমেকার মডেল রেজিস্ট্রির মধ্যে মডেলটিকে নিবন্ধন করে:
পাইপলাইন বন্ধ করার জন্য একটি ব্যর্থ পদক্ষেপ সংজ্ঞায়িত করুন
যদি AUC স্কোর সংজ্ঞায়িত থ্রেশহোল্ড পূরণ না করে তবে নিম্নলিখিত কোডটি একটি ত্রুটি বার্তা সহ পাইপলাইন চালানো বন্ধ করতে পাইপলাইন ব্যর্থ পদক্ষেপকে সংজ্ঞায়িত করে:
AUC স্কোর পরীক্ষা করার জন্য একটি শর্ত ধাপ সংজ্ঞায়িত করুন
নিম্নলিখিত কোডটি AUC স্কোর পরীক্ষা করার জন্য একটি শর্তের ধাপ সংজ্ঞায়িত করে এবং শর্তসাপেক্ষে একটি মডেল তৈরি করে এবং একটি ব্যাচ রূপান্তর চালাতে এবং মডেল রেজিস্ট্রিতে একটি মডেল নিবন্ধন করে, অথবা একটি ব্যর্থ অবস্থায় পাইপলাইন চালানো বন্ধ করে:
পাইপলাইন তৈরি করুন এবং চালান
সমস্ত উপাদান পদক্ষেপগুলি সংজ্ঞায়িত করার পরে, আপনি সেগুলিকে একটি পাইপলাইন অবজেক্টে একত্রিত করতে পারেন। আপনাকে পাইপলাইনের ক্রম নির্দিষ্ট করতে হবে না কারণ পাইপলাইনগুলি স্বয়ংক্রিয়ভাবে ধাপগুলির মধ্যে নির্ভরতার উপর ভিত্তি করে অর্ডার ক্রম অনুমান করে।
আপনার নোটবুকের একটি ঘরে নিম্নলিখিত কোডটি চালান। যদি পাইপলাইনটি ইতিমধ্যেই বিদ্যমান থাকে, কোডটি পাইপলাইন আপডেট করে। পাইপলাইন বিদ্যমান না থাকলে, এটি একটি নতুন তৈরি করে।
উপসংহার
এই পোস্টে, আমরা মন্থন পূর্বাভাসের জন্য একটি মডেল বিকাশ, পুনরাবৃত্তি এবং স্থাপন করার জন্য অন্যান্য অন্তর্নির্মিত সেজমেকার বৈশিষ্ট্য এবং XGBoost অ্যালগরিদম সহ পাইপলাইনগুলির সাথে এখন উপলব্ধ কিছু নতুন বৈশিষ্ট্যগুলি উপস্থাপন করেছি। সমাধানটি অতিরিক্ত ডেটা উত্স দিয়ে প্রসারিত করা যেতে পারে
আপনার নিজের এমএল ওয়ার্কফ্লো বাস্তবায়ন করতে। পাইপলাইন ওয়ার্কফ্লোতে উপলব্ধ পদক্ষেপগুলি সম্পর্কে আরও বিশদ বিবরণের জন্য, পড়ুন আমাজন সেজমেকার মডেল বিল্ডিং পাইপলাইন এবং সেজমেকার ওয়ার্কফ্লোস. দ্য AWS SageMaker উদাহরণ GitHub রেপোতে পাইপলাইন ব্যবহার করে বিভিন্ন ব্যবহারের ক্ষেত্রে আরও উদাহরণ রয়েছে।
লেখক সম্পর্কে
জেরি পেং AWS SageMaker এর একজন সফটওয়্যার ডেভেলপমেন্ট ইঞ্জিনিয়ার। তিনি প্রশিক্ষণ থেকে শুরু করে উৎপাদনে মডেল মনিটরিং পর্যন্ত এন্ড-টু-এন্ড বৃহৎ-স্কেল MLOps সিস্টেম তৈরির দিকে মনোনিবেশ করেন। তিনি আরও বৃহত্তর শ্রোতাদের কাছে MLOps-এর ধারণা নিয়ে আসার বিষয়ে উত্সাহী।
ডিউয়েন কিউই AWS-এর একজন সফটওয়্যার ডেভেলপমেন্ট ইঞ্জিনিয়ার। তিনি বর্তমানে সেজমেকার পাইপলাইন উন্নয়ন এবং উন্নতিতে মনোনিবেশ করেন। কাজের বাইরে, তিনি সেলো অনুশীলন উপভোগ করেন।
গায়ত্রী ঘনাকোটা AWS পেশাদার পরিষেবা সহ একজন সিনিয়র মেশিন লার্নিং ইঞ্জিনিয়ার। তিনি বিভিন্ন ডোমেন জুড়ে AI/ML সমাধানগুলি বিকাশ, স্থাপন এবং ব্যাখ্যা করার বিষয়ে উত্সাহী। এই ভূমিকার আগে, তিনি আর্থিক এবং খুচরা জায়গায় শীর্ষ বিশ্বব্যাপী সংস্থাগুলির সাথে ডেটা বিজ্ঞানী এবং এমএল ইঞ্জিনিয়ার হিসাবে একাধিক উদ্যোগের নেতৃত্ব দিয়েছিলেন। তিনি কলোরাডো ইউনিভার্সিটি, বোল্ডার থেকে ডেটা সায়েন্সে বিশেষায়িত কম্পিউটার সায়েন্সে স্নাতকোত্তর ডিগ্রি অর্জন করেছেন।
রুপিন্দর গ্রেওয়াল AWS সহ একজন Sr Ai/ML বিশেষজ্ঞ সমাধান স্থপতি। তিনি বর্তমানে সেজমেকারে মডেল এবং এমএলওপ পরিবেশন করার দিকে মনোনিবেশ করেন। এই ভূমিকার আগে তিনি মেশিন লার্নিং ইঞ্জিনিয়ার বিল্ডিং এবং হোস্টিং মডেল হিসাবে কাজ করেছেন। কাজের বাইরে সে টেনিস খেলা এবং পাহাড়ের পথে বাইক চালানো উপভোগ করে।
রে লি AWS প্রফেশনাল সার্ভিসের সাথে একজন সিনিয়র ডেটা সায়েন্টিস্ট। তার বিশেষত্ব স্টার্টআপ থেকে শুরু করে এন্টারপ্রাইজ সংস্থা পর্যন্ত বিভিন্ন আকারের গ্রাহকদের জন্য এআই/এমএল সমাধান তৈরি এবং কার্যকর করার উপর দৃষ্টি নিবদ্ধ করে। কাজের বাইরে, রায় ফিটনেস এবং ভ্রমণ উপভোগ করেন।
- AI
- ai শিল্প
- এআই আর্ট জেনারেটর
- আইআই রোবট
- আমাজন সেজমেকার
- কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম বুদ্ধিমত্তা সার্টিফিকেশন
- ব্যাংকিং এ কৃত্রিম বুদ্ধিমত্তা
- কৃত্রিম বুদ্ধিমত্তার রোবট
- কৃত্রিম বুদ্ধিমত্তার রোবট
- কৃত্রিম বুদ্ধিমত্তা সফ্টওয়্যার
- এডাব্লুএস মেশিন লার্নিং
- blockchain
- ব্লকচেইন সম্মেলন এআই
- coingenius
- কথোপকথন কৃত্রিম বুদ্ধিমত্তা
- ক্রিপ্টো সম্মেলন এআই
- ডাল-ই
- গভীর জ্ঞানার্জন
- গুগল আই
- মেশিন লার্নিং
- Plato
- প্লেটো এআই
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটো গেম
- প্লেটোডাটা
- প্লেটোগেমিং
- স্কেল ai
- বাক্য গঠন
- zephyrnet