Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence দ্বারা চালিত নোটবুকের জন্য ইন্টারেক্টিভ ডেটা প্রিপ উইজেট। উল্লম্ব অনুসন্ধান. আ.

Amazon SageMaker Data Wrangler দ্বারা চালিত নোটবুকের জন্য ইন্টারেক্টিভ ডেটা প্রিপ উইজেট

অ্যানাকোন্ডা দ্বারা পরিচালিত ডেটা বিজ্ঞানীদের 2020 সালের একটি সমীক্ষা অনুসারে, মেশিন লার্নিং (ML) এবং ডেটা অ্যানালিটিক্স ওয়ার্কফ্লোতে ডেটা প্রস্তুতি অন্যতম গুরুত্বপূর্ণ পদক্ষেপ এবং ডেটা বিজ্ঞানীদের জন্য প্রায়শই খুব সময় সাপেক্ষ৷ ডেটা বিজ্ঞানীরা তাদের প্রায় 66% সময় ডেটা প্রস্তুতি এবং বিশ্লেষণের কাজে ব্যয় করেন, যার মধ্যে লোড করা (19%), পরিষ্কার করা (26%) এবং ডেটা ভিজ্যুয়ালাইজ করা (21%) রয়েছে।

অ্যামাজন সেজমেকার স্টুডিও ML-এর জন্য প্রথম সম্পূর্ণ সমন্বিত উন্নয়ন পরিবেশ (IDE)। একটি একক ক্লিকে, ডেটা বিজ্ঞানী এবং বিকাশকারীরা দ্রুত ঘুরতে পারে স্টুডিও নোটবুক ডেটাসেট অন্বেষণ করতে এবং মডেল তৈরি করতে। আপনি যদি একটি GUI-ভিত্তিক এবং ইন্টারেক্টিভ ইন্টারফেস পছন্দ করেন, আপনি ব্যবহার করতে পারেন অ্যামাজন সেজমেকার ডেটা র্যাংলার, 300 টিরও বেশি বিল্ট ইন ভিজ্যুয়ালাইজেশন, বিশ্লেষণ এবং রূপান্তরগুলি দক্ষতার সাথে স্পার্ক দ্বারা সমর্থিত ডেটা প্রক্রিয়া করার জন্য কোডের একটি লাইন না লিখে।

ডেটা র‍্যাংলার এখন একটি অন্তর্নির্মিত ডেটা প্রস্তুতির ক্ষমতা প্রদান করে অ্যামাজন সেজমেকার স্টুডিও নোটবুক যা ML অনুশীলনকারীদের দৃশ্যত ডেটা বৈশিষ্ট্যগুলি পর্যালোচনা করতে, সমস্যাগুলি সনাক্ত করতে এবং ডেটা-গুণমানের সমস্যাগুলি সমাধান করতে দেয় — সরাসরি নোটবুকের মধ্যে মাত্র কয়েকটি ক্লিকে৷

এই পোস্টে, আমরা আপনাকে দেখাতে কিভাবে ডেটা র‍্যাংলার ডেটা প্রিপ উইজেট স্বয়ংক্রিয়ভাবে একটি পান্ডাস ডেটা ফ্রেমের উপরে কী ভিজ্যুয়ালাইজেশন তৈরি করে ডেটা বিতরণ বোঝার জন্য, ডেটা মানের সমস্যাগুলি সনাক্ত করতে এবং প্রতিটি বৈশিষ্ট্যের জন্য আউটলারের মতো পৃষ্ঠের ডেটা অন্তর্দৃষ্টিগুলি। এটি ডেটার সাথে ইন্টারঅ্যাক্ট করতে এবং অন্তর্দৃষ্টিগুলি আবিষ্কার করতে সহায়তা করে যা অ্যাডহক অনুসন্ধানের সাথে অলক্ষিত হতে পারে। এটি প্রতিকারের জন্য রূপান্তরগুলি সুপারিশ করে, আপনাকে UI-তে ডেটা রূপান্তর প্রয়োগ করতে এবং নোটবুক কোষগুলিতে স্বয়ংক্রিয়ভাবে কোড তৈরি করতে সক্ষম করে৷ এই বৈশিষ্ট্যটি সমস্ত অঞ্চলে উপলব্ধ যেখানে সেজমেকার স্টুডিও উপলব্ধ।

সমাধান ওভারভিউ

আসুন আরও বুঝতে পারি কীভাবে এই নতুন উইজেট ডেটা অন্বেষণকে উল্লেখযোগ্যভাবে সহজ করে তোলে এবং ডেটা ইঞ্জিনিয়ার এবং অনুশীলনকারীদের জন্য সামগ্রিক ডেটা প্রস্তুতির অভিজ্ঞতা উন্নত করার জন্য একটি বিরামহীন অভিজ্ঞতা প্রদান করে। আমাদের ব্যবহারের ক্ষেত্রে, আমরা এর একটি পরিবর্তিত সংস্করণ ব্যবহার করি টাইটানিক ডেটাসেট, ML সম্প্রদায়ের একটি জনপ্রিয় ডেটাসেট, যা এখন a হিসাবে যোগ করা হয়েছে৷ নমুনা ডেটাসেট তাই আপনি দ্রুত সেজমেকার ডেটা র্যাংলার দিয়ে শুরু করতে পারেন। মূল ডেটাসেট থেকে প্রাপ্ত করা হয়েছে OpenML, এবং এই ডেমোর জন্য Amazon দ্বারা সিন্থেটিক ডেটা মানের সমস্যা যুক্ত করার জন্য সংশোধন করা হয়েছে। আপনি পাবলিক S3 পাথ থেকে ডেটাসেটের পরিবর্তিত সংস্করণ ডাউনলোড করতে পারেন s3://sagemaker-sample-files/datasets/tabular/dirty-titanic/titanic-dirty-4.csv.

পূর্বশর্ত

এই পোস্টে বর্ণিত সমস্ত বৈশিষ্ট্যের সাথে হ্যান্ডস-অন অভিজ্ঞতা পেতে, নিম্নলিখিত পূর্বশর্তগুলি সম্পূর্ণ করুন:

  1. আপনার একটি AWS অ্যাকাউন্ট আছে তা নিশ্চিত করুন, এর মাধ্যমে অ্যাকাউন্টে লগ ইন করার জন্য নিরাপদ অ্যাক্সেস এডাব্লুএস ম্যানেজমেন্ট কনসোল, এবং এডাব্লুএস আইডেন্টিটি এবং অ্যাক্সেস ম্যানেজমেন্ট (IAM) ব্যবহারের অনুমতি আমাজন সেজমেকার এবং আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3) সম্পদ।
  2. পাবলিক S3 পাথ থেকে নমুনা ডেটাসেট ব্যবহার করুন s3://sagemaker-sample-files/datasets/tabular/dirty-titanic/titanic-dirty-4.csv বা বিকল্পভাবে এটি একটি S3 বালতিতে আপলোড করুন আপনার অ্যাকাউন্টে।
  3. একটি SageMaker ডোমেনে অনবোর্ড এবং নোটবুক ব্যবহার করতে স্টুডিও অ্যাক্সেস করুন। নির্দেশাবলীর জন্য, পড়ুন Amazon SageMaker ডোমেনে অনবোর্ড. আপনি যদি বিদ্যমান স্টুডিও ব্যবহার করেন, তাহলে আপগ্রেড করুন স্টুডিওর সর্বশেষ সংস্করণ.

ডেটা এক্সপ্লোরেশন উইজেট সক্রিয় করুন

আপনি যখন পান্ডাস ডেটা ফ্রেম ব্যবহার করছেন, স্টুডিও নোটবুক ব্যবহারকারীরা ম্যানুয়ালি ডেটা এক্সপ্লোরেশন উইজেট সক্ষম করতে পারেন যাতে প্রতিটি কলামের উপরে ডিফল্টরূপে নতুন ভিজ্যুয়ালাইজেশন প্রদর্শিত হয়। উইজেটটি সংখ্যাসূচক ডেটার জন্য একটি হিস্টোগ্রাম এবং অন্যান্য ধরণের ডেটার জন্য একটি বার চার্ট দেখায়। এই উপস্থাপনাগুলি আপনাকে প্রতিটি এবং প্রতিটি কলামের জন্য বয়লারপ্লেট পদ্ধতিগুলি লিখতে ছাড়াই ডেটা বিতরণকে দ্রুত বুঝতে এবং অনুপস্থিত মান এবং আউটলায়ারগুলি আবিষ্কার করতে দেয়। ডিস্ট্রিবিউশনের দ্রুত বোঝার জন্য আপনি প্রতিটি ভিজ্যুয়ালের বারের উপরে ঘুরতে পারেন।

স্টুডিও খুলুন এবং একটি নতুন পাইথন 3 নোটবুক তৈরি করুন। নির্বাচন নিশ্চিত করুন ডেটা সায়েন্স 3.0 ক্লিক করে SageMaker ইমেজ থেকে ছবি পরিবেশ পরিবর্তন করুন বোতাম.

নিম্নলিখিত চিত্রগুলিতে ডেটা অনুসন্ধান উইজেট উপলব্ধ। ডিফল্ট সেজমেকার চিত্রগুলির তালিকার জন্য, পড়ুন অ্যামাজন সেজমেকার ইমেজ উপলব্ধ.

  • পাইথন 3 (ডেটা সায়েন্স) পাইথন 3.7 সহ
  • পাইথন 3 (ডেটা সায়েন্স 2.0) পাইথন 3.8 সহ
  • পাইথন 3 (ডেটা সায়েন্স 3.0) পাইথন 3.10 সহ
  • স্পার্ক অ্যানালিটিক্স 1.0 এবং 2.0

এই উইজেটটি ব্যবহার করতে, আমদানি করুন SageMaker_DataWrangler লাইব্রেরি থেকে টাইটানিক ডেটাসেটের পরিবর্তিত সংস্করণ লোড করুন S3://sagemaker-sample-files/datasets/tabular/dirty-titanic/titanic-dirty-4.csv এবং পান্ডাস লাইব্রেরির সাথে CSV পড়ুন:

import pandas as pd
import boto3
import io
import sagemaker_datawrangler

s3 = boto3.client('s3')
obj = s3.get_object(Bucket='sagemaker-sample-files', Key='datasets/tabular/dirty-titanic/titanic-dirty-4.csv')
df = pd.read_csv(io.BytesIO(obj['Body'].read()))

ডেটা র্যাংলার ডেটা প্রিপ উইজেট - উদাহরণ নোটবুক

ডেটা ভিজ্যুয়ালাইজ করুন

পান্ডাস ডেটা ফ্রেমে ডেটা লোড হওয়ার পরে, আপনি কেবল ব্যবহার করে ডেটা দেখতে পারেন df or display(df). সারি তালিকাভুক্ত করার পাশাপাশি, ডেটা প্রিপ উইজেট অন্তর্দৃষ্টি, ভিজ্যুয়ালাইজেশন এবং ডেটা গুণমানের বিষয়ে পরামর্শ তৈরি করে। বৈশিষ্ট্য এবং লক্ষ্য অন্তর্দৃষ্টি, বিতরণ তথ্য, বা ডেটা গুণমান পরীক্ষা রেন্ডার করার জন্য আপনাকে কোনও অতিরিক্ত কোড লিখতে হবে না। আপনি ডেটা ফ্রেম টেবিলের শিরোনাম চয়ন করতে পারেন পরিসংখ্যানগত সারাংশ দেখতে, যদি থাকে ডেটা গুণমান সতর্কতা দেখায়৷

ডেটা কল্পনা করুন

প্রতিটি কলাম ডেটা টাইপের উপর ভিত্তি করে একটি বার চার্ট বা হিস্টোগ্রাম দেখায়। ডিফল্টরূপে, অর্থপূর্ণ অন্তর্দৃষ্টি তৈরির জন্য উইজেট 10,000 পর্যন্ত পর্যবেক্ষণের নমুনা দেয়। এটি সমগ্র ডেটাসেটে অন্তর্দৃষ্টি বিশ্লেষণ চালানোর বিকল্পও প্রদান করে।

নিম্নলিখিত স্ক্রিনশটে দেখানো হয়েছে, এই উইজেটটি সনাক্ত করে যে একটি কলামে শ্রেণীগত বা পরিমাণগত ডেটা আছে কিনা।

শ্রেণীগত বা পরিমাণগত তথ্য

সুনির্দিষ্ট তথ্যের জন্য, উইজেটটি সমস্ত বিভাগ সহ বার চার্ট তৈরি করে। নিম্নলিখিত স্ক্রিনশটে, উদাহরণস্বরূপ, কলাম Sex তথ্যের বিভাগগুলি চিহ্নিত করে। আপনি বারের উপর হোভার করতে পারেন (পুরুষ এই ক্ষেত্রে) এই বিভাগগুলির বিশদ বিবরণ দেখতে, যেমন মান সহ সারির মোট সংখ্যা male এবং মোট ভিজ্যুয়ালাইজড ডেটাসেটে এর বিতরণ (এই উদাহরণে 64.07%)। এটি শ্রেণীবদ্ধ ডেটার জন্য একটি ভিন্ন রঙে অনুপস্থিত মানগুলির মোট শতাংশ হাইলাইট করে। যেমন পরিমাণগত তথ্য জন্য ticket কলাম, এটি অবৈধ মানগুলির শতাংশের সাথে বিতরণ দেখায়।

আপনি যদি নোটবুকে একটি স্ট্যান্ডার্ড পান্ডাস ভিজ্যুয়ালাইজেশন দেখতে চান তবে আপনি বেছে নিতে পারেন পান্ডা টেবিল দেখুন এবং উইজেট এবং পান্ডা প্রতিনিধিত্বের মধ্যে টগল করুন, যেমনটি নিম্নলিখিত স্ক্রিনশটে দেখানো হয়েছে।

পান্ডা টেবিল দেখুন

ডাটা র্যাংলার টেবিল দেখুন

কলামের ডেটা সম্পর্কে আরও বিস্তারিত অন্তর্দৃষ্টি পেতে, কলামের জন্য নিবেদিত একটি পার্শ্ব প্যানেল খুলতে কলামের শিরোনামটি বেছে নিন। এখানে আপনি দুটি ট্যাব পর্যবেক্ষণ করতে পারেন: অন্তর্দৃষ্টিগুলির এবং উপাত্ত গুণমান.

অন্তর্দৃষ্টি এবং ডেটা গুণমান

নিম্নলিখিত বিভাগে, আমরা এই দুটি বিকল্পকে আরও বিশদে অন্বেষণ করি।

অন্তর্দৃষ্টিগুলির

সার্জারির অন্তর্দৃষ্টিগুলির ট্যাব প্রতিটি কলামের জন্য বিবরণ সহ বিশদ প্রদান করে। এই বিভাগে সমষ্টিগত পরিসংখ্যানগুলি তালিকাভুক্ত করা হয়েছে, যেমন মোড, অনন্যের সংখ্যা, অনুপাত এবং অনুপস্থিত/অবৈধ মানগুলির জন্য গণনা ইত্যাদি, সেইসাথে হিস্টোগ্রাম বা একটি বার চার্টের সাহায্যে ডেটা বন্টন কল্পনা করে৷ নিম্নলিখিত স্ক্রিনশটগুলিতে, আপনি নির্বাচিত কলামের জন্য তৈরি করা সহজে বোধগম্য ভিজ্যুয়ালাইজেশন সহ প্রদর্শিত ডেটা অন্তর্দৃষ্টি এবং বিতরণ তথ্য পরীক্ষা করতে পারেন survived.

উপাত্ত গুণমান

স্টুডিও ডেটা প্রিপ উইজেট হেডারে সতর্কীকরণ চিহ্ন সহ চিহ্নিত ডেটা মানের সমস্যাগুলি হাইলাইট করে। উইজেট মৌলিক (অনুপস্থিত মান, ধ্রুবক কলাম, ইত্যাদি) থেকে আরও ML নির্দিষ্ট (লক্ষ্য ফাঁস, কম ভবিষ্যদ্বাণীমূলক স্কোর বৈশিষ্ট্য, ইত্যাদি) পর্যন্ত ডেটা গুণমানের সমস্যাগুলির সম্পূর্ণ বর্ণালী সনাক্ত করতে পারে। উইজেট কক্ষগুলিকে হাইলাইট করে যা ডেটার গুণমানের সমস্যা সৃষ্টি করে এবং সমস্যাযুক্ত কক্ষগুলিকে শীর্ষে রাখার জন্য সারিগুলিকে পুনর্গঠিত করে৷ ডেটা মানের সমস্যা সমাধানের জন্য উইজেট একটি বোতামে ক্লিক করলে প্রযোজ্য বেশ কয়েকটি ট্রান্সফরমার সরবরাহ করে।

ডেটা গুণমান বিভাগটি অন্বেষণ করতে, কলাম শিরোনামটি চয়ন করুন এবং পাশের প্যানেলে, নির্বাচন করুন৷ উপাত্ত গুণমান ট্যাব আপনি আপনার স্টুডিও পরিবেশে নিম্নলিখিত দেখতে হবে.

ডেটা মানের ট্যাব

এর উপর উপলব্ধ বিভিন্ন বিকল্প তাকান উপাত্ত গুণমান ট্যাব এই উদাহরণের জন্য, আমরা বয়সের কলামটি বেছে নিই, যা ডেটার উপর ভিত্তি করে একটি পরিমাণগত কলাম হিসাবে সনাক্ত করা হয়। আমরা নিম্নলিখিত স্ক্রিনশটটিতে দেখতে পাচ্ছি, এই উইজেটটি বিভিন্ন ধরণের রূপান্তরের পরামর্শ দেয় যা আপনি প্রয়োগ করতে পারেন, সবচেয়ে সাধারণ ক্রিয়াগুলি সহ, যেমন নতুন মান দিয়ে প্রতিস্থাপন করুন, ড্রপ অনুপস্থিত, মধ্যমা দিয়ে প্রতিস্থাপন করুন, বা গড় দিয়ে প্রতিস্থাপন করুন. ব্যবহারের ক্ষেত্রে (আপনি যে এমএল সমস্যাটি সমাধান করার চেষ্টা করছেন) এর উপর ভিত্তি করে আপনি আপনার ডেটাসেটের জন্য সেগুলির মধ্যে যেকোনো একটি বেছে নিতে পারেন। এটি আপনাকে দেয় কলাম ড্রপ করুন বিকল্পটি যদি আপনি বৈশিষ্ট্যটি সম্পূর্ণরূপে অপসারণ করতে চান।

বয়স

আপনি যখন চয়ন কোড প্রয়োগ করুন এবং রপ্তানি করুন, রূপান্তরটি ডেটা ফ্রেমের গভীর অনুলিপিতে প্রয়োগ করা হয়। রূপান্তরটি সফলভাবে প্রয়োগ করার পরে, তথ্য টেবিলটি অন্তর্দৃষ্টি এবং ভিজ্যুয়ালাইজেশন সহ রিফ্রেশ করা হয়। নোটবুকে বিদ্যমান সেলের পরে ট্রান্সফর্ম কোড তৈরি হয়। আপনার ডেটাসেটে রূপান্তর প্রয়োগ করতে আপনি এই রপ্তানি করা কোডটি পরে চালাতে পারেন এবং আপনার প্রয়োজন অনুযায়ী এটি প্রসারিত করতে পারেন। আপনি সরাসরি জেনারেট করা কোড পরিবর্তন করে রূপান্তর কাস্টমাইজ করতে পারেন। যদি আমরা প্রয়োগ করি ড্রপ অনুপস্থিত বয়স কলামের বিকল্পে, নিম্নলিখিত রূপান্তর কোডটি ডেটাসেটে প্রয়োগ করা হয় এবং কোডটি উইজেটের নীচের একটি ঘরেও তৈরি করা হয়:

#Pandas code generated by sagemaker_datawrangler
output_df = df.copy(deep=True) 

#Code to Drop missing for column: age to resolve warning: Missing values 
output_df = output_df[output_df['age'].notnull()]

নিম্নলিখিত জন্য একটি কোড স্নিপেট আরেকটি উদাহরণ মধ্যমা দিয়ে প্রতিস্থাপন করুন:

#Pandas code generated by sagemaker_datawrangler
output_df = df.copy(deep=True) 

#Code to Replace with median for column: age to resolve warning: Missing values 
output_df['age']=output_df['age'].fillna(output_df['age'].median(skipna=True))

এখন আসুন ডেটা প্রিপ উইজেটের টার্গেট ইনসাইট ক্ষমতা দেখি। আপনি ব্যবহার করতে চান অনুমান survived একজন যাত্রী বেঁচে থাকবে কিনা তা ভবিষ্যদ্বাণী করার বৈশিষ্ট্য। পছন্দ survived কলাম হেডার। পাশের প্যানেলে, নির্বাচন করুন লক্ষ্য কলাম হিসাবে নির্বাচন করুন. জন্য আদর্শ তথ্য বিতরণ survived বৈশিষ্ট্যের শুধুমাত্র দুটি ক্লাস থাকা উচিত: হ্যাঁ (1) অথবা না (0), যা টাইটানিক দুর্ঘটনায় বেঁচে থাকার সম্ভাবনাকে শ্রেণীবদ্ধ করতে সাহায্য করে। যাইহোক, নির্বাচিত টার্গেট কলামে ডেটা অসঙ্গতির কারণে, টিকে থাকা বৈশিষ্ট্যটি রয়েছে 0, 1, ?, unknown, এবং yes.

লক্ষ্য কলাম হিসাবে নির্বাচন করুন

নির্বাচিত টার্গেট কলামের উপর ভিত্তি করে সমস্যার ধরন বেছে নিন, যেটি হতে পারে শ্রেণীবিন্যাস or প্রত্যাগতি. বেঁচে থাকা কলামের জন্য, সমস্যার ধরন হল শ্রেণিবিন্যাস। পছন্দ করা চালান লক্ষ্য কলামের জন্য অন্তর্দৃষ্টি তৈরি করতে।

উদ্বর্তিত

ডাটা প্রিপ উইজেট টার্গেট কলামের ডাটা মানের সমস্যা সমাধানের জন্য সুপারিশ এবং নমুনা ব্যাখ্যা সহ লক্ষ্য কলামের অন্তর্দৃষ্টি তালিকাভুক্ত করে। এটি স্বয়ংক্রিয়ভাবে কলামের অস্বাভাবিক ডেটা হাইলাইট করে।

সুপারিশ সহ লক্ষ্য কলাম অন্তর্দৃষ্টি

আমরা প্রস্তাবিত রূপান্তর চয়ন করুন বিরল লক্ষ্য মান ড্রপ, কারণ বিরল লক্ষ্য মানের জন্য কম পর্যবেক্ষণ আছে।

বিরল লক্ষ্য মান ড্রপ

নির্বাচিত রূপান্তরটি পান্ডাস ডেটা ফ্রেমে প্রয়োগ করা হয় এবং অস্বাভাবিক লক্ষ্য মানগুলি বেঁচে থাকা কলাম থেকে বাদ দেওয়া হয়। নিম্নলিখিত কোড দেখুন:

# Pandas code generated by sagemaker_datawrangler
output_df = df.copy(deep=True)

# Code to Drop rare target values for column: survived to resolve warning: Too few instances per class 
rare_target_labels_to_drop = ['?', 'unknown', 'yes']
output_df = output_df[~output_df['survived'].isin(rare_target_labels_to_drop)]

প্রয়োগকৃত রূপান্তরের ফলাফল ডাটা ফ্রেমে অবিলম্বে দৃশ্যমান হয়। ডেটা প্রিপ উইজেট ব্যবহার করে প্রয়োগ করা ডেটা প্রস্তুতি কার্যক্রম ট্র্যাক করতে, নিম্নলিখিত নোটবুক সেলে রূপান্তরিত কোডটিও তৈরি করা হয়।

উপসংহার

এই পোস্টে, আমরা কীভাবে স্টুডিও ডেটা প্রিপ উইজেট আপনাকে ডেটা বিতরণ বিশ্লেষণ করতে, টুলের দ্বারা তৈরি ডেটার গুণমানের অন্তর্দৃষ্টিগুলি অন্বেষণ করতে এবং প্রতিটি গুরুত্বপূর্ণ বৈশিষ্ট্যের জন্য আউটলারের মতো সম্ভাব্য সমস্যাগুলি উন্মোচন করতে সহায়তা করতে পারে সে সম্পর্কে নির্দেশিকা প্রদান করেছি। এটি আপনাকে উচ্চ-মানের মডেলগুলিকে প্রশিক্ষণ দিতে সাহায্য করার জন্য সামগ্রিক ডেটা গুণমান উন্নত করতে সাহায্য করে এবং এটি আপনাকে ব্যবহারকারী ইন্টারফেসে ডেটা রূপান্তর করতে এবং নোটবুক কোষগুলির জন্য স্বয়ংক্রিয়ভাবে কোড তৈরি করার অনুমতি দিয়ে অভেদহীন ভারী উত্তোলনকে সরিয়ে দেয়৷ তারপরে আপনি এই কোডটি আপনার MLOps পাইপলাইনে ব্যবহার করতে পারেন পুনরুত্পাদনযোগ্যতা তৈরি করতে, পুনরাবৃত্তিমূলক কাজে সময় নষ্ট করা এড়াতে এবং ডেটা র্যাংলিং পাইপলাইনগুলির নির্মাণ এবং স্থাপনার দ্রুততার মাধ্যমে সামঞ্জস্যের সমস্যাগুলি হ্রাস করতে পারেন৷

আপনি যদি সেজমেকার ডেটা র‍্যাংলার বা স্টুডিওতে নতুন হন তবে দেখুন সেজমেকার ডেটা র্যাংলার দিয়ে শুরু করুন. আপনার যদি এই পোস্ট সম্পর্কিত কোন প্রশ্ন থাকে, তাহলে মন্তব্য বিভাগে এটি যোগ করুন.


লেখক সম্পর্কে

Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence দ্বারা চালিত নোটবুকের জন্য ইন্টারেক্টিভ ডেটা প্রিপ উইজেট। উল্লম্ব অনুসন্ধান. আ.পার্থ প্যাটেল সান ফ্রান্সিসকো বে এরিয়াতে AWS-এর একজন সমাধান স্থপতি। পার্থ গ্রাহকদের ক্লাউডে তাদের যাত্রা ত্বরান্বিত করতে এবং তাদের AWS ক্লাউডে সফলভাবে গ্রহণ ও বৃদ্ধি পেতে সহায়তা করে। তিনি মেশিন লার্নিং, পরিবেশগত স্থায়িত্ব এবং অ্যাপ্লিকেশন আধুনিকীকরণের দিকে মনোনিবেশ করেন।

Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence দ্বারা চালিত নোটবুকের জন্য ইন্টারেক্টিভ ডেটা প্রিপ উইজেট। উল্লম্ব অনুসন্ধান. আ.ইশার দুআ সান ফ্রান্সিসকো বে এরিয়াতে অবস্থিত একজন সিনিয়র সলিউশন আর্কিটেক্ট। তিনি AWS এন্টারপ্রাইজের গ্রাহকদের তাদের লক্ষ্য এবং চ্যালেঞ্জগুলি বোঝার মাধ্যমে বৃদ্ধি পেতে সাহায্য করেন এবং কীভাবে তারা তাদের অ্যাপ্লিকেশনগুলিকে ক্লাউড-নেটিভ পদ্ধতিতে আর্কিটেক্ট করতে পারেন এবং তারা স্থিতিস্থাপক এবং পরিমাপযোগ্য তা নিশ্চিত করে তাদের নির্দেশনা দেন। তিনি মেশিন লার্নিং প্রযুক্তি এবং পরিবেশগত স্থায়িত্ব সম্পর্কে উত্সাহী।

Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence দ্বারা চালিত নোটবুকের জন্য ইন্টারেক্টিভ ডেটা প্রিপ উইজেট। উল্লম্ব অনুসন্ধান. আ.হরিহরন সুরেশ AWS-এর একজন সিনিয়র সলিউশন আর্কিটেক্ট। তিনি ডাটাবেস, মেশিন লার্নিং এবং উদ্ভাবনী সমাধান ডিজাইন করার বিষয়ে উত্সাহী। AWS-এ যোগ দেওয়ার আগে, হরিহরন একজন পণ্য স্থপতি, কোর ব্যাঙ্কিং বাস্তবায়ন বিশেষজ্ঞ এবং বিকাশকারী ছিলেন এবং 11 বছরেরও বেশি সময় ধরে BFSI সংস্থাগুলির সাথে কাজ করেছিলেন। প্রযুক্তির বাইরে, তিনি প্যারাগ্লাইডিং এবং সাইক্লিং উপভোগ করেন।

Amazon SageMaker Data Wrangler PlatoBlockchain Data Intelligence দ্বারা চালিত নোটবুকের জন্য ইন্টারেক্টিভ ডেটা প্রিপ উইজেট। উল্লম্ব অনুসন্ধান. আ.দানি মিচেল অ্যামাজন ওয়েব সার্ভিসেসের একজন এআই/এমএল বিশেষজ্ঞ সলিউশন আর্কিটেক্ট। তিনি কম্পিউটার ভিশন ব্যবহারের ক্ষেত্রে এবং EMEA জুড়ে গ্রাহকদের তাদের ML যাত্রাকে ত্বরান্বিত করতে সহায়তা করার দিকে মনোনিবেশ করেছেন।

সময় স্ট্যাম্প:

থেকে আরো এডাব্লুএস মেশিন লার্নিং

একটি কাস্টম লেন্স দিয়ে ভাল-আর্কিটেক্টেড IDP সমাধান তৈরি করুন – পার্ট 4: পারফরম্যান্স দক্ষতা | আমাজন ওয়েব সার্ভিসেস

উত্স নোড: 1917726
সময় স্ট্যাম্প: নভেম্বর 22, 2023