অ্যামাজন সেজমেকার অটোপাইলট স্বয়ংক্রিয়ভাবে আপনার ডেটার উপর ভিত্তি করে সেরা মেশিন লার্নিং (ML) মডেলগুলি তৈরি করে, প্রশিক্ষণ দেয় এবং সুর করে, যেখানে আপনাকে সম্পূর্ণ নিয়ন্ত্রণ এবং দৃশ্যমানতা বজায় রাখার অনুমতি দেয়। আমরা সম্প্রতি ঘোষণা করেছি অটোপাইলটে টাইম সিরিজ ডেটার জন্য সমর্থন. আপনি টাইম সিরিজ ডেটা, বা সাধারণভাবে সিকোয়েন্স ডেটাতে রিগ্রেশন এবং শ্রেণীবিভাগের কাজগুলি মোকাবেলা করতে অটোপাইলট ব্যবহার করতে পারেন। টাইম সিরিজ ডেটা হল একটি বিশেষ ধরনের সিকোয়েন্স ডেটা যেখানে ডেটা পয়েন্টগুলি জোড় সময়ের ব্যবধানে সংগ্রহ করা হয়।
ম্যানুয়ালি ডেটা প্রস্তুত করা, সঠিক ML মডেল নির্বাচন করা এবং এর পরামিতিগুলি অপ্টিমাইজ করা একটি জটিল কাজ, এমনকি একজন বিশেষজ্ঞ অনুশীলনকারীর জন্যও। যদিও স্বয়ংক্রিয় পদ্ধতির অস্তিত্ব রয়েছে যা সর্বোত্তম মডেল এবং তাদের পরামিতিগুলি খুঁজে পেতে পারে, এইগুলি সাধারণত ক্রম হিসাবে আসে এমন ডেটা পরিচালনা করতে পারে না, যেমন নেটওয়ার্ক ট্র্যাফিক, বিদ্যুত খরচ, বা সময়ের সাথে রেকর্ড করা পরিবারের খরচ। যেহেতু এই ডেটা বিভিন্ন সময় পয়েন্টে অর্জিত পর্যবেক্ষণের রূপ নেয়, পরপর পর্যবেক্ষণগুলি একে অপরের থেকে স্বাধীন হিসাবে বিবেচনা করা যায় না এবং সম্পূর্ণরূপে প্রক্রিয়া করা প্রয়োজন। আপনি ক্রমিক ডেটা নিয়ে কাজ করার জন্য বিস্তৃত সমস্যার জন্য অটোপাইলট ব্যবহার করতে পারেন। উদাহরণস্বরূপ, আপনি দূষিত কার্যকলাপ সনাক্ত করতে সময়ের সাথে রেকর্ড করা নেটওয়ার্ক ট্র্যাফিককে শ্রেণীবদ্ধ করতে পারেন, বা ব্যক্তিরা তাদের ক্রেডিট ইতিহাসের উপর ভিত্তি করে একটি বন্ধকের জন্য যোগ্য কিনা তা নির্ধারণ করতে পারেন। আপনি টাইম সিরিজ ডেটা সহ একটি ডেটাসেট সরবরাহ করেন এবং অটোপাইলট বাকিগুলি পরিচালনা করে, বিশেষ বৈশিষ্ট্য রূপান্তরের মাধ্যমে অনুক্রমিক ডেটা প্রক্রিয়াকরণ করে এবং আপনার পক্ষে সেরা মডেলটি খুঁজে পায়।
অটোপাইলট ML মডেল তৈরির ভারী উত্তোলন দূর করে, এবং আপনাকে স্বয়ংক্রিয়ভাবে আপনার ডেটার উপর ভিত্তি করে সেরা ML মডেল তৈরি করতে, প্রশিক্ষণ দিতে এবং সুর করতে সাহায্য করে৷ অটোপাইলট আপনার ডেটাতে বেশ কয়েকটি অ্যালগরিদম চালায় এবং সম্পূর্ণরূপে পরিচালিত গণনা পরিকাঠামোতে তাদের হাইপারপ্যারামিটারগুলিকে সুর করে৷ এই পোস্টে, আমরা প্রদর্শন করি আপনি কিভাবে ব্যবহার করতে পারেন স্বনির্দেশকারী টাইম সিরিজ ডেটার শ্রেণীবিভাগ এবং রিগ্রেশন সমস্যা সমাধান করতে। একটি অটোপাইলট মডেল তৈরি এবং প্রশিক্ষণের নির্দেশাবলীর জন্য, দেখুন আমাজন সেজমেকার অটোপাইলট সহ গ্রাহক মন্থন পূর্বাভাস.
অটোপাইলট ব্যবহার করে টাইম সিরিজ ডেটা শ্রেণীবিভাগ
চলমান উদাহরণ হিসাবে, আমরা সময় সিরিজে একটি বহু-শ্রেণীর সমস্যা বিবেচনা করি ডেটা সেটটি UWaveGestureLibraryX, আটটি পূর্বনির্ধারিত হাতের অঙ্গভঙ্গির মধ্যে একটি সম্পাদন করার সময় অ্যাক্সিলোমিটার সেন্সরগুলির সমান দূরত্বের রিডিং রয়েছে৷ সরলতার জন্য, আমরা অ্যাক্সিলোমিটারের শুধুমাত্র X মাত্রা বিবেচনা করি। কাজটি হল সেন্সর রিডিং থেকে পূর্বনির্ধারিত অঙ্গভঙ্গিগুলিতে টাইম সিরিজ ডেটা ম্যাপ করার জন্য একটি শ্রেণিবিন্যাস মডেল তৈরি করা। নিম্নলিখিত চিত্রটি CSV বিন্যাসে ডেটাসেটের প্রথম সারিগুলি দেখায়৷ পুরো টেবিলটিতে 896টি সারি এবং দুটি কলাম রয়েছে: প্রথম কলামটি একটি অঙ্গভঙ্গি লেবেল এবং দ্বিতীয় কলামটি সেন্সর রিডিংয়ের একটি টাইম সিরিজ।
Amazon SageMaker Data Wrangler-এর মাধ্যমে সঠিক বিন্যাসে ডেটা রূপান্তর করুন
সংখ্যাসূচক, সুনির্দিষ্ট, এবং আদর্শ পাঠ্য কলাম গ্রহণ করার উপরে, অটোপাইলট এখন একটি ক্রম ইনপুট কলামও গ্রহণ করে। যদি আপনার টাইম সিরিজ ডেটা এই ফর্ম্যাটটি অনুসরণ না করে, তাহলে আপনি সহজেই এটিকে রূপান্তর করতে পারেন অ্যামাজন সেজমেকার ডেটা র্যাংলার. ডেটা র্যাংলার ML-এর জন্য ডেটা একত্রিত করতে এবং প্রস্তুত করতে কয়েক সপ্তাহ থেকে মিনিট পর্যন্ত সময় কমিয়ে দেয়। ডেটা র্যাংলারের সাহায্যে, আপনি ডেটা প্রস্তুতি এবং বৈশিষ্ট্য প্রকৌশলের প্রক্রিয়াটিকে সহজ করতে পারেন এবং একটি একক ভিজ্যুয়াল ইন্টারফেস থেকে ডেটা নির্বাচন, পরিষ্কারকরণ, অন্বেষণ এবং ভিজ্যুয়ালাইজেশন সহ ডেটা প্রস্তুতির কর্মপ্রবাহের প্রতিটি ধাপ সম্পূর্ণ করতে পারেন। উদাহরণস্বরূপ, একই ডেটাসেট বিবেচনা করুন কিন্তু একটি ভিন্ন ইনপুট বিন্যাসে: প্রতিটি অঙ্গভঙ্গি (আইডি দ্বারা নির্দিষ্ট) অ্যাক্সিলোমিটারের সমান দূরত্বের পরিমাপের একটি ক্রম। উল্লম্বভাবে সংরক্ষণ করা হলে, প্রতিটি সারিতে একটি টাইমস্ট্যাম্প এবং একটি মান থাকে। নিম্নলিখিত চিত্রটি এই ডেটাটিকে তার মূল বিন্যাসে এবং একটি ক্রম বিন্যাসে তুলনা করে।
Data Wrangler ব্যবহার করে পূর্বে বর্ণিত ফরম্যাটে এই ডেটাসেটটিকে রূপান্তর করতে, থেকে ডেটাসেটটি লোড করুন আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3)। তারপর ব্যবহার করুন রূপান্তর দ্বারা সময় সিরিজ গ্রুপ, নিম্নলিখিত স্ক্রিনশটে দেখানো হয়েছে, এবং CSV বিন্যাসে Amazon S3 এ ডেটা রপ্তানি করুন।
যখন ডেটাসেটটি তার নির্ধারিত বিন্যাসে থাকে, আপনি অটোপাইলটের সাথে এগিয়ে যেতে পারেন। ডেটা র্যাংলারের অন্যান্য টাইম সিরিজ ট্রান্সফরমারগুলি দেখুন Amazon SageMaker Data Wrangler দিয়ে টাইম সিরিজ ডেটা প্রস্তুত করুন.
একটি AutoML কাজ চালু করুন
অটোপাইলট দ্বারা সমর্থিত অন্যান্য ইনপুট প্রকারের মতো, ডেটাসেটের প্রতিটি সারি একটি আলাদা পর্যবেক্ষণ এবং প্রতিটি কলাম একটি বৈশিষ্ট্য। এই উদাহরণে, আমাদের কাছে একটি একক কলাম রয়েছে যেখানে টাইম সিরিজ ডেটা রয়েছে, তবে আপনার একাধিক টাইম সিরিজ কলাম থাকতে পারে। আপনার কাছে বিভিন্ন ধরনের ইনপুট সহ একাধিক কলাম থাকতে পারে, যেমন সময় সিরিজ, পাঠ্য এবং সংখ্যাসূচক।
থেকে একটি অটোপাইলট পরীক্ষা তৈরি করুন, একটি S3 বালতিতে ডেটাসেট রাখুন এবং এর মধ্যে একটি নতুন পরীক্ষা তৈরি করুন৷ অ্যামাজন সেজমেকার স্টুডিও. নিম্নলিখিত স্ক্রিনশটে দেখানো হয়েছে, আপনাকে অবশ্যই পরীক্ষার নাম, ডেটাসেটের S3 অবস্থান, আউটপুট শিল্পকর্মের জন্য S3 অবস্থান এবং ভবিষ্যদ্বাণী করার জন্য কলামের নাম উল্লেখ করতে হবে।
অটোপাইলট ডেটা বিশ্লেষণ করে, ML পাইপলাইন তৈরি করে এবং এই শ্রেণীবিভাগের টাস্কে হাইপারপ্যারামিটার অপ্টিমাইজেশানের একটি ডিফল্ট 250 পুনরাবৃত্তি চালায়। নিম্নলিখিত মডেল লিডারবোর্ডে দেখানো হয়েছে, অটোপাইলট 0.821 নির্ভুলতায় পৌঁছেছে এবং আপনি শুধুমাত্র একটি ক্লিকেই সেরা মডেল স্থাপন করতে পারেন।
উপরন্তু, অটোপাইলট একটি উৎপন্ন করে তথ্য অনুসন্ধান প্রতিবেদন, যেখানে আপনি আপনার ডেটা ভিজ্যুয়ালাইজ এবং অন্বেষণ করতে পারেন।
স্বচ্ছতা অটোপাইলটের জন্য ভিত্তি। আপনি প্রার্থী সংজ্ঞা নোটবুকের মধ্যে জেনারেট করা ML পাইপলাইনগুলি পরিদর্শন এবং সংশোধন করতে পারেন। নিম্নলিখিত স্ক্রিনশটটি দেখায় যে কিভাবে অটোপাইলট টাইম সিরিজ ট্রান্সফরমারকে একত্রিত করে পাইপলাইনের একটি পরিসীমা সুপারিশ করে TSFeatureExtractor
বিভিন্ন ML অ্যালগরিদম সহ, যেমন গ্রেডিয়েন্ট বুস্টেড ডিসিশন ট্রি এবং লিনিয়ার মডেল। দ্য TSFeatureExtractor
আপনার জন্য শত শত টাইম সিরিজের বৈশিষ্ট্য বের করে, যেগুলি ভবিষ্যদ্বাণী করার জন্য ডাউনস্ট্রিম অ্যালগরিদমগুলিতে খাওয়ানো হয়। টাইম সিরিজ বৈশিষ্ট্যের সম্পূর্ণ তালিকার জন্য, পড়ুন নিষ্কাশিত বৈশিষ্ট্য উপর ওভারভিউ.
উপসংহার
এই পোস্টে, আমরা দেখিয়েছি কিভাবে সেজমেকার অটোপাইলট ব্যবহার করে টাইম সিরিজের শ্রেণীবিভাগ এবং রিগ্রেশন সমস্যাগুলিকে মাত্র কয়েকটি ক্লিকে সমাধান করতে হয়।
অটোপাইলট সম্পর্কে আরও তথ্যের জন্য, দেখুন অ্যামাজন সেজমেকার অটোপাইলট. সেজমেকার সম্পর্কিত বৈশিষ্ট্যগুলি অন্বেষণ করতে, দেখুন অ্যামাজন সেজমেকার ডেটা র্যাংলার.
লেখক সম্পর্কে
নিকিতা ইভকিন একজন ফলিত বিজ্ঞানী, অ্যামাজন সেজমেকার ডেটা র্যাংলার।
অ্যান মিলবার্ট অ্যামাজন সেজমেকার স্বয়ংক্রিয় মডেল টিউনিং-এ কাজ করা একজন সফটওয়্যার ডেভেলপমেন্ট ইঞ্জিনিয়ার।
ভ্যালেরিও পেরোন অ্যামাজন সেজমেকার স্বয়ংক্রিয় মডেল টিউনিং এবং অটোপাইলটে কর্মরত একজন ফলিত বিজ্ঞান ব্যবস্থাপক।
মেঘনা সতীশ অ্যামাজন সেজমেকার স্বয়ংক্রিয় মডেল টিউনিং-এ কাজ করা একজন সফটওয়্যার ডেভেলপমেন্ট ইঞ্জিনিয়ার।
আলী তাকবিরী একজন AI/ML বিশেষজ্ঞ সলিউশন আর্কিটেক্ট, এবং AWS ক্লাউডে তাদের ব্যবসায়িক চ্যালেঞ্জগুলি সমাধান করতে মেশিন লার্নিং ব্যবহার করে গ্রাহকদের সাহায্য করে।
- "
- 100
- সম্পর্কে
- অর্জিত
- ক্রিয়াকলাপ
- আলগোরিদিম
- অনুমতি
- যদিও
- মর্দানী স্ত্রীলোক
- ঘোষিত
- অটোমেটেড
- ডেস্কটপ AWS
- সর্বোত্তম
- চালচিত্রকে
- নির্মাণ করা
- ভবন
- তৈরী করে
- ব্যবসায়
- চ্যালেঞ্জ
- শ্রেণীবিন্যাস
- মেঘ
- স্তম্ভ
- জটিল
- গনা
- পরপর
- খরচ
- ধারণ
- নিয়ন্ত্রণ
- তৈরি করা হচ্ছে
- ধার
- গ্রাহকদের
- উপাত্ত
- ডিলিং
- স্থাপন
- উন্নয়ন
- বিভিন্ন
- মাত্রা
- না
- সহজে
- বিদ্যুৎ
- প্রকৌশলী
- প্রকৌশল
- উদাহরণ
- খরচ
- পরীক্ষা
- অন্বেষণ
- চায়ের
- বৈশিষ্ট্য
- বৈশিষ্ট্য
- প্রতিপালিত
- ব্যক্তিত্ব
- প্রথম
- অনুসরণ করা
- অনুসরণ
- ফর্ম
- বিন্যাস
- সম্পূর্ণ
- সাধারণ
- গ্রুপ
- সাহায্য
- ইতিহাস
- পরিবার
- কিভাবে
- কিভাবে
- HTTPS দ্বারা
- শত শত
- সনাক্ত করা
- সুদ্ধ
- তথ্য
- পরিকাঠামো
- ইন্টারফেস
- IT
- শিক্ষা
- লিঙ্কডইন
- তালিকা
- বোঝা
- অবস্থান
- মেশিন
- মেশিন লার্নিং
- পরিচালক
- মানচিত্র
- ML
- মডেল
- মডেল
- নেটওয়ার্ক
- নেটওয়ার্ক ট্রাফিক
- নোটবই
- অপ্টিমাইজেশান
- অন্যান্য
- ভবিষ্যদ্বাণী
- ভবিষ্যতবাণী
- সমস্যা
- সমস্যা
- প্রক্রিয়া
- প্রদান
- পরিসর
- বিশেষ পরামর্শ দেওয়া হচ্ছে
- বিশ্রাম
- দৌড়
- বিজ্ঞান
- বিজ্ঞানী
- ক্রম
- সহজ
- সফটওয়্যার
- সফটওয়্যার উন্নয়ন
- সলিউশন
- সমাধান
- বিশেষজ্ঞ
- স্টোরেজ
- সমর্থিত
- সমর্থন
- কাজ
- দ্বারা
- সময়
- শীর্ষ
- ট্রাফিক
- প্রশিক্ষণ
- ট্রেন
- ব্যবহার
- মূল্য
- দৃষ্টিপাত
- কল্পনা
- মধ্যে
- কাজ
- X