আমাজন সেজমেকার Apache Spark এর সাথে বিতরণ করা ডেটা প্রসেসিং কাজ চালানোর বিভিন্ন উপায় অফার করে, বড় ডেটা প্রসেসিংয়ের জন্য একটি জনপ্রিয় ডিস্ট্রিবিউটেড কম্পিউটিং ফ্রেমওয়ার্ক।
আপনি স্পার্ক অ্যাপ্লিকেশনগুলিকে ইন্টারেক্টিভভাবে চালাতে পারেন অ্যামাজন সেজমেকার স্টুডিও সংযোগ দ্বারা সেজমেকার স্টুডিও নোটবুক এবং AWS গ্লু ইন্টারেক্টিভ সেশন একটি সার্ভারহীন ক্লাস্টার সহ স্পার্ক কাজ চালানোর জন্য। ইন্টারেক্টিভ সেশনগুলির সাথে, আপনি ক্লাস্টার পরিচালনার বিষয়ে চিন্তা না করে সহজেই বড় ডেটাসেটগুলি প্রক্রিয়া করতে Apache Spark বা Ray বেছে নিতে পারেন।
বিকল্পভাবে, আপনার যদি পরিবেশের উপর আরও নিয়ন্ত্রণের প্রয়োজন হয়, আপনি একটি সম্পূর্ণরূপে পরিচালিত বিতরণ করা ক্লাস্টারে ব্যাচ জব হিসাবে স্পার্ক অ্যাপ্লিকেশনগুলি চালানোর জন্য একটি পূর্ব-নির্মিত সেজমেকার স্পার্ক কন্টেইনার ব্যবহার করতে পারেন আমাজন সেজমেকার প্রসেসিং. এই বিকল্পটি আপনাকে বিভিন্ন ধরণের উদাহরণ (কম্পিউট অপ্টিমাইজ করা, মেমরি অপ্টিমাইজ করা এবং আরও অনেক কিছু), ক্লাস্টারে নোডের সংখ্যা এবং ক্লাস্টার কনফিগারেশন নির্বাচন করতে দেয়, যার ফলে ডেটা প্রক্রিয়াকরণ এবং মডেল প্রশিক্ষণের জন্য আরও নমনীয়তা সক্ষম হয়।
অবশেষে, আপনি স্টুডিও নোটবুকের সাথে সংযোগ করে স্পার্ক অ্যাপ্লিকেশন চালাতে পারেন আমাজন ইএমআর ক্লাস্টার, অথবা আপনার স্পার্ক ক্লাস্টার চালু করে অ্যামাজন ইলাস্টিক কম্পিউট ক্লাউড (Amazon EC2)।
এই সমস্ত বিকল্পগুলি আপনাকে সাধারণত ওয়েব-ভিত্তিক ইউজার ইন্টারফেসের মাধ্যমে বিশ্লেষণ করার জন্য স্পার্ক ইভেন্ট লগগুলি তৈরি এবং সংরক্ষণ করতে দেয় স্পার্ক UI, যা স্পার্ক অ্যাপ্লিকেশনের অগ্রগতি, ট্র্যাক রিসোর্স ব্যবহার এবং ডিবাগ ত্রুটিগুলি নিরীক্ষণ করতে একটি স্পার্ক ইতিহাস সার্ভার চালায়।
এই পোস্টে, আমরা একটি ভাগ সমাধান সেজমেকার স্টুডিওতে স্পার্ক হিস্ট্রি সার্ভার ইনস্টল এবং চালানোর জন্য এবং সেজমেকার স্টুডিও আইডিই থেকে সরাসরি স্পার্ক UI অ্যাক্সেস করার জন্য, বিভিন্ন AWS পরিষেবা (AWS Glue Interactive Sessions, SageMaker Processing jobs, and Amazon EMR) দ্বারা উত্পাদিত স্পার্ক লগ বিশ্লেষণ করার জন্য এবং একটিতে সংরক্ষিত আমাজন সিম্পল স্টোরেজ সার্ভিস (অ্যামাজন এস 3) বালতি।
সমাধান ওভারভিউ
সমাধানটি SageMaker স্টুডিওতে জুপিটার সার্ভার অ্যাপে স্পার্ক হিস্ট্রি সার্ভারকে একীভূত করে। এটি ব্যবহারকারীদের সেজমেকার স্টুডিও আইডিই থেকে সরাসরি স্পার্ক লগ অ্যাক্সেস করতে দেয়। ইন্টিগ্রেটেড স্পার্ক ইতিহাস সার্ভার নিম্নলিখিত সমর্থন করে:
- SageMaker প্রসেসিং স্পার্ক কাজ দ্বারা উত্পন্ন লগ অ্যাক্সেস করা
- AWS Glue Spark অ্যাপ্লিকেশন দ্বারা উত্পন্ন লগ অ্যাক্সেস করা
- স্ব-পরিচালিত স্পার্ক ক্লাস্টার এবং অ্যামাজন ইএমআর দ্বারা উত্পন্ন লগ অ্যাক্সেস করা
একটি ইউটিলিটি কমান্ড লাইন ইন্টারফেস (CLI) বলা হয় sm-spark-cli
SageMaker স্টুডিও সিস্টেম টার্মিনাল থেকে স্পার্ক UI এর সাথে ইন্টারঅ্যাক্ট করার জন্যও প্রদান করা হয়। দ্য sm-spark-cli
SageMaker স্টুডিও ছাড়াই স্পার্ক হিস্ট্রি সার্ভার পরিচালনা করতে সক্ষম করে।
সমাধানটি শেল স্ক্রিপ্টগুলি নিয়ে গঠিত যা নিম্নলিখিত ক্রিয়াগুলি সম্পাদন করে:
- জুপিটার সার্ভারে সেজমেকার স্টুডিও ব্যবহারকারী প্রোফাইলের জন্য বা সেজমেকার স্টুডিও ভাগ করা স্থানের জন্য স্পার্ক ইনস্টল করুন
- ইনস্টল করুন
sm-spark-cli
একটি ব্যবহারকারীর প্রোফাইল বা ভাগ করা স্থানের জন্য
একটি SageMaker স্টুডিও ডোমেনে ম্যানুয়ালি স্পার্ক UI ইনস্টল করুন
SageMaker স্টুডিওতে স্পার্ক UI হোস্ট করতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- বেছে নিন সিস্টেম টার্মিনাল সেজমেকার স্টুডিও লঞ্চার থেকে।
- সিস্টেম টার্মিনালে নিম্নলিখিত কমান্ডগুলি চালান:
কমান্ডগুলি সম্পূর্ণ হতে কয়েক সেকেন্ড সময় নেবে।
- ইনস্টলেশন সম্পূর্ণ হলে, আপনি প্রদত্ত ব্যবহার করে স্পার্ক UI শুরু করতে পারেন
sm-spark-cli
এবং নিম্নলিখিত কোড চালানোর মাধ্যমে একটি ওয়েব ব্রাউজার থেকে এটি অ্যাক্সেস করুন:
sm-spark-cli start s3://DOC-EXAMPLE-BUCKET/<SPARK_EVENT_LOGS_LOCATION>
S3 অবস্থান যেখানে SageMaker প্রসেসিং, AWS Glue, বা Amazon EMR দ্বারা উত্পাদিত ইভেন্ট লগগুলি সংরক্ষণ করা হয় স্পার্ক অ্যাপ্লিকেশনগুলি চালানোর সময় কনফিগার করা যেতে পারে৷
সেজমেকার স্টুডিও নোটবুক এবং AWS গ্লু ইন্টারেক্টিভ সেশনের জন্য, আপনি নোটবুক থেকে সরাসরি স্পার্ক ইভেন্ট লগ অবস্থান সেট আপ করতে পারেন sparkmagic
কার্নেল
সার্জারির sparkmagic
কার্নেলে নোটবুকের মাধ্যমে দূরবর্তী স্পার্ক ক্লাস্টারগুলির সাথে ইন্টারঅ্যাক্ট করার জন্য সরঞ্জামগুলির একটি সেট রয়েছে। এটি জাদু প্রদান করে (%spark
, %sql
) স্পার্ক কোড চালানোর জন্য, এসকিউএল কোয়েরি সম্পাদন করতে এবং নির্বাহক মেমরি এবং কোরের মতো স্পার্ক সেটিংস কনফিগার করার জন্য কমান্ড দেয়।
SageMaker প্রসেসিং কাজের জন্য, আপনি SageMaker Python SDK থেকে সরাসরি স্পার্ক ইভেন্ট লগ অবস্থান কনফিগার করতে পারেন।
অতিরিক্ত তথ্যের জন্য AWS ডকুমেন্টেশন পড়ুন:
আপনি স্পার্ক UI অ্যাক্সেস করতে জেনারেট করা URL বেছে নিতে পারেন।
নিম্নলিখিত স্ক্রিনশটটি স্পার্ক UI এর একটি উদাহরণ দেখায়।
আপনি ব্যবহার করে স্পার্ক হিস্ট্রি সার্ভারের স্থিতি পরীক্ষা করতে পারেন sm-spark-cli status
স্টুডিও সিস্টেম টার্মিনালে কমান্ড।
প্রয়োজনে আপনি স্পার্ক হিস্ট্রি সার্ভারও বন্ধ করতে পারেন।
SageMaker স্টুডিও ডোমেনে ব্যবহারকারীদের জন্য স্পার্ক UI ইনস্টলেশন স্বয়ংক্রিয় করুন
একজন আইটি প্রশাসক হিসাবে, আপনি একটি ব্যবহার করে সেজমেকার স্টুডিও ব্যবহারকারীদের জন্য ইনস্টলেশন স্বয়ংক্রিয় করতে পারেন জীবনচক্র কনফিগারেশন. এটি একটি SageMaker স্টুডিও ডোমেনের অধীনে বা নির্দিষ্টগুলির জন্য সমস্ত ব্যবহারকারী প্রোফাইলের জন্য করা যেতে পারে। দেখা লাইফসাইকেল কনফিগারেশন ব্যবহার করে Amazon SageMaker স্টুডিও কাস্টমাইজ করুন আরো বিস্তারিত জানার জন্য.
আপনি থেকে একটি জীবনচক্র কনফিগারেশন তৈরি করতে পারেন install-history-server.sh স্ক্রিপ্ট এবং এটি একটি বিদ্যমান SageMaker স্টুডিও ডোমেনে সংযুক্ত করুন। ইনস্টলেশনটি ডোমেনের সমস্ত ব্যবহারকারী প্রোফাইলের জন্য চালানো হয়।
এর সাথে কনফিগার করা একটি টার্মিনাল থেকে এডাব্লুএস কমান্ড লাইন ইন্টারফেস (AWS CLI) এবং উপযুক্ত অনুমতি, নিম্নলিখিত কমান্ডগুলি চালান:
জুপিটার সার্ভার পুনরায় চালু হওয়ার পরে, স্পার্ক UI এবং sm-spark-cli
আপনার সেজমেকার স্টুডিও পরিবেশে উপলব্ধ হবে।
পরিষ্কার কর
এই বিভাগে, আমরা আপনাকে দেখাব কিভাবে একটি SageMaker স্টুডিও ডোমেনে ম্যানুয়ালি বা স্বয়ংক্রিয়ভাবে স্পার্ক UI পরিষ্কার করতে হয়।
ম্যানুয়ালি স্পার্ক UI আনইনস্টল করুন
SageMaker স্টুডিওতে স্পার্ক UI ম্যানুয়ালি আনইনস্টল করতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- বেছে নিন সিস্টেম টার্মিনাল সেজমেকার স্টুডিও লঞ্চারে।
- সিস্টেম টার্মিনালে নিম্নলিখিত কমান্ডগুলি চালান:
সমস্ত SageMaker স্টুডিও ব্যবহারকারী প্রোফাইলের জন্য স্বয়ংক্রিয়ভাবে স্পার্ক UI আনইনস্টল করুন
সমস্ত ব্যবহারকারী প্রোফাইলের জন্য SageMaker স্টুডিওতে স্পার্ক UI স্বয়ংক্রিয়ভাবে আনইনস্টল করতে, নিম্নলিখিত পদক্ষেপগুলি সম্পূর্ণ করুন:
- সেজমেকার কনসোলে, নির্বাচন করুন ডোমেইনের নেভিগেশন প্যানে, তারপর SageMaker স্টুডিও ডোমেন নির্বাচন করুন।
- ডোমেনের বিশদ পৃষ্ঠায়, নেভিগেট করুন পরিবেশ ট্যাব।
- SageMaker স্টুডিওতে স্পার্ক UI এর জন্য জীবনচক্র কনফিগারেশন নির্বাচন করুন।
- বেছে নিন বিচ্ছিন্ন.
- সেজমেকার স্টুডিও ব্যবহারকারী প্রোফাইলগুলির জন্য জুপিটার সার্ভার অ্যাপগুলি মুছুন এবং পুনরায় চালু করুন।
উপসংহার
এই পোস্টে, আমরা একটি সমাধান শেয়ার করেছি যা আপনি SageMaker স্টুডিওতে দ্রুত স্পার্ক UI ইনস্টল করতে ব্যবহার করতে পারেন। SageMaker-এ হোস্ট করা স্পার্ক UI-এর সাহায্যে, মেশিন লার্নিং (ML) এবং ডেটা ইঞ্জিনিয়ারিং দলগুলি যে কোনও জায়গা থেকে স্পার্ক লগগুলি অ্যাক্সেস করতে এবং বিশ্লেষণ করতে এবং তাদের প্রজেক্ট ডেলিভারির গতি বাড়াতে স্কেলযোগ্য ক্লাউড কম্পিউট ব্যবহার করতে পারে। আইটি প্রশাসকরা ক্লাউডে সমাধানের বিধানকে মানসম্মত এবং ত্বরান্বিত করতে পারে এবং এমএল প্রকল্পগুলির জন্য কাস্টম উন্নয়ন পরিবেশের বিস্তার এড়াতে পারে।
এই পোস্টের অংশ হিসাবে দেখানো সমস্ত কোড পাওয়া যায় GitHub সংগ্রহস্থল.
লেখক সম্পর্কে
জিউসেপ অ্যাঞ্জেলো পোরসেলি অ্যামাজন ওয়েব পরিষেবাগুলির জন্য একজন প্রধান মেশিন লার্নিং বিশেষজ্ঞ সমাধান স্থপতি৷ কয়েক বছরের সফ্টওয়্যার ইঞ্জিনিয়ারিং এবং একটি ML ব্যাকগ্রাউন্ডের সাথে, তিনি যেকোন আকারের গ্রাহকদের সাথে তাদের ব্যবসা এবং প্রযুক্তিগত চাহিদাগুলি বোঝার জন্য এবং AI এবং ML সমাধানগুলি ডিজাইন করেন যা AWS ক্লাউড এবং Amazon মেশিন লার্নিং স্ট্যাকের সর্বোত্তম ব্যবহার করে৷ তিনি MLOps, কম্পিউটার ভিশন এবং NLP সহ বিভিন্ন ডোমেনে প্রজেক্টে কাজ করেছেন, যেখানে AWS পরিষেবার একটি বিস্তৃত সেট জড়িত। তার অবসর সময়ে, জিউসেপ ফুটবল খেলা উপভোগ করেন।
ব্রুনো পিস্টোন মিলান ভিত্তিক AWS-এর জন্য একজন AI/ML বিশেষজ্ঞ সমাধান স্থপতি৷ তিনি যেকোন আকারের গ্রাহকদের সাথে কাজ করেন, তাদের প্রযুক্তিগত চাহিদা বুঝতে এবং AWS ক্লাউড এবং অ্যামাজন মেশিন লার্নিং স্ট্যাকের সর্বোত্তম ব্যবহার করে এমন AI এবং ML সমাধানগুলি ডিজাইন করতে সহায়তা করে। তার দক্ষতার ক্ষেত্রের মধ্যে রয়েছে মেশিন লার্নিং এন্ড টু এন্ড, মেশিন লার্নিং এন্ডস্ট্রিয়ালাইজেশন এবং জেনারেটিভ এআই। তিনি তার বন্ধুদের সাথে সময় কাটাতে এবং নতুন জায়গা অন্বেষণের পাশাপাশি নতুন গন্তব্যে ভ্রমণ উপভোগ করেন।
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- PlatoData.Network উল্লম্ব জেনারেটিভ Ai. নিজেকে ক্ষমতায়িত করুন। এখানে প্রবেশ করুন.
- প্লেটোএআইস্ট্রিম। Web3 ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- প্লেটোইএসজি। মোটরগাড়ি / ইভি, কার্বন, ক্লিনটেক, শক্তি, পরিবেশ সৌর, বর্জ্য ব্যবস্থাপনা. এখানে প্রবেশ করুন.
- ব্লকঅফসেট। পরিবেশগত অফসেট মালিকানার আধুনিকীকরণ। এখানে প্রবেশ করুন.
- উত্স: https://aws.amazon.com/blogs/machine-learning/host-the-spark-ui-on-amazon-sagemaker-studio/
- : আছে
- : হয়
- :কোথায়
- $ ইউপি
- 1
- 100
- 12
- 7
- 8
- 9
- a
- সম্পর্কে
- প্রবেশ
- অ্যাক্সেস করা
- স্টক
- অতিরিক্ত
- অতিরিক্ত তথ্য
- অ্যাডমিন
- AI
- এআই / এমএল
- সব
- অনুমতি
- অনুমতি
- এছাড়াও
- মর্দানী স্ত্রীলোক
- আমাজন EC2
- আমাজন ইএমআর
- অ্যামাজন মেশিন লার্নিং
- আমাজন সেজমেকার
- অ্যামাজন সেজমেকার স্টুডিও
- অ্যামাজন ওয়েব সার্ভিসেস
- an
- বিশ্লেষণ করা
- বিশ্লেষণ
- এবং
- কোন
- কোথাও
- এ্যাপাচি
- অ্যাপ্লিকেশন
- অ্যাপ্লিকেশন
- যথাযথ
- অ্যাপস
- রয়েছি
- AS
- সংযুক্ত
- স্বয়ংক্রিয় পদ্ধতি প্রয়োগ করা
- স্বয়ংক্রিয়ভাবে
- সহজলভ্য
- এড়াতে
- ডেস্কটপ AWS
- এডাব্লুএস আঠালো
- পটভূমি
- ভিত্তি
- BE
- সর্বোত্তম
- বিশাল
- বড় ডেটা
- প্রশস্ত
- ব্রাউজার
- ব্যবসায়
- by
- নামক
- CAN
- CD
- চেক
- বেছে নিন
- মেঘ
- গুচ্ছ
- কোড
- সাধারণভাবে
- সম্পূর্ণ
- গনা
- কম্পিউটার
- কম্পিউটার ভিশন
- কম্পিউটিং
- কনফিগারেশন
- কনফিগার
- সংযোজক
- গঠিত
- কনসোল
- আধার
- ধারণ
- নিয়ন্ত্রণ
- সৃষ্টি
- প্রথা
- গ্রাহকদের
- উপাত্ত
- তথ্য প্রক্রিয়াজাতকরণ
- ডেটাসেট
- বিলি
- নকশা
- গন্তব্যস্থল
- বিস্তারিত
- উন্নয়ন
- বিভিন্ন
- সরাসরি
- বণ্টিত
- ডিস্ট্রিবিউটেড কম্পিউটিং
- ডকুমেন্টেশন
- ডোমেইন
- ডোমেইনের
- সম্পন্ন
- সহজে
- পারেন
- সম্ভব
- সক্রিয়
- শেষ
- প্রকৌশল
- পরিবেশ
- পরিবেশের
- ত্রুটি
- ঘটনা
- উদাহরণ
- বিদ্যমান
- সুবিধাযুক্ত
- এক্সপ্লোরিং
- কয়েক
- ক্ষেত্র
- নমনীয়তা
- অনুসরণ
- ফুটবল
- জন্য
- ফ্রেমওয়ার্ক
- বিনামূল্যে
- বন্ধুদের
- থেকে
- সম্পূর্ণরূপে
- উত্পাদন করা
- উত্পন্ন
- সৃজক
- জেনারেটিভ এআই
- বৃহত্তর
- he
- সাহায্য
- তার
- ইতিহাস
- নিমন্ত্রণকর্তা
- হোস্ট
- কিভাবে
- কিভাবে
- এইচটিএমএল
- HTTP
- HTTPS দ্বারা
- if
- in
- অন্তর্ভুক্ত
- সুদ্ধ
- তথ্য
- ইনস্টল
- স্থাপন
- ইনস্টল করার
- সংহত
- সংহত
- আলাপচারিতার
- ইন্টারেক্টিভ
- ইন্টারফেস
- মধ্যে
- ঘটিত
- IT
- কাজ
- জবস
- JPG
- বড়
- শিক্ষা
- ছোড়
- জীবনচক্র
- মত
- লাইন
- অবস্থান
- লগ ইন করুন
- মেশিন
- মেশিন লার্নিং
- জাদু
- করা
- পরিচালিত
- ব্যবস্থাপনা
- পরিচালক
- ম্যানুয়ালি
- স্মৃতি
- MILAN
- ML
- এমএলওএস
- মডেল
- মনিটর
- অধিক
- নামে
- নেভিগেট করুন
- ন্যাভিগেশন
- প্রয়োজন
- প্রয়োজন
- চাহিদা
- নতুন
- NLP
- নোড
- নোটবই
- সংখ্যা
- of
- অফার
- on
- ওগুলো
- অপ্টিমাইজ
- পছন্দ
- অপশন সমূহ
- or
- শেষ
- পৃষ্ঠা
- শার্সি
- অংশ
- সম্পাদন করা
- অনুমতি
- জায়গা
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- কেলি
- জনপ্রিয়
- পোস্ট
- অধ্যক্ষ
- প্রক্রিয়া
- প্রক্রিয়াজাতকরণ
- প্রযোজনা
- প্রোফাইল
- প্রোফাইল
- উন্নতি
- প্রকল্প
- প্রকল্প
- প্রদত্ত
- পাইথন
- প্রশ্নের
- দ্রুত
- রশ্মি
- দূরবর্তী
- সংস্থান
- চালান
- দৌড়
- রান
- ঋষি নির্মাতা
- মাপযোগ্য
- স্ক্রিপ্ট
- SDK
- সেকেন্ড
- অধ্যায়
- দেখ
- Serverless
- সেবা
- সেশন
- সেট
- সেটিংস
- বিভিন্ন
- শেয়ার
- ভাগ
- খোল
- প্রদর্শনী
- প্রদর্শিত
- শো
- সহজ
- আয়তন
- সফটওয়্যার
- সফ্টওয়্যার প্রকৌশল
- সমাধান
- সলিউশন
- স্ফুলিঙ্গ
- বিশেষজ্ঞ
- নির্দিষ্ট
- স্পীড
- খরচ
- গাদা
- শুরু
- অবস্থা
- প্রারম্ভিক ব্যবহারের নির্দেশাবলী
- থামুন
- স্টোরেজ
- দোকান
- সঞ্চিত
- চিত্রশালা
- সমর্থন
- পদ্ধতি
- গ্রহণ করা
- দল
- কারিগরী
- প্রান্তিক
- যে
- সার্জারির
- তাদের
- তাহাদিগকে
- তারপর
- যার ফলে
- এইগুলো
- এই
- দ্বারা
- সময়
- থেকে
- সরঞ্জাম
- পথ
- প্রশিক্ষণ
- ভ্রমণ
- ধরনের
- ui
- অধীনে
- বোঝা
- URL টি
- ব্যবহার
- ব্যবহার
- ব্যবহারকারী
- ব্যবহারকারী ইন্টারফেস
- ব্যবহারকারী
- ব্যবহার
- উপযোগ
- দৃষ্টি
- উপায়
- we
- ওয়েব
- ওয়েব ব্রাউজার
- ওয়েব সার্ভিস
- ওয়েব ভিত্তিক
- আমরা একটি
- কখন
- যে
- ইচ্ছা
- সঙ্গে
- ছাড়া
- কাজ করছে
- কাজ
- বছর
- আপনি
- আপনার
- zephyrnet