অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট উপস্থাপন করা হচ্ছে

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স একটি উদ্দেশ্য-নির্মিত অনুমান বিকল্প যা আপনার জন্য মেশিন লার্নিং (ML) মডেল স্থাপন এবং স্কেল করা সহজ করে তোলে। এটি একটি পে-প্রতি-ব্যবহার মডেল প্রদান করে, যা সেইসব পরিষেবার জন্য আদর্শ যেখানে এন্ডপয়েন্ট আহ্বান বিরল এবং অপ্রত্যাশিত। একটি রিয়েল-টাইম হোস্টিং এন্ডপয়েন্টের বিপরীতে, যা একটি দীর্ঘ-চলমান উদাহরণ দ্বারা সমর্থিত, সার্ভারহীন এন্ডপয়েন্টগুলির জন্য গণনা সংস্থানগুলি চাহিদা অনুসারে সরবরাহ করা হয়, যার ফলে উদাহরণের প্রকারগুলি বেছে নেওয়া বা স্কেলিং নীতিগুলি পরিচালনা করার প্রয়োজনীয়তা বাদ দেওয়া হয়।

নিম্নোক্ত উচ্চ-স্তরের আর্কিটেকচারটি ব্যাখ্যা করে যে কীভাবে একটি সার্ভারহীন এন্ডপয়েন্ট কাজ করে। একটি ক্লায়েন্ট একটি এন্ডপয়েন্ট আহ্বান করে, যা AWS পরিচালিত পরিকাঠামো দ্বারা সমর্থিত।

যাইহোক, সার্ভারবিহীন এন্ডপয়েন্টগুলি সেকেন্ডের ক্রমানুসারে ঠান্ডা শুরু হওয়ার প্রবণ, এবং তাই বিরতিহীন বা অপ্রত্যাশিত কাজের চাপের জন্য আরও উপযুক্ত।

খরচ এবং কর্মক্ষমতা দৃষ্টিকোণ থেকে সার্ভারহীন এন্ডপয়েন্ট সঠিক স্থাপনার বিকল্প কিনা তা নির্ধারণে সহায়তা করার জন্য, আমরা বিকাশ করেছি সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট, যা বিভিন্ন এন্ডপয়েন্ট কনফিগারেশন পরীক্ষা করে এবং তুলনামূলক রিয়েল-টাইম হোস্টিং উদাহরণের সাথে সবচেয়ে অনুকূলের তুলনা করে।

এই পোস্টে, আমরা টুলকিটটি প্রবর্তন করি এবং এর কনফিগারেশন এবং আউটপুটগুলির একটি ওভারভিউ প্রদান করি।

সমাধান ওভারভিউ

আপনি টুলকিটটি ডাউনলোড করতে পারেন এবং এটি থেকে ইনস্টল করতে পারেন গিটহুব রেপো. শুরু করা সহজ: কেবল লাইব্রেরি ইনস্টল করুন, একটি তৈরি করুন সেজমেকার মডেল, এবং পেলোড বডি এবং কন্টেন্টের ধরন সহ, ইনভোকেশন প্যারামিটারের একটি নমুনা সেট ধারণকারী JSON লাইনের ফর্ম্যাট করা ফাইলের সাথে আপনার মডেলের নাম প্রদান করুন। একটি JSON লাইন ফাইল বা চিত্র, ভিডিও বা অডিওর মতো বাইনারি পেলোডের জন্য একটি আচার ফাইলে নমুনা আহ্বান আর্গুমেন্টের একটি তালিকা রূপান্তর করার জন্য একটি সুবিধার ফাংশন প্রদান করা হয়।

টুলকিট ইনস্টল করুন

প্রথমে পাইপ ব্যবহার করে আপনার পাইথন পরিবেশে বেঞ্চমার্কিং লাইব্রেরি ইনস্টল করুন:

pip install sm-serverless-benchmarking

আপনি একটি থেকে নিম্নলিখিত কোড চালাতে পারেন অ্যামাজন সেজমেকার স্টুডিও দৃষ্টান্ত, সেজমেকার নোটবুক উদাহরণ, অথবা সঙ্গে কোনো উদাহরণ প্রোগ্রাম্যাটিক অ্যাক্সেস AWS এবং উপযুক্ত এডাব্লুএস আইডেন্টিটি এবং অ্যাক্সেস ম্যানেজমেন্ট (IAM) অনুমতি। প্রয়োজনীয় IAM অনুমতি নথিভুক্ত করা হয় গিটহুব রেপো. IAM-এর জন্য অতিরিক্ত নির্দেশিকা এবং উদাহরণ নীতির জন্য, পড়ুন কিভাবে Amazon SageMaker IAM এর সাথে কাজ করে. এই কোডটি একটি মডেলে প্যারামিটারের একটি ডিফল্ট সেট সহ একটি বেঞ্চমার্ক চালায় যা দুটি উদাহরণ রেকর্ড সহ একটি CSV ইনপুট আশা করে৷ বিভিন্ন ইনপুট পেলোডের সাথে এন্ডপয়েন্ট কীভাবে পারফর্ম করে তা বিশ্লেষণ করতে উদাহরণের একটি প্রতিনিধি সেট প্রদান করা একটি ভাল অভ্যাস।

from sm_serverless_benchmarking import benchmark
from sm_serverless_benchmarking.utils import convert_invoke_args_to_jsonl
model_name = ""
example_invoke_args = [
        {'Body': '1,2,3,4,5', "ContentType": "text/csv"},
        {'Body': '6,7,8,9,10', "ContentType": "text/csv"}
        ]
example_args_file = convert_invoke_args_to_jsonl(example_invoke_args,
output_path=".")
r = benchmark.run_serverless_benchmarks(model_name, example_args_file)

অতিরিক্তভাবে, আপনি বেঞ্চমার্কটিকে সেজমেকার প্রসেসিং কাজ হিসাবে চালাতে পারেন, যা প্রচুর সংখ্যক আহ্বান সহ দীর্ঘমেয়াদী বেঞ্চমার্কের জন্য আরও নির্ভরযোগ্য বিকল্প হতে পারে। নিম্নলিখিত কোড দেখুন:

from sm_serverless_benchmarking.sagemaker_runner import run_as_sagemaker_job
run_as_sagemaker_job(
                    role="",
                    model_name="",
                    invoke_args_examples_file="",
                    )

নোট করুন যে এটি বেঞ্চমার্কের সময়কালের জন্য একটি ml.m5.large SageMaker প্রসেসিং উদাহরণ চালানোর অতিরিক্ত খরচ বহন করবে।

উভয় পদ্ধতিই কনফিগার করার জন্য অনেকগুলি পরামিতি গ্রহণ করে, যেমন বেঞ্চমার্কে মেমরি কনফিগারেশনের তালিকা এবং প্রতিটি কনফিগারেশন কতবার আহ্বান করা হবে। বেশিরভাগ ক্ষেত্রে, ডিফল্ট বিকল্পগুলি একটি সূচনা বিন্দু হিসাবে যথেষ্ট হওয়া উচিত, তবে উল্লেখ করুন গিটহুব রেপো প্রতিটি প্যারামিটারের সম্পূর্ণ তালিকা এবং বর্ণনার জন্য।

বেঞ্চমার্কিং কনফিগারেশন

বেঞ্চমার্ক কী করে এবং এটি কী আউটপুট তৈরি করে তা দেখার আগে, সার্ভারহীন এন্ডপয়েন্ট কনফিগার করার ক্ষেত্রে কয়েকটি মূল ধারণা বোঝা গুরুত্বপূর্ণ।

সেখানে দুটি মূল কনফিগারেশন বিকল্প: MemorySizeInMB এবং MaxConcurrency. MemorySizeInMB ইন্সট্যান্সে বরাদ্দকৃত মেমরির পরিমাণ কনফিগার করে এবং 1024 MB, 2048 MB, 3072 MB, 4096 MB, 5120 MB, বা 6144 MB হতে পারে। vCPU-র সংখ্যাও বরাদ্দকৃত মেমরির পরিমাণের সমানুপাতিকভাবে স্কেল করে। দ্য MaxConcurrency পরামিতি সামঞ্জস্য করে কতগুলি সমবর্তী অনুরোধ একটি এন্ডপয়েন্ট পরিষেবা দিতে সক্ষম। সঙ্গে একটি MaxConcurrency 1 এর মধ্যে, একটি সার্ভারহীন এন্ডপয়েন্ট একবারে শুধুমাত্র একটি অনুরোধ প্রক্রিয়া করতে পারে।

সংক্ষিপ্তসার হিসাবে, MemorySizeInMB প্যারামিটার উল্লম্ব স্কেলেবিলিটির জন্য একটি প্রক্রিয়া প্রদান করে, যা আপনাকে মেমরি সামঞ্জস্য করতে এবং বৃহত্তর মডেলগুলি পরিবেশন করার জন্য সম্পদ গণনা করতে দেয়, যেখানে MaxConcurrency অনুভূমিক স্কেলেবিলিটির জন্য একটি প্রক্রিয়া প্রদান করে, আপনার এন্ডপয়েন্টকে আরও সমবর্তী অনুরোধগুলি প্রক্রিয়া করার অনুমতি দেয়।

একটি এন্ডপয়েন্ট পরিচালনার খরচ মূলত মেমরির আকার দ্বারা নির্ধারিত হয়, এবং সর্বাধিক সংমিশ্রণ বাড়ানোর সাথে সম্পর্কিত কোন খরচ নেই। যাইহোক, সব শেষ পয়েন্ট জুড়ে সর্বোচ্চ একত্রিতার জন্য প্রতি-অঞ্চল অ্যাকাউন্টের সীমা রয়েছে। নির্দেশ করে সেজমেকার এন্ডপয়েন্ট এবং কোটা সর্বশেষ সীমার জন্য।

বেঞ্চমার্কিং আউটপুট

এই প্রদত্ত, একটি সার্ভারহীন এন্ডপয়েন্ট বেঞ্চমার্ক করার লক্ষ্য হল সবচেয়ে সাশ্রয়ী এবং নির্ভরযোগ্য মেমরির আকারের সেটিং এবং সর্বনিম্ন সর্বোচ্চ একযোগে যা আপনার প্রত্যাশিত ট্র্যাফিক প্যাটার্নগুলি পরিচালনা করতে পারে তা নির্ধারণ করা।

ডিফল্টরূপে, টুল দুটি বেঞ্চমার্ক চালায়। প্রথমটি হল একটি স্থিতিশীলতার মানদণ্ড, যা প্রতিটি নির্দিষ্ট মেমরি কনফিগারেশনের জন্য একটি এন্ডপয়েন্ট স্থাপন করে এবং প্রদত্ত নমুনা পেলোড সহ প্রতিটি এন্ডপয়েন্টকে আহ্বান করে। এই বেঞ্চমার্কের লক্ষ্য হল সবচেয়ে কার্যকর এবং স্থিতিশীল MemorySizeInMB সেটিং নির্ধারণ করা। বেঞ্চমার্কটি আমন্ত্রণ বিলম্বগুলি ক্যাপচার করে এবং প্রতিটি শেষ পয়েন্টের জন্য প্রত্যাশিত প্রতি আহ্বানের খরচ গণনা করে৷ এটি তারপর একটি অনুরূপ রিয়েল-টাইম হোস্টিং উদাহরণের সাথে খরচ তুলনা করে।

বেঞ্চমার্কিং সম্পূর্ণ হলে, টুলটি নির্দিষ্ট কিছু আউটপুট তৈরি করে result_save_path নিম্নলিখিত ডিরেক্টরি কাঠামো সহ ডিরেক্টরি:

├── benchmarking_report
├── concurrency_benchmark_raw_results
├── concurrency_benchmark_summary_results
├── cost_analysis_summary_results
├── stability_benchmark_raw_results
├── stability_benchmark_summary_results

সার্জারির benchmarking_report ডিরেক্টরিতে সমস্ত সারাংশ আউটপুট সহ একটি সমন্বিত প্রতিবেদন রয়েছে যা আমরা এই পোস্টে রূপরেখা দিয়েছি। অতিরিক্ত ডিরেক্টরিতে কাঁচা এবং মধ্যবর্তী আউটপুট রয়েছে যা আপনি অতিরিক্ত বিশ্লেষণের জন্য ব্যবহার করতে পারেন। পড়ুন গিটহুব রেপো প্রতিটি আউটপুট আর্টিফ্যাক্টের আরও বিশদ বিবরণের জন্য।

আসুন একটি কম্পিউটার ভিশন MobileNetV2 TensorFlow মডেল পরিবেশনকারী একটি এন্ডপয়েন্টের জন্য কয়েকটি প্রকৃত বেঞ্চমার্কিং আউটপুট পরীক্ষা করি। আপনি যদি এই উদাহরণটি পুনরুত্পাদন করতে চান তবে দেখুন উদাহরণ নোটবুক GitHub রেপোতে ডিরেক্টরি।

একত্রিত প্রতিবেদনের মধ্যে প্রথম আউটপুট হল একটি সারাংশ সারণী যা প্রতিটির জন্য ন্যূনতম, গড়, মাঝারি এবং সর্বোচ্চ লেটেন্সি মেট্রিক্স প্রদান করে MemorySizeInMB সফল মেমরি আকার কনফিগারেশন. নিম্নলিখিত সারণীতে দেখানো হয়েছে, গড় আহ্বানের বিলম্বিতা (invocation_latency_mean) মেমরি কনফিগারেশন 3072 MB পর্যন্ত বাড়ানোর সাথে সাথে উন্নতি হতে থাকে, কিন্তু তারপরে উন্নতি করা বন্ধ হয়ে যায়।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

উচ্চ-স্তরের বর্ণনামূলক পরিসংখ্যান ছাড়াও, প্রতিটি মেমরি কনফিগারেশনের জন্য ক্লায়েন্টের কাছ থেকে পর্যবেক্ষণ করা বিলম্বের বন্টন দেখানো একটি চার্ট দেওয়া হয়। আবার, আমরা লক্ষ্য করতে পারি যে 1024 MB কনফিগারেশন অন্যান্য বিকল্পগুলির মতো পারফরম্যান্স নয়, তবে 2048 এবং তার উপরে কনফিগারেশনগুলিতে পারফরম্যান্সের মধ্যে উল্লেখযোগ্য পার্থক্য নেই।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

অ্যামাজন ক্লাউডওয়াচ প্রতিটি এন্ডপয়েন্ট কনফিগারেশনের সাথে যুক্ত মেট্রিক্সও প্রদান করা হয়। একটি মূল মেট্রিক এখানে ModelSetupTime, যা পরিমাপ করে যে মডেলটি লোড হতে কত সময় লেগেছিল যখন শেষ পয়েন্টটি ঠান্ডা অবস্থায় চালু করা হয়েছিল৷ মেট্রিক সবসময় রিপোর্টে উপস্থিত নাও হতে পারে কারণ একটি শেষ পয়েন্ট উষ্ণ অবস্থায় চালু করা হয়। ক cold_start_delay একটি স্থাপন করা এন্ডপয়েন্টে বেঞ্চমার্ক শুরু করার আগে ঘুমের জন্য কত সেকেন্ডের সংখ্যা নির্দিষ্ট করার জন্য প্যারামিটার উপলব্ধ। এই প্যারামিটারটিকে একটি উচ্চতর সংখ্যা যেমন 600 সেকেন্ডে সেট করা একটি ঠান্ডা অবস্থার আহ্বানের সম্ভাবনা বাড়াবে এবং এই মেট্রিকটি ক্যাপচার করার সম্ভাবনাকে উন্নত করবে৷ উপরন্তু, এই মেট্রিকটি সমবর্তী আহ্বানের বেঞ্চমার্কের সাথে ক্যাপচার করার সম্ভাবনা অনেক বেশি, যা আমরা এই বিভাগে পরে আলোচনা করব।

নিম্নলিখিত টেবিলটি প্রতিটি মেমরি কনফিগারেশনের জন্য ক্লাউডওয়াচ দ্বারা ক্যাপচার করা মেট্রিক্স দেখায়।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

পরবর্তী চার্ট বিভিন্ন মেমরি কনফিগারেশনের কর্মক্ষমতা এবং খরচ ট্রেড-অফ দেখায়। একটি লাইন এন্ডপয়েন্ট 1 মিলিয়ন বার আহ্বান করার আনুমানিক খরচ দেখায় এবং অন্যটি গড় প্রতিক্রিয়া লেটেন্সি দেখায়। এই মেট্রিক্স আপনার সিদ্ধান্ত জানাতে পারে কোন শেষ পয়েন্ট কনফিগারেশন সবচেয়ে সাশ্রয়ী। এই উদাহরণে, আমরা দেখতে পাই যে 2048 MB এর পরে গড় বিলম্বিতা কম হয়ে যায়, যেখানে খরচ ক্রমাগত বাড়তে থাকে, ইঙ্গিত করে যে এই মডেলের জন্য 2048-এর মেমরি আকারের কনফিগারেশন সবচেয়ে অনুকূল হবে।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

খরচ এবং স্থিতিশীলতার বেঞ্চমার্কের চূড়ান্ত আউটপুট হল একটি প্রস্তাবিত মেমরি কনফিগারেশন, একটি সারণী সহ একটি তুলনীয় SageMaker হোস্টিং উদাহরণের সাথে একটি সার্ভারবিহীন এন্ডপয়েন্ট পরিচালনার খরচ তুলনা করে। সংগৃহীত ডেটার উপর ভিত্তি করে, টুলটি নির্ধারণ করেছে যে 2048 MB কনফিগারেশন এই মডেলের জন্য সবচেয়ে অনুকূল। যদিও 3072 কনফিগারেশন মোটামুটি 10 ​​মিলিসেকেন্ডের ভালো লেটেন্সি প্রদান করে, যা প্রতি 30 মিলিয়ন অনুরোধে $4.55 থেকে $5.95 পর্যন্ত খরচের 1% বৃদ্ধির সাথে আসে। অতিরিক্তভাবে, আউটপুট দেখায় যে একটি সার্ভারহীন এন্ডপয়েন্ট একটি তুলনামূলক রিয়েল-টাইম হোস্টিং উদাহরণের বিপরীতে 88.72% পর্যন্ত সঞ্চয় প্রদান করবে যখন 1 মিলিয়নেরও কম মাসিক আহ্বানের অনুরোধ থাকে এবং 8.5 মিলিয়ন অনুরোধের পরেও একটি রিয়েল-টাইম এন্ডপয়েন্টের সাথে বিরতি হয়।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

দ্বিতীয় ধরনের বেঞ্চমার্ক ঐচ্ছিক এবং বিভিন্ন পরীক্ষা MaxConcurency বিভিন্ন ট্রাফিক প্যাটার্নের অধীনে সেটিংস। এই বেঞ্চমার্ক সাধারণত সর্বোত্তম ব্যবহার করে চালানো হয় MemorySizeInMB স্থিতিশীলতা বেঞ্চমার্ক থেকে কনফিগারেশন। এই বেঞ্চমার্কের জন্য দুটি মূল পরামিতির একটি তালিকা MaxConcurency ক্লায়েন্ট গুণকগুলির একটি তালিকা সহ পরীক্ষা করার জন্য সেটিংস, যা সিমুলেটেড সমসাময়িক ক্লায়েন্টের সংখ্যা নির্ধারণ করে যেগুলির সাথে এন্ডপয়েন্ট পরীক্ষা করা হয়।

উদাহরণস্বরূপ, সেট করে concurrency_benchmark_max_conc parameter থেকে [4, 8] এবং concurrency_num_clients_multiplier [1, 1.5, 2] থেকে, দুটি শেষ বিন্দু চালু করা হয়েছে: একটি সহ MaxConcurency এর 4 এবং অন্যান্য 8। প্রতিটি শেষ পয়েন্ট তারপর একটি (MaxConcurency x গুণক) সিমুলেটেড কনকারেন্ট ক্লায়েন্টের সংখ্যা, যা 4 এর একযোগে এন্ডপয়েন্টের জন্য 4, 6 এবং 8টি সমবর্তী ক্লায়েন্টের সাথে পরীক্ষার বেঞ্চমার্ক লোড করতে অনুবাদ করে।

এই বেঞ্চমার্কের প্রথম আউটপুট হল একটি টেবিল যা প্রতিটির সাথে যুক্ত লেটেন্সি মেট্রিক্স, থ্রোটলিং এক্সেপশন এবং প্রতি সেকেন্ড মেট্রিক্স (TPS) লেনদেন দেখায় MaxConcurrency বিভিন্ন সংখ্যক সমসাময়িক ক্লায়েন্টের সাথে কনফিগারেশন। এই মেট্রিক্স উপযুক্ত নির্ধারণ করতে সাহায্য করে MaxConcurrency প্রত্যাশিত ট্রাফিক লোড পরিচালনা করার জন্য সেটিং। নিম্নলিখিত সারণীতে, আমরা দেখতে পাচ্ছি যে 8-এর সর্বোচ্চ একযোগে কনফিগার করা একটি এন্ডপয়েন্ট প্রতি সেকেন্ডে গড়ে 16টি লেনদেনের মাধ্যমে করা 2,500টি আহ্বানের মধ্যে শুধুমাত্র দুটি থ্রটলিং ব্যতিক্রম সহ 24টি সমবর্তী ক্লায়েন্টকে পরিচালনা করতে সক্ষম হয়েছে।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

আউটপুট পরবর্তী সেট প্রতিটি জন্য একটি চার্ট প্রদান করে MaxConcurrency সেটিং বিভিন্ন লোডের অধীনে বিলম্বের বন্টন দেখাচ্ছে। এই উদাহরণে, আমরা দেখতে পারি যে a এর সাথে একটি শেষ বিন্দু MaxConcurrency 4-এর সেটিং সফলভাবে 8 জন সমকালীন ক্লায়েন্টের সাথে সমস্ত অনুরোধ প্রক্রিয়া করতে সক্ষম হয়েছে যাতে আমন্ত্রণ বিলম্বের ন্যূনতম বৃদ্ধি হয়।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

চূড়ান্ত আউটপুট প্রতিটির জন্য ক্লাউডওয়াচ মেট্রিক্স সহ একটি টেবিল প্রদান করে MaxConcurrency কনফিগারেশন. প্রতিটি মেমরি কনফিগারেশনের জন্য লেটেন্সি ডিস্ট্রিবিউশন দেখানো পূর্ববর্তী টেবিলের বিপরীতে, যা সবসময় কোল্ড স্টার্ট প্রদর্শন নাও করতে পারে ModelSetupTime মেট্রিক, বৃহত্তর সংখ্যক আমন্ত্রণ অনুরোধের কারণে এই মেট্রিকটি এই টেবিলে উপস্থিত হওয়ার সম্ভাবনা অনেক বেশি MaxConcurrency.

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.

উপসংহার

এই পোস্টে, আমরা সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্রবর্তন করেছি এবং এর কনফিগারেশন এবং আউটপুটগুলির একটি ওভারভিউ প্রদান করেছি। টুলটি আপনাকে বাস্তবসম্মত ট্র্যাফিক প্যাটার্ন সহ বিভিন্ন কনফিগারেশন লোড পরীক্ষা করে সার্ভারহীন অনুমানের বিষয়ে আরও সচেতন সিদ্ধান্ত নিতে সাহায্য করতে পারে। একটি সার্ভারহীন এন্ডপয়েন্ট স্থাপন করে আপনি যে কর্মক্ষমতা এবং খরচ সাশ্রয় আশা করতে পারেন তা দেখতে আপনার নিজের মডেলগুলির সাথে বেঞ্চমার্কিং টুলকিটটি ব্যবহার করে দেখুন৷ অনুগ্রহ করে দেখুন গিটহুব রেপো অতিরিক্ত ডকুমেন্টেশন এবং উদাহরণ নোটবুকের জন্য।

অতিরিক্ত সম্পদ


লেখক সম্পর্কে

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.সাইমন জামারিন একজন AI/ML সলিউশন আর্কিটেক্ট যার মূল ফোকাস গ্রাহকদের তাদের ডেটা সম্পদ থেকে মূল্য বের করতে সাহায্য করে। তার অবসর সময়ে, সাইমন পরিবারের সাথে সময় কাটানো, সাই-ফাই পড়া এবং বিভিন্ন DIY হাউস প্রকল্পে কাজ করা উপভোগ করে।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.ধাওয়াল প্যাটেল AWS-এর একজন প্রধান মেশিন লার্নিং আর্কিটেক্ট। তিনি ডিস্ট্রিবিউটেড কম্পিউটিং এবং কৃত্রিম বুদ্ধিমত্তা সংক্রান্ত সমস্যা নিয়ে বড় উদ্যোগ থেকে শুরু করে মাঝারি আকারের স্টার্টআপ পর্যন্ত সংস্থাগুলির সাথে কাজ করেছেন। তিনি এনএলপি এবং কম্পিউটার ভিশন ডোমেন সহ গভীর শিক্ষার উপর মনোনিবেশ করেন। তিনি গ্রাহকদের সেজমেকারে উচ্চ-পারফরম্যান্স মডেল অনুমান অর্জনে সহায়তা করেন।

অ্যামাজন সেজমেকার সার্ভারলেস ইনফারেন্স বেঞ্চমার্কিং টুলকিট প্লেটোব্লকচেন ডেটা ইন্টেলিজেন্সের সাথে পরিচয় করিয়ে দেওয়া হচ্ছে। উল্লম্ব অনুসন্ধান. আ.ঋষভ রায় চৌধুরী অ্যামাজন সেজমেকারের একজন সিনিয়র প্রোডাক্ট ম্যানেজার, মেশিন লার্নিং ইনফারেন্সের উপর ফোকাস করে। তিনি AWS-এ মেশিন লার্নিং গ্রাহকদের কাজের চাপ কমাতে সাহায্য করার জন্য তাদের উদ্ভাবন এবং নতুন অভিজ্ঞতা তৈরি করার বিষয়ে উত্সাহী। তার অবসর সময়ে, তিনি ভ্রমণ এবং রান্না উপভোগ করেন। আপনি তাকে খুঁজে পেতে পারেন লিঙ্কডইন.

সময় স্ট্যাম্প:

থেকে আরো এডাব্লুএস মেশিন লার্নিং

আমাজন বেডরকের জন্য এজেন্টদের সাথে একটি ফাউন্ডেশন মডেল (এফএম) চালিত গ্রাহক পরিষেবা বট তৈরি করুন | আমাজন ওয়েব সার্ভিসেস

উত্স নোড: 1914810
সময় স্ট্যাম্প: নভেম্বর 17, 2023

Amazon SageMaker Data Wrangler-এ Amazon Athena ডেটা উৎসের জন্য একটি কাস্টম অ্যামাজন S3 কোয়েরি আউটপুট অবস্থান এবং ডেটা ধরে রাখার নীতি কনফিগার করুন

উত্স নোড: 1673951
সময় স্ট্যাম্প: সেপ্টেম্বর 20, 2022

অ্যামাজন বেডরকের জন্য জ্ঞানের ভিত্তিগুলি এখন RetrieveAndGenerate API এর জন্য কাস্টম প্রম্পট এবং সর্বাধিক সংখ্যক পুনরুদ্ধার ফলাফলের কনফিগারেশন সমর্থন করে | আমাজন ওয়েব সার্ভিসেস

উত্স নোড: 1962691
সময় স্ট্যাম্প: এপ্রিল 9, 2024

প্রান্তে ভিজ্যুয়াল গুণমান পরিদর্শনের জন্য এন্ড-টু-এন্ড MLOps পাইপলাইন তৈরি করুন – পার্ট 1 | আমাজন ওয়েব সার্ভিসেস

উত্স নোড: 1897422
সময় স্ট্যাম্প: অক্টোবর 2, 2023