এই দুই-অংশের সিরিজে, আমরা 3D অবজেক্ট সনাক্তকরণ কাজের জন্য মডেলগুলিকে কীভাবে লেবেল এবং প্রশিক্ষণ দিতে হয় তা প্রদর্শন করি। পার্ট 1-এ, আমরা যে ডেটাসেট ব্যবহার করছি, সেইসাথে ডেটা বোঝার এবং লেবেল করার জন্য যেকোন প্রি-প্রসেসিং ধাপ নিয়ে আলোচনা করি। পার্ট 2-এ, আমরা কীভাবে আপনার ডেটাসেটে একটি মডেলকে প্রশিক্ষিত করব এবং এটিকে উত্পাদনে স্থাপন করব।
LiDAR (আলো সনাক্তকরণ এবং রেঞ্জিং) একটি লেজারের সাহায্যে একটি বস্তু বা পৃষ্ঠকে লক্ষ্য করে এবং রিসিভারে প্রতিফলিত আলোর ফিরে আসার সময় পরিমাপ করে রেঞ্জ নির্ধারণের একটি পদ্ধতি। স্বায়ত্তশাসিত যানবাহন কোম্পানিগুলি সাধারণত তাদের যানবাহনের চারপাশের পরিবেশ সম্পর্কে 3D বোঝার জন্য LiDAR সেন্সর ব্যবহার করে।
যেহেতু LiDAR সেন্সরগুলি আরও অ্যাক্সেসযোগ্য এবং সাশ্রয়ী হয়ে উঠেছে, গ্রাহকরা রোবোটিক্স, সিগন্যাল ম্যাপিং এবং অগমেন্টেড রিয়েলিটির মতো নতুন স্থানগুলিতে পয়েন্ট ক্লাউড ডেটা ব্যবহার করছেন৷ কিছু নতুন মোবাইল ডিভাইস এমনকি LiDAR সেন্সর অন্তর্ভুক্ত. LiDAR সেন্সরগুলির ক্রমবর্ধমান প্রাপ্যতা 3D অবজেক্ট ডিটেকশন এবং ট্র্যাকিং, 3D সেগমেন্টেশন, 3D অবজেক্ট সংশ্লেষণ এবং পুনর্গঠনের মতো মেশিন লার্নিং (ML) কাজের জন্য পয়েন্ট ক্লাউড ডেটার প্রতি আগ্রহ বাড়িয়েছে এবং 3D গভীরতা অনুমান যাচাই করতে 2D ডেটা ব্যবহার করে৷
এই সিরিজে, আমরা আপনাকে দেখাই যে কীভাবে একটি অবজেক্ট ডিটেকশন মডেলকে প্রশিক্ষণ দিতে হয় যা পয়েন্ট ক্লাউড ডেটাতে চলে একটি 3D দৃশ্যে যানবাহনের অবস্থানের পূর্বাভাস দিতে। এই পোস্টে, আমরা বিশেষভাবে LiDAR ডেটা লেবেল করার উপর ফোকাস করি। স্ট্যান্ডার্ড LiDAR সেন্সর আউটপুট হল 3D পয়েন্ট ক্লাউড ফ্রেমের একটি ক্রম, যার একটি সাধারণ ক্যাপচার রেট প্রতি সেকেন্ডে 10 ফ্রেম। এই সেন্সর আউটপুট লেবেল করতে আপনার একটি লেবেলিং টুল প্রয়োজন যা 3D ডেটা পরিচালনা করতে পারে। আমাজন সেজমেকার গ্রাউন্ড ট্রুথ ML প্রশিক্ষণ ডেটাসেট তৈরির জন্য একটি একক 3D ফ্রেমে বা 3D পয়েন্ট ক্লাউড ফ্রেমের একটি ক্রম জুড়ে বস্তুগুলিকে লেবেল করা সহজ করে তোলে৷ গ্রাউন্ড ট্রুথ আটটি ভিডিও ক্যামেরা ইনপুট সহ ক্যামেরা এবং LiDAR ডেটার সেন্সর ফিউশনকেও সমর্থন করে।
যেকোন এমএল প্রকল্পের জন্য ডেটা অপরিহার্য। বিশেষ করে 3D ডেটা উৎস, কল্পনা এবং লেবেল করা কঠিন হতে পারে। আমরা ব্যবহার করি A2D2 ডেটাসেট এই পোস্টে এবং এটিকে ভিজ্যুয়ালাইজ এবং লেবেল করার জন্য আপনাকে পদক্ষেপের মাধ্যমে নিয়ে যেতে হবে।
A2D2-এ 40,000টি ফ্রেম রয়েছে যার মধ্যে সিমেন্টিক সেগমেন্টেশন এবং পয়েন্ট ক্লাউড লেবেল রয়েছে, যার মধ্যে 12,499D বাউন্ডিং বক্স লেবেল সহ 3টি ফ্রেম রয়েছে। যেহেতু আমরা অবজেক্ট ডিটেকশনে ফোকাস করছি, তাই আমরা 12,499D বাউন্ডিং বক্স লেবেল সহ 3 ফ্রেমে আগ্রহী। এই টীকাগুলিতে গাড়ি, পথচারী, ট্রাক, বাস ইত্যাদির মতো ড্রাইভিং সম্পর্কিত 14টি ক্লাস অন্তর্ভুক্ত রয়েছে।
নিম্নলিখিত টেবিল সম্পূর্ণ ক্লাস তালিকা দেখায়:
সূচক | ক্লাস তালিকা |
1 | পশু |
2 | সাইকেল |
3 | বাস |
4 | গাড়ী |
5 | কাফেলা পরিবহনকারী |
6 | সাইকেল-আরোহী |
7 | জরুরি গাড়ির |
8 | মোটর বাইকার |
9 | মোটরসাইকেল |
10 | পথচারী |
11 | লতা |
12 | ট্রাক |
13 | ইউটিলিটি যানবাহন |
14 | ভ্যান/এসইউভি |
আমরা আমাদের ডিটেক্টরকে বিশেষভাবে গাড়ি সনাক্ত করতে প্রশিক্ষণ দেব কারণ এটি আমাদের ডেটাসেটের সবচেয়ে সাধারণ শ্রেণী (ডেটাসেটের মোট 32616টি বস্তুর মধ্যে 42816টি গাড়ি হিসাবে লেবেল করা হয়েছে)।
সমাধান ওভারভিউ
এই সিরিজে, আমরা আমাজন সেজমেকার গ্রাউন্ড ট্রুথের সাথে কীভাবে আপনার ডেটা ভিজ্যুয়ালাইজ এবং লেবেল করতে হয় তা কভার করি এবং একটি অ্যামাজন সেজমেকার এন্ডপয়েন্টে স্থাপন করা একটি অবজেক্ট ডিটেকশন মডেল তৈরি করতে একটি অ্যামাজন সেজমেকার প্রশিক্ষণের কাজে এই ডেটা কীভাবে ব্যবহার করতে হয় তা প্রদর্শন করি। বিশেষ করে, আমরা সমাধানটি পরিচালনা করতে এবং কোনো লেবেলিং বা প্রশিক্ষণের কাজ চালু করতে একটি Amazon SageMaker নোটবুক ব্যবহার করব।
নিম্নলিখিত চিত্রটি সেন্সর ডেটার সামগ্রিক প্রবাহকে লেবেল থেকে প্রশিক্ষণ থেকে স্থাপন পর্যন্ত চিত্রিত করে:
আপনি শিখবেন কিভাবে একটি রিয়েল-টাইম 3D অবজেক্ট ডিটেকশন মডেলের সাথে প্রশিক্ষণ এবং স্থাপন করতে হয় আমাজন সেজমেকার নিম্নোক্ত ধাপ সহ গ্রাউন্ড ট্রুথ:
- একটি পয়েন্ট ক্লাউড ডেটাসেট ডাউনলোড এবং কল্পনা করুন
- এর সাথে লেবেল করা তথ্য প্রস্তুত করুন অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথ পয়েন্ট ক্লাউড টুল
- এর সাথে একটি বিতরণকৃত অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথ প্রশিক্ষণ কাজ চালু করুন এমএমডিটেকশন3ডি
- আপনার প্রশিক্ষণ কাজের ফলাফল মূল্যায়ন এবং এর সাথে আপনার সম্পদ ব্যবহারের প্রোফাইলিং আমাজন সেজমেকার ডিবাগার
- একটি অ্যাসিঙ্ক্রোনাস স্থাপন করুন সেজমেকার এন্ডপয়েন্ট
- এন্ডপয়েন্টে কল করুন এবং 3D অবজেক্টের ভবিষ্যদ্বাণী ভিজ্যুয়ালাইজ করুন
এই সমাধান বাস্তবায়ন করতে ব্যবহৃত AWS পরিষেবা
পূর্বশর্ত
নিচের চিত্রটি দেখায় কিভাবে একটি ব্যক্তিগত কর্মী বাহিনী তৈরি করা যায়। লিখিত, ধাপে ধাপে নির্দেশাবলীর জন্য, দেখুন লেবেলিং ওয়ার্কফোর্স পৃষ্ঠা ব্যবহার করে একটি অ্যামাজন কগনিটো ওয়ার্কফোর্স তৈরি করুন.
AWS CloudFormation স্ট্যাক চালু করা হচ্ছে
এখন আপনি সমাধানের কাঠামো দেখেছেন, আপনি এটি আপনার অ্যাকাউন্টে স্থাপন করেছেন যাতে আপনি একটি উদাহরণ ওয়ার্কফ্লো চালাতে পারেন। লেবেলিং পাইপলাইন সম্পর্কিত সমস্ত স্থাপনার পদক্ষেপ AWS CloudFormation দ্বারা পরিচালিত হয়। এর মানে হল AWS ক্লাউডফর্মেশন আপনার নোটবুকের উদাহরণ তৈরি করে সেইসাথে যেকোন ভূমিকা বা Amazon S3 Buckets সমাধান চালানোর জন্য সমর্থন করে।
আপনি AWS অঞ্চলে স্ট্যাক চালু করতে পারেন us-east-1
AWS CloudFormation কনসোলে ব্যবহার করে স্ট্যাক চালু করুন
বোতাম একটি ভিন্ন অঞ্চলে স্ট্যাক চালু করতে, এর README-এ পাওয়া নির্দেশাবলী ব্যবহার করুন GitHub সংগ্রহস্থল.
সমস্ত সংস্থান তৈরি করতে এটি প্রায় 20 মিনিট সময় নেয়। আপনি AWS CloudFormation ইউজার ইন্টারফেস (UI) থেকে অগ্রগতি নিরীক্ষণ করতে পারেন।
একবার আপনার ক্লাউডফর্মেশন টেমপ্লেটটি চালু হয়ে গেলে AWS কনসোলে ফিরে যান।
নোটবুক খুলছি
Amazon SageMaker নোটবুক ইনস্ট্যান্স হল ML কম্পিউট ইনস্ট্যান্স যা জুপিটার নোটবুক অ্যাপে চলে। Amazon SageMaker দৃষ্টান্ত এবং সম্পর্কিত সংস্থান তৈরি পরিচালনা করে। আপনার নোটবুক ইনস্ট্যান্সে জুপিটার নোটবুকগুলি ব্যবহার করুন ডেটা প্রস্তুত এবং প্রক্রিয়া করতে, মডেলগুলিকে প্রশিক্ষণের জন্য কোড লিখুন, অ্যামাজন সেজমেকার হোস্টিংয়ে মডেলগুলি স্থাপন করুন এবং আপনার মডেলগুলি পরীক্ষা বা যাচাই করুন৷
অ্যামাজন সেজমেকার নোটবুক পরিবেশ অ্যাক্সেস করতে পরবর্তী পদক্ষেপগুলি অনুসরণ করুন:
- সেবার অধীনে অনুসন্ধান আমাজন সেজমেকার.
- অধীনে নোটবই, নির্বাচন করুন নোটবুক উদাহরণস্বরূপ.
- একটি নোটবুকের উদাহরণ দেওয়া উচিত। খুলুন নির্বাচন করুন জুপিটারল্যাব, যা পূর্ব-নির্ধারিত নোটবুক ইনস্ট্যান্সের ডান পাশে অবস্থিত কার্যপ্রণালী.
- পৃষ্ঠাটি লোড হওয়ার সাথে সাথে আপনি একটি আইকন দেখতে পাবেন:
- আপনাকে একটি নতুন ব্রাউজার ট্যাবে পুনঃনির্দেশিত করা হবে যা নিচের চিত্রের মত দেখাচ্ছে:
- একবার আপনি অ্যামাজন সেজমেকার নোটবুক ইনস্ট্যান্স লঞ্চার UI-তে থাকবেন। বাম সাইডবার থেকে, নির্বাচন করুন git নিম্নলিখিত চিত্রে দেখানো আইকন।
- নির্বাচন করা একটি সংগ্রহস্থল ক্লোন করুন বিকল্প।
- GitHub URL লিখুন(https://github.com/aws-samples/end-2-end-3d-ml) পপ-আপ উইন্ডোতে এবং নির্বাচন করুন ক্লোন.
- নির্বাচন করা ফাইল ব্রাউজার GitHub ফোল্ডারটি দেখতে।
- শিরোনামের নোটবুকটি খুলুন
1_visualization.ipynb.
নোটবুক পরিচালনা করা
সংক্ষিপ্ত বিবরণ
শিরোনাম বিভাগে নোটবুকের প্রথম কয়েকটি ঘর ডাউনলোড করা ফাইল কিভাবে ডেটাসেট ডাউনলোড করতে হয় এবং এর মধ্যে থাকা ফাইলগুলি পরিদর্শন করতে হয়। সেলগুলি কার্যকর হওয়ার পরে, ডেটা ডাউনলোড শেষ হতে কয়েক মিনিট সময় লাগে৷
একবার ডাউনলোড হয়ে গেলে, আপনি A2D2 ফাইলের কাঠামো পর্যালোচনা করতে পারেন, যা দৃশ্য বা ড্রাইভের একটি তালিকা। একটি দৃশ্য হল আমাদের গাড়ির সেন্সর ডেটার একটি সংক্ষিপ্ত রেকর্ডিং৷ A2D2 আমাদের প্রশিক্ষণের জন্য এই দৃশ্যগুলির মধ্যে 18টি প্রদান করে, যেগুলি অনন্য তারিখ দ্বারা চিহ্নিত করা হয়। প্রতিটি দৃশ্যে 2D ক্যামেরা ডেটা, 2D লেবেল, 3D কিউবয়েড টীকা এবং 3D পয়েন্ট ক্লাউড রয়েছে।
আপনি নিম্নলিখিতগুলির সাথে A2D2 ডেটাসেটের জন্য ফাইলের কাঠামো দেখতে পারেন:
A2D2 সেন্সর সেটআপ
পরবর্তী বিভাগটি এই পয়েন্টের কিছু ক্লাউড ডেটা পড়ার মধ্য দিয়ে যায় যাতে আমরা এটিকে সঠিকভাবে ব্যাখ্যা করছি এবং এটিকে ডেটা লেবেলিংয়ের জন্য প্রস্তুত একটি বিন্যাসে রূপান্তর করার চেষ্টা করার আগে নোটবুকে ভিজ্যুয়ালাইজ করতে পারি।
যেকোনো ধরনের স্বায়ত্তশাসিত ড্রাইভিং সেটআপের জন্য যেখানে আমাদের কাছে 2D এবং 3D সেন্সর ডেটা রয়েছে, সেন্সর ক্রমাঙ্কন ডেটা ক্যাপচার করা অপরিহার্য। কাঁচা ডেটা ছাড়াও, আমরা ডাউনলোডও করেছি cams_lidar.json
. এই ফাইলটিতে গাড়ির স্থানাঙ্ক ফ্রেমের সাথে সম্পর্কিত প্রতিটি সেন্সরের অনুবাদ এবং অভিযোজন রয়েছে, এটিকে সেন্সরের ভঙ্গি বা স্থানের অবস্থান হিসাবেও উল্লেখ করা যেতে পারে। একটি সেন্সরের স্থানাঙ্ক ফ্রেম থেকে গাড়ির স্থানাঙ্ক ফ্রেমে পয়েন্ট রূপান্তর করার জন্য এটি গুরুত্বপূর্ণ। অন্য কথায়, গাড়ি চালানোর সময় 2D এবং 3D সেন্সরগুলিকে কল্পনা করার জন্য এটি গুরুত্বপূর্ণ। গাড়ির স্থানাঙ্ক ফ্রেমটিকে গাড়ির কেন্দ্রে একটি স্থির বিন্দু হিসাবে সংজ্ঞায়িত করা হয়, যেখানে x-অক্ষটি গাড়ির সামনের গতিপথের দিকে থাকে, y-অক্ষটি বাম এবং ডানকে ইতিবাচক হিসাবে নির্দেশ করে এবং z- গাড়ির ছাদের মধ্য দিয়ে নির্দেশিত অক্ষ। (5,2,1) এর একটি বিন্দু (X,Y,Z) মানে এই বিন্দুটি আমাদের গাড়ি থেকে 5 মিটার এগিয়ে, বাম দিকে 2 মিটার এবং আমাদের গাড়ি থেকে 1 মিটার উপরে। এই ক্রমাঙ্কনগুলি আমাদের 3D চিত্রে 2D পয়েন্ট প্রজেক্ট করার অনুমতি দেয়, যা পয়েন্ট ক্লাউড লেবেলিংয়ের কাজগুলির জন্য বিশেষভাবে সহায়ক।
গাড়িতে সেন্সর সেটআপ দেখতে, নিম্নলিখিত চিত্রটি দেখুন।
আমরা যে পয়েন্ট ক্লাউড ডেটাতে প্রশিক্ষণ দিচ্ছি তা বিশেষভাবে সামনের দিকের ক্যামেরা বা ক্যামের সামনের কেন্দ্রের সাথে সংযুক্ত করা হয়েছে:
এটি 3D তে ক্যামেরা সেন্সরগুলির আমাদের ভিজ্যুয়ালাইজেশনের সাথে মেলে:
নোটবুকের এই অংশটি যাচাই করে যে A2D2 ডেটাসেট সেন্সর অবস্থান সম্পর্কে আমাদের প্রত্যাশার সাথে মেলে এবং আমরা ক্যামেরা ফ্রেমে পয়েন্ট ক্লাউড সেন্সর থেকে ডেটা সারিবদ্ধ করতে সক্ষম হয়েছি। শিরোনাম একটি মাধ্যমে সব কক্ষ চালানোর জন্য নির্দ্বিধায় 3D থেকে 2D পর্যন্ত অভিক্ষেপ নিম্নলিখিত ক্যামেরা ছবিতে আপনার পয়েন্ট ক্লাউড ডেটা ওভারলে দেখতে।
আমাজন সেজমেকার গ্রাউন্ড ট্রুথে রূপান্তর
আমাদের নোটবুকে আমাদের ডেটা ভিজ্যুয়ালাইজ করার পরে, আমরা আত্মবিশ্বাসের সাথে আমাদের পয়েন্ট ক্লাউডগুলিকে আমাজনে রূপান্তর করতে পারি সেজমেকার গ্রাউন্ড ট্রুথের 3D বিন্যাস আমাদের লেবেল যাচাই এবং সামঞ্জস্য করতে। এই বিভাগটি A2D2 এর ডেটা ফরম্যাট থেকে একটি Amazon-এ রূপান্তরের মাধ্যমে চলে সেজমেকার গ্রাউন্ড ট্রুথ সিকোয়েন্স ফাইল, অবজেক্ট ট্র্যাকিং পদ্ধতি দ্বারা ব্যবহৃত ইনপুট বিন্যাস সহ।
সিকোয়েন্স ফাইল ফরম্যাটে পয়েন্ট ক্লাউড ফরম্যাট, প্রতিটি পয়েন্ট ক্লাউডের সাথে যুক্ত ছবি এবং পয়েন্ট ক্লাউডের সাথে ছবি সারিবদ্ধ করার জন্য প্রয়োজনীয় সমস্ত সেন্সর পজিশন এবং ওরিয়েন্টেশন ডেটা অন্তর্ভুক্ত থাকে। এই রূপান্তরগুলি পূর্ববর্তী বিভাগ থেকে পড়া সেন্সর তথ্য ব্যবহার করে করা হয়। নিম্নলিখিত উদাহরণ হল অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথ থেকে একটি সিকোয়েন্স ফাইল ফরম্যাট, যা শুধুমাত্র একটি টাইমস্টেপ সহ একটি ক্রম বর্ণনা করে।
এই টাইমস্টেপের জন্য পয়েন্ট ক্লাউড এখানে অবস্থিত s3://sagemaker-us-east-1-322552456788/a2d2_smgt/20180807_145028_out/20180807145028_lidar_frontcenter_000000091.txt
এবং এর একটি বিন্যাস আছে <x coordinate> <y coordinate> <z coordinate>
.
পয়েন্ট ক্লাউডের সাথে যুক্ত, এটি অবস্থিত একটি একক ক্যামেরা চিত্র s3://sagemaker-us-east-1-322552456788/a2d2_smgt/20180807_145028_out/undistort_20180807145028_camera_frontcenter_000000091.png
. লক্ষ্য করুন যে আমরা সিকোয়েন্স ফাইলটি নিই যা সমস্ত ক্যামেরা প্যারামিটারকে সংজ্ঞায়িত করে যাতে পয়েন্ট ক্লাউড থেকে ক্যামেরা এবং পিছনে প্রজেকশনের অনুমতি দেওয়া হয়।
এই ইনপুট ফর্ম্যাটে রূপান্তরের জন্য আমাদেরকে A2D2 এর ডেটা ফর্ম্যাট থেকে Amazon SageMaker Ground Truth দ্বারা সমর্থিত ডেটা ফর্ম্যাটে একটি রূপান্তর লিখতে হবে৷ লেবেলিংয়ের জন্য তাদের নিজস্ব ডেটা আনার সময় যে কেউ এই একই প্রক্রিয়ার মধ্য দিয়ে যেতে হবে। আমরা ধাপে ধাপে এই রূপান্তর কিভাবে কাজ করে তা দেখব। নোটবুকে অনুসরণ করলে, নামের ফাংশনটি দেখুন a2d2_scene_to_smgt_sequence_and_seq_label
.
পয়েন্ট ক্লাউড রূপান্তর
প্রথম ধাপ হল একটি সংকুচিত Numpy-ফরম্যাটেড ফাইল (NPZ) থেকে ডেটা রূপান্তর করা, যা numpy দিয়ে তৈরি করা হয়েছিল।জানা পদ্ধতি, একটি কাঁচা 3D বিন্যাস স্বীকৃত অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথের জন্য। বিশেষ করে, আমরা প্রতি পয়েন্টে এক সারি দিয়ে একটি ফাইল তৈরি করি। প্রতিটি 3D বিন্দু তিনটি ভাসমান বিন্দু X, Y, এবং Z স্থানাঙ্ক দ্বারা সংজ্ঞায়িত করা হয়। যখন আমরা সিকোয়েন্স ফাইলে আমাদের ফরম্যাট নির্দিষ্ট করি, তখন আমরা স্ট্রিং ব্যবহার করি text/xyz
এই বিন্যাস প্রতিনিধিত্ব করতে. অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথ তীব্রতার মান বা লাল সবুজ নীল (আরজিবি) পয়েন্ট যোগ করতেও সমর্থন করে।
A2D2 এর NPZ ফাইলগুলিতে একাধিক Numpy অ্যারে রয়েছে, যার প্রত্যেকটির নিজস্ব নাম রয়েছে। একটি রূপান্তর সম্পাদন করতে, আমরা Numpy's ব্যবহার করে NPZ ফাইল লোড করি বোঝা পদ্ধতি, নামক অ্যারে অ্যাক্সেস করুন পয়েন্ট (অর্থাৎ, একটি Nx3 অ্যারে, যেখানে N হল পয়েন্ট ক্লাউডের পয়েন্টের সংখ্যা), এবং Numpy's ব্যবহার করে একটি নতুন ফাইলে পাঠ্য হিসাবে সংরক্ষণ করুন savetxt পদ্ধতি।
ইমেজ প্রিপ্রসেসিং
পরবর্তী, আমরা আমাদের ইমেজ ফাইল প্রস্তুত. A2D2 PNG ইমেজ প্রদান করে, এবং Amazon SageMaker Ground Truth PNG ছবি সমর্থন করে; যাইহোক, এই ছবি বিকৃত হয়. বিকৃতি প্রায়শই ঘটে কারণ ছবি তোলার লেন্সটি ইমেজিং সমতলের সমান্তরালভাবে সারিবদ্ধ নয়, যা চিত্রের কিছু অংশকে প্রত্যাশার চেয়ে কাছাকাছি দেখায়। এই বিকৃতি একটি শারীরিক ক্যামেরা এবং একটি মধ্যে পার্থক্য বর্ণনা করে আদর্শ পিনহোল ক্যামেরা মডেল. যদি বিকৃতি বিবেচনা না করা হয়, তাহলে অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথ ক্যামেরা ভিউয়ের উপরে আমাদের 3D পয়েন্ট রেন্ডার করতে সক্ষম হবে না, যা লেবেলিং সম্পাদন করা আরও চ্যালেঞ্জিং করে তোলে। ক্যামেরা ক্রমাঙ্কনের উপর একটি টিউটোরিয়ালের জন্য, থেকে এই ডকুমেন্টেশনটি দেখুন OpenCV.
যদিও Amazon SageMaker Ground Truth তার ইনপুট ফাইলে বিকৃতি সহগকে সমর্থন করে, আপনি লেবেলিং কাজের আগে প্রিপ্রসেসিংও করতে পারেন। যেহেতু A2D2 আনডিস্টরশন করার জন্য হেল্পার কোড প্রদান করে, তাই আমরা ইমেজে এটি প্রয়োগ করি এবং আমাদের সিকোয়েন্স ফাইলের বাইরে বিকৃতি সম্পর্কিত ক্ষেত্রগুলি ছেড়ে দিই। উল্লেখ্য যে বিকৃতি সম্পর্কিত ক্ষেত্র অন্তর্ভুক্ত k1, k2, k3, k4, p1, p2, এবং তির্যক.
ক্যামেরা অবস্থান, অভিযোজন, এবং অভিক্ষেপ রূপান্তর
লেবেলিংয়ের জন্য প্রয়োজনীয় কাঁচা ডেটা ফাইলের বাইরে, 3D ক্যামেরা ভিউতে 2D পয়েন্টের অভিক্ষেপ সঞ্চালনের জন্য সিকোয়েন্স ফাইলের ক্যামেরার অবস্থান এবং ওরিয়েন্টেশন তথ্যও প্রয়োজন। আমাদের ছবিগুলির উপরে 3D কিউবয়েড লেবেল এবং 3D পয়েন্টগুলি কীভাবে রেন্ডার করা উচিত তা বের করতে 3D স্পেসে ক্যামেরাটি কোথায় খুঁজছে তা আমাদের জানতে হবে।
যেহেতু আমরা A2D2 সেন্সর সেটআপ বিভাগে একটি সাধারণ ট্রান্সফর্ম ম্যানেজারে আমাদের সেন্সর অবস্থানগুলি লোড করেছি, তাই আমরা যে তথ্য চাই তার জন্য আমরা সহজেই ট্রান্সফর্ম ম্যানেজারকে জিজ্ঞাসা করতে পারি। আমাদের ক্ষেত্রে, আমরা প্রতিটি ফ্রেমে গাড়ির অবস্থানকে (0, 0, 0) হিসাবে বিবেচনা করি কারণ আমাদের কাছে A2D2 এর অবজেক্ট ডিটেকশন ডেটাসেট দ্বারা প্রদত্ত সেন্সরের অবস্থানের তথ্য নেই। তাই আমাদের গাড়ির সাপেক্ষে, ক্যামেরার অভিযোজন এবং অবস্থান নিম্নলিখিত কোড দ্বারা বর্ণনা করা হয়েছে:
এখন যে অবস্থান এবং অভিযোজন রূপান্তরিত হয়েছে, আমাদের এছাড়াও fx, fy, cx, এবং cy-এর মান সরবরাহ করতে হবে, প্রতিটি ক্যামেরার জন্য ক্রম ফাইল বিন্যাসে সমস্ত পরামিতি।
এই প্যারামিটারগুলি ক্যামেরা ম্যাট্রিক্সের মানগুলিকে নির্দেশ করে৷ অবস্থান এবং অভিযোজন বর্ণনা করে যে ক্যামেরা কোন দিকে মুখ করছে, ক্যামেরা ম্যাট্রিক্স ক্যামেরার দৃশ্যের ক্ষেত্র বর্ণনা করে এবং ঠিক কীভাবে ক্যামেরার সাথে সম্পর্কিত একটি 3D পয়েন্ট একটি ছবিতে 2D পিক্সেল অবস্থানে রূপান্তরিত হয়।
A2D2 একটি ক্যামেরা ম্যাট্রিক্স প্রদান করে। একটি রেফারেন্স ক্যামেরা ম্যাট্রিক্স নিম্নলিখিত কোডে দেখানো হয়েছে, আমাদের নোটবুক কীভাবে উপযুক্ত ক্ষেত্র পেতে এই ম্যাট্রিক্সটিকে সূচী করে।
A2D2 এর বিন্যাস থেকে সমস্ত ক্ষেত্র পার্স করে, আমরা সিকোয়েন্স ফাইলটি সংরক্ষণ করতে পারি এবং এটি একটি অ্যামাজনে ব্যবহার করতে পারি সেজমেকার গ্রাউন্ড ট্রুথ ইনপুট ম্যানিফেস্ট ফাইল একটি লেবেলিং কাজ শুরু করতে। এই লেবেলিং কাজটি আমাদের 3D মডেল প্রশিক্ষণের জন্য ডাউনস্ট্রিম ব্যবহার করার জন্য 3D বাউন্ডিং বক্স লেবেল তৈরি করতে দেয়।
নোটবুকের শেষ পর্যন্ত সমস্ত ঘর চালান, এবং নিশ্চিত করুন যে আপনি প্রতিস্থাপন করেছেন workteam
অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথের সাথে এআরএন workteam
ARN আপনি একটি পূর্বশর্ত তৈরি করেছেন। কাজ তৈরির সময় লেবেল করার প্রায় 10 মিনিটের পরে, আপনি কর্মী পোর্টালে লগইন করতে এবং ব্যবহার করতে সক্ষম হবেন লেবেল ব্যবহারকারী ইন্টারফেস আপনার দৃশ্য কল্পনা করতে।
পরিষ্কার কর
আপনি ব্যবহার করে মোতায়েন করা AWS ক্লাউডফর্মেশন স্ট্যাক মুছুন স্ট্যাক চালু করুন নামের বোতাম ThreeD
AWS CloudFormation কনসোলে যেকোন চলমান উদাহরণ সহ এই পোস্টে ব্যবহৃত সমস্ত সংস্থান সরাতে।
আনুমানিক খরচ
5 ঘন্টার জন্য আনুমানিক খরচ $2।
উপসংহার
এই পোস্টে, আমরা দেখিয়েছি কীভাবে 3D ডেটা নেওয়া যায় এবং এটিকে অ্যামাজন সেজমেকার গ্রাউন্ড ট্রুথ-এ লেবেলিংয়ের জন্য প্রস্তুত ফর্মে রূপান্তর করা যায়। এই পদক্ষেপগুলির সাথে, আপনি অবজেক্ট সনাক্তকরণ মডেল প্রশিক্ষণের জন্য আপনার নিজস্ব 3D ডেটা লেবেল করতে পারেন। এই সিরিজের পরবর্তী পোস্টে, আমরা আপনাকে দেখাব কিভাবে A2D2 নিতে হয় এবং ইতিমধ্যে ডেটাসেটে থাকা লেবেলে একটি অবজেক্ট ডিটেক্টর মডেলকে প্রশিক্ষণ দিতে হয়।
শুভ ভবন!
লেখক সম্পর্কে
আইজাক প্রিভিটেরা এর একজন সিনিয়র ডেটা সায়েন্টিস্ট আমাজন মেশিন লার্নিং সলিউশন ল্যাব, যেখানে তিনি গ্রাহকদের ব্যবসায়িক সমস্যা সমাধানের জন্য বেসপোক মেশিন লার্নিং এবং ডিপ লার্নিং সমাধান তৈরি করেন। তিনি প্রাথমিকভাবে কম্পিউটার ভিশন স্পেসে কাজ করেন, AWS গ্রাহকদের বিতরণ করা প্রশিক্ষণ এবং সক্রিয় শিক্ষার সাথে সক্ষম করার দিকে মনোনিবেশ করেন।
বিদ্যা সাগর রবিপতি এ ম্যানেজার আছেন আমাজন মেশিন লার্নিং সলিউশন ল্যাবযেখানে তিনি বিশাল আকারের বিতরণ ব্যবস্থাগুলিতে তার বিশাল অভিজ্ঞতা এবং বিভিন্ন শিল্পের উল্লম্ব অঞ্চলে এডাব্লুএস গ্রাহকদের তাদের এআই এবং ক্লাউড গ্রহণকে ত্বরান্বিত করতে সহায়তা করার জন্য মেশিন লার্নিংয়ের প্রতি তাঁর আগ্রহকে উপকৃত করেন। পূর্বে, তিনি অ্যামাজনে কানেক্টিভিটি সার্ভিসে মেশিন লার্নিং ইঞ্জিনিয়ার ছিলেন যিনি ব্যক্তিগতকরণ এবং ভবিষ্যদ্বাণীমূলক রক্ষণাবেক্ষণ প্ল্যাটফর্ম তৈরিতে সহায়তা করেছিলেন।
জেরেমি ফেল্টেরকো সাথে একজন সফটওয়্যার ডেভেলপমেন্ট ইঞ্জিনিয়ার আমাজন মেশিন লার্নিং সলিউশন ল্যাব অ্যামাজন ওয়েব সার্ভিসে। তিনি AWS গ্রাহকদের তাদের AI গ্রহণকে ত্বরান্বিত করতে সাহায্য করার জন্য কম্পিউটার দৃষ্টি, রোবোটিক্স এবং মেশিন লার্নিং-এ তার পটভূমি ব্যবহার করেন।
- এসইও চালিত বিষয়বস্তু এবং পিআর বিতরণ। আজই পরিবর্ধিত পান।
- প্লেটোব্লকচেন। Web3 মেটাভার্স ইন্টেলিজেন্স। জ্ঞান প্রসারিত. এখানে প্রবেশ করুন.
- উত্স: https://aws.amazon.com/blogs/machine-learning/using-amazon-sagemaker-with-point-clouds-part-1-ground-truth-for-3d-labeling/
- : হয়
- $ ইউপি
- 000
- 1
- 10
- 100
- 1996
- 2D
- 3d
- 7
- 9
- a
- সক্ষম
- সম্পর্কে
- উপরে
- দ্রুততর করা
- প্রবেশ
- প্রবেশযোগ্য
- হিসাব
- দিয়ে
- সক্রিয়
- যোগ
- ঠিকানা
- গ্রহণ
- পর
- এগিয়ে
- AI
- প্রান্তিককৃত
- সব
- অনুমতি
- ইতিমধ্যে
- মর্দানী স্ত্রীলোক
- অ্যামাজন কগনিটো
- আমাজন সেজমেকার
- আমাজন সেজমেকার গ্রাউন্ড ট্রুথ
- অ্যামাজন ওয়েব সার্ভিসেস
- এবং
- যে কেউ
- অ্যাপ্লিকেশন
- প্রয়োগ করা
- যথাযথ
- আন্দাজ
- স্থাপত্য
- রয়েছি
- এলাকার
- কাছাকাছি
- বিন্যাস
- AS
- যুক্ত
- At
- উদ্দীপিত
- উদ্দীপিত বাস্তবতা
- স্বশাসিত
- উপস্থিতি
- ডেস্কটপ AWS
- এডাব্লুএস ক্লাউডফর্মেশন
- পিছনে
- পটভূমি
- BE
- কারণ
- পরিণত
- আগে
- হচ্ছে
- নিচে
- মধ্যে
- নীল
- বক্স
- আনয়ন
- ব্রাউজার
- নির্মাণ করা
- ভবন
- বাস
- ব্যবসায়
- বোতাম
- by
- নামক
- ক্যামেরা
- CAN
- গ্রেপ্তার
- ক্যাপচার
- গাড়ী
- কার
- কেস
- সেল
- কেন্দ্র
- চ্যালেঞ্জিং
- চেক
- বেছে নিন
- শ্রেণী
- ক্লাস
- কাছাকাছি
- মেঘ
- মেঘ গ্রহণ
- কোড
- সাধারণ
- কোম্পানি
- সম্পূর্ণ
- গনা
- কম্পিউটার
- কম্পিউটার ভিশন
- অসংশয়ে
- কানেক্টিভিটি
- কনসোল
- ধারণ করা
- ধারণ
- পরিবর্তন
- ধর্মান্তর
- রূপান্তর
- ধর্মান্তরিত
- তুল্য
- মূল্য
- সাশ্রয়ের
- আবরণ
- সৃষ্টি
- নির্মিত
- সৃষ্টি
- সৃষ্টি
- গ্রাহকদের
- CX
- উপাত্ত
- তথ্য বিজ্ঞানী
- ডেটাসেট
- তারিখগুলি
- গভীর
- গভীর জ্ঞানার্জন
- সংজ্ঞায়িত
- সংজ্ঞায়িত
- প্রদর্শন
- প্রদর্শিত
- প্রমান
- স্থাপন
- মোতায়েন
- বিস্তৃতি
- গভীরতা
- বর্ণনা করা
- বর্ণিত
- সনাক্তকরণ
- নির্ণয়
- উন্নয়ন
- বিকাশ
- ডিভাইস
- পার্থক্য
- বিভিন্ন
- কঠিন
- অভিমুখ
- আলোচনা করা
- বণ্টিত
- বিতরণ সিস্টেম
- বিতরণ করা প্রশিক্ষণ
- ডকুমেন্টেশন
- Dont
- ডাউনলোড
- পরিচালনা
- e
- প্রতি
- সহজে
- সক্রিয়
- শেষপ্রান্ত
- প্রকৌশলী
- নিশ্চিত করা
- পরিবেশ
- বিশেষত
- অপরিহার্য
- ইত্যাদি
- এমন কি
- ঠিক
- উদাহরণ
- প্রত্যাশা
- প্রত্যাশিত
- অভিজ্ঞতা
- সম্মুখ
- কয়েক
- ক্ষেত্র
- ক্ষেত্রসমূহ
- ব্যক্তিত্ব
- ফাইল
- নথি পত্র
- শেষ
- প্রথম
- নির্দলীয়
- প্রবাহ
- কেন্দ্রবিন্দু
- মনোযোগ
- অনুসরণ
- জন্য
- ফর্ম
- বিন্যাস
- অগ্রবর্তী
- পাওয়া
- ফ্রেম
- বিনামূল্যে
- থেকে
- সদর
- ক্রিয়া
- লয়
- FX
- উত্পাদন করা
- উত্পন্ন
- পাওয়া
- GIF
- git
- GitHub
- Go
- Goes
- Green
- স্থল
- ক্রমবর্ধমান
- হাতল
- আছে
- জমিদারি
- শিরোনাম
- সাহায্য
- সাহায্য
- সহায়ক
- হোস্টিং
- ঘন্টার
- কিভাবে
- কিভাবে
- যাহোক
- এইচটিএমএল
- HTTPS দ্বারা
- i
- আইকন
- চিহ্নিত
- ভাবমূর্তি
- চিত্র
- ইমেজিং
- বাস্তবায়ন
- গুরুত্বপূর্ণ
- in
- অন্যান্য
- অন্তর্ভুক্ত করা
- অন্তর্ভুক্ত
- সুদ্ধ
- বর্ধিত
- ক্রমবর্ধমানভাবে
- ইনডেক্স
- শিল্প
- তথ্য
- ইনপুট
- উদাহরণ
- নির্দেশাবলী
- স্বার্থ
- আগ্রহী
- ইন্টারফেস
- IT
- এর
- কাজ
- জবস
- JPG
- JSON
- রকম
- জানা
- লেবেল
- লেবেল
- লেবেলগুলি
- বড় আকারের
- লেজার
- শুরু করা
- শিখতে
- শিক্ষা
- ত্যাগ
- ওঠানামায়
- আলো
- মত
- তালিকা
- বোঝা
- লোড
- অবস্থিত
- অবস্থান
- দেখুন
- খুঁজছি
- সৌন্দর্য
- মেশিন
- মেশিন লার্নিং
- রক্ষণাবেক্ষণ
- করা
- তৈরি করে
- পরিচালিত
- পরিচালক
- পরিচালনা করে
- ম্যাপিং
- জরায়ু
- মানে
- পরিমাপ
- পদ্ধতি
- মিনিট
- ML
- মোবাইল
- মোবাইল ডিভাইস
- মডেল
- মডেল
- মনিটর
- অধিক
- সেতু
- আন্দোলন
- বহু
- নাম
- নামে
- প্রয়োজন
- নতুন
- পরবর্তী
- নোটবই
- সংখ্যা
- অসাড়
- লক্ষ্য
- বস্তু সনাক্তকরণ
- বস্তু
- of
- on
- ONE
- খোলা
- OpenCV
- পরিচালনা করা
- পছন্দ
- অন্যান্য
- আউটপুট
- সামগ্রিক
- নিজের
- পৃষ্ঠা
- সমান্তরাল
- পরামিতি
- অংশ
- বিশেষ
- আবেগ
- পথ
- সম্পাদন করা
- ব্যক্তিগতকরণ
- শারীরিক
- পাইপলাইন
- পিক্সেল
- প্ল্যাটফর্ম
- Plato
- প্লেটো ডেটা ইন্টেলিজেন্স
- প্লেটোডাটা
- বিন্দু
- পয়েন্ট
- পোর্টাল
- অবস্থান
- অবস্থানের
- ধনাত্মক
- পোস্ট
- ভবিষ্যদ্বাণী করা
- প্রস্তুত করা
- আগে
- পূর্বে
- প্রাথমিকভাবে
- ব্যক্তিগত
- সমস্যা
- প্রক্রিয়া
- উত্পাদনের
- প্রোফাইলিং
- উন্নতি
- প্রকল্প
- অভিক্ষেপ
- প্রদত্ত
- উপলব্ধ
- রেঞ্জিং
- হার
- কাঁচা
- পড়া
- পড়া
- প্রস্তুত
- প্রকৃত সময়
- বাস্তবতা
- রেকর্ডিং
- লাল
- উল্লেখ করা
- প্রতিফলিত
- এলাকা
- সংশ্লিষ্ট
- প্রাসঙ্গিক
- অবশিষ্ট
- অপসারণ
- প্রতিস্থাপন করা
- চিত্রিত করা
- প্রয়োজনীয়
- প্রয়োজন
- সংস্থান
- Resources
- ফলাফল
- প্রত্যাবর্তন
- এখানে ক্লিক করুন
- আরজিবি
- রোবোটিক্স
- ভূমিকা
- ছাদ
- সারিটি
- চালান
- দৌড়
- s
- ঋষি নির্মাতা
- একই
- সংরক্ষণ করুন
- দৃশ্য
- লোকচক্ষুর
- বিজ্ঞানী
- সার্চ
- দ্বিতীয়
- অধ্যায়
- সেগমেন্টেশন
- জ্যেষ্ঠ
- সেন্সর
- ক্রম
- ক্রম
- সেবা
- সেটআপ
- সংক্ষিপ্ত
- উচিত
- প্রদর্শনী
- প্রদর্শিত
- শো
- পাশ
- সংকেত
- থেকে
- একক
- So
- সফটওয়্যার
- সফটওয়্যার উন্নয়ন
- সমাধান
- সলিউশন
- কিছু
- উৎস
- স্থান
- শূণ্যস্থান
- বিশেষভাবে
- গাদা
- মান
- শুরু
- ধাপ
- প্রারম্ভিক ব্যবহারের নির্দেশাবলী
- গঠন
- সরবরাহ
- সমর্থন
- সমর্থিত
- সমর্থন
- পৃষ্ঠতল
- সিস্টেম
- টেবিল
- গ্রহণ করা
- লাগে
- লক্ষ্য করে
- কাজ
- টেমপ্লেট
- পরীক্ষা
- যে
- সার্জারির
- তথ্য
- তাদের
- এইগুলো
- তিন
- দ্বারা
- সময়
- খেতাবধারী
- থেকে
- টুল
- শীর্ষ
- মোট
- অনুসরণকরণ
- রেলগাড়ি
- প্রশিক্ষণ
- রুপান্তর
- অনুবাদ
- আচরণ করা
- ট্রাক
- অভিভাবকসংবঁধীয়
- টিপিক্যাল
- সাধারণত
- ui
- অধীনে
- বোঝা
- বোধশক্তি
- অনন্য
- us
- ব্যবহার
- ব্যবহারকারী
- ব্যবহারকারী ইন্টারফেস
- যাচাই করুন
- মানগুলি
- সুবিশাল
- বাহন
- যানবাহন
- যাচাই
- উল্লম্ব
- ভিডিও
- চেক
- মতামত
- দৃষ্টি
- কল্পনা
- উপায়..
- ওয়েব
- ওয়েব সার্ভিস
- আমরা একটি
- যে
- যখন
- হু
- উইকিপিডিয়া
- ইচ্ছা
- সঙ্গে
- মধ্যে
- শব্দ
- কর্মী
- কর্মীসংখ্যার
- কাজ
- লেখা
- কোড লিখুন
- লিখিত
- X
- ইয়ামল
- আপনি
- আপনার
- zephyrnet