AI এর সাথে, আপনাকে বড় হার্ডওয়্যার এবং সফ্টওয়্যার ছবি PlatoBlockchain ডেটা ইন্টেলিজেন্স দেখতে হবে। উল্লম্ব অনুসন্ধান. আ.

AI এর সাথে, আপনাকে বড় হার্ডওয়্যার এবং সফ্টওয়্যার ছবি দেখতে হবে

স্পনসরড বৈশিষ্ট্য এটি দেড় দশকের পর থেকে গবেষকরা প্রযুক্তি বিশ্বকে চমকিত করে দেখিয়েছেন যে গ্রাফিক্যাল প্রসেসিং ইউনিটগুলি নাটকীয়ভাবে কী এআই অপারেশনগুলিকে ত্বরান্বিত করতে ব্যবহার করা যেতে পারে।

সেই উপলব্ধি উদ্যোগের কল্পনাকে আঁকড়ে ধরে চলেছে। IDC রিপোর্ট করেছে যে যখন পরিকাঠামোর কথা আসে, GPU ত্বরান্বিত গণনা এবং HPC-এর মতো স্কেল-আপ প্রযুক্তি নেতা এবং স্থপতিরা তাদের AI পরিকাঠামো তৈরি করতে চাইছেন তাদের জন্য শীর্ষ বিবেচনার মধ্যে রয়েছে।

কিন্তু বাস্তব জগতের সমস্যায় সফলভাবে AI প্রয়োগ করেছে এমন সমস্ত সংস্থার জন্য, পরীক্ষা-নিরীক্ষা বা পাইলট পর্যায় অতিক্রম করার জন্য আরও অনেক সংগ্রাম করে। IDC এর 2021 গবেষণা দেখা গেছে যে উত্তরদাতাদের এক তৃতীয়াংশেরও কম তাদের এআই প্রকল্পগুলিকে উৎপাদনে স্থানান্তরিত করেছে এবং তাদের মাত্র এক তৃতীয়াংশ "উৎপাদনের পরিপক্ক পর্যায়ে" পৌঁছেছে।

উদ্ধৃত প্রতিবন্ধকতার মধ্যে রয়েছে ডেটা প্রক্রিয়াকরণ এবং প্রস্তুতির সমস্যা এবং এন্টারপ্রাইজ স্কেলে এআই সমর্থন করার জন্য পরিকাঠামো তৈরি করা। "উদ্দেশ্য-নির্মিত এবং সঠিক আকারের অবকাঠামো" আইডিসি বলেছে যে উদ্যোগগুলিকে বিনিয়োগ করতে হবে।

এখানে AI সমস্যা কি?

তাহলে সেই সংস্থাগুলো কোথায় এআই নিয়ে ভুল করছে? একটি কারণ হতে পারে যে প্রযুক্তির নেতারা এবং এআই বিশেষজ্ঞরা বিস্তৃত AI পাইপলাইনের একটি সামগ্রিক দৃষ্টিভঙ্গি নিতে ব্যর্থ হচ্ছেন যখন অন্যান্য গণনা ইঞ্জিনগুলির তুলনায় জিপিইউতে খুব বেশি মনোযোগ দিচ্ছেন, বিশেষ করে সম্মানিত সিপিইউ।

কারণ শেষ পর্যন্ত, এটি সিপিইউ বনাম জিপিইউ বনাম ASIC-কে সমর্থন করার প্রশ্ন নয়। বরং, এটি একটি AI পাইপলাইন নির্মাণের সর্বোত্তম উপায় খোঁজার বিষয়ে যা আপনাকে ধারণা এবং ডেটা এবং মডেল বিল্ডিং থেকে স্থাপনা এবং অনুমান পর্যন্ত পেতে পারে। এবং এর অর্থ হল বিভিন্ন প্রসেসর আর্কিটেকচারের নিজ নিজ শক্তির প্রশংসা করা, যাতে আপনি সঠিক সময়ে সঠিক কম্পিউট ইঞ্জিন প্রয়োগ করতে পারেন।

Intel-এর সিনিয়র ডিরেক্টর, Datacenter AI স্ট্র্যাটেজি অ্যান্ড এক্সিকিউশন হিসেবে, শার্দুল ব্রহ্মভট্ট ব্যাখ্যা করেছেন, “CPU মাইক্রোসার্ভিসেস এবং ক্লাউডে প্রচলিত কম্পিউট ইন্সট্যান্সের জন্য ব্যবহার করা হয়েছে। এবং জিপিইউগুলি সমান্তরাল গণনার জন্য ব্যবহার করা হয়েছে, যেমন মিডিয়া স্ট্রিমিং, গেমিং এবং এআই ওয়ার্কলোডের জন্য।

তাই হাইপারস্কেলার এবং অন্যান্য ক্লাউড প্লেয়াররা AI এর দিকে তাদের মনোযোগ দিয়েছে, এটি স্পষ্ট হয়ে গেছে যে তারা বিভিন্ন কাজের জন্য এই একই শক্তিগুলি ব্যবহার করছে।

প্যারালাল কম্পিউটের আশেপাশে জিপিইউ-এর ক্ষমতা তাদের এআই অ্যালগরিদম প্রশিক্ষণের জন্য অত্যন্ত উপযুক্ত করে তোলে, উদাহরণস্বরূপ। এদিকে, কম ব্যাচ, কম লেটেন্সি রিয়েল টাইম ইনফারেন্স এবং লাইভ ডেটা বিশ্লেষণ করতে এবং ফলাফল এবং ভবিষ্যদ্বাণী প্রদান করতে সেই অ্যালগরিদমগুলি ব্যবহার করার ক্ষেত্রে সিপিইউগুলির একটি প্রান্ত রয়েছে।

আবার, সেখানে সতর্কতা রয়েছে, ব্রহ্মভট্ট ব্যাখ্যা করেছেন, “এমন জায়গা রয়েছে যেখানে আপনি আরও ব্যাচ অনুমান করতে চান। এবং সেই ব্যাচের অনুমানও এমন কিছু যা GPUs বা ASIC-এর মাধ্যমে করা হচ্ছে।"

পাইপলাইন নিচে তাকিয়ে

কিন্তু এআই পাইপলাইন প্রশিক্ষণ এবং অনুমানের বাইরে প্রসারিত। পাইপলাইনের বাম দিকে, ডেটা প্রিপ্রসেস করতে হবে, এবং অ্যালগরিদম তৈরি করতে হবে। জেনারেলিস্ট সিপিইউ এখানে একটি গুরুত্বপূর্ণ ভূমিকা পালন করে।

প্রকৃতপক্ষে, জিপিইউগুলি এআই পাইপলাইন জুড়ে মোট প্রসেসরের ক্রিয়াকলাপের একটি অপেক্ষাকৃত ছোট অনুপাতের জন্য দায়ী, সিপিইউ-চালিত "ডেটা স্টেজ" ওয়ার্কলোডগুলি সামগ্রিকভাবে দুই তৃতীয়াংশের জন্য, ইন্টেলের মতে (আপনি একটি সমাধান সংক্ষিপ্ত পড়তে পারেন - ইন্টেল সিপিইউ প্রযুক্তির সাথে অপ্টিমাইজ ইনফারেন্স এখানে).

এবং ব্রহ্মভট্ট আমাদের মনে করিয়ে দেন যে সিপিইউ আর্কিটেকচারে প্রোগ্রামযোগ্যতা সহ অন্যান্য সুবিধা রয়েছে।

"কারণ সিপিইউগুলি এত ব্যাপকভাবে ব্যবহার করা হয়েছে, ইতিমধ্যেই বিকাশকারী এবং অ্যাপ্লিকেশনগুলির একটি বিদ্যমান বাস্তুতন্ত্র উপলব্ধ রয়েছে, এছাড়াও সরঞ্জামগুলি যা সাধারণ উদ্দেশ্য গণনার জন্য ব্যবহারের সহজতা এবং প্রোগ্রামযোগ্যতা প্রদান করে," তিনি বলেছেন।

“দ্বিতীয়, CPU গুলি বৃহত্তর মেমরি স্পেসে দ্রুত অ্যাক্সেস প্রদান করে। এবং তারপরে তৃতীয় জিনিসটি হল এটি আরও আনস্ট্রাকচার্ড কম্পিউট বনাম GPUs [যা] আরও সমান্তরাল গণনা। এই কারণে, সিপিইউগুলি ডেটা মুভার হিসাবে কাজ করে যা জিপিইউগুলিকে ফিড করে, যার ফলে সুপারিশকারী সিস্টেম মডেলগুলির পাশাপাশি গ্রাফ নিউরাল নেটওয়ার্কগুলির মতো কাজের লোডগুলিকে বিকশিত করতে সহায়তা করে।"

এআই বিকাশের জন্য একটি উন্মুক্ত পরিকল্পনা

তাই আমরা একটি এআই ডেভেলপমেন্ট পাইপলাইন পরিকল্পনা করার সময় যথাক্রমে সিপিইউ এবং জিপিইউ-এর ভূমিকা কীভাবে দেখা উচিত, তা অন-প্রেম, ক্লাউডে, বা উভয়ই স্ট্র্যাডলিং?

জিপিইউ এআই ডেভেলপমেন্টে বৈপ্লবিক পরিবর্তন এনেছে, কারণ তারা ত্বরণের একটি পদ্ধতি অফার করেছে যা CPU থেকে অপারেশন অফলোড করে। কিন্তু এটি অনুসরণ করে না যে এটি একটি প্রদত্ত কাজের জন্য সবচেয়ে বুদ্ধিমান বিকল্প।

যেমন ইন্টেল প্ল্যাটফর্মের স্থপতি শরথ রাঘব ব্যাখ্যা করেছেন "এআই অ্যাপ্লিকেশনগুলির ভেক্টরাইজড গণনা রয়েছে৷ ভেক্টর গণনা সমান্তরাল। এআই ওয়ার্কলোডগুলিকে দক্ষতার সাথে চালানোর জন্য, ভেক্টর কম্পিউটেশনের আকার, অফলোড লেটেন্সি, সমান্তরালতা এবং অন্যান্য অনেক কারণ বিবেচনা করে কেউ সিপিইউ এবং জিপিইউ এর ক্ষমতা ব্যবহার করতে পারে”। তবে তিনি চালিয়ে যান, একটি "ছোট" কাজের জন্য, অফলোডিংয়ের "খরচ" অত্যধিক হবে এবং এটি একটি GPU বা এক্সিলারেটরে চালানোর অর্থ হতে পারে না।

সিপিইউগুলি অন্যান্য সিস্টেম উপাদানগুলির সাথে ঘনিষ্ঠ সংহতকরণ থেকেও উপকৃত হতে পারে যা তাদের এআই কাজটি আরও দ্রুত সম্পন্ন করতে দেয়। AI স্থাপনাগুলি থেকে সর্বাধিক মূল্য অর্জনের জন্য শুধুমাত্র মডেলগুলি চালানোর চেয়ে আরও বেশি কিছু জড়িত - যে অন্তর্দৃষ্টি চাওয়া হয়েছে তা নির্ভর করে দক্ষ প্রিপ্রসেসিং, অনুমান এবং পোস্টপ্রসেসিং অপারেশনগুলির উপর। প্রি-প্রসেসিং এর জন্য প্রশিক্ষিত মডেলের ইনপুট প্রত্যাশার সাথে মিলের জন্য ডেটা প্রস্তুত করা প্রয়োজন যা অনুমান তৈরি করতে খাওয়ানোর আগে। পরবর্তী প্রক্রিয়াকরণ পর্যায়ে অনুমান ফলাফল থেকে দরকারী তথ্য বের করা হয়।

উদাহরণ স্বরূপ যদি আমরা একটি ডেটা সেন্টার ইনট্রুশন ডিটেকশন সিস্টেম (IDS) সম্পর্কে চিন্তা করি, তাহলে সময়মত সাইবার আক্রমণ থেকে কোনো ক্ষতিকে রক্ষা করতে এবং প্রতিরোধ করতে মডেলটির আউটপুট নিয়ে কাজ করা গুরুত্বপূর্ণ। এবং সাধারণত, প্রি-প্রসেসিং এবং পোস্ট-প্রসেসিং ধাপগুলি যখন হোস্ট সিস্টেম সিপিইউতে পরিচালিত হয় তখন আরও কার্যকর হয় কারণ তারা বাকি স্থাপত্য ইকোসিস্টেমের সাথে আরও ঘনিষ্ঠভাবে একত্রিত হয়।

প্রারম্ভিক আদেশ অধীনে কর্মক্ষমতা বুস্ট

তাহলে, এর মানে কি GPU ত্বরণের সুবিধাগুলিকে সম্পূর্ণভাবে ত্যাগ করা? অগত্যা. ইন্টেল কয়েক বছর ধরে তার Xeon স্কেলেবল CPU-তে AI ত্বরণ তৈরি করছে। ডিপ লার্নিং মডেলগুলিতে উচ্চ কর্মক্ষমতা অনুমান করার জন্য এই পরিসরে ইতিমধ্যেই ডিপ লার্নিং বুস্ট অন্তর্ভুক্ত রয়েছে, যেখানে ইন্টেলের অ্যাডভান্সড ভেক্টর এক্সটেনশন 512 (AVX 512) এবং ভেক্টর নিউরাল নেটওয়ার্ক এক্সটেনশনগুলি (VNNI) INT8 ইনফারেন্সিং পারফরম্যান্সের গতি বাড়িয়েছে৷ কিন্তু DL বুস্টও ব্রেন ফ্লোটিং পয়েন্ট ফরম্যাট (BF16) ব্যবহার করে প্রশিক্ষণের কাজের চাপে কর্মক্ষমতা বাড়াতে যার জন্য উচ্চ মাত্রার নির্ভুলতার প্রয়োজন হয় না।

ইন্টেলের আসন্ন Xeon স্কেলেবল চতুর্থ প্রজন্মের CPU গুলি অ্যাডভান্সড ম্যাট্রিক্স গুন বা AMX যোগ করবে। এটি AVX-8 VNNI x512 এক্সটেনশনগুলির তুলনায় আরও 86 গুণ বুস্ট দেবে যা ইন্টেলের গণনা অনুসারে পূর্ববর্তী প্রসেসরগুলিতে প্রয়োগ করা হয়েছে এবং 4র্থ প্রজন্মের ইন্টেল জেওন স্কেলেবল প্রসেসরগুলিকে "প্রশিক্ষণ কাজের লোড এবং ডিএল অ্যালগরিদমগুলি যেমন একটি GPU করে" পরিচালনা করার অনুমতি দেবে৷ কিন্তু সেই একই অ্যাক্সিলারেটরগুলি এআই এবং নন-এআই ওয়ার্কলোডের জন্য সাধারণ সিপিইউ কম্পিউটেও প্রয়োগ করা যেতে পারে।

এর মানে এই নয় যে ইন্টেল AI পাইপলাইনগুলি শুরু থেকে শেষ পর্যন্ত x86 হবে বলে আশা করে৷ যখন সমান্তরালকরণ থেকে উপকৃত হবে এমন প্রশিক্ষণের কাজের লোডগুলি সম্পূর্ণরূপে অফলোড করা আরও বোধগম্য হয়, তখন ইন্টেল তার হাবানা গাউডি এআই প্রশিক্ষণ প্রসেসর অফার করে। বেঞ্চমার্ক পরীক্ষাগুলি পরামর্শ দেয় যে পরের শক্তি Amazon EC2 DL1 দৃষ্টান্তগুলি যা ক্লাউডে হোস্ট করা তুলনীয় Nvidia GPU-ভিত্তিক প্রশিক্ষণ উদাহরণগুলির তুলনায় 40 শতাংশ পর্যন্ত ভাল মূল্য-কর্মক্ষমতা প্রদান করতে পারে।

একই সময়ে, ইন্টেলের ডেটা সেন্টার জিপিইউ ফ্লেক্স সিরিজ "হালকা" এবং আরও জটিল এআই মডেলগুলিতে পিচ করা বিভিন্ন বাস্তবায়ন সহ AI অনুমানের মতো সমান্তরালকরণ থেকে উপকৃত হওয়া কাজের চাপ এবং অপারেশনগুলির দিকে প্রস্তুত। আরেকটি Intel® ডেটা সেন্টার GPU, কোডনাম Ponte Vecchio (PVC), খুব শীঘ্রই Argonne National Laboratory-তে Aurora সুপার কম্পিউটারকে শক্তি দেওয়া শুরু করবে।

আমরা কি শেষ থেকে শেষ যেতে পারি?

অপ্রয়োজনীয়ভাবে বিভিন্ন কম্পিউট ইঞ্জিনের মধ্যে ডেটা অফলোড করার প্রয়োজনীয়তা হ্রাস করার সময়, সম্ভাব্যভাবে, তখন, ইন্টেলের সিলিকন সমগ্র AI পাইপলাইনকে আন্ডারপিন করতে পারে। কোম্পানির প্রসেসর - GPU হোক বা CPU - এছাড়াও একটি সাধারণ সফ্টওয়্যার মডেলকে সমর্থন করে ওপেন-সোর্স টুলিং এবং ফ্রেমওয়ার্কের উপর ভিত্তি করে ইন্টেল অপ্টিমাইজেশান এর OneAPI প্রোগ্রামের মাধ্যমে।

ব্রহ্মভট্ট সম্প্রদায় এবং ওপেন সোর্সের উপর ভিত্তি করে একটি x86 সফ্টওয়্যার ইকোসিস্টেম তৈরিতে ইন্টেলের ঐতিহ্যকে আরেকটি সুবিধা হিসেবে উল্লেখ করেছেন। “ইন্টেলের যে দর্শন আছে তা হল … 'বাস্তুতন্ত্রকে দত্তক গ্রহণ করতে দিন'। এবং আমাদের নিশ্চিত করতে হবে যে আমরা ইকোসিস্টেমের জন্য ন্যায্য এবং উন্মুক্ত, এবং আমরা ইকোসিস্টেমে আমাদের গোপন সস সরবরাহ করি।"

"আমরা একটি সাধারণ সফ্টওয়্যার স্ট্যাক ব্যবহার করছি, মূলত নিশ্চিত করতে যে বিকাশকারীদের AI এর জন্য CPU এবং GPU-এর মধ্যে IP-এর অন্তর্নিহিত পার্থক্য সম্পর্কে চিন্তা করতে হবে না।"

একটি সাধারণ সফ্টওয়্যার স্ট্যাকের এই সমন্বয় এবং সঠিক কাজের জন্য সঠিক কম্পিউট ইঞ্জিন ব্যবহার করার উপর ফোকাস করা এন্টারপ্রাইজে আরও বেশি গুরুত্বপূর্ণ। ব্যবসাগুলি তাদের সবচেয়ে চাপের সমস্যাগুলির সমাধান করতে সাহায্য করার জন্য AI-এর উপর নির্ভর করছে, তা ক্লাউডে থাকে বা প্রেমে থাকে। কিন্তু মিশ্র কাজের লোডের জন্য সম্পূর্ণ বৈশিষ্ট্যযুক্ত সফ্টওয়্যার প্রয়োজন, সেইসাথে সিস্টেম স্ট্যাকের রক্ষণাবেক্ষণ এবং পরিচালনার জন্য, অ্যাক্সিলারেটরের উপর বসে থাকা কার্নেলে অন্তর্ভুক্ত নয় এমন কোড চালানোর জন্য।

সুতরাং, যখন "আমরা কীভাবে এন্টারপ্রাইজ স্কেলে AI পেতে পারি" প্রশ্নের উত্তর দেওয়ার কথা আসে তখন উত্তরটি আরও বড় চিত্রটি একবার দেখে নেওয়া এবং আপনি আপনার নিষ্পত্তিতে হার্ডওয়্যার এবং সফ্টওয়্যার কিটের সম্পূর্ণ পরিপূরক ব্যবহার করেছেন তা নিশ্চিত করার উপর নির্ভর করতে পারে।

ইন্টেল দ্বারা স্পনসর.

সময় স্ট্যাম্প:

থেকে আরো নিবন্ধনকর্মী