Amazon SageMaker জাম্পস্টার্ট টেক্সট 2 টেক্সট জেনারেশন বড় ভাষার মডেলের সাথে ব্যাচ রূপান্তর সম্পাদন করুন | আমাজন ওয়েব সার্ভিসেস

Amazon SageMaker জাম্পস্টার্ট টেক্সট 2 টেক্সট জেনারেশন বড় ভাষার মডেলের সাথে ব্যাচ রূপান্তর সম্পাদন করুন | আমাজন ওয়েব সার্ভিসেস

আজ আমরা ঘোষণা করতে পেরে আনন্দিত যে আপনি এখন ব্যাচ ট্রান্সফর্ম করতে পারবেন আমাজন সেজমেকার জাম্পস্টার্ট টেক্সট 2 টেক্সট জেনারেশনের জন্য বড় ভাষা মডেল (এলএলএম)। ব্যাচ ট্রান্সফর্মগুলি এমন পরিস্থিতিতে দরকারী যেখানে প্রতিক্রিয়াগুলি বাস্তব সময় হওয়ার দরকার নেই এবং সেইজন্য আপনি বাল্কের বড় ডেটাসেটের জন্য ব্যাচে অনুমান করতে পারেন। ব্যাচ ট্রান্সফর্মের জন্য, একটি ব্যাচ কাজ চালানো হয় যা ডেটাসেট এবং একটি প্রাক-প্রশিক্ষিত মডেল হিসাবে ব্যাচ ইনপুট নেয় এবং ডেটাসেটের প্রতিটি ডেটা পয়েন্টের জন্য পূর্বাভাস দেয়। ব্যাচ ট্রান্সফর্ম খরচ-কার্যকর কারণ রিয়েল-টাইম হোস্টেড এন্ডপয়েন্টের বিপরীতে যাতে স্থায়ী হার্ডওয়্যার থাকে, ব্যাচ ট্রান্সফর্ম ক্লাস্টারগুলি কাজ শেষ হয়ে গেলে ছিঁড়ে ফেলা হয় এবং সেইজন্য হার্ডওয়্যারটি শুধুমাত্র ব্যাচ কাজের সময়কালের জন্য ব্যবহার করা হয়।

কিছু ব্যবহারের ক্ষেত্রে, রিয়েল-টাইম ইনফারেন্স রিকোয়েস্টগুলিকে রিয়েল-টাইম বা কাছাকাছি-রিয়েল-টাইম প্রতিক্রিয়া তৈরি করতে ব্যাচ প্রক্রিয়াকরণের জন্য ছোট ব্যাচে গোষ্ঠীভুক্ত করা যেতে পারে। উদাহরণস্বরূপ, যদি আপনাকে কম লেটেন্সি এবং উচ্চ থ্রুপুট সহ ডেটার একটি অবিচ্ছিন্ন প্রবাহ প্রক্রিয়া করতে হয়, প্রতিটি অনুরোধের জন্য আলাদাভাবে একটি রিয়েল-টাইম এন্ডপয়েন্ট আহ্বান করার জন্য আরও সংস্থান প্রয়োজন এবং সমস্ত অনুরোধগুলি প্রক্রিয়া করতে আরও বেশি সময় লাগতে পারে কারণ প্রক্রিয়াকরণটি ধারাবাহিকভাবে করা হচ্ছে . একটি ভাল পদ্ধতি হবে কিছু অনুরোধকে গোষ্ঠীবদ্ধ করা এবং ব্যাচ ইনফারেন্স মোডে রিয়েল-টাইম এন্ডপয়েন্টকে কল করা, যা মডেলের একটি ফরোয়ার্ড পাসে আপনার অনুরোধগুলিকে প্রক্রিয়া করে এবং রিয়েল টাইমে বা কাছাকাছি-রিয়েল টাইমে অনুরোধের জন্য বাল্ক প্রতিক্রিয়া প্রদান করে। . প্রতিক্রিয়ার লেটেন্সি নির্ভর করবে আপনি কতগুলি অনুরোধ একসাথে গ্রুপ করেছেন এবং মেমরির আকারের উদাহরণের উপর, তাই আপনি লেটেন্সি এবং থ্রুপুটের জন্য আপনার ব্যবসার প্রয়োজনীয়তা অনুসারে ব্যাচের আকার টিউন করতে পারেন। আমরা এই কল রিয়েল-টাইম ব্যাচ ইনফারেন্স কারণ এটি এখনও রিয়েল-টাইম প্রতিক্রিয়া প্রদান করার সময় ব্যাচিংয়ের ধারণাকে একত্রিত করে। রিয়েল-টাইম ব্যাচ ইনফারেন্সের সাহায্যে, আপনি কম লেটেন্সি এবং উচ্চ থ্রুপুটের মধ্যে একটি ভারসাম্য অর্জন করতে পারেন, আপনাকে সময়মত এবং দক্ষ পদ্ধতিতে প্রচুর পরিমাণে ডেটা প্রক্রিয়া করতে সক্ষম করে।

টেক্সট2 টেক্সট জেনারেশন মডেলের জন্য জাম্পস্টার্ট ব্যাচ ট্রান্সফর্ম আপনাকে এনভায়রনমেন্ট ভেরিয়েবলের মাধ্যমে ব্যাচ হাইপারপ্যারামিটার পাস করতে দেয় যা আরও থ্রুপুট বাড়ায় এবং লেটেন্সি কমিয়ে দেয়।

জাম্পস্টার্ট আপনাকে মেশিন লার্নিং (এমএল) দিয়ে শুরু করতে সাহায্য করার জন্য বিস্তৃত ধরণের সমস্যার জন্য পূর্বপ্রশিক্ষিত, ওপেন-সোর্স মডেল সরবরাহ করে। আপনি স্থাপনের আগে এই মডেলগুলিকে ক্রমবর্ধমানভাবে প্রশিক্ষণ এবং টিউন করতে পারেন। জাম্পস্টার্ট সমাধান টেমপ্লেটগুলিও সরবরাহ করে যা সাধারণ ব্যবহারের ক্ষেত্রে অবকাঠামো সেট আপ করে এবং এমএল এর জন্য এক্সিকিউটেবল উদাহরণ নোটবুক আমাজন সেজমেকার. আপনি জাম্পস্টার্ট ল্যান্ডিং পৃষ্ঠার মাধ্যমে প্রাক-প্রশিক্ষিত মডেল, সমাধান টেমপ্লেট এবং উদাহরণগুলি অ্যাক্সেস করতে পারেন অ্যামাজন সেজমেকার স্টুডিও. আপনি SageMaker Python SDK ব্যবহার করে জাম্পস্টার্ট মডেলগুলিও অ্যাক্সেস করতে পারেন।

এই পোস্টে, আমরা প্রদর্শন করি কিভাবে অত্যাধুনিক প্রাক-প্রশিক্ষিত ব্যবহার করতে হয় text2text FLAN T5 মডেল ব্যাচ ট্রান্সফর্ম এবং রিয়েল-টাইম ব্যাচ ইনফারেন্সের জন্য হাগিং ফেস থেকে।

সমাধান ওভারভিউ

নোটবুকে প্রাক-প্রশিক্ষিত Text2Text FLAN T5 মডেলের ব্যাচ রূপান্তর দেখানো হচ্ছে আলিঙ্গন মুখ নিম্নলিখিত পাওয়া যায় GitHub সংগ্রহস্থল. এই নোটবুক আলিঙ্গন মুখ থেকে তথ্য ব্যবহার করে cnn_dailymail SageMaker SDK ব্যবহার করে একটি পাঠ্য সংক্ষিপ্তকরণ কাজের জন্য ডেটাসেট।

ব্যাচ ট্রান্সফর্ম এবং রিয়েল-টাইম ব্যাচ ইনফারেন্স বাস্তবায়নের জন্য নিম্নলিখিত মূল পদক্ষেপগুলি রয়েছে:

  1. পূর্বশর্ত সেট আপ করুন।
  2. একটি প্রাক-প্রশিক্ষিত মডেল নির্বাচন করুন।
  3. মডেলের জন্য নিদর্শন পুনরুদ্ধার করুন.
  4. ব্যাচ ট্রান্সফর্ম কাজের হাইপারপ্যারামিটার নির্দিষ্ট করুন।
  5. ব্যাচ ট্রান্সফর্মের জন্য ডেটা প্রস্তুত করুন।
  6. ব্যাচ ট্রান্সফর্ম কাজ চালান।
  7. a ব্যবহার করে সারসংক্ষেপ মূল্যায়ন করুন লাল (রিকল ওরিয়েন্টেড আন্ডারস্টাডি ফর জিস্টিং ইভালুয়েশন) স্কোর।
  8. রিয়েল-টাইম ব্যাচ ইনফারেন্স সম্পাদন করুন।

পূর্বশর্ত সেট আপ করুন

আপনি নোটবুক চালানোর আগে, আপনাকে কিছু প্রাথমিক সেটআপ পদক্ষেপগুলি সম্পূর্ণ করতে হবে৷ আসুন সেজমেকার এক্সিকিউশন রোল সেট আপ করি যাতে আপনার পক্ষে AWS পরিষেবাগুলি চালানোর অনুমতি থাকে:

sagemaker_session = Session()
aws_role = sagemaker_session.get_caller_identity_arn()
aws_region = boto3.Session().region_name
sess = sagemaker.Session()

একটি প্রাক-প্রশিক্ষিত মডেল নির্বাচন করুন

আমরা একটি ডিফল্ট মডেল হিসাবে huggingface-text2text-flan-t5-large মডেল ব্যবহার করি। ঐচ্ছিকভাবে, আপনি JumpStart-এ উপলব্ধ Text2Text মডেলের তালিকা পুনরুদ্ধার করতে পারেন এবং আপনার পছন্দের মডেল বেছে নিতে পারেন। এই পদ্ধতিটি একই নোটবুক ব্যবহার করে বিভিন্ন মডেল আইডি নির্বাচন করার একটি সহজ উপায় প্রদান করে। প্রদর্শনের উদ্দেশ্যে, আমরা huggingface-text2text-flan-t5-বড় মডেল ব্যবহার করি:

model_id, model_version, = ( "huggingface-text2text-flan-t5-large", "*",
)

মডেলের জন্য নিদর্শন পুনরুদ্ধার করুন

সেজমেকারের সাহায্যে, আমরা একটি নতুন ডেটাসেটে প্রথমে ফাইন-টিউনিং না করেও প্রাক-প্রশিক্ষিত মডেলের উপর অনুমান করতে পারি। আমরা পুনরুদ্ধার দ্বারা শুরু deploy_image_uri, deploy_source_uri, এবং model_uri প্রাক-প্রশিক্ষিত মডেলের জন্য:

inference_instance_type = "ml.p3.2xlarge" # Retrieve the inference docker container uri. This is the base HuggingFace container image for the default model above.
deploy_image_uri = image_uris.retrieve(
region=None,
framework=None, # automatically inferred from model_id
image_scope="inference",
model_id=model_id,
model_version=model_version,
instance_type=inference_instance_type,
) # Retrieve the model uri.
model_uri = model_uris.retrieve(
model_id=model_id, model_version=model_version, model_scope="inference"
) #Create the SageMaker model instance
model = Model(
image_uri=deploy_image_uri,
model_data=model_uri,
role=aws_role,
predictor_cls=Predictor)

ব্যাচ ট্রান্সফর্ম কাজের হাইপারপ্যারামিটার নির্দিষ্ট করুন

আপনি ব্যাচ ট্রান্সফর্ম কাজের জন্য এনভায়রনমেন্ট ভেরিয়েবল হিসাবে হাইপারপ্যারামিটারের যেকোনো উপসেট পাস করতে পারেন। আপনি একটি JSON পেলোডে এই হাইপারপ্যারামিটারগুলিও পাস করতে পারেন। যাইহোক, আপনি যদি হাইপারপ্যারামিটারের জন্য এনভায়রনমেন্ট ভেরিয়েবল সেট করে থাকেন যেমন নিচের কোড দেখায়, তাহলে JSON লাইন পেলোডের পৃথক উদাহরণ থেকে উন্নত হাইপারপ্যারামিটার ব্যবহার করা হবে না। আপনি যদি পেলোড থেকে হাইপারপ্যারামিটার ব্যবহার করতে চান তবে আপনি সেট করতে চাইতে পারেন hyper_params_dict পরিবর্তে নাল হিসাবে প্যারামিটার।

#Specify the Batch Job Hyper Params Here, If you want to treate each example hyperparameters different please pass hyper_params_dict as None
hyper_params = {"batch_size":4, "max_length":50, "top_k": 50, "top_p": 0.95, "do_sample": True}
hyper_params_dict = {"HYPER_PARAMS":str(hyper_params)}

ব্যাচ ট্রান্সফর্মের জন্য ডেটা প্রস্তুত করুন

এখন আমরা লোড করার জন্য প্রস্তুত cnn_dailymail আলিঙ্গন মুখ থেকে ডেটাসেট:

cnn_test = load_dataset('cnn_dailymail','3.0.0',split='test')

আমরা প্রতিটি ডেটা এন্ট্রির উপরে যাই এবং প্রয়োজনীয় বিন্যাসে ইনপুট ডেটা তৈরি করি। আমরা একটি তৈরি করি articles.jsonl একটি পরীক্ষা ডেটা ফাইল হিসাবে ফাইল যা নিবন্ধগুলি ধারণকারী যা ইনপুট পেলোড হিসাবে সংক্ষিপ্ত করা প্রয়োজন। যখন আমরা এই ফাইলটি তৈরি করি, আমরা প্রম্পট যুক্ত করি "Briefly summarize this text:" প্রতিটি পরীক্ষার ইনপুট সারিতে। আপনি যদি প্রতিটি পরীক্ষার ইনপুটের জন্য আলাদা হাইপারপ্যারামিটার রাখতে চান তবে আপনি ডেটাসেট তৈরির অংশ হিসাবে সেই হাইপারপ্যারামিটারগুলি যুক্ত করতে পারেন।

আমরা বানাই highlights.jsonl পরীক্ষা ফাইলে সংরক্ষিত প্রতিটি নিবন্ধের হাইলাইট ধারণকারী গ্রাউন্ড ট্রুথ ফাইল হিসাবে articles.jsonl. আমরা একটি পরীক্ষা ফাইল উভয় সংরক্ষণ আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3) বালতি। নিম্নলিখিত কোড দেখুন:

#You can specify a prompt here
prompt = "Briefly summarize this text: "
#Provide the test data and the ground truth file name
test_data_file_name = "articles.jsonl"
test_reference_file_name = 'highlights.jsonl' test_articles = []
test_highlights =[] # We will go over each data entry and create the data in the input required format as described above
for id, test_entry in enumerate(cnn_test): article = test_entry['article'] highlights = test_entry['highlights'] # Create a payload like this if you want to have different hyperparameters for each test input # payload = {"id": id,"text_inputs": f"{prompt}{article}", "max_length": 100, "temperature": 0.95} # Note that if you specify hyperparameter for each payload individually, you may want to ensure that hyper_params_dict is set to None instead payload = {"id": id,"text_inputs": f"{prompt}{article}"} test_articles.append(payload) test_highlights.append({"id":id, "highlights": highlights}) with open(test_data_file_name, "w") as outfile: for entry in test_articles: outfile.write("%sn" % json.dumps(entry)) with open(test_reference_file_name, "w") as outfile: for entry in test_highlights: outfile.write("%sn" % json.dumps(entry)) # Uploading the data s3 = boto3.client("s3")
s3.upload_file(test_data_file_name, output_bucket, os.path.join(output_prefix + "/batch_input/articles.jsonl"))

ব্যাচ ট্রান্সফর্ম কাজ চালান

যখন আপনি একটি ব্যাচ ট্রান্সফর্ম কাজ শুরু করেন, তখন সেজমেকার সিপিইউ বা জিপিইউ ইনস্ট্যান্স সহ ডেটা প্রক্রিয়া করার জন্য প্রয়োজনীয় কম্পিউট রিসোর্স চালু করে নির্বাচিত উদাহরণের প্রকারের উপর নির্ভর করে। ব্যাচ ট্রান্সফর্ম কাজের সময়, সেজমেকার স্বয়ংক্রিয়ভাবে তথ্য, স্টোরেজ, এবং নেটওয়ার্কিং সংস্থান সহ ডেটা প্রক্রিয়া করার জন্য প্রয়োজনীয় গণনা সংস্থানগুলির বিধান এবং পরিচালনা করে। ব্যাচ ট্রান্সফর্ম কাজ সম্পূর্ণ হলে, গণনা সংস্থানগুলি স্বয়ংক্রিয়ভাবে সেজমেকার দ্বারা পরিষ্কার করা হয়। এর মানে হল কাজের সময় ব্যবহৃত দৃষ্টান্ত এবং সঞ্চয়স্থান বন্ধ করা হয় এবং সরানো হয়, সম্পদ মুক্ত করে এবং খরচ কমিয়ে দেয়। নিম্নলিখিত কোড দেখুন:

# Creating the Batch transformer object
batch_transformer = model.transformer( instance_count=1, instance_type=inference_instance_type, output_path=s3_output_data_path, assemble_with="Line", accept="text/csv", max_payload=1, env = hyper_params_dict
) # Making the predications on the input data
batch_transformer.transform(s3_input_data_path, content_type="application/jsonlines", split_type="Line") batch_transformer.wait()

নিম্নলিখিত থেকে একটি উদাহরণ রেকর্ড articles.jsonl পরীক্ষা ফাইল। নোট করুন যে এই ফাইলে একটি আইডি আছে যার সাথে মিলেছে predict.jsonl ফাইল রেকর্ড যা আউটপুট হিসাবে একটি সংক্ষিপ্ত রেকর্ড দেখায় Hugging Face Text2Text মডেল থেকে। একইভাবে, গ্রাউন্ড ট্রুথ ফাইলেও ডেটা রেকর্ডের জন্য একটি ম্যাচিং আইডি রয়েছে। টেস্ট ফাইল, গ্রাউন্ড ট্রুথ ফাইল এবং আউটপুট ফাইল জুড়ে মিলে যাওয়া আইডি ফলাফলের সহজ ব্যাখ্যার জন্য আউটপুট রেকর্ডের সাথে ইনপুট রেকর্ড লিঙ্ক করার অনুমতি দেয়।

সংক্ষিপ্তকরণের জন্য দেওয়া ইনপুট রেকর্ডের উদাহরণ নিচে দেওয়া হল:

{"id": 0, "text_inputs": "Briefly summarize this text: (CNN)The Palestinian Authority officially became the 123rd member of the International Criminal Court on Wednesday, a step that gives the court jurisdiction over alleged crimes in Palestinian territories. The formal accession was marked with a ceremony at The Hague, in the Netherlands, where the court is based. The Palestinians signed the ICC's founding Rome Statute in January, when they also accepted its jurisdiction over alleged crimes committed "in the occupied Palestinian territory, including East Jerusalem, since June 13, 2014." Later that month, the ICC opened a preliminary examination into the situation in Palestinian territories, paving the way for possible war crimes investigations against Israelis. As members of the court, Palestinians may be subject to counter-charges as well. Israel and the United States, neither of which is an ICC member, opposed the Palestinians' efforts to join the body. But Palestinian Foreign Minister Riad al-Malki, speaking at Wednesday's ceremony, said it was a move toward greater justice. "As Palestine formally becomes a State Party to the Rome Statute today, the world is also a step closer to ending a long era of impunity and injustice," he said, according to an ICC news release. "Indeed, today brings us closer to our shared goals of justice and peace." Judge Kuniko Ozaki, a vice president of the ICC, said acceding to the treaty was just the first step for the Palestinians. "As the Rome Statute today enters into force for the State of Palestine, Palestine acquires all the rights as well as responsibilities that come with being a State Party to the Statute. These are substantive commitments, which cannot be taken lightly," she said. Rights group Human Rights Watch welcomed the development. "Governments seeking to penalize Palestine for joining the ICC should immediately end their pressure, and countries that support universal acceptance of the court's treaty should speak out to welcome its membership," said Balkees Jarrah, international justice counsel for the group. "What's objectionable is the attempts to undermine international justice, not Palestine's decision to join a treaty to which over 100 countries around the world are members." In January, when the preliminary ICC examination was opened, Israeli Prime Minister Benjamin Netanyahu described it as an outrage, saying the court was overstepping its boundaries. The United States also said it "strongly" disagreed with the court's decision. "As we have said repeatedly, we do not believe that Palestine is a state and therefore we do not believe that it is eligible to join the ICC," the State Department said in a statement. It urged the warring sides to resolve their differences through direct negotiations. "We will continue to oppose actions against Israel at the ICC as counterproductive to the cause of peace," it said. But the ICC begs to differ with the definition of a state for its purposes and refers to the territories as "Palestine." While a preliminary examination is not a formal investigation, it allows the court to review evidence and determine whether to investigate suspects on both sides. Prosecutor Fatou Bensouda said her office would "conduct its analysis in full independence and impartiality." The war between Israel and Hamas militants in Gaza last summer left more than 2,000 people dead. The inquiry will include alleged war crimes committed since June. The International Criminal Court was set up in 2002 to prosecute genocide, crimes against humanity and war crimes. CNN's Vasco Cotovio, Kareem Khadder and Faith Karimi contributed to this report."}

নিম্নলিখিত সারাংশ সহ পূর্বাভাসিত আউটপুট:

{'id': 0, 'generated_texts': ['The Palestinian Authority officially became a member of the International Criminal Court on Wednesday, a step that gives the court jurisdiction over alleged crimes in Palestinian territories.']}

মডেল মূল্যায়নের উদ্দেশ্যে নিম্নোক্ত গ্রাউন্ড ট্রুথ সারসংক্ষেপ:

{"id": 0, "highlights": "Membership gives the ICC jurisdiction over alleged crimes committed in Palestinian territories since last June .nIsrael and the United States opposed the move, which could open the door to war crimes investigations against Israelis ."}

এর পরে, আমরা মডেল মূল্যায়নের জন্য স্থল সত্য এবং ভবিষ্যদ্বাণীকৃত আউটপুট ব্যবহার করি।

একটি ROUGE স্কোর ব্যবহার করে মডেল মূল্যায়ন করুন

লাল, অথবা Gisting Evaluation এর জন্য Recall-oriented Understudy হল মেট্রিক্সের একটি সেট এবং প্রাকৃতিক ভাষা প্রক্রিয়াকরণে স্বয়ংক্রিয় সংক্ষিপ্তকরণ এবং মেশিন অনুবাদের মূল্যায়নের জন্য ব্যবহৃত একটি সফ্টওয়্যার প্যাকেজ। মেট্রিক্স একটি স্বয়ংক্রিয়ভাবে উত্পাদিত সারাংশ বা অনুবাদকে একটি রেফারেন্স (মানব-উত্পাদিত) সারাংশ বা অনুবাদ বা রেফারেন্সের একটি সেটের সাথে তুলনা করে।

নিম্নলিখিত কোডে, আমরা সাধারণ কী-তে যুক্ত করে পূর্বাভাসিত এবং মূল সারাংশগুলিকে একত্রিত করি id এবং ROUGE স্কোর গণনা করতে এটি ব্যবহার করুন:

# Downloading the predictions
s3.download_file(
output_bucket, output_prefix + "/batch_output/" + "articles.jsonl.out", "predict.jsonl"
) with open('predict.jsonl', 'r') as json_file:
json_list = list(json_file) # Creating the prediction list for the dataframe
predict_dict_list = []
for predict in json_list:
if len(predict) > 1:
predict_dict = ast.literal_eval(predict)
predict_dict_req = {"id": predict_dict["id"], "prediction": predict_dict["generated_texts"][0]}
predict_dict_list.append(predict_dict_req) # Creating the predictions dataframe
predict_df = pd.DataFrame(predict_dict_list) test_highlights_df = pd.DataFrame(test_highlights) # Combining the predict dataframe with the original summarization on id to compute the rouge score
df_merge = test_highlights_df.merge(predict_df, on="id", how="left") rouge = evaluate.load('rouge')
results = rouge.compute(predictions=list(df_merge["prediction"]),references=list(df_merge["highlights"]))
print(results)
{'rouge1': 0.32749078992945646, 'rouge2': 0.126038645005132, 'rougeL': 0.22764277967933363, 'rougeLsum': 0.28162915746368966}

রিয়েল-টাইম ব্যাচ ইনফারেন্স সম্পাদন করুন

এর পরে, আমরা আপনাকে দেখাব কিভাবে একটি তালিকা হিসাবে ইনপুট প্রদান করে এন্ডপয়েন্টে রিয়েল-টাইম ব্যাচ ইনফারেন্স চালাতে হয়। আমরা আগের মতই একই মডেল আইডি এবং ডেটাসেট ব্যবহার করি, আমরা টেস্ট ডেটাসেট থেকে কিছু রেকর্ড গ্রহণ করি এবং একটি রিয়েল-টাইম এন্ডপয়েন্ট চালু করতে ব্যবহার করি।

নিম্নলিখিত কোডটি দেখায় কিভাবে রিয়েল-টাইম ব্যাচ ইনফারেন্সের জন্য একটি রিয়েল-টাইম এন্ডপয়েন্ট তৈরি এবং স্থাপন করতে হয়:

from sagemaker.utils import name_from_base
endpoint_name = name_from_base(f"jumpstart-example-{model_id}")
# deploy the Model. Note that we need to pass Predictor class when we deploy model through Model class,
# for being able to run inference through the sagemaker API.
model_predictor = model.deploy( initial_instance_count=1, instance_type=inference_instance_type, predictor_cls=Predictor, endpoint_name=endpoint_name
)

এর পরে, আমরা আমাদের ইনপুট পেলোড প্রস্তুত করি। এর জন্য, আমরা আগে তৈরি করা ডেটা ব্যবহার করি এবং প্রথম 10টি টেস্ট ইনপুট বের করি এবং হাইপারপ্যারামিটারের সাথে টেক্সট ইনপুট যুক্ত করি যা আমরা ব্যবহার করতে চাই। আমরা রিয়েল-টাইমে এই পেলোড প্রদান করি invoke_endpoint. প্রতিক্রিয়া পেলোড তারপর প্রতিক্রিয়াগুলির একটি তালিকা হিসাবে ফিরে আসে। নিম্নলিখিত কোড দেখুন:

#Provide all the text inputs to the model as a list
text_inputs = [entry["text_inputs"] for entry in test_articles[0:10]] # The information about the different Parameters is provided above
payload = { "text_inputs": text_inputs, "max_length": 50, "num_return_sequences": 1, "top_k": 50, "top_p": 0.95, "do_sample": True, "batch_size": 4
} def query_endpoint_with_json_payload(encoded_json, endpoint_name):
client = boto3.client("runtime.sagemaker")
response = client.invoke_endpoint(
EndpointName=endpoint_name, ContentType="application/json", Body=encoded_json
)
return response query_response = query_endpoint_with_json_payload(
json.dumps(payload).encode("utf-8"), endpoint_name=endpoint_name
) def parse_response_multiple_texts(query_response):
model_predictions = json.loads(query_response["Body"].read())
return model_predictions generated_text_list = parse_response_multiple_texts(query_response)
print(*generated_text_list, sep='n')

পরিষ্কার কর

আপনি এন্ডপয়েন্ট পরীক্ষা করার পরে, নিশ্চিত করুন যে আপনি সেজমেকার ইনফারেন্স এন্ডপয়েন্ট মুছে ফেলেছেন এবং চার্জ এড়াতে মডেলটি মুছে ফেলেছেন।

উপসংহার

এই নোটবুকে, আমরা সারসংক্ষেপের কাজগুলির জন্য Hugging Face Text2Text জেনারেটর মডেলটি প্রদর্শন করার জন্য একটি ব্যাচ ট্রান্সফর্ম করেছি। ব্যাচ ট্রান্সফর্ম একটি ক্রমাগত শেষ বিন্দুর প্রয়োজন ছাড়াই বড় ডেটাসেট থেকে অনুমানগুলি পেতে সুবিধাজনক। আমরা ফলাফলের ব্যাখ্যায় সহায়তা করার জন্য ইনপুট রেকর্ডগুলিকে অনুমানের সাথে সংযুক্ত করেছি। আমরা মডেল-উত্পন্ন সারাংশের সাথে পরীক্ষার ডেটা সারাংশের তুলনা করতে ROUGE স্কোর ব্যবহার করেছি।

উপরন্তু, আমরা রিয়েল-টাইম ব্যাচ ইনফারেন্স প্রদর্শন করেছি, যেখানে আপনি ইনপুট ডেটা স্ট্রিমিং করার মতো পরিস্থিতিতে লেটেন্সি এবং থ্রুপুটের মধ্যে ভারসাম্য অর্জন করতে একটি রিয়েল-টাইম এন্ডপয়েন্টে ডেটার একটি ছোট ব্যাচ পাঠাতে পারেন। রিয়েল-টাইম ব্যাচ ইনফারেন্স রিয়েল-টাইম অনুরোধের জন্য থ্রুপুট বাড়াতে সাহায্য করে।

SageMaker-এ Text2Text Generation মডেলের সাথে ব্যাচ ট্রান্সফর্ম করে দেখুন এবং আমাদের আপনার প্রতিক্রিয়া জানান!


লেখক সম্পর্কে

Amazon SageMaker জাম্পস্টার্ট টেক্সট 2 টেক্সট জেনারেশন বড় ভাষার মডেলের সাথে ব্যাচ রূপান্তর সম্পাদন করুন | আমাজন ওয়েব সার্ভিস প্লেটোব্লকচেইন ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.হেমন্ত সিং অ্যামাজন সেজমেকার জাম্পস্টার্ট এবং অ্যামাজন সেজমেকার বিল্ট-ইন অ্যালগরিদমে অভিজ্ঞতা সহ একজন মেশিন লার্নিং ইঞ্জিনিয়ার। তিনি Courant Institute of Mathematical Sciences থেকে স্নাতকোত্তর এবং IIT দিল্লি থেকে B.Tech অর্জন করেন। ন্যাচারাল ল্যাঙ্গুয়েজ প্রসেসিং, কম্পিউটার ভিশন এবং টাইম সিরিজ অ্যানালাইসিসের ডোমেইনের মধ্যে মেশিন লার্নিং সমস্যার বিভিন্ন পরিসরে কাজ করার অভিজ্ঞতা রয়েছে তার।

Amazon SageMaker জাম্পস্টার্ট টেক্সট 2 টেক্সট জেনারেশন বড় ভাষার মডেলের সাথে ব্যাচ রূপান্তর সম্পাদন করুন | আমাজন ওয়েব সার্ভিস প্লেটোব্লকচেইন ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.রচনা চাদা AWS এ স্ট্র্যাটেজিক অ্যাকাউন্টে একজন প্রিন্সিপাল সলিউশন আর্কিটেক্ট এআই/এমএল। রচনা একজন আশাবাদী যিনি বিশ্বাস করেন যে AI এর নৈতিক ও দায়িত্বশীল ব্যবহার ভবিষ্যতে সমাজের উন্নতি করতে পারে এবং অর্থনৈতিক ও সামাজিক সমৃদ্ধি আনতে পারে। অবসর সময়ে, রচনা তার পরিবারের সাথে সময় কাটাতে, হাইকিং করতে এবং গান শুনতে পছন্দ করে।

Amazon SageMaker জাম্পস্টার্ট টেক্সট 2 টেক্সট জেনারেশন বড় ভাষার মডেলের সাথে ব্যাচ রূপান্তর সম্পাদন করুন | আমাজন ওয়েব সার্ভিস প্লেটোব্লকচেইন ডেটা ইন্টেলিজেন্স। উল্লম্ব অনুসন্ধান. আ.আশিস খেতান ড অ্যামাজন সেজমেকার বিল্ট-ইন অ্যালগরিদম সহ একজন সিনিয়র ফলিত বিজ্ঞানী এবং মেশিন লার্নিং অ্যালগরিদম বিকাশে সহায়তা করে। তিনি ইউনিভার্সিটি অফ ইলিনয় আরবানা-চ্যাম্পেইন থেকে পিএইচডি লাভ করেন। তিনি মেশিন লার্নিং এবং পরিসংখ্যানগত অনুমানে একজন সক্রিয় গবেষক এবং নিউরিআইপিএস, আইসিএমএল, আইসিএলআর, জেএমএলআর, এসিএল এবং ইএমএনএলপি সম্মেলনে অনেক গবেষণাপত্র প্রকাশ করেছেন।

সময় স্ট্যাম্প:

থেকে আরো এডাব্লুএস মেশিন লার্নিং

নেক্সট জেনারেশন অ্যামাজন সেজমেকার এক্সপেরিমেন্টস - স্কেলে আপনার মেশিন লার্নিং ট্রেনিং সংগঠিত করুন, ট্র্যাক করুন এবং তুলনা করুন

উত্স নোড: 1773442
সময় স্ট্যাম্প: ডিসেম্বর 16, 2022