ایمیزون سیج میکر اسٹوڈیو اور ایمیزون سیج میکر آٹو پائلٹ کا استعمال کرتے ہوئے سیٹلائٹ امیج کی خصوصیات کا استعمال کرتے ہوئے مینگروو کے جنگلات کی شناخت کریں

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

مینگروو کے جنگلات ایک صحت مند ماحولیاتی نظام کا ایک درآمدی حصہ ہیں، اور انسانی سرگرمیاں دنیا بھر کے ساحلی خطوں سے ان کے بتدریج غائب ہونے کی ایک بڑی وجہ ہیں۔ سیٹلائٹ امیج سے مینگروو کے علاقوں کی شناخت کے لیے مشین لرننگ (ML) ماڈل کا استعمال محققین کو وقت کے ساتھ ساتھ جنگلات کے سائز کی نگرانی کرنے کا ایک مؤثر طریقہ فراہم کرتا ہے۔ میں حصہ 1 اس سلسلے میں، ہم نے دکھایا کہ سیٹلائٹ ڈیٹا کو خودکار انداز میں کیسے جمع کیا جائے اور اس کا تجزیہ کیا جائے ایمیزون سیج میکر اسٹوڈیو انٹرایکٹو تصور کے ساتھ۔ اس پوسٹ میں، ہم استعمال کرنے کا طریقہ بتاتے ہیں۔ ایمیزون سیج میکر آٹو پائلٹ اپنی مرضی کے مطابق مینگروو کلاسیفائر بنانے کے عمل کو خودکار کرنے کے لیے۔

آٹو پائلٹ کے ساتھ ماڈل کو تربیت دیں۔

آٹو پائلٹ متعدد ماڈلز بنانے اور بہترین کو منتخب کرنے کا متوازن طریقہ فراہم کرتا ہے۔ کم سے کم کوشش کے ساتھ مختلف ڈیٹا پری پروسیسنگ تکنیکوں اور ایم ایل ماڈلز کے متعدد امتزاج تخلیق کرتے ہوئے، آٹو پائلٹ اگر چاہے تو ڈیٹا سائنسدان کو ان اجزاء کے مراحل پر مکمل کنٹرول فراہم کرتا ہے۔

آپ AWS SDKs میں سے کسی ایک کا استعمال کرتے ہوئے آٹو پائلٹ استعمال کر سکتے ہیں (تفصیلات اس میں دستیاب ہیں۔ آٹو پائلٹ کے لیے API حوالہ گائیڈ) یا اسٹوڈیو کے ذریعے۔ ہم اس سیکشن میں بیان کردہ اقدامات کے بعد اپنے اسٹوڈیو حل میں آٹو پائلٹ کا استعمال کرتے ہیں:

اسٹوڈیو لانچر صفحہ پر، اس کے لیے جمع نشان کا انتخاب کریں۔ نیا آٹو پائلٹ تجربہ.
کے لئے اپنا ڈیٹا جوڑیں۔منتخب S3 بالٹی تلاش کریں۔، اور بالٹی کا نام درج کریں جہاں آپ نے ٹریننگ اور ٹیسٹ ڈیٹاسیٹ رکھے تھے۔
کے لئے ڈیٹا سیٹ فائل کا نام، اس ٹریننگ ڈیٹا فائل کا نام درج کریں جسے آپ نے بنایا ہے۔ تربیت کا ڈیٹا تیار کریں۔ سیکشن میں حصہ 1.
کے لئے آؤٹ پٹ ڈیٹا لوکیشن (S3 بالٹی)، وہی بالٹی نام درج کریں جو آپ نے مرحلہ 2 میں استعمال کیا تھا۔
کے لئے ڈیٹا سیٹ ڈائریکٹری کا نام، بالٹی کے نیچے ایک فولڈر کا نام درج کریں جہاں آپ آٹو پائلٹ کو نمونے ذخیرہ کرنا چاہتے ہیں۔
کے لئے کیا آپ کا S3 ان پٹ ایک مینی فیسٹ فائل ہے؟منتخب کریں بند.
کے لئے ہدفمنتخب کریں لیبل.
کے لئے خودکار تعیناتمنتخب کریں بند.
کے نیچے اعلی درجے کی ترتیبات، کے لئے مشین لرننگ کے مسئلے کی قسممنتخب کریں بائنری درجہ بندی.
کے لئے مقصدی میٹرکمنتخب کریں اے او سی.
کے لئے اپنے تجربہ کو چلانے کا طریقہ منتخب کریں۔منتخب کریں نہیں، امیدوار کی تعریفوں کے ساتھ ایک نوٹ بک بنانے کے لیے پائلٹ چلائیں۔.
میں سے انتخاب کریں تجربہ بنائیں.

ایک تجربہ بنانے کے بارے میں مزید معلومات کے لیے، رجوع کریں۔ ایمیزون سیج میکر آٹو پائلٹ تجربہ بنائیںاس قدم کو چلانے میں تقریباً 15 منٹ لگ سکتے ہیں۔
مکمل ہونے پر، منتخب کریں۔ امیدوار نسل کی نوٹ بک کھولیں۔، جو صرف پڑھنے کے موڈ میں ایک نئی نوٹ بک کھولتا ہے۔
میں سے انتخاب کریں نوٹ بک درآمد کریں۔ نوٹ بک کو قابل تدوین بنانے کے لیے۔
تصویر کے لیے، منتخب کریں۔ ڈیٹا سائنس.
کے لئے دانامنتخب کریں ازگر 3.
میں سے انتخاب کریں منتخب کریں.

اس خود کار طریقے سے تیار کردہ نوٹ بک میں تفصیلی وضاحتیں ہیں اور اس پر عمل کرنے کے لیے اصل ماڈل بنانے کے کام پر مکمل کنٹرول فراہم کرتا ہے۔ کا ایک حسب ضرورت ورژن نوٹ بکجہاں ایک درجہ بندی کرنے والے کو 2013 سے لینڈ سیٹ سیٹلائٹ بینڈز کا استعمال کرتے ہوئے تربیت دی جاتی ہے، کوڈ ریپوزٹری میں دستیاب ہے notebooks/mangrove-2013.ipynb.

ماڈل بلڈنگ فریم ورک دو حصوں پر مشتمل ہے: ڈیٹا پروسیسنگ مرحلے کے حصے کے طور پر فیچر ٹرانسفارمیشن، اور ماڈل سلیکشن سٹیپ کے حصے کے طور پر ہائپر پیرامیٹر آپٹیمائزیشن (HPO)۔ ان کاموں کے لیے تمام ضروری نمونے آٹو پائلٹ تجربے کے دوران بنائے گئے تھے اور محفوظ کیے گئے تھے۔ ایمیزون سادہ اسٹوریج سروس (ایمیزون S3)۔ پہلا نوٹ بک سیل ان نمونوں کو Amazon S3 سے مقامی میں ڈاؤن لوڈ کرتا ہے۔ ایمیزون سیج میکر معائنہ اور کسی ضروری ترمیم کے لیے فائل سسٹم۔ دو فولڈر ہیں: generated_module اور sagemaker_automl، جہاں نوٹ بک کو چلانے کے لیے تمام Python ماڈیولز اور اسکرپٹس کو محفوظ کیا جاتا ہے۔ مختلف فیچر ٹرانسفارمیشن کے اقدامات جیسے امپیوٹیشن، اسکیلنگ، اور پی سی اے کو بطور محفوظ کیا جاتا ہے۔ generated_modules/candidate_data_processors/dpp*.py.

آٹو پائلٹ XGBoost، لکیری لرنر، اور ملٹی لیئر پرسیپٹرون (MLP) الگورتھم کی بنیاد پر تین مختلف ماڈل بناتا ہے۔ امیدواروں کی پائپ لائن فیچر ٹرانسفارمیشن آپشنز میں سے ایک پر مشتمل ہوتی ہے، جسے کہا جاتا ہے۔ data_transformer، اور ایک الگورتھم۔ پائپ لائن ایک ازگر کی لغت ہے اور اس کی تعریف اس طرح کی جا سکتی ہے:

candidate1 = { "data_transformer": { "name": "dpp5", "training_resource_config": { "instance_type": "ml.m5.4xlarge", "instance_count": 1, "volume_size_in_gb": 50 }, "transform_resource_config": { "instance_type": "ml.m5.4xlarge", "instance_count": 1, }, "transforms_label": True, "transformed_data_format": "application/x-recordio-protobuf", "sparse_encoding": True }, "algorithm": { "name": "xgboost", "training_resource_config": { "instance_type": "ml.m5.4xlarge", "instance_count": 1, }, }
}

اس مثال میں، پائپ لائن ٹریننگ ڈیٹا کو اسکرپٹ کے مطابق تبدیل کرتی ہے۔ generated_modules/candidate_data_processors/dpp5.py اور ایک XGBoost ماڈل بناتا ہے۔ یہ وہ جگہ ہے جہاں آٹو پائلٹ ڈیٹا سائنسدان کو مکمل کنٹرول فراہم کرتا ہے، جو خود بخود پیدا ہونے والی خصوصیت کی تبدیلی اور ماڈل کے انتخاب کے مراحل کو چن سکتا ہے یا اپنا مجموعہ بنا سکتا ہے۔

اب آپ آٹو پائلٹ کے لیے ایک پول میں پائپ لائن شامل کر سکتے ہیں تاکہ تجربہ کو اس طرح چلایا جا سکے:

from sagemaker_automl import AutoMLInteractiveRunner, AutoMLLocalCandidate automl_interactive_runner = AutoMLInteractiveRunner(AUTOML_LOCAL_RUN_CONFIG)
automl_interactive_runner.select_candidate(candidate1)

یہ ایک اہم مرحلہ ہے جہاں آپ آٹو پائلٹ کی طرف سے تجویز کردہ امیدواروں کے صرف ذیلی سیٹ کو رکھنے کا فیصلہ کر سکتے ہیں، موضوع کی مہارت کی بنیاد پر، کل رن ٹائم کو کم کرنے کے لیے۔ ابھی کے لیے، آٹو پائلٹ کی تمام تجاویز کو اپنے پاس رکھیں، جن کی آپ درج ذیل فہرست بنا سکتے ہیں:

automl_interactive_runner.display_candidates()

امیدوار کا نام	الگورتھم	فیچر ٹرانسفارمر
dpp0-xgboost	xgboost	dpp0.py
dpp1-xgboost	xgboost	dpp1.py
dpp2-linear-earner	لکیری سیکھنے والا	dpp2.py
dpp3-xgboost	xgboost	dpp3.py
dpp4-xgboost	xgboost	dpp4.py
dpp5-xgboost	xgboost	dpp5.py
dpp6-mlp	MLP	dpp6.py

مکمل آٹو پائلٹ تجربہ دو حصوں میں کیا جاتا ہے۔ سب سے پہلے، آپ کو ڈیٹا ٹرانسفارمیشن جابز چلانے کی ضرورت ہے:

automl_interactive_runner.fit_data_transformers(parallel_jobs=7)

یہ مرحلہ تمام امیدواروں کے لیے تقریباً 30 منٹ میں مکمل ہونا چاہیے، اگر آپ اس میں مزید کوئی ترمیم نہیں کرتے ہیں۔ dpp*.py فائلوں.

اگلا مرحلہ متعلقہ الگورتھم کے لیے ہائپر پیرامیٹرز کو ٹیوننگ کرکے ماڈلز کا بہترین سیٹ بنانا ہے۔ ہائپر پیرامیٹر کو عام طور پر دو حصوں میں تقسیم کیا جاتا ہے: جامد اور ٹیون ایبل۔ ایک ہی الگورتھم کا اشتراک کرنے والے تمام امیدواروں کے لیے پورے تجربے میں جامد ہائپرپیرامیٹر میں کوئی تبدیلی نہیں ہوتی۔ یہ ہائپرپیرامیٹر ایک لغت کے طور پر تجربے میں بھیجے جاتے ہیں۔ اگر آپ پانچ گنا کراس توثیق اسکیم کے تین راؤنڈز سے AUC کو زیادہ سے زیادہ کر کے بہترین XGBoost ماڈل کو منتخب کرنے کا انتخاب کرتے ہیں، تو لغت درج ذیل کوڈ کی طرح نظر آتی ہے:

{ 'objective': 'binary:logistic', 'eval_metric': 'auc', '_kfold': 5, '_num_cv_round': 3,
}

ٹیون ایبل ہائپرپیرامیٹرس کے لیے، آپ کو رینجز اور اسکیلنگ کی قسم کے ساتھ ایک اور لغت پاس کرنے کی ضرورت ہے:

{ 'num_round': IntegerParameter(64, 1024, scaling_type='Logarithmic'), 'max_depth': IntegerParameter(2, 8, scaling_type='Logarithmic'), 'eta': ContinuousParameter(1e-3, 1.0, scaling_type='Logarithmic'),
... }

ہائپرپیرامیٹر کا مکمل سیٹ میں دستیاب ہے۔ mangrove-2013.ipynb نوٹ بک.

ایک ایسا تجربہ بنانے کے لیے جہاں تمام سات امیدواروں کو متوازی طور پر جانچا جا سکے، ایک ملٹی الگورتھم HPO ٹیونر بنائیں:

multi_algo_tuning_parameters = automl_interactive_runner.prepare_multi_algo_parameters( objective_metrics=ALGORITHM_OBJECTIVE_METRICS, static_hyperparameters=STATIC_HYPERPARAMETERS, hyperparameters_search_ranges=ALGORITHM_TUNABLE_HYPERPARAMETER_RANGES)

مقصدی میٹرکس کو ہر الگورتھم کے لیے آزادانہ طور پر بیان کیا گیا ہے:

ALGORITHM_OBJECTIVE_METRICS = { 'xgboost': 'validation:auc', 'linear-learner': 'validation:roc_auc_score', 'mlp': 'validation:roc_auc',
}

تمام تجربات کے لیے ہائپرپیرامیٹر کی تمام ممکنہ اقدار کو آزمانا فضول ہے۔ آپ HPO ٹونر بنانے کے لیے Bayesian حکمت عملی اپنا سکتے ہیں:

multi_algo_tuning_inputs = automl_interactive_runner.prepare_multi_algo_inputs()
ase_tuning_job_name = "{}-tuning".format(AUTOML_LOCAL_RUN_CONFIG.local_automl_job_name) tuner = HyperparameterTuner.create( base_tuning_job_name=base_tuning_job_name, strategy='Bayesian', objective_type='Maximize', max_parallel_jobs=10, max_jobs=50, **multi_algo_tuning_parameters,
)

پہلے سے طے شدہ ترتیب میں، آٹو پائلٹ بہترین ماڈل کو منتخب کرنے کے لیے ٹونر میں 250 ملازمتیں چنتا ہے۔ اس استعمال کے کیس کے لیے، یہ سیٹ کرنا کافی ہے۔ max_jobs=50 وقت اور وسائل کو بچانے کے لیے، ہائپر پیرامیٹر کے بہترین سیٹ کو منتخب کرنے کے معاملے میں کسی اہم جرمانے کے بغیر۔ آخر میں، مندرجہ ذیل طور پر HPO جاب جمع کروائیں:

tuner.fit(inputs=multi_algo_tuning_inputs, include_cls_metadata=None)

اس عمل میں ml.m80x بڑی مثالوں پر تقریباً 5.4 منٹ لگتے ہیں۔ آپ انتخاب کرکے سیج میکر کنسول پر پیشرفت کی نگرانی کرسکتے ہیں۔ ہائپر پیرامیٹر ٹیوننگ جابز کے تحت ٹریننگ نیوی گیشن پین میں.

آپ پیشرفت میں کام کا نام منتخب کرکے، ہر امیدوار کی کارکردگی سمیت مفید معلومات کے ایک میزبان کو دیکھ سکتے ہیں۔

آخر میں، بہترین امیدواروں کی ماڈل کارکردگی کا موازنہ حسب ذیل کریں:

from sagemaker.analytics import HyperparameterTuningJobAnalytics SAGEMAKER_SESSION = AUTOML_LOCAL_RUN_CONFIG.sagemaker_session
SAGEMAKER_ROLE = AUTOML_LOCAL_RUN_CONFIG.role tuner_analytics = HyperparameterTuningJobAnalytics( tuner.latest_tuning_job.name, sagemaker_session=SAGEMAKER_SESSION) df_tuning_job_analytics = tuner_analytics.dataframe() df_tuning_job_analytics.sort_values( by=['FinalObjectiveValue'], inplace=True, ascending=False if tuner.objective_type == "Maximize" else True) # select the columns to display and rename
select_columns = ["TrainingJobDefinitionName", "FinalObjectiveValue", "TrainingElapsedTimeSeconds"]
rename_columns = { "TrainingJobDefinitionName": "candidate", "FinalObjectiveValue": "AUC", "TrainingElapsedTimeSeconds": "run_time" } # Show top 5 model performances
df_tuning_job_analytics.rename(columns=rename_columns)[rename_columns.values()].set_index("candidate").head(5)

امیدوار	اے او سی	run_time (s)
dpp6-mlp	0.96008	2711.0
dpp4-xgboost	0.95236	385.0
dpp3-xgboost	0.95095	202.0
dpp4-xgboost	0.95069	458.0
dpp3-xgboost	0.95015	361.0

ایم ایل پی کی بنیاد پر اعلیٰ کارکردگی کا مظاہرہ کرنے والا ماڈل، جبکہ ڈیٹا پروسیسنگ کے مختلف مراحل کے ساتھ XGBoost ماڈلز سے معمولی طور پر بہتر، تربیت میں بھی بہت زیادہ وقت لگتا ہے۔ آپ ایم ایل پی ماڈل ٹریننگ کے بارے میں اہم تفصیلات حاصل کر سکتے ہیں، بشمول استعمال شدہ ہائپر پیرامیٹرس کا مجموعہ، حسب ذیل:

df_tuning_job_analytics.loc[df_tuning_job_analytics.TrainingJobName==best_training_job].T.dropna()

ٹریننگ جاب کا نام	mangrove-2-notebook–211021-2016-012-500271c8
ٹریننگ جاب اسٹیٹس	مکمل
FinalObjectiveValue	0.96008
ٹریننگ اسٹارٹ ٹائم	2021-10-21 20:22:55+00:00
ٹریننگ اینڈ ٹائم	2021-10-21 21:08:06+00:00
ٹریننگ ایلپسڈ ٹائم سیکنڈز	2711
TrainingJobDefinitionName	dpp6-mlp
ڈراپ آؤٹ_پروب	0.415778
ایمبیڈنگ_سائز_فیکٹر	0.849226
تہوں	256
سیکھنے کی_ شرح	0.00013862
منی_بیچ_سائز	317
نیٹ ورک_قسم	فیڈفورورڈ
وزن میں کمی	1.29323 ای -12

ایک انفرنس پائپ لائن بنائیں

نئے ڈیٹا پر قیاس پیدا کرنے کے لیے، آپ کو بہترین ماڈل کی میزبانی کے لیے SageMaker پر ایک انفرنس پائپ لائن بنانا ہوگی جسے بعد میں تخمینہ پیدا کرنے کے لیے کال کیا جا سکتا ہے۔ سیج میکر پائپ لائن ماڈل کو اس کے اجزاء کے طور پر تین کنٹینرز کی ضرورت ہوتی ہے: ڈیٹا ٹرانسفارمیشن، الگورتھم، اور الٹا لیبل ٹرانسفارمیشن (اگر عددی پیشین گوئیوں کو غیر عددی لیبلز پر میپ کرنے کی ضرورت ہے)۔ اختصار کے لیے، مطلوبہ کوڈ کا صرف ایک حصہ درج ذیل ٹکڑوں میں دکھایا گیا ہے۔ مکمل کوڈ میں دستیاب ہے۔ mangrove-2013.ipynb نوٹ بک:

from sagemaker.estimator import Estimator
from sagemaker import PipelineModel
from sagemaker_automl import select_inference_output …
# Final pipeline model model_containers = [best_data_transformer_model, best_algo_model]
if best_candidate.transforms_label: model_containers.append(best_candidate.get_data_transformer_model( transform_mode="inverse-label-transform", role=SAGEMAKER_ROLE, sagemaker_session=SAGEMAKER_SESSION)) # select the output type
model_containers = select_inference_output("BinaryClassification", model_containers, output_keys=['predicted_label'])

ماڈل کنٹینرز کی تعمیر کے بعد، آپ مندرجہ ذیل طور پر پائپ لائن کی تعمیر اور تعینات کر سکتے ہیں:

from sagemaker import PipelineModel pipeline_model = PipelineModel( name=f"mangrove-automl-2013", role=SAGEMAKER_ROLE, models=model_containers, vpc_config=AUTOML_LOCAL_RUN_CONFIG.vpc_config) pipeline_model.deploy(initial_instance_count=1, instance_type='ml.m5.2xlarge', endpoint_name=pipeline_model.name, wait=True)

اختتامی نقطہ کی تعیناتی کو مکمل ہونے میں تقریباً 10 منٹ لگتے ہیں۔

اینڈ پوائنٹ کا استعمال کرتے ہوئے ٹیسٹ ڈیٹاسیٹ کا اندازہ حاصل کریں۔

اختتامی نقطہ کے تعینات ہونے کے بعد، آپ اسے B1–B7 خصوصیات کے پے لوڈ کے ساتھ استعمال کر سکتے ہیں تاکہ تصویر میں ہر پکسل کو مینگروو (1) یا دوسرے (0) کے طور پر درجہ بندی کیا جا سکے۔

import boto3
sm_runtime = boto3.client('runtime.sagemaker') pred_labels = []
with open(local_download, 'r') as f: for i, row in enumerate(f): payload = row.rstrip('n') x = sm_runtime.invoke_endpoint(EndpointName=inf_endpt, ContentType="text/csv", Body=payload) pred_labels.append(int(x['Body'].read().decode().strip()))

تشخیص اور منصوبہ بندی کے لیے ماڈل کی پیشین گوئیوں کے پوسٹ پروسیسنگ کے بارے میں مکمل تفصیلات اس میں دستیاب ہیں۔ notebooks/model_performance.ipynb.

بیچ ٹرانسفارم کا استعمال کرتے ہوئے ٹیسٹ ڈیٹاسیٹ کا اندازہ حاصل کریں۔

اب جب کہ آپ نے آٹو پائلٹ کے ساتھ بہترین کارکردگی کا مظاہرہ کرنے والا ماڈل بنایا ہے، ہم اندازہ کے لیے ماڈل کا استعمال کر سکتے ہیں۔ بڑے ڈیٹا سیٹس کا اندازہ لگانے کے لیے، بیچ ٹرانسفارم استعمال کرنا زیادہ کارآمد ہے۔ آئیے پورے ڈیٹاسیٹ (ٹریننگ اور ٹیسٹ) پر پیشین گوئیاں تیار کریں اور نتائج کو خصوصیات میں شامل کریں، تاکہ ہم مزید تجزیہ کر سکیں، مثال کے طور پر، پیشین گوئی بمقابلہ حقیقت اور پیشین گوئی شدہ کلاسوں کے درمیان خصوصیات کی تقسیم کو چیک کریں۔

سب سے پہلے، ہم Amazon S3 میں ایک مینی فیسٹ فائل بناتے ہیں جو ڈیٹا پراسیسنگ کے پچھلے مراحل سے ٹریننگ اور ٹیسٹ ڈیٹا کے مقامات کی طرف اشارہ کرتی ہے:

import boto3
data_bucket = <Name of the S3 bucket that has the training data>
prefix = "LANDSAT_LC08_C01_T1_SR/Year2013"
manifest = "[{{"prefix": "s3://{}/{}/"}},n"train.csv",n"test.csv"n]".format(data_bucket, prefix)
s3_client = boto3.client('s3')
s3_client.put_object(Body=manifest, Bucket=data_bucket, Key=f"{prefix}/data.manifest")

اب ہم بیچ ٹرانسفارم جاب بنا سکتے ہیں۔ کیونکہ ہماری ان پٹ ٹرین اور ٹیسٹ ڈیٹاسیٹ ہے۔ label آخری کالم کے طور پر، ہمیں تخمینہ کے دوران اسے چھوڑنے کی ضرورت ہے۔ ایسا کرنے کے لیے، ہم گزر جاتے ہیں۔ InputFilter میں DataProcessing دلیل. کوڈ "$[:-2]" آخری کالم چھوڑنے کا اشارہ کرتا ہے۔ اس کے بعد پیش گوئی کی گئی پیداوار کو مزید تجزیہ کے لیے سورس ڈیٹا کے ساتھ جوڑ دیا جاتا ہے۔

مندرجہ ذیل کوڈ میں، ہم بیچ ٹرانسفارم جاب کے لیے دلائل بناتے ہیں اور پھر پاس کرتے ہیں۔ create_transform_job فنکشن:

from time import gmtime, strftime batch_job_name = "Batch-Transform-" + strftime("%Y-%m-%d-%H-%M-%S", gmtime())
output_location = "s3://{}/{}/batch_output/{}".format(data_bucket, prefix, batch_job_name)
input_location = "s3://{}/{}/data.manifest".format(data_bucket, prefix) request = { "TransformJobName": batch_job_name, "ModelName": pipeline_model.name, "TransformOutput": { "S3OutputPath": output_location, "Accept": "text/csv", "AssembleWith": "Line", }, "TransformInput": { "DataSource": {"S3DataSource": {"S3DataType": "ManifestFile", "S3Uri": input_location}}, "ContentType": "text/csv", "SplitType": "Line", "CompressionType": "None", }, "TransformResources": {"InstanceType": "ml.m4.xlarge", "InstanceCount": 1}, "DataProcessing": {"InputFilter": "$[:-2]", "JoinSource": "Input"}
} sagemaker = boto3.client("sagemaker")
sagemaker.create_transform_job(**request)
print("Created Transform job with name: ", batch_job_name)

آپ SageMaker کنسول پر جاب کی حالت کی نگرانی کر سکتے ہیں۔

ماڈل کی کارکردگی کا تصور کریں۔

اب آپ ٹیسٹ ڈیٹاسیٹ پر بہترین ماڈل کی کارکردگی کا تصور کر سکتے ہیں، جس میں ہندوستان، میانمار، کیوبا اور ویتنام کے علاقوں پر مشتمل ہے، کنفیوژن میٹرکس کے طور پر۔ ماڈل میں مینگرووز کی نمائندگی کرنے والے پکسلز کے لیے زیادہ یاد کرنے کی قدر ہے، لیکن صرف 75% درستگی۔ نان مینگروو یا دیگر پکسلز کی درستگی 99 فیصد یاد کے ساتھ 85 فیصد ہے۔ آپ مخصوص استعمال کے معاملے کی بنیاد پر متعلقہ اقدار کو ایڈجسٹ کرنے کے لیے ماڈل پیشین گوئیوں کے امکانی کٹ آف کو ٹیون کر سکتے ہیں۔

یہ بات قابل غور ہے کہ نتائج بلٹ ان سمائل کارٹ ماڈل کے مقابلے میں نمایاں بہتری ہیں۔

ماڈل کی پیشین گوئیوں کا تصور کریں۔

آخر میں، نقشے پر مخصوص علاقوں میں ماڈل کی کارکردگی کا مشاہدہ کرنا مفید ہے۔ مندرجہ ذیل تصویر میں، ہندوستان-بنگلہ دیش سرحد میں مینگروو کے علاقے کو سرخ رنگ میں دکھایا گیا ہے۔ ٹیسٹ ڈیٹاسیٹ سے تعلق رکھنے والے لینڈ سیٹ امیج پیچ سے نمونے لیے گئے پوائنٹس کو اس خطے پر سپرد کیا جاتا ہے، جہاں ہر پوائنٹ ایک پکسل ہوتا ہے جسے ماڈل مینگرووز کی نمائندگی کرنے کا تعین کرتا ہے۔ نیلے پوائنٹس کو ماڈل کے ذریعہ صحیح طریقے سے درجہ بندی کیا گیا ہے، جبکہ سیاہ پوائنٹس ماڈل کی غلطیوں کی نمائندگی کرتے ہیں۔

مندرجہ ذیل تصویر میں صرف وہی نکات دکھائے گئے ہیں جن کے بارے میں ماڈل نے پیش گوئی کی تھی کہ وہ مینگرووز کی نمائندگی نہیں کرے گی، اسی رنگ کی سکیم کے ساتھ جو پچھلی مثال کے طور پر ہے۔ سرمئی خاکہ لینڈ سیٹ پیچ کا وہ حصہ ہے جس میں کوئی مینگرووز شامل نہیں ہے۔ جیسا کہ تصویر سے ظاہر ہے، ماڈل پانی پر پوائنٹس کی درجہ بندی کرنے میں کوئی غلطی نہیں کرتا، لیکن مینگرووز کی نمائندگی کرنے والے پکسلز کو باقاعدہ پودوں کی نمائندگی کرنے والوں سے ممتاز کرتے وقت ایک چیلنج کا سامنا کرنا پڑتا ہے۔

مندرجہ ذیل تصویر میانمار مینگروو کے علاقے میں ماڈل کی کارکردگی کو ظاہر کرتی ہے۔

مندرجہ ذیل تصویر میں، ماڈل مینگروو پکسلز کی شناخت کے لیے بہتر کام کرتا ہے۔

صاف کرو

SageMaker انفرنس اینڈ پوائنٹ پر لاگت آتی رہتی ہے اگر چل رہا ہے۔ جب آپ کام کر لیں تو اختتامی نقطہ کو مندرجہ ذیل طور پر حذف کریں:

sagemaker.delete_endpoint(EndpointName=pipeline_model.name)

نتیجہ

خطوط کا یہ سلسلہ GIS کے مسائل کو حل کرنے کے لیے ڈیٹا سائنسدانوں کے لیے ایک اختتام سے آخر تک فریم ورک فراہم کرتا ہے۔ حصہ 1 ETL عمل اور ڈیٹا کے ساتھ بصری طور پر تعامل کرنے کا ایک آسان طریقہ دکھایا۔ حصہ 2 نے دکھایا کہ کس طرح ایک حسب ضرورت مینگروو درجہ بندی کو خودکار بنانے کے لیے آٹو پائلٹ کا استعمال کرنا ہے۔

آپ اس فریم ورک کو نئے سیٹلائٹ ڈیٹا سیٹس کو دریافت کرنے کے لیے استعمال کر سکتے ہیں جس میں مینگروو کی درجہ بندی کے لیے کارآمد بینڈز کا ایک بھرپور سیٹ ہے اور ڈومین کے علم کو شامل کر کے فیچر انجینئرنگ کو دریافت کر سکتے ہیں۔

مصنفین کے بارے میں

آندرے ایوانووچ ٹورنٹو یونیورسٹی میں کمپیوٹر سائنس کا ایک آنے والا ماسٹر طالب علم ہے اور ٹورنٹو یونیورسٹی میں انجینئرنگ سائنس پروگرام کا حالیہ گریجویٹ ہے، جو روبوٹکس/میکیٹرونکس نابالغ کے ساتھ مشین انٹیلی جنس میں بڑا ہے۔ وہ کمپیوٹر وژن، گہری سیکھنے اور روبوٹکس میں دلچسپی رکھتا ہے۔ اس نے ایمیزون میں اپنی سمر انٹرن شپ کے دوران اس پوسٹ میں پیش کردہ کام کیا۔

ڈیوڈ ڈونگ ایمیزون ویب سروسز میں ڈیٹا سائنٹسٹ ہے۔

آرکا جیوتی مشرا ایمیزون لاسٹ مائل ٹرانسپورٹیشن میں ڈیٹا سائنٹسٹ ہے۔ وہ زمین کی مدد کرنے والے مسائل کو حل کرنے کے لیے کمپیوٹر ویژن تکنیکوں کو استعمال کرنے کا شوق رکھتا ہے۔ وہ غیر منافع بخش تنظیموں کے ساتھ کام کرنا پسند کرتا ہے اور اس کا بانی رکن ہے۔ ekipi.org.

ٹائم اسٹیمپ: جون 21، 2022

ٹائم اسٹیمپ: جون 1، 2023

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

ہگنگ فیس ٹرانسفارمرز کے ساتھ ٹیکسٹ سمریائزیشن پروجیکٹ ترتیب دیں: حصہ 1

ایمیزون سیج میکر پر MLOps کے ساتھ مضبوط ٹائم سیریز کی پیشن گوئی | ایمیزون ویب سروسز

ایمیزون سیج میکر ماڈل بلڈنگ پائپ لائنز بنائیں اور ایمیزون سیج میکر پر آر اسٹوڈیو کا استعمال کرتے ہوئے آر ماڈلز کو تعینات کریں۔

Amazon Translate کا استعمال کرتے ہوئے متعدد ماخذ زبان کے دستاویزات کا متعدد ہدف کی زبانوں میں ترجمہ کریں۔

TensorFlow اور Amazon SageMaker کے ساتھ ٹیرا بائٹس ڈیٹا پر ایک بلین پیرامیٹر لینگویج ماڈل بنائیں، تربیت دیں اور تعینات کریں۔

AWS Low Code- No Code خدمات کے ساتھ سرمایہ کاری کے عمل کو تیز کریں۔

Huging Face Q&A NLU ماڈل کو تربیت دینے کے لیے Amazon SageMaker Ground Truth کا استعمال کرتے ہوئے ایک حسب ضرورت سوال و جواب ڈیٹاسیٹ بنائیں

Abode اپنے سمارٹ ہوم صارفین کو ریئل ٹائم اطلاعات فراہم کرنے کے لیے Amazon Recognition سٹریمنگ ویڈیو ایونٹس کا استعمال کرتا ہے۔

The Very Group میں Amazon Comprehend کے ساتھ PII ڈیٹا کو درست کرنا

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ