لائف سائنسز انڈسٹری کے لیے ریگولیٹری گذارشات تخلیق کرنے کے لیے Amazon SageMaker پر RStudio استعمال کریں۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

فالونگ: 0

فارماسیوٹیکل کمپنیاں جو ریگولیٹری ایجنسیوں جیسے کہ یو ایس فوڈ اینڈ ڈرگ ایڈمنسٹریشن (FDA) یا Japanese Pharmaceuticals and Medical Devices Agency (PMDA) سے اپنی دوائیں مارکیٹ میں فروخت کرنے کے لیے اجازت طلب کرتی ہیں، ان کو یہ ثابت کرنے کے لیے ثبوت پیش کرنا ہوں گے کہ ان کی دوا محفوظ اور مؤثر ہے۔ استعمال کریں معالجین، شماریات دانوں، کیمیا دان، فارماسسٹ، اور دیگر طبی سائنس دانوں کی ایک ٹیم کلینیکل ٹرائل جمع کرانے کے ڈیٹا اور مجوزہ لیبلنگ کا جائزہ لیتی ہے۔ اگر جائزے میں یہ ثابت ہوتا ہے کہ یہ ثابت کرنے کے لیے کافی شماریاتی ثبوت موجود ہیں کہ دوا کے صحت کے فوائد خطرات سے زیادہ ہیں، تو دوا کو فروخت کے لیے منظور کر لیا جاتا ہے۔

کلینیکل ٹرائل جمع کرانے کا پیکیج ٹیبلیٹڈ ڈیٹا، تجزیہ ڈیٹا، ٹرائل میٹا ڈیٹا، اور شماریاتی رپورٹوں پر مشتمل ہوتا ہے جس میں شماریاتی جدولوں، فہرستوں اور اعداد و شمار شامل ہوتے ہیں۔ یو ایس ایف ڈی اے کے معاملے میں، الیکٹرانک کامن ٹیکنیکل دستاویز (ای سی ٹی ڈی) ایف ڈی اے کے سنٹر فار بایولوجکس ایویلیوایشن اینڈ ریسرچ (سی بی ای آر) اور سینٹر فار ڈرگ ایویلیوایشن اینڈ ریسرچ (سی بی ای آر) کو درخواستیں، ترامیم، سپلیمنٹس اور رپورٹس جمع کرانے کا معیاری فارمیٹ ہے۔ CDER)۔ FDA اور جاپانی PMDA کے لیے، CDISC سٹینڈرڈ ڈیٹا ٹیبلیشن ماڈل (SDTM) میں ٹیبل شدہ ڈیٹا، CDISC تجزیہ ڈیٹا سیٹ ماڈل (ADaM) میں تجزیہ ڈیٹا، اور CDISC Define-XML میں ٹرائل میٹا ڈیٹا (آپریشنل ڈیٹا ماڈل کی بنیاد پر) جمع کرنا ایک ریگولیٹری ضرورت ہے۔ (ODM))۔

اس پوسٹ میں، ہم یہ ظاہر کرتے ہیں کہ ہم کس طرح RStudio کو آن استعمال کر سکتے ہیں۔ ایمیزون سیج میکر اس طرح کے ریگولیٹری جمع کرانے کی ڈیلیوری ایبل بنانے کے لیے۔ یہ پوسٹ کلینکل ٹرائل جمع کرانے کے عمل کی وضاحت کرتی ہے، کہ ہم کس طرح کلینیکل ٹرائل ریسرچ ڈیٹا کو نگل سکتے ہیں، ڈیٹا کو ٹیبلیٹ اور تجزیہ کر سکتے ہیں، اور پھر شماریاتی رپورٹس تشکیل دے سکتے ہیں — خلاصہ ٹیبل، ڈیٹا لسٹنگ، اور اعداد و شمار (TLF)۔ یہ طریقہ فارماسیوٹیکل صارفین کو اپنے AWS ماحول میں ذخیرہ شدہ کلینیکل ڈیٹا سے بغیر کسی رکاوٹ کے جڑنے، R کا استعمال کرتے ہوئے اس پر کارروائی کرنے، اور کلینیکل ٹرائل ریسرچ کے عمل کو تیز کرنے میں مدد فراہم کر سکتا ہے۔

منشیات کی نشوونما کا عمل

منشیات کی نشوونما کے عمل کو بڑے پیمانے پر پانچ بڑے مراحل میں تقسیم کیا جا سکتا ہے، جیسا کہ مندرجہ ذیل تصویر میں واضح کیا گیا ہے۔

تقریباً 10 ممکنہ مالیکیولز میں سے ایک دوا کو کامیاب منظوری حاصل کرنے میں اوسطاً 15-1 سال اور تقریباً 3-10,000 بلین امریکی ڈالر لگتے ہیں۔ تحقیق کے ابتدائی مراحل (منشیات کی دریافت کے مرحلے) کے دوران، امید افزا منشیات کے امیدواروں کی نشاندہی کی جاتی ہے، جو مزید طبی تحقیق کی طرف بڑھتے ہیں۔ preclinical مرحلے کے دوران، محققین کارکردگی کے ذریعے منشیات کی زہریلا کو تلاش کرنے کی کوشش کرتے ہیں وٹرو میں لیبارٹری میں تجربات اور vivo میں جانوروں پر تجربات. طبی جانچ کے بعد، دوائیں کلینکل ٹرائل ریسرچ کے مرحلے میں منتقل ہوتی ہیں، جہاں ان کی حفاظت اور افادیت کا پتہ لگانے کے لیے ان کا انسانوں پر تجربہ کیا جانا چاہیے۔ محققین کلینیکل ٹرائلز ڈیزائن کرتے ہیں اور کلینیکل ٹرائل پروٹوکول میں مطالعہ کے منصوبے کی تفصیل دیتے ہیں۔ وہ مختلف طبی تحقیقی مراحل کی وضاحت کرتے ہیں—منشیات کی حفاظت اور خوراک کا تعین کرنے کے لیے چھوٹے فیز 1 اسٹڈیز سے لے کر، منشیات کی افادیت اور مضر اثرات کا تعین کرنے کے لیے بڑے فیز 2 کے ٹرائلز تک، منشیات کی افادیت، حفاظت، اور تعین کرنے کے لیے بڑے فیز 3 اور 4 ٹرائلز تک۔ منفی ردعمل کی نگرانی. کامیاب انسانی کلینکل ٹرائلز کے بعد، دوا کا اسپانسر منشیات کی مارکیٹنگ کے لیے ایک نئی ڈرگ ایپلی کیشن (NDA) فائل کرتا ہے۔ ریگولیٹری ایجنسیاں تمام ڈیٹا کا جائزہ لیتی ہیں، نسخے کے لیبلنگ کی معلومات پر کفیل کے ساتھ کام کرتی ہیں، اور دوا کی منظوری دیتی ہیں۔ دوا کی منظوری کے بعد، ریگولیٹری ایجنسیاں مصنوعات کی مکمل حفاظت کو یقینی بنانے کے لیے پوسٹ مارکیٹ سیفٹی رپورٹس کا جائزہ لیتی ہیں۔

1997 میں، کلینیکل ڈیٹا انٹرچینج اسٹینڈرڈز کنسورشیم (CDISC)، ایک عالمی، غیر منافع بخش تنظیم جس میں فارماسیوٹیکل کمپنیوں، CROs، بائیوٹیک، تعلیمی اداروں، صحت کی دیکھ بھال فراہم کرنے والے، اور سرکاری ایجنسیوں پر مشتمل ہے، رضاکار گروپ کے طور پر شروع کیا گیا تھا۔ CDISC نے جمع کرنے کے ذریعے ڈیٹا کے بہاؤ کو ہموار کرنے کے لیے ڈیٹا کے معیارات شائع کیے ہیں، اور شراکت داروں اور فراہم کنندگان کے درمیان ڈیٹا کے تبادلے کو آسان بنایا ہے۔ CDISC نے درج ذیل معیارات شائع کیے ہیں:

CDASH (کلینیکل ڈیٹا ایکوزیشن سٹینڈرڈز ہارمونائزیشن) - جمع کردہ ڈیٹا کے معیارات
SDTM (مطالعہ ڈیٹا ٹیبلیشن ماڈل) - ٹیبلیٹڈ ڈیٹا جمع کرانے کے معیارات
ADaM (تجزیہ ڈیٹا ماڈل) - تجزیہ ڈیٹا کے معیارات
بھیجیں (غیر طبی ڈیٹا کے تبادلے کے لیے معیاری) - غیر طبی ڈیٹا کے معیارات
PRM (پروٹوکول ریپریزنٹیشن ماڈل) - پروٹوکول کے معیارات

یہ معیار تربیت یافتہ جائزہ لینے والوں کو معیاری ٹولز کا استعمال کرتے ہوئے زیادہ مؤثر طریقے سے اور تیزی سے ڈیٹا کا تجزیہ کرنے میں مدد کر سکتے ہیں، اس طرح منشیات کی منظوری کے اوقات کو کم کیا جا سکتا ہے۔ یہ US FDA اور جاپانی PMDA کی جانب سے SDTM فارمیٹ کا استعمال کرتے ہوئے تمام ٹیبل شدہ ڈیٹا جمع کروانے کے لیے ایک ریگولیٹری ضرورت ہے۔

کلینیکل ٹرائل ریسرچ گذارشات کے لیے R

SAS اور R دو سب سے زیادہ استعمال ہونے والے شماریاتی تجزیہ سافٹ ویئر ہیں جو فارماسیوٹیکل انڈسٹری میں استعمال ہوتے ہیں۔ جب SDTM معیارات کی ترقی CDISC کے ذریعے شروع کی گئی تھی، SAS فارماسیوٹیکل انڈسٹری اور FDA میں تقریباً عالمگیر استعمال میں تھا۔ تاہم، R آج کل زبردست مقبولیت حاصل کر رہا ہے کیونکہ یہ اوپن سورس ہے، اور نئے پیکجز اور لائبریریاں مسلسل شامل کی جا رہی ہیں۔ طلباء بنیادی طور پر اپنے تعلیمی اور تحقیق کے دوران R کا استعمال کرتے ہیں، اور وہ R سے اس واقفیت کو اپنی ملازمتوں میں لے جاتے ہیں۔ R ابھرتی ہوئی ٹکنالوجیوں کے لیے بھی مدد فراہم کرتا ہے جیسے کہ اعلی درجے کی گہری سیکھنے کے انضمام۔

AWS جیسے کلاؤڈ فراہم کرنے والے اب فارماسیوٹیکل صارفین کے لیے اپنے بنیادی ڈھانچے کی میزبانی کے لیے انتخاب کا پلیٹ فارم بن چکے ہیں۔ AWS منظم خدمات بھی فراہم کرتا ہے جیسے کہ SageMaker، جو کلاؤڈ میں مشین لرننگ (ML) ماڈلز کو تخلیق، تربیت، اور تعینات کرنا آسان بناتا ہے۔ سیج میکر ویب براؤزر کے ذریعے کہیں سے بھی RStudio IDE تک رسائی کی اجازت دیتا ہے۔ اس پوسٹ میں بتایا گیا ہے کہ شماریاتی پروگرامرز اور بایوسٹیٹسٹسٹ کس طرح اپنے طبی ڈیٹا کو R ماحول میں داخل کر سکتے ہیں، R کوڈ کو کیسے چلایا جا سکتا ہے، اور نتائج کیسے محفوظ کیے جاتے ہیں۔ ہم کوڈ کے ٹکڑوں کو فراہم کرتے ہیں جو کلینیکل ٹرائل ڈیٹا سائنسدانوں کو XPT فائلوں کو R ماحول میں داخل کرنے، SDTM اور ADaM کے لیے R ڈیٹا فریم بنانے، اور آخر میں TLF تخلیق کرنے کی اجازت دیتے ہیں جسے ایک ایمیزون سادہ اسٹوریج سروس (ایمیزون S3) آبجیکٹ اسٹوریج بالٹی۔

سیج میکر پر آر اسٹوڈیو

2 نومبر 2021 کو AWS کے تعاون سے آر اسٹوڈیو پی بی سی کا اعلان کیا ہے کی عام دستیابی سیج میکر پر آر اسٹوڈیو، کلاؤڈ میں صنعت کا پہلا مکمل طور پر منظم RStudio Workbench IDE۔ اب آپ اپنا موجودہ RStudio لائسنس لا سکتے ہیں تاکہ اپنے خود کے زیر انتظام RStudio ماحول کو صرف چند آسان مراحل میں SageMaker میں منتقل کر سکیں۔ اس دلچسپ تعاون کے بارے میں مزید جاننے کے لیے، چیک آؤٹ کریں۔ ایمیزون سیج میکر پر آر اسٹوڈیو کا اعلان.

RStudio Workbench کے ساتھ ساتھ، R ڈویلپرز کے لیے RStudio سویٹ RStudio Connect اور RStudio پیکیج مینیجر بھی پیش کرتا ہے۔ RStudio Connect کو ڈیٹا سائنسدانوں کو بصیرت، ڈیش بورڈز اور ویب ایپلیکیشنز شائع کرنے کی اجازت دینے کے لیے ڈیزائن کیا گیا ہے۔. ڈیٹا سائنسدانوں کے پیچیدہ کام سے ML اور ڈیٹا سائنس کی بصیرت کا اشتراک کرنا اور اسے فیصلہ سازوں کے ہاتھ میں دینا آسان بناتا ہے۔ RStudio Connect وسیع استعمال کے لیے مواد کی میزبانی اور انتظام کو آسان اور قابل توسیع بھی بناتا ہے۔

حل جائزہ

مندرجہ ذیل حصوں میں، ہم اس بات پر بات کرتے ہیں کہ ہم SageMaker پر RStudio میں ریموٹ ریپوزٹری یا S3 بالٹی سے خام ڈیٹا کیسے درآمد کر سکتے ہیں۔ سے براہ راست جڑنا بھی ممکن ہے۔ ایمیزون متعلقہ ڈیٹا بیس سروس (ایمیزون آر ڈی ایس) اور ڈیٹا گودام جیسے ایمیزون ریڈ شفٹ (ملاحظہ کریں R کو Amazon Redshift کے ساتھ جوڑ رہا ہے۔) براہ راست RStudio سے؛ تاہم، یہ اس پوسٹ کے دائرہ کار سے باہر ہے۔ کچھ مختلف ذرائع سے ڈیٹا لینے کے بعد، ہم اس پر کارروائی کرتے ہیں اور ٹیبل کے لیے R ڈیٹا فریم بناتے ہیں۔ پھر ہم ٹیبل ڈیٹا فریم کو RTF فائل میں تبدیل کرتے ہیں اور نتائج کو واپس S3 بالٹی میں محفوظ کرتے ہیں۔ ان آؤٹ پٹس کو پھر ممکنہ طور پر ریگولیٹری جمع کرانے کے مقاصد کے لیے استعمال کیا جا سکتا ہے، بشرطیکہ پوسٹ میں استعمال کیے گئے R پیکجز کو گاہک کے ذریعے ریگولیٹری گذارشات کے لیے استعمال کرنے کی توثیق کر دی گئی ہو۔

SageMaker پر RStudio سیٹ اپ کریں۔

اپنے ماحول میں SageMaker پر RStudio قائم کرنے سے متعلق ہدایات کے لیے، رجوع کریں۔ SageMaker پر RStudio کے ساتھ شروع کریں۔. اس بات کو یقینی بنائیں کہ SageMaker پر RStudio کے ایگزیکیوشن رول کو S3 بالٹی میں ڈیٹا ڈاؤن لوڈ اور اپ لوڈ کرنے تک رسائی حاصل ہے جس میں ڈیٹا محفوظ ہے۔ SageMaker پر RStudio کا استعمال کرتے ہوئے R پیکجوں کا نظم کرنے اور اپنے تجزیے کو شائع کرنے کے بارے میں مزید جاننے کے لیے، دیکھیں ڈیٹا سائنسدانوں کے لیے سیج میکر پر مکمل طور پر منظم آر ایس اسٹوڈیو کا اعلان.

RStudio میں ڈیٹا داخل کریں۔

اس مرحلے میں، ہم اپنے R سیشن کے لیے دستیاب کرنے کے لیے مختلف ذرائع سے ڈیٹا اکٹھا کرتے ہیں۔ ہم SAS XPT فارمیٹ میں ڈیٹا درآمد کرتے ہیں۔ تاہم، اگر آپ ڈیٹا کو دوسرے فارمیٹس میں ہضم کرنا چاہتے ہیں تو یہ عمل یکساں ہے۔ SageMaker پر RStudio استعمال کرنے کا ایک فائدہ یہ ہے کہ اگر سورس ڈیٹا آپ کے AWS اکاؤنٹس میں محفوظ ہے، تو SageMaker مقامی طور پر ڈیٹا تک رسائی حاصل کر سکتا ہے۔ AWS شناخت اور رسائی کا انتظام (IAM) کے کردار۔

ریموٹ ریپوزٹری میں محفوظ کردہ ڈیٹا تک رسائی حاصل کریں۔

اس مرحلے میں، ہم سے ADaM ڈیٹا درآمد کرتے ہیں۔ FDA کا GitHub ذخیرہ. ہم ایک مقامی ڈائرکٹری بناتے ہیں جسے کہتے ہیں۔ data ڈیٹا کو ذخیرہ کرنے اور ڈیموگرافکس ڈیٹا ڈاؤن لوڈ کرنے کے لیے RStudio ماحول میں (dm.xpt) دور دراز کے ذخیرے سے۔ اس تناظر میں، مقامی ڈائریکٹری سے مراد آپ کے نجی Amazon EFS سٹوریج پر بنائی گئی ایک ڈائریکٹری ہے جو آپ کے R سیشن ماحول سے ڈیفالٹ منسلک ہے۔ درج ذیل کوڈ دیکھیں:

######################################################
# Step 1.1 – Ingest Data from Remote Data Repository #
######################################################

# Remote Data Path 
raw_data_url = “https://github.com/FDA/PKView/raw/master/Installation%20Package/OCP/data/clinical/DRUG000/0000/m5/datasets/test001/tabulations/sdtm”
raw_data_name = “dm.xpt”

#Create Local Directory to store downloaded files
dir.create(“data”)
local_file_location <- paste0(getwd(),”/data/”)
download.file(raw_data_url, paste0(local_file_location,raw_data_name))

جب یہ مرحلہ مکمل ہوجائے تو آپ دیکھ سکتے ہیں۔ dm.xpt پر نیویگیٹ کرکے ڈاؤن لوڈ کیا جا رہا ہے۔ فائلوں, اعداد و شمار, dm.xpt.

Amazon S3 میں محفوظ کردہ ڈیٹا تک رسائی حاصل کریں۔

اس مرحلے میں، ہم اپنے اکاؤنٹ میں S3 بالٹی میں ذخیرہ کردہ ڈیٹا ڈاؤن لوڈ کرتے ہیں۔ ہم نے FDA کے GitHub ذخیرے سے مواد کو S3 نامی بالٹی میں کاپی کیا ہے۔ aws-sagemaker-rstudio اس مثال کے لئے. درج ذیل کوڈ دیکھیں:

#####################################################
# Step 1.2 - Ingest Data from S3 Bucket             #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()

s3_bucket = "aws-sagemaker-rstudio"
s3_key = "DRUG000/test001/tabulations/sdtm/pp.xpt"

session$download_data(local_file_location, s3_bucket, s3_key)

جب مرحلہ مکمل ہو جائے گا، آپ دیکھ سکتے ہیں pp.xpt پر نیویگیٹ کرکے ڈاؤن لوڈ کیا جا رہا ہے۔ فائلوں, اعداد و شمار, pp.xpt.

XPT ڈیٹا پر کارروائی کریں۔

اب جب کہ ہمارے پاس R ماحول میں SAS XPT فائلیں دستیاب ہیں، ہمیں انہیں R ڈیٹا فریموں میں تبدیل کرنے اور ان پر کارروائی کرنے کی ضرورت ہے۔ ہم استعمال کرتے ہیں haven XPT فائلوں کو پڑھنے کے لیے لائبریری۔ ہم CDISC SDTM ڈیٹاسیٹس کو ضم کرتے ہیں۔ dm اور pp ADPP ڈیٹاسیٹ بنانے کے لیے۔ پھر ہم ADPP ڈیٹا فریم کا استعمال کرتے ہوئے ایک خلاصہ شماریاتی جدول بناتے ہیں۔ خلاصہ ٹیبل پھر RTF فارمیٹ میں برآمد کیا جاتا ہے۔

سب سے پہلے، XPT فائلوں کو استعمال کرکے پڑھا جاتا ہے۔ read_xpt ہیون لائبریری کا کام پھر ایک تجزیہ ڈیٹاسیٹ کا استعمال کرتے ہوئے بنایا گیا ہے۔ sqldf کی تقریب sqldf کتب خانہ. درج ذیل کوڈ دیکھیں:

########################################################
# Step 2.1 - Read XPT files. Create Analysis dataset.  #
########################################################

library(haven)
library(sqldf)


# Read XPT Files, convert them to R data frame
dm = read_xpt("data/dm.xpt")
pp = read_xpt("data/pp.xpt")

# Create ADaM dataset
adpp = sqldf("select a.USUBJID
                    ,a.PPCAT as ACAT
                    ,a.PPTESTCD
                    ,a.PPTEST
                    ,a.PPDTC
                    ,a.PPSTRESN as AVAL
                    ,a.VISIT as AVISIT
                    ,a.VISITNUM as AVISITN
                    ,b.sex
                from pp a 
           left join dm b 
                  on a.usubjid = b.usubjid
             ")

پھر، سے فنکشنز کا استعمال کرتے ہوئے آؤٹ پٹ ڈیٹا فریم بنایا جاتا ہے۔ Tplyr اور dplyr لائبریریاں:

########################################################
# Step 2.2 - Create output table                       #
########################################################

library(Tplyr)
library(dplyr)

t = tplyr_table(adpp, SEX) %>% 
  add_layer(
    group_desc(AVAL, by = "Area under the concentration-time curve", where= PPTESTCD=="AUC") %>% 
      set_format_strings(
        "n"        = f_str("xx", n),
        "Mean (SD)"= f_str("xx.x (xx.xx)", mean, sd),
        "Median"   = f_str("xx.x", median),
        "Q1, Q3"   = f_str("xx, xx", q1, q3),
        "Min, Max" = f_str("xx, xx", min, max),
        "Missing"  = f_str("xx", missing)
      )
  )  %>% 
  build()

output = t %>% 
  rename(Variable = row_label1,Statistic = row_label2,Female =var1_F, Male = var1_M) %>% 
  select(Variable,Statistic,Female, Male)

آؤٹ پٹ ڈیٹا فریم پھر RStudio ماحول میں آؤٹ پٹ فولڈر میں RTF فائل کے طور پر محفوظ کیا جاتا ہے:

#####################################################
# Step 3 - Save the Results as RTF                  #
#####################################################
library(rtf)

dir.create("output")
rtf = RTF("output/tab_adpp.rtf")  
addHeader(rtf,title="Section 1 - Tables", subtitle="This Section contains all tables")
addParagraph(rtf, "Table 1 - Pharmacokinetic Parameters by Sex:n")
addTable(rtf, output)
done(rtf)

Amazon S3 پر آؤٹ پٹ اپ لوڈ کریں۔

آؤٹ پٹ تیار ہونے کے بعد، ہم ڈیٹا کو واپس S3 بالٹی میں ڈال دیتے ہیں۔ ہم اسے دوبارہ سیج میکر سیشن بنا کر حاصل کر سکتے ہیں، اگر کوئی سیشن پہلے سے فعال نہیں ہے، اور آؤٹ پٹ فولڈر کے مواد کو S3 بالٹی میں اپ لوڈ کر کے session$upload_data فنکشن:

#####################################################
# Step 4 - Upload outputs to S3                     #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()
s3_bucket = "aws-sagemaker-rstudio"
output_location = "output/"
s3_folder_name = "output"
session$upload_data(output_location, s3_bucket, s3_folder_name)

ان اقدامات کے ساتھ، ہم نے ڈیٹا اکٹھا کیا ہے، اس پر کارروائی کی ہے، اور نتائج اپ لوڈ کیے ہیں جو ریگولیٹری اتھارٹیز کو جمع کرانے کے لیے دستیاب کیے جائیں گے۔

صاف کرو

کسی بھی غیر ارادی اخراجات سے بچنے کے لیے، آپ کو اپنا موجودہ سیشن چھوڑنا ہوگا۔ صفحہ کے اوپری دائیں کونے میں، پاور آئیکن کا انتخاب کریں۔ یہ خود بخود بنیادی مثال کو روک دے گا اور اس وجہ سے کسی بھی غیر ارادی کمپیوٹ کے اخراجات اٹھانا بند کردے گا۔

چیلنجز

پوسٹ میں S3 بالٹی یا دور دراز کے ذخیرے سے ذخیرہ شدہ خام ڈیٹا کو ہضم کرنے کے اقدامات کا خاکہ پیش کیا گیا ہے۔ تاہم، کلینیکل ٹرائل کے لیے خام ڈیٹا کے بہت سے دوسرے ذرائع ہیں، بنیادی طور پر ای سی آر ایف (الیکٹرانک کیس رپورٹ فارم) ڈیٹا جو ای ڈی سی (الیکٹرانک ڈیٹا کیپچر) سسٹمز میں ذخیرہ کیا جاتا ہے جیسے اوریکل کلینیکل، میڈیڈیٹا ریو، اوپن کلینکا، یا سنو فلیک؛ لیبارٹری ڈیٹا؛ eCOA (طبی نتائج کی تشخیص) اور ePRO (الیکٹرانک مریض کے رپورٹ شدہ نتائج) سے ڈیٹا؛ ایپس اور طبی آلات سے حقیقی دنیا کا ڈیٹا؛ اور ہسپتالوں میں الیکٹرانک ہیلتھ ریکارڈ (EHRs)۔ اس ڈیٹا کو ریگولیٹری گذارشات کے لیے قابل استعمال بنانے سے پہلے اہم پری پروسیسنگ شامل ہے۔ ڈیٹا کے مختلف ذرائع سے کنیکٹر بنانا اور انہیں سنٹرلائزڈ ڈیٹا ریپوزٹری (سی ڈی آر) یا کلینیکل ڈیٹا لیک میں جمع کرنا، مناسب رسائی کے کنٹرول کو برقرار رکھتے ہوئے، اہم چیلنجز کا سامنا ہے۔

قابو پانے کے لیے ایک اور اہم چیلنج ریگولیٹری تعمیل ہے۔ ریگولیٹری جمع کرانے کے آؤٹ پٹس بنانے کے لیے استعمال ہونے والا کمپیوٹر سسٹم مناسب ضوابط، جیسے 21 CFR پارٹ 11، HIPAA، GDPR، یا GxP کی کوئی دوسری ضروریات یا ICH رہنما خطوط کے مطابق ہونا چاہیے۔ اس کا ترجمہ ایک توثیق شدہ اور اہل ماحول میں کام کرنے سے ہوتا ہے جس میں رسائی، سیکیورٹی، بیک اپ، اور آڈٹ ایبلٹی کے کنٹرول ہوتے ہیں۔ اس کا مطلب یہ بھی ہے کہ کوئی بھی R پیکجز جو ریگولیٹری جمع کرانے کے آؤٹ پٹس بنانے کے لیے استعمال کیے جاتے ہیں، استعمال کرنے سے پہلے اس کی تصدیق ہونی چاہیے۔

نتیجہ

اس پوسٹ میں، ہم نے دیکھا کہ eCTD جمع کرانے کے لیے کچھ اہم ڈیلیوری ایبلز CDISC SDTM، ADaM ڈیٹاسیٹس، اور TLF تھے۔ اس پوسٹ نے SageMaker پر RStudio میں کچھ ذرائع سے ڈیٹا کو پہلے داخل کرکے ان ریگولیٹری جمع کرانے کی ڈیلیوری ایبلز بنانے کے لیے درکار اقدامات کا خاکہ پیش کیا ہے۔ پھر ہم نے دیکھا کہ ہم کس طرح داخل شدہ ڈیٹا کو XPT فارمیٹ میں پروسیس کر سکتے ہیں۔ SDTM، ADaM، اور TLF بنانے کے لیے اسے R ڈیٹا فریم میں تبدیل کریں۔ اور پھر آخر میں نتائج کو S3 بالٹی میں اپ لوڈ کریں۔

ہم امید کرتے ہیں کہ پوسٹ میں دیے گئے وسیع نظریات کے ساتھ، شماریاتی پروگرامرز اور بایوسٹیٹسٹسٹس SageMaker پر RStudio میں کلینکل ٹرائل ریسرچ ڈیٹا کو لوڈ کرنے، پروسیسنگ اور تجزیہ کرنے کے اختتام سے آخر تک کے عمل کو آسانی سے تصور کر سکتے ہیں اور سیکھنے کو اپنی مرضی کے مطابق بیان کرنے کے لیے استعمال کر سکتے ہیں۔ ورک فلو آپ کی ریگولیٹری گذارشات کے لیے موزوں ہے۔

کیا آپ محققین، شماریات دانوں، اور R پروگرامرز کی زندگیوں کو آسان بنانے میں مدد کرنے کے لیے RStudio استعمال کرنے کی کسی دوسری ایپلی کیشن کے بارے میں سوچ سکتے ہیں؟ ہم آپ کے خیالات کے بارے میں سننا پسند کریں گے! اور اگر آپ کے کوئی سوالات ہیں، تو براہ کرم انہیں تبصرے کے سیکشن میں شیئر کریں۔

وسائل

مزید معلومات کے لئے ، درج ذیل لنکس ملاحظہ کریں:

مصنفین کے بارے میں

روہت بنگا لندن، یوکے میں مقیم گلوبل کلینیکل ڈویلپمنٹ انڈسٹری کا ماہر ہے۔ وہ تربیت کے ذریعے ایک بایوسٹیٹسٹسٹ ہیں اور ہیلتھ کیئر اور لائف سائنس کے صارفین کو AWS پر جدید طبی ترقی کے حل تعینات کرنے میں مدد کرتا ہے۔ وہ اس بارے میں پرجوش ہیں کہ کس طرح ڈیٹا سائنس، AI/ML، اور ابھرتی ہوئی ٹیکنالوجیز کو ہیلتھ کیئر اور لائف سائنس انڈسٹری میں حقیقی کاروباری مسائل کو حل کرنے کے لیے استعمال کیا جا سکتا ہے۔ اپنے فارغ وقت میں، روہت اسکیئنگ، بی بی کیونگ، اور خاندان اور دوستوں کے ساتھ وقت گزارنے سے لطف اندوز ہوتے ہیں۔

لائف سائنسز انڈسٹری PlatoBlockchain Data Intelligence کے لیے ریگولیٹری گذارشات تخلیق کرنے کے لیے Amazon SageMaker پر RStudio استعمال کریں۔ عمودی تلاش۔ عی جارجیوس شیناس EMEA خطے میں AI/ML کے لیے ایک ماہر حل آرکیٹیکٹ ہے۔ وہ لندن میں مقیم ہے اور برطانیہ اور آئرلینڈ کے صارفین کے ساتھ مل کر کام کرتا ہے۔ Georgios صارفین کو MLOps طریقوں میں خاص دلچسپی کے ساتھ مشین لرننگ ایپلی کیشنز کو AWS پر پروڈکشن میں ڈیزائن اور تعینات کرنے میں مدد کرتا ہے اور صارفین کو پیمانے پر مشین لرننگ انجام دینے کے قابل بناتا ہے۔ اپنے فارغ وقت میں، وہ سفر کرنے، کھانا پکانے اور دوستوں اور کنبہ کے ساتھ وقت گزارنے سے لطف اندوز ہوتا ہے۔

ٹائم اسٹیمپ: ستمبر 20، 2022ستمبر 21، 2022

ٹائم اسٹیمپ: ستمبر 5، 2023

لائف سائنسز انڈسٹری کے لیے ریگولیٹری گذارشات تخلیق کرنے کے لیے Amazon SageMaker پر RStudio استعمال کریں۔

افلاطون کے ذریعہ دوبارہ شائع کیا گیا۔

منشیات کی نشوونما کا عمل

کلینیکل ٹرائل ریسرچ گذارشات کے لیے R

سیج میکر پر آر اسٹوڈیو

حل جائزہ

SageMaker پر RStudio سیٹ اپ کریں۔

RStudio میں ڈیٹا داخل کریں۔

ریموٹ ریپوزٹری میں محفوظ کردہ ڈیٹا تک رسائی حاصل کریں۔

Amazon S3 میں محفوظ کردہ ڈیٹا تک رسائی حاصل کریں۔

XPT ڈیٹا پر کارروائی کریں۔

Amazon S3 پر آؤٹ پٹ اپ لوڈ کریں۔

صاف کرو

چیلنجز

نتیجہ

وسائل

مصنفین کے بارے میں

سے زیادہ AWS مشین لرننگ

محفوظ ایمیزون سیج میکر اسٹوڈیو کے پیش کردہ URLs حصہ 2: JWT تصدیق کے ساتھ نجی API

AWS پر ڈیٹا میش آرکیٹیکچر کا استعمال کرتے ہوئے ML ماڈلز بنائیں اور تربیت دیں: حصہ 1

مصنوعی ڈیٹا کے معیار کا اندازہ کیسے لگایا جائے - وفاداری، افادیت، اور رازداری کے نقطہ نظر سے پیمائش

پروڈیج نے کم کوڈ کمپیوٹر ویژن AI کا استعمال کرتے ہوئے سالانہ انسانی جائزے کے اخراجات میں $1.5 ملین کی بچت کی۔

Amazon SageMaker Data Wrangler کے ساتھ ڈیٹا کے بے ترتیب اور مرتب شدہ نمونے بنائیں

AWS AI خدمات کے ساتھ ذہین دستاویز پروسیسنگ: حصہ 2

شناخت کی توثیق کے حل کا جائزہ لینے کے لیے میٹرکس

Amazon SageMaker جمپ سٹارٹ فاؤنڈیشن ماڈلز کی Amazon SageMaker غیر مطابقت پذیر اینڈ پوائنٹس کے ساتھ تعیناتی لاگت کو بہتر بنائیں۔ ایمیزون ویب سروسز

ہمارے متعلق

عمودی تلاش اور Ai

پلیٹ فارم

مربوط رہو

اکاؤنٹ