জীবন বিজ্ঞান শিল্প PlatoBlockchain ডেটা ইন্টেলিজেন্সের জন্য নিয়ন্ত্রক জমা তৈরি করতে Amazon SageMaker-এ RStudio ব্যবহার করুন। উল্লম্ব অনুসন্ধান. আ.

জীবন বিজ্ঞান শিল্পের জন্য নিয়ন্ত্রক জমা তৈরি করতে Amazon SageMaker-এ RStudio ব্যবহার করুন

ফার্মাসিউটিক্যাল কোম্পানি যারা ইউএস ফুড অ্যান্ড ড্রাগ অ্যাডমিনিস্ট্রেশন (এফডিএ) বা জাপানিজ ফার্মাসিউটিক্যালস অ্যান্ড মেডিকেল ডিভাইস এজেন্সি (পিএমডিএ) এর মতো নিয়ন্ত্রক সংস্থার কাছ থেকে তাদের ওষুধ বাজারে বিক্রি করার জন্য তাদের ওষুধ নিরাপদ এবং কার্যকর তা প্রমাণ করতে প্রমাণ জমা দিতে হবে। ব্যবহার চিকিত্সক, পরিসংখ্যানবিদ, রসায়নবিদ, ফার্মাকোলজিস্ট এবং অন্যান্য ক্লিনিকাল বিজ্ঞানীদের একটি দল ক্লিনিকাল ট্রায়াল জমা দেওয়ার ডেটা এবং প্রস্তাবিত লেবেলিং পর্যালোচনা করে। যদি পর্যালোচনায় প্রমাণিত হয় যে ওষুধের স্বাস্থ্য উপকারিতা ঝুঁকির চেয়ে বেশি তা প্রমাণ করার জন্য পর্যাপ্ত পরিসংখ্যানগত প্রমাণ রয়েছে, ওষুধটি বিক্রির জন্য অনুমোদিত।

ক্লিনিকাল ট্রায়াল জমা দেওয়ার প্যাকেজটি সারণীযুক্ত ডেটা, বিশ্লেষণের ডেটা, ট্রায়াল মেটাডেটা এবং পরিসংখ্যান সংক্রান্ত সারণী, তালিকা এবং পরিসংখ্যান সমন্বিত পরিসংখ্যান প্রতিবেদন নিয়ে গঠিত। ইউএস এফডিএর ক্ষেত্রে, ইলেকট্রনিক কমন টেকনিক্যাল ডকুমেন্ট (ইসিটিডি) হল এফডিএর সেন্টার ফর বায়োলজিক্স ইভালুয়েশন অ্যান্ড রিসার্চ (সিবিইআর) এবং সেন্টার ফর ড্রাগ ইভালুয়েশন অ্যান্ড রিসার্চ (সিবিইআর) এ আবেদন, সংশোধনী, পরিপূরক এবং প্রতিবেদন জমা দেওয়ার জন্য আদর্শ বিন্যাস। CDER)। FDA এবং জাপানি PMDA-এর জন্য, CDISC স্ট্যান্ডার্ড ডেটা ট্যাবুলেশন মডেল (SDTM), CDISC বিশ্লেষণ ডেটাসেট মডেল (ADaM) এ বিশ্লেষণ ডেটা এবং CDISC ডিফাইন-এক্সএমএল (অপারেশনাল ডেটা মডেলের উপর ভিত্তি করে) ট্রায়াল মেটাডেটা জমা দেওয়া একটি নিয়ন্ত্রক প্রয়োজনীয়তা। (ODM))।

এই পোস্টে, আমরা দেখিয়েছি কিভাবে আমরা RStudio ব্যবহার করতে পারি আমাজন সেজমেকার এই ধরনের নিয়ন্ত্রক জমা প্রদানযোগ্য তৈরি করতে। এই পোস্টটি ক্লিনিকাল ট্রায়াল জমা দেওয়ার প্রক্রিয়াটি বর্ণনা করে, কীভাবে আমরা ক্লিনিকাল ট্রায়াল গবেষণার ডেটা ইনজেস্ট করতে পারি, ডেটা ট্যাব্যুলেট এবং বিশ্লেষণ করতে পারি এবং তারপর পরিসংখ্যান প্রতিবেদন তৈরি করতে পারি—সারাংশ টেবিল, ডেটা তালিকা এবং পরিসংখ্যান (TLF)। এই পদ্ধতিটি ফার্মাসিউটিক্যাল গ্রাহকদের তাদের AWS পরিবেশে সঞ্চিত ক্লিনিকাল ডেটার সাথে নির্বিঘ্নে সংযোগ করতে, R ব্যবহার করে এটি প্রক্রিয়া করতে এবং ক্লিনিকাল ট্রায়াল গবেষণা প্রক্রিয়াকে ত্বরান্বিত করতে সাহায্য করতে পারে।

ড্রাগ উন্নয়ন প্রক্রিয়া

ওষুধের বিকাশ প্রক্রিয়াকে বিস্তৃতভাবে পাঁচটি প্রধান ধাপে ভাগ করা যেতে পারে, যেমনটি নিচের চিত্রে দেখানো হয়েছে।

প্রায় 10 সম্ভাব্য অণুর মধ্যে একটি ওষুধের সফল অনুমোদন পেতে এটি গড়ে 15-1 বছর এবং প্রায় USD $3-10,000 বিলিয়ন সময় নেয়। গবেষণার প্রাথমিক পর্যায়ে (ঔষধ আবিষ্কারের পর্যায়), প্রতিশ্রুতিশীল ওষুধ প্রার্থীদের চিহ্নিত করা হয়, যারা প্রিক্লিনিকাল গবেষণার দিকে এগিয়ে যায়। প্রিক্লিনিকাল পর্যায়ে, গবেষকরা কার্য সম্পাদন করে ওষুধের বিষাক্ততা খুঁজে বের করার চেষ্টা করেন ভিট্রো ল্যাবে পরীক্ষা এবং ভিভোতে প্রাণীদের উপর পরীক্ষা। প্রিক্লিনিকাল পরীক্ষার পরে, ওষুধগুলি ক্লিনিকাল ট্রায়াল গবেষণা পর্যায়ে চলে যায়, যেখানে তাদের নিরাপত্তা এবং কার্যকারিতা নিশ্চিত করার জন্য তাদের অবশ্যই মানুষের উপর পরীক্ষা করা উচিত। গবেষকরা ক্লিনিকাল ট্রায়াল ডিজাইন করেন এবং ক্লিনিকাল ট্রায়াল প্রোটোকলের মধ্যে অধ্যয়ন পরিকল্পনার বিশদ বিবরণ দেন। তারা বিভিন্ন ক্লিনিকাল গবেষণা পর্যায়গুলিকে সংজ্ঞায়িত করে- ওষুধের নিরাপত্তা এবং ডোজ নির্ধারণের জন্য ছোট ফেজ 1 অধ্যয়ন থেকে, ওষুধের কার্যকারিতা এবং পার্শ্ব প্রতিক্রিয়া নির্ধারণের জন্য একটি বড় পর্যায় 2 ট্রায়াল, এমনকি ওষুধের কার্যকারিতা, নিরাপত্তা, এবং নির্ধারণের জন্য আরও বড় ফেজ 3 এবং 4 ট্রায়াল পর্যন্ত। প্রতিকূল প্রতিক্রিয়া পর্যবেক্ষণ। সফল মানব ক্লিনিকাল ট্রায়ালের পরে, ওষুধের পৃষ্ঠপোষক ওষুধ বাজারজাত করার জন্য একটি নতুন ড্রাগ অ্যাপ্লিকেশন (NDA) ফাইল করে। নিয়ন্ত্রক সংস্থাগুলি সমস্ত ডেটা পর্যালোচনা করে, প্রেসক্রিপশন লেবেলিং তথ্যের উপর স্পনসরের সাথে কাজ করে এবং ওষুধটি অনুমোদন করে। ওষুধের অনুমোদনের পর, নিয়ন্ত্রক সংস্থাগুলি সম্পূর্ণ পণ্যের নিরাপত্তা নিশ্চিত করতে বাজার-পরবর্তী নিরাপত্তা প্রতিবেদন পর্যালোচনা করে।

1997 সালে, ক্লিনিক্যাল ডেটা ইন্টারচেঞ্জ স্ট্যান্ডার্ডস কনসোর্টিয়াম (সিডিআইএসসি), একটি বিশ্বব্যাপী, অলাভজনক সংস্থা যার মধ্যে ফার্মাসিউটিক্যাল কোম্পানি, সিআরও, বায়োটেক, একাডেমিক প্রতিষ্ঠান, স্বাস্থ্যসেবা প্রদানকারী এবং সরকারী সংস্থাগুলি রয়েছে, স্বেচ্ছাসেবক গোষ্ঠী হিসাবে শুরু হয়েছিল। CDISC জমা দেওয়ার মাধ্যমে সংগ্রহ থেকে ডেটার প্রবাহকে স্ট্রীমলাইন করতে ডেটা স্ট্যান্ডার্ড প্রকাশ করেছে এবং অংশীদার এবং প্রদানকারীদের মধ্যে ডেটা আদান-প্রদানের সুবিধা দিয়েছে। CDISC নিম্নলিখিত মান প্রকাশ করেছে:

  • CDASH (ক্লিনিকাল ডেটা অ্যাকুইজিশন স্ট্যান্ডার্ড হারমোনাইজেশন) - সংগৃহীত ডেটার জন্য মানদণ্ড
  • SDTM (স্টাডি ডেটা ট্যাবুলেশন মডেল) - ট্যাবুলেড ডেটা জমা দেওয়ার জন্য মানদণ্ড
  • ADaM (বিশ্লেষণ ডেটা মডেল) - বিশ্লেষণ ডেটার জন্য মানদণ্ড
  • পাঠান (ননক্লিনিকাল ডেটা বিনিময়ের জন্য স্ট্যান্ডার্ড) - ননক্লিনিকাল ডেটার জন্য মানদণ্ড
  • PRM (প্রটোকল প্রতিনিধিত্ব মডেল) - প্রোটোকল জন্য মান

এই মানগুলি প্রশিক্ষিত পর্যালোচকদের স্ট্যান্ডার্ড সরঞ্জামগুলি ব্যবহার করে আরও কার্যকরভাবে এবং দ্রুত ডেটা বিশ্লেষণ করতে সাহায্য করতে পারে, যার ফলে ওষুধের অনুমোদনের সময় হ্রাস পায়। SDTM ফর্ম্যাট ব্যবহার করে সমস্ত সারণীকৃত ডেটা জমা দেওয়ার জন্য এটি US FDA এবং জাপানি PMDA থেকে একটি নিয়ন্ত্রক প্রয়োজনীয়তা।

ক্লিনিকাল ট্রায়াল গবেষণা জমা দেওয়ার জন্য R

SAS এবং R হল ফার্মাসিউটিক্যাল শিল্পের মধ্যে ব্যবহৃত দুটি সর্বাধিক ব্যবহৃত পরিসংখ্যান বিশ্লেষণ সফ্টওয়্যার। যখন সিডিআইএসসি দ্বারা এসডিটিএম মানগুলির বিকাশ শুরু হয়েছিল, তখন এসএএস ওষুধ শিল্পে এবং এফডিএ-তে প্রায় সর্বজনীন ব্যবহারে ছিল। যাইহোক, R আজকাল অসাধারণ জনপ্রিয়তা অর্জন করছে কারণ এটি ওপেন সোর্স, এবং নতুন প্যাকেজ এবং লাইব্রেরি ক্রমাগত যোগ করা হচ্ছে। ছাত্ররা প্রাথমিকভাবে তাদের শিক্ষা এবং গবেষণার সময় R ব্যবহার করে এবং তারা R এর সাথে এই পরিচিতিটিকে তাদের চাকরিতে নিয়ে যায়। R উদীয়মান প্রযুক্তি যেমন উন্নত গভীর শিক্ষার একীকরণের জন্য সহায়তা প্রদান করে।

ক্লাউড প্রদানকারী যেমন AWS এখন ফার্মাসিউটিক্যাল গ্রাহকদের তাদের অবকাঠামো হোস্ট করার জন্য পছন্দের প্ল্যাটফর্মে পরিণত হয়েছে। এডব্লিউএস সেজমেকারের মতো পরিচালিত পরিষেবাও প্রদান করে, যা ক্লাউডে মেশিন লার্নিং (এমএল) মডেল তৈরি, প্রশিক্ষণ এবং স্থাপন করা সহজ করে তোলে। সেজমেকার ওয়েব ব্রাউজারের মাধ্যমে যেকোন জায়গা থেকে RStudio IDE-তে অ্যাক্সেসের অনুমতি দেয়। এই পোস্টে পরিসংখ্যানগত প্রোগ্রামার এবং বায়োস্ট্যাটিস্টিয়ানরা কীভাবে তাদের ক্লিনিকাল ডেটা R পরিবেশে প্রবেশ করতে পারে, কীভাবে R কোড চালানো যেতে পারে এবং কীভাবে ফলাফলগুলি সংরক্ষণ করা হয় তার বিবরণ রয়েছে। আমরা কোডের স্নিপেটগুলি সরবরাহ করি যা ক্লিনিকাল ট্রায়াল ডেটা বিজ্ঞানীদের R পরিবেশে XPT ফাইলগুলিকে প্রবেশ করতে, SDTM এবং ADaM-এর জন্য R ডেটা ফ্রেম তৈরি করতে এবং অবশেষে TLF তৈরি করতে দেয় যা সংরক্ষণ করা যেতে পারে আমাজন সিম্পল স্টোরেজ সার্ভিস (Amazon S3) অবজেক্ট স্টোরেজ বালতি।

SageMaker-এ RStudio

2 নভেম্বর, 2021-এ, AWS-এর সহযোগিতায় আর স্টুডিও পিবিসি ঘোষিত সাধারণ প্রাপ্যতা SageMaker-এ RStudio, ক্লাউডে শিল্পের প্রথম সম্পূর্ণরূপে পরিচালিত RStudio Workbench IDE। আপনি এখন আপনার স্ব-পরিচালিত RStudio পরিবেশগুলিকে SageMaker-এ মাত্র কয়েকটি সহজ ধাপে স্থানান্তর করতে আপনার বর্তমান RStudio লাইসেন্স আনতে পারেন। এই উত্তেজনাপূর্ণ সহযোগিতা সম্পর্কে আরও জানতে, চেক আউট করুন Amazon SageMaker-এ RStudio ঘোষণা করা হচ্ছে.

RStudio ওয়ার্কবেঞ্চের পাশাপাশি, R ডেভেলপারদের জন্য RStudio স্যুট RStudio Connect এবং RStudio প্যাকেজ ম্যানেজারও অফার করে। RStudio Connect ডেটা বিজ্ঞানীদের অন্তর্দৃষ্টি, ড্যাশবোর্ড এবং ওয়েব অ্যাপ্লিকেশন প্রকাশ করার অনুমতি দেওয়ার জন্য ডিজাইন করা হয়েছে. এটি ডেটা বিজ্ঞানীদের জটিল কাজ থেকে এমএল এবং ডেটা বিজ্ঞানের অন্তর্দৃষ্টি ভাগ করে নেওয়া এবং সিদ্ধান্ত গ্রহণকারীদের হাতে তুলে দেওয়া সহজ করে তোলে৷ আরস্টুডিও কানেক্ট হোস্টিং এবং কন্টেন্ট ম্যানেজ করাকে সহজ এবং ব্যাপক ব্যবহারের জন্য মাপযোগ্য করে তোলে।

সমাধান ওভারভিউ

নিম্নলিখিত বিভাগে, আমরা আলোচনা করব কিভাবে আমরা সেজমেকার-এ RStudio-এ দূরবর্তী সংগ্রহস্থল বা S3 বাকেট থেকে কাঁচা ডেটা আমদানি করতে পারি। এর সাথে সরাসরি সংযোগ করাও সম্ভব অ্যামাজন রিলেশনাল ডাটাবেস পরিষেবা (Amazon RDS) এবং ডাটা গুদামের মত আমাজন রেডশিফ্ট (দেখুন অ্যামাজন রেডশিফ্টের সাথে R-কে সংযুক্ত করা হচ্ছে) সরাসরি RStudio থেকে; যাইহোক, এটি এই পোস্টের সুযোগের বাইরে। কয়েকটি ভিন্ন উত্স থেকে ডেটা গ্রহণ করার পরে, আমরা এটি প্রক্রিয়া করি এবং একটি টেবিলের জন্য R ডেটা ফ্রেম তৈরি করি। তারপরে আমরা টেবিল ডেটা ফ্রেমটিকে একটি RTF ফাইলে রূপান্তর করি এবং ফলাফলগুলিকে S3 বালতিতে সংরক্ষণ করি। এই আউটপুটগুলি তখন সম্ভাব্যভাবে নিয়ন্ত্রক জমা দেওয়ার উদ্দেশ্যে ব্যবহার করা যেতে পারে, তবে পোস্টে ব্যবহৃত R প্যাকেজগুলি গ্রাহকের দ্বারা নিয়ন্ত্রক জমা দেওয়ার জন্য ব্যবহারের জন্য বৈধ করা হয়েছে।

SageMaker-এ RStudio সেট আপ করুন

আপনার পরিবেশে SageMaker-এ RStudio সেট আপ করার নির্দেশাবলীর জন্য, পড়ুন SageMaker-এ RStudio দিয়ে শুরু করুন. নিশ্চিত করুন যে SageMaker-এ RStudio-এর কার্যকরী ভূমিকার S3 বাকেটের ডেটা ডাউনলোড এবং আপলোড করার অ্যাক্সেস রয়েছে যেখানে ডেটা সংরক্ষণ করা হয়। কীভাবে R প্যাকেজগুলি পরিচালনা করবেন এবং সেজমেকারে RStudio ব্যবহার করে আপনার বিশ্লেষণ প্রকাশ করবেন সে সম্পর্কে আরও জানতে, দেখুন ডেটা বিজ্ঞানীদের জন্য SageMaker-এ সম্পূর্ণরূপে পরিচালিত RStudio ঘোষণা করা হচ্ছে.

RStudio-তে ডেটা ইনজেস্ট করুন

এই ধাপে, আমরা আমাদের R সেশনের জন্য এটি উপলব্ধ করতে বিভিন্ন উত্স থেকে ডেটা গ্রহণ করি। আমরা SAS XPT ফরম্যাটে ডেটা আমদানি করি; যাইহোক, যদি আপনি অন্যান্য বিন্যাসে ডেটা গ্রহণ করতে চান তবে প্রক্রিয়াটি একই রকম। SageMaker-এ RStudio ব্যবহার করার একটি সুবিধা হল যে যদি উৎস ডেটা আপনার AWS অ্যাকাউন্টে সংরক্ষিত থাকে, তাহলে SageMaker ব্যবহার করে নেটিভভাবে ডেটা অ্যাক্সেস করতে পারে এডাব্লুএস আইডেন্টিটি এবং অ্যাক্সেস ম্যানেজমেন্ট (IAM) ভূমিকা।

দূরবর্তী সংগ্রহস্থলে সংরক্ষিত ডেটা অ্যাক্সেস করুন

এই ধাপে, আমরা থেকে ADaM ডেটা আমদানি করি FDA এর GitHub সংগ্রহস্থল. আমরা নামক একটি স্থানীয় ডিরেক্টরি তৈরি করি data RStudio পরিবেশে ডেটা সংরক্ষণ করতে এবং জনসংখ্যার ডেটা ডাউনলোড করতে (dm.xpt) দূরবর্তী সংগ্রহস্থল থেকে। এই প্রসঙ্গে, স্থানীয় ডিরেক্টরি বলতে আপনার ব্যক্তিগত অ্যামাজন ইএফএস স্টোরেজে তৈরি করা একটি ডিরেক্টরি বোঝায় যা ডিফল্টরূপে আপনার R সেশন পরিবেশে সংযুক্ত থাকে। নিম্নলিখিত কোড দেখুন:

######################################################
# Step 1.1 – Ingest Data from Remote Data Repository #
######################################################

# Remote Data Path 
raw_data_url = “https://github.com/FDA/PKView/raw/master/Installation%20Package/OCP/data/clinical/DRUG000/0000/m5/datasets/test001/tabulations/sdtm”
raw_data_name = “dm.xpt”

#Create Local Directory to store downloaded files
dir.create(“data”)
local_file_location <- paste0(getwd(),”/data/”)
download.file(raw_data_url, paste0(local_file_location,raw_data_name))

এই ধাপ সম্পূর্ণ হলে, আপনি দেখতে পারেন dm.xpt নেভিগেট করে ডাউনলোড করা হচ্ছে নথি পত্র, উপাত্ত, dm.xpt.

অ্যামাজন S3-তে সংরক্ষিত ডেটা অ্যাক্সেস করুন

এই ধাপে, আমরা আমাদের অ্যাকাউন্টে একটি S3 বালতিতে সংরক্ষিত ডেটা ডাউনলোড করি। আমরা FDA-এর GitHub সংগ্রহস্থল থেকে S3 বাকেট নামক বিষয়বস্তু কপি করেছি aws-sagemaker-rstudio এই উদাহরণের জন্য। নিম্নলিখিত কোড দেখুন:

#####################################################
# Step 1.2 - Ingest Data from S3 Bucket             #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()

s3_bucket = "aws-sagemaker-rstudio"
s3_key = "DRUG000/test001/tabulations/sdtm/pp.xpt"

session$download_data(local_file_location, s3_bucket, s3_key)

ধাপ সম্পূর্ণ হলে, আপনি দেখতে পারেন pp.xpt নেভিগেট করে ডাউনলোড করা হচ্ছে নথি পত্র, উপাত্ত, pp.xpt.

XPT ডেটা প্রক্রিয়া করুন

এখন যেহেতু আমাদের কাছে SAS XPT ফাইলগুলি R পরিবেশে উপলব্ধ রয়েছে, আমাদের সেগুলিকে R ডেটা ফ্রেমে রূপান্তর করতে হবে এবং সেগুলি প্রক্রিয়া করতে হবে। আমরা ব্যবহার করি haven XPT ফাইল পড়ার জন্য লাইব্রেরি। আমরা CDISC SDTM ডেটাসেট একত্রিত করি dm এবং pp ADPP ডেটাসেট তৈরি করতে। তারপরে আমরা ADPP ডেটা ফ্রেম ব্যবহার করে একটি সংক্ষিপ্ত পরিসংখ্যান টেবিল তৈরি করি। সংক্ষিপ্ত সারণী তারপর RTF বিন্যাসে রপ্তানি করা হয়.

প্রথমত, XPT ফাইলগুলি ব্যবহার করে পড়া হয় read_xpt হেভেন লাইব্রেরির কাজ। তারপর একটি বিশ্লেষণ ডেটাসেট ব্যবহার করে তৈরি করা হয় sqldf এর ফাংশন sqldf লাইব্রেরি নিম্নলিখিত কোড দেখুন:

########################################################
# Step 2.1 - Read XPT files. Create Analysis dataset.  #
########################################################

library(haven)
library(sqldf)


# Read XPT Files, convert them to R data frame
dm = read_xpt("data/dm.xpt")
pp = read_xpt("data/pp.xpt")

# Create ADaM dataset
adpp = sqldf("select a.USUBJID
                    ,a.PPCAT as ACAT
                    ,a.PPTESTCD
                    ,a.PPTEST
                    ,a.PPDTC
                    ,a.PPSTRESN as AVAL
                    ,a.VISIT as AVISIT
                    ,a.VISITNUM as AVISITN
                    ,b.sex
                from pp a 
           left join dm b 
                  on a.usubjid = b.usubjid
             ")

তারপরে, থেকে ফাংশন ব্যবহার করে একটি আউটপুট ডেটা ফ্রেম তৈরি করা হয় Tplyr এবং dplyr লাইব্রেরি:

########################################################
# Step 2.2 - Create output table                       #
########################################################

library(Tplyr)
library(dplyr)

t = tplyr_table(adpp, SEX) %>% 
  add_layer(
    group_desc(AVAL, by = "Area under the concentration-time curve", where= PPTESTCD=="AUC") %>% 
      set_format_strings(
        "n"        = f_str("xx", n),
        "Mean (SD)"= f_str("xx.x (xx.xx)", mean, sd),
        "Median"   = f_str("xx.x", median),
        "Q1, Q3"   = f_str("xx, xx", q1, q3),
        "Min, Max" = f_str("xx, xx", min, max),
        "Missing"  = f_str("xx", missing)
      )
  )  %>% 
  build()

output = t %>% 
  rename(Variable = row_label1,Statistic = row_label2,Female =var1_F, Male = var1_M) %>% 
  select(Variable,Statistic,Female, Male)

আউটপুট ডেটা ফ্রেমটি RStudio পরিবেশে আউটপুট ফোল্ডারে একটি RTF ফাইল হিসাবে সংরক্ষণ করা হয়:

#####################################################
# Step 3 - Save the Results as RTF                  #
#####################################################
library(rtf)

dir.create("output")
rtf = RTF("output/tab_adpp.rtf")  
addHeader(rtf,title="Section 1 - Tables", subtitle="This Section contains all tables")
addParagraph(rtf, "Table 1 - Pharmacokinetic Parameters by Sex:n")
addTable(rtf, output)
done(rtf)

Amazon S3 এ আউটপুট আপলোড করুন

আউটপুট জেনারেট হওয়ার পর, আমরা ডাটা আবার একটি S3 বালতিতে রাখি। আমরা আবার একটি সেজমেকার সেশন তৈরি করে এটি অর্জন করতে পারি, যদি একটি সেশন ইতিমধ্যে সক্রিয় না থাকে, এবং আউটপুট ফোল্ডারের বিষয়বস্তু একটি S3 বাকেট ব্যবহার করে আপলোড করে session$upload_data ফাংশন:

#####################################################
# Step 4 - Upload outputs to S3                     #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()
s3_bucket = "aws-sagemaker-rstudio"
output_location = "output/"
s3_folder_name = "output"
session$upload_data(output_location, s3_bucket, s3_folder_name)

এই পদক্ষেপগুলির মাধ্যমে, আমরা ডেটা গ্রহণ করেছি, এটি প্রক্রিয়া করেছি এবং ফলাফলগুলি আপলোড করেছি যা নিয়ন্ত্রক কর্তৃপক্ষের কাছে জমা দেওয়ার জন্য উপলব্ধ করা হবে৷

পরিষ্কার কর

কোনো অনিচ্ছাকৃত খরচ এড়াতে, আপনাকে আপনার বর্তমান সেশনটি ছেড়ে দিতে হবে। পৃষ্ঠার উপরের ডানদিকে, পাওয়ার আইকনটি বেছে নিন। এটি স্বয়ংক্রিয়ভাবে অন্তর্নিহিত দৃষ্টান্ত বন্ধ করবে এবং তাই কোনো অনিচ্ছাকৃত গণনা খরচ বহন করা বন্ধ করবে।

জীবন বিজ্ঞান শিল্প PlatoBlockchain ডেটা ইন্টেলিজেন্সের জন্য নিয়ন্ত্রক জমা তৈরি করতে Amazon SageMaker-এ RStudio ব্যবহার করুন। উল্লম্ব অনুসন্ধান. আ.

চ্যালেঞ্জ

পোস্টটিতে একটি S3 বালতি বা দূরবর্তী রিপোজিটরি থেকে সঞ্চিত কাঁচা ডেটা খাওয়ার জন্য পদক্ষেপের রূপরেখা দেওয়া হয়েছে। যাইহোক, ক্লিনিকাল ট্রায়ালের জন্য অপরিশোধিত ডেটার আরও অনেক উৎস রয়েছে, প্রাথমিকভাবে ইসিআরএফ (ইলেক্ট্রনিক কেস রিপোর্ট ফর্ম) ডেটা ইডিসি (ইলেক্ট্রনিক ডেটা ক্যাপচার) সিস্টেমে সংরক্ষিত যেমন ওরাকল ক্লিনিক্যাল, মেডিডাটা রেভ, ওপেনক্লিনিকা বা স্নোফ্লেক; ল্যাব ডেটা; eCOA (ক্লিনিকাল ফলাফল মূল্যায়ন) এবং ePRO (ইলেক্ট্রনিক রোগী-প্রতিবেদিত ফলাফল); অ্যাপ এবং মেডিকেল ডিভাইস থেকে বাস্তব-বিশ্বের ডেটা; এবং হাসপাতালের ইলেকট্রনিক স্বাস্থ্য রেকর্ড (EHRs)। নিয়ন্ত্রক জমা দেওয়ার জন্য এই ডেটা ব্যবহারযোগ্য করার আগে উল্লেখযোগ্য প্রিপ্রসেসিং জড়িত। বিভিন্ন ডেটা উত্সের সাথে সংযোগকারী তৈরি করা এবং সেগুলিকে কেন্দ্রীভূত ডেটা ভান্ডারে (সিডিআর) বা একটি ক্লিনিকাল ডেটা লেকে সংগ্রহ করা, সঠিক অ্যাক্সেস নিয়ন্ত্রণ বজায় রাখার সাথে সাথে, গুরুত্বপূর্ণ চ্যালেঞ্জ তৈরি করে।

কাটিয়ে উঠতে আরেকটি মূল চ্যালেঞ্জ হল নিয়ন্ত্রক সম্মতি। নিয়ন্ত্রক জমা দেওয়ার আউটপুট তৈরির জন্য ব্যবহৃত কম্পিউটার সিস্টেমটি অবশ্যই উপযুক্ত প্রবিধানের সাথে সঙ্গতিপূর্ণ হতে হবে, যেমন 21 CFR পার্ট 11, HIPAA, GDPR, বা অন্য কোন GxP প্রয়োজনীয়তা বা ICH নির্দেশিকা। এটি অ্যাক্সেস, নিরাপত্তা, ব্যাকআপ এবং নিরীক্ষাযোগ্যতার জন্য নিয়ন্ত্রণ সহ একটি বৈধ এবং যোগ্য পরিবেশে কাজ করার অনুবাদ। এর মানে হল যে কোনও R প্যাকেজ যা নিয়ন্ত্রক জমা দেওয়ার আউটপুট তৈরি করতে ব্যবহার করা হয় ব্যবহারের আগে অবশ্যই যাচাই করা উচিত।

উপসংহার

এই পোস্টে, আমরা দেখেছি যে একটি eCTD জমা দেওয়ার জন্য কিছু মূল বিতরণযোগ্য ছিল CDISC SDTM, ADaM ডেটাসেট এবং TLF। এই পোস্টটি SageMaker-এর RStudio-তে কয়েকটি উৎস থেকে ডেটা গ্রহণ করে এই নিয়ন্ত্রক জমা দেওয়ার জন্য প্রয়োজনীয় পদক্ষেপগুলিকে রূপরেখা দিয়েছে। আমরা তখন দেখেছি কিভাবে আমরা এক্সপিটি ফরম্যাটে ইনজেস্টেড ডেটা প্রক্রিয়া করতে পারি; SDTM, ADaM, এবং TLF তৈরি করতে এটিকে R ডেটা ফ্রেমে রূপান্তর করুন; এবং তারপর অবশেষে ফলাফলগুলি একটি S3 বালতিতে আপলোড করুন।

আমরা আশা করি যে পোস্টে দেওয়া বিস্তৃত ধারণাগুলির সাহায্যে, পরিসংখ্যান প্রোগ্রামার এবং বায়োস্ট্যাটিস্টিয়ানরা সেজমেকারের RStudio-এ ক্লিনিকাল ট্রায়াল গবেষণা ডেটা লোড, প্রক্রিয়াকরণ এবং বিশ্লেষণের শেষ-থেকে-এন্ড প্রক্রিয়া সহজেই কল্পনা করতে পারে এবং একটি কাস্টম সংজ্ঞায়িত করতে শেখার ব্যবহার করতে পারে। আপনার নিয়ন্ত্রক জমা দেওয়ার জন্য উপযুক্ত কর্মপ্রবাহ।

আপনি কি গবেষক, পরিসংখ্যানবিদ এবং আর প্রোগ্রামারদের তাদের জীবন সহজ করতে সাহায্য করার জন্য RStudio ব্যবহার করার অন্য কোন অ্যাপ্লিকেশনের কথা ভাবতে পারেন? আমরা আপনার ধারনা সম্পর্কে শুনতে চাই! এবং যদি আপনার কোন প্রশ্ন থাকে, অনুগ্রহ করে সেগুলি মন্তব্য বিভাগে শেয়ার করুন।

Resources

আরও তথ্যের জন্য, নিম্নলিখিত লিঙ্কগুলিতে যান:


লেখক সম্পর্কে

জীবন বিজ্ঞান শিল্প PlatoBlockchain ডেটা ইন্টেলিজেন্সের জন্য নিয়ন্ত্রক জমা তৈরি করতে Amazon SageMaker-এ RStudio ব্যবহার করুন। উল্লম্ব অনুসন্ধান. আ.রোহিত বঙ্গ লন্ডন, যুক্তরাজ্যের বাইরে অবস্থিত একটি গ্লোবাল ক্লিনিক্যাল ডেভেলপমেন্ট ইন্ডাস্ট্রি বিশেষজ্ঞ। তিনি প্রশিক্ষণের মাধ্যমে একজন জৈব পরিসংখ্যানবিদ এবং স্বাস্থ্যসেবা এবং লাইফসায়েন্স গ্রাহকদের AWS-এ উদ্ভাবনী ক্লিনিকাল ডেভেলপমেন্ট সমাধান স্থাপনে সহায়তা করেন। স্বাস্থ্যসেবা এবং লাইফসায়েন্স শিল্পের মধ্যে প্রকৃত ব্যবসায়িক সমস্যা সমাধানের জন্য ডেটা সায়েন্স, এআই/এমএল এবং উদীয়মান প্রযুক্তিগুলি কীভাবে ব্যবহার করা যেতে পারে সে সম্পর্কে তিনি উত্সাহী। তার অবসর সময়ে, রোহিত স্কিইং, BBQing এবং পরিবার এবং বন্ধুদের সাথে সময় কাটাতে উপভোগ করেন।

জীবন বিজ্ঞান শিল্প PlatoBlockchain ডেটা ইন্টেলিজেন্সের জন্য নিয়ন্ত্রক জমা তৈরি করতে Amazon SageMaker-এ RStudio ব্যবহার করুন। উল্লম্ব অনুসন্ধান. আ.জর্জিওস শিনাস EMEA অঞ্চলে AI/ML-এর জন্য একজন বিশেষজ্ঞ সমাধান স্থপতি৷ তিনি লন্ডনে অবস্থিত এবং যুক্তরাজ্য এবং আয়ারল্যান্ডের গ্রাহকদের সাথে ঘনিষ্ঠভাবে কাজ করেন। Georgios গ্রাহকদের MLOps অনুশীলনে বিশেষ আগ্রহের সাথে AWS-এ উৎপাদনে মেশিন লার্নিং অ্যাপ্লিকেশন ডিজাইন ও স্থাপন করতে সাহায্য করে এবং গ্রাহকদের স্কেলে মেশিন লার্নিং করতে সক্ষম করে। তার অবসর সময়ে, তিনি ভ্রমণ, রান্না এবং বন্ধু এবং পরিবারের সাথে সময় কাটাতে উপভোগ করেন।

সময় স্ট্যাম্প:

থেকে আরো এডাব্লুএস মেশিন লার্নিং