ใช้ RStudio บน Amazon SageMaker เพื่อสร้างการส่งตามข้อบังคับสำหรับอุตสาหกรรมวิทยาศาสตร์ชีวภาพ PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ใช้ RStudio บน Amazon SageMaker เพื่อสร้างการส่งข้อบังคับสำหรับอุตสาหกรรมชีววิทยาศาสตร์

บริษัทยาที่ต้องการอนุมัติจากหน่วยงานกำกับดูแล เช่น สำนักงานคณะกรรมการอาหารและยาของสหรัฐอเมริกา (FDA) หรือสำนักงานยาและอุปกรณ์การแพทย์ของญี่ปุ่น (PMDA) เพื่อขายยาของตนในตลาดจะต้องส่งหลักฐานเพื่อพิสูจน์ว่ายาของตนปลอดภัยและมีประสิทธิภาพตามวัตถุประสงค์ ใช้. ทีมแพทย์ นักสถิติ นักเคมี เภสัชกร และนักวิทยาศาสตร์ทางคลินิกอื่นๆ ตรวจสอบข้อมูลการส่งการทดลองทางคลินิกและการติดฉลากที่เสนอ หากการทบทวนพบว่ามีหลักฐานทางสถิติเพียงพอที่จะพิสูจน์ว่าประโยชน์ต่อสุขภาพของยามีมากกว่าความเสี่ยง ยานั้นจะได้รับการอนุมัติให้ขาย

แพ็คเกจการส่งการทดลองทางคลินิกประกอบด้วยข้อมูลแบบตาราง ข้อมูลการวิเคราะห์ เมตาดาต้าของการทดลอง และรายงานทางสถิติที่ประกอบด้วยตารางทางสถิติ รายการ และตัวเลข ในกรณีของ FDA ของสหรัฐอเมริกา เอกสารทางเทคนิคทั่วไปทางอิเล็กทรอนิกส์ (eCTD) เป็นรูปแบบมาตรฐานสำหรับการส่งใบสมัคร การแก้ไข เอกสารเพิ่มเติม และรายงานไปยังศูนย์ประเมินและวิจัยทางชีววิทยา (CBER) ของ FDA และศูนย์ประเมินและวิจัยยา ( ซีดีเดอร์) สำหรับ FDA และ PMDA ของญี่ปุ่น เป็นข้อกำหนดตามกฎระเบียบในการส่งข้อมูลแบบตารางใน CDISC Standard Data Tabulation Model (SDTM) ข้อมูลการวิเคราะห์ใน CDISC Analysis Dataset Model (ADaM) และข้อมูลเมตาของการทดลองใน CDISC Define-XML (อิงตาม Operational Data Model (ODM))

ในโพสต์นี้ เราจะสาธิตวิธีการใช้ RStudio บน อเมซอน SageMaker เพื่อสร้างการส่งมอบตามกฎระเบียบดังกล่าว โพสต์นี้อธิบายกระบวนการยื่นเสนอการทดลองทางคลินิก วิธีที่เราสามารถนำเข้าข้อมูลการวิจัยการทดลองทางคลินิก จัดตารางและวิเคราะห์ข้อมูล จากนั้นสร้างรายงานทางสถิติ เช่น ตารางสรุป รายการข้อมูล และตัวเลข (TLF) วิธีนี้สามารถช่วยให้ลูกค้าเภสัชภัณฑ์เชื่อมต่อกับข้อมูลทางคลินิกที่จัดเก็บไว้ในสภาพแวดล้อม AWS ได้อย่างราบรื่น ประมวลผลโดยใช้ R และช่วยเร่งกระบวนการวิจัยการทดลองทางคลินิก

กระบวนการพัฒนายา

กระบวนการพัฒนายาสามารถแบ่งกว้าง ๆ ได้เป็น XNUMX ขั้นตอนหลัก ดังแสดงในรูปต่อไปนี้

ใช้เวลาประมาณ 10–15 ปีและประมาณ 1–3 พันล้านดอลลาร์สหรัฐสำหรับยาหนึ่งตัวจึงจะได้รับการอนุมัติจากโมเลกุลที่เป็นไปได้ประมาณ 10,000 โมเลกุล ในระหว่างระยะแรกของการวิจัย (ระยะการค้นพบยา) จะมีการระบุตัวยาที่มีแนวโน้มจะเป็นที่ต้องการ ซึ่งจะมุ่งไปสู่การวิจัยพรีคลินิกต่อไป ในระหว่างระยะพรีคลินิก นักวิจัยพยายามค้นหาความเป็นพิษของยาด้วยการดำเนินการ ในหลอดทดลอง การทดลองในห้องทดลองและ ในร่างกาย การทดลองกับสัตว์ หลังจากการทดสอบพรีคลินิก ยาจะเข้าสู่ขั้นตอนการวิจัยทางคลินิก ซึ่งจะต้องทดสอบกับมนุษย์เพื่อยืนยันความปลอดภัยและประสิทธิภาพ นักวิจัยออกแบบการทดลองทางคลินิกและให้รายละเอียดแผนการศึกษาในโครงการวิจัยทางคลินิก พวกเขากำหนดขั้นตอนการวิจัยทางคลินิกที่แตกต่างกัน ตั้งแต่การศึกษาระยะที่ 1 ขนาดเล็กเพื่อตรวจสอบความปลอดภัยและปริมาณยา ไปจนถึงการทดลองระยะที่ 2 ที่ใหญ่กว่าเพื่อตรวจสอบประสิทธิภาพของยาและผลข้างเคียง ไปจนถึงการทดลองระยะที่ 3 และ 4 ที่ใหญ่กว่าเพื่อตรวจสอบประสิทธิภาพ ความปลอดภัย และ ติดตามอาการไม่พึงประสงค์ หลังจากประสบความสำเร็จในการทดลองทางคลินิกในมนุษย์ ผู้สนับสนุนยาได้ยื่นคำขอรับยาใหม่ (NDA) เพื่อจำหน่ายยาดังกล่าว หน่วยงานกำกับดูแลจะตรวจสอบข้อมูลทั้งหมด ทำงานร่วมกับผู้สนับสนุนเกี่ยวกับข้อมูลการติดฉลากใบสั่งยา และอนุมัติยา หลังจากการอนุมัติยา หน่วยงานกำกับดูแลจะตรวจสอบรายงานความปลอดภัยหลังการวางตลาดเพื่อให้มั่นใจในความปลอดภัยของผลิตภัณฑ์ทั้งหมด

ในปี 1997 Clinical Data Interchange Standards Consortium (CDISC) ซึ่งเป็นองค์กรระดับโลกที่ไม่แสวงหาผลกำไรที่ประกอบด้วยบริษัทยา, CRO, เทคโนโลยีชีวภาพ, สถาบันการศึกษา, ผู้ให้บริการด้านการดูแลสุขภาพ และหน่วยงานภาครัฐ ได้ก่อตั้งขึ้นในฐานะกลุ่มอาสาสมัคร CDISC ได้เผยแพร่มาตรฐานข้อมูลเพื่อปรับปรุงการไหลของข้อมูลจากการรวบรวมจนถึงการส่ง และอำนวยความสะดวกในการแลกเปลี่ยนข้อมูลระหว่างพันธมิตรและผู้ให้บริการ CDISC ได้เผยแพร่มาตรฐานดังต่อไปนี้:

  • CDASH (การประสานมาตรฐานการได้มาซึ่งข้อมูลทางคลินิก) – มาตรฐานการรวบรวมข้อมูล
  • SDTM (แบบจำลองการจัดตารางข้อมูลการศึกษา) – มาตรฐานการส่งข้อมูลแบบตาราง
  • AdaM (แบบจำลองข้อมูลการวิเคราะห์) – มาตรฐานการวิเคราะห์ข้อมูล
  • SEND (มาตรฐานสำหรับการแลกเปลี่ยนข้อมูลที่ไม่ใช่ทางคลินิก) – มาตรฐานสำหรับข้อมูลที่ไม่ใช่ทางคลินิก
  • PRM (แบบจำลองการเป็นตัวแทนโปรโตคอล) – มาตรฐานโปรโตคอล

มาตรฐานเหล่านี้สามารถช่วยให้ผู้ตรวจสอบที่ได้รับการฝึกอบรมวิเคราะห์ข้อมูลได้อย่างมีประสิทธิภาพและรวดเร็วยิ่งขึ้นโดยใช้เครื่องมือมาตรฐาน ซึ่งช่วยลดเวลาในการอนุมัติยาได้ เป็นข้อกำหนดด้านกฎระเบียบจาก FDA ของสหรัฐอเมริกาและ PMDA ของญี่ปุ่นในการส่งข้อมูลแบบตารางทั้งหมดโดยใช้รูปแบบ SDTM

R สำหรับการส่งงานวิจัยทางคลินิก

SAS และ R เป็นซอฟต์แวร์การวิเคราะห์ทางสถิติที่มีการใช้งานมากที่สุดสองซอฟต์แวร์ที่ใช้ในอุตสาหกรรมยา เมื่อการพัฒนามาตรฐาน SDTM เริ่มต้นโดย CDISC นั้น SAS ได้ถูกนำมาใช้เกือบสากลในอุตสาหกรรมยาและที่ FDA อย่างไรก็ตาม R กำลังได้รับความนิยมอย่างมากในปัจจุบันเนื่องจากเป็นโอเพ่นซอร์ส และมีการเพิ่มแพ็คเกจและไลบรารีใหม่อย่างต่อเนื่อง นักเรียนใช้ R เป็นหลักในระหว่างการเรียนและการวิจัย และพวกเขานำความคุ้นเคยนี้ไปใช้ในการทำงาน R ยังให้การสนับสนุนเทคโนโลยีเกิดใหม่ เช่น การบูรณาการการเรียนรู้เชิงลึกขั้นสูง

ผู้ให้บริการระบบคลาวด์ เช่น AWS ได้กลายเป็นแพลตฟอร์มที่ลูกค้าเภสัชภัณฑ์เลือกใช้ในการโฮสต์โครงสร้างพื้นฐานของตน AWS ยังให้บริการที่มีการจัดการ เช่น SageMaker ซึ่งทำให้สร้าง ฝึกอบรม และปรับใช้โมเดล Machine Learning (ML) ในระบบคลาวด์ได้อย่างง่ายดาย SageMaker ยังอนุญาตให้เข้าถึง RStudio IDE ได้จากทุกที่ผ่านเว็บเบราว์เซอร์ โพสต์นี้ให้รายละเอียดว่าโปรแกรมเมอร์เชิงสถิติและนักชีวสถิติสามารถนำข้อมูลทางคลินิกเข้าสู่สภาพแวดล้อม R ได้อย่างไร วิธีเรียกใช้โค้ด R และวิธีการจัดเก็บผลลัพธ์ เราจัดเตรียมตัวอย่างโค้ดที่ช่วยให้นักวิทยาศาสตร์ข้อมูลการทดลองทางคลินิกนำเข้าไฟล์ XPT เข้าสู่สภาพแวดล้อม R สร้างเฟรมข้อมูล R สำหรับ SDTM และ AdaM และสุดท้ายสร้าง TLF ที่สามารถจัดเก็บไว้ใน บริการจัดเก็บข้อมูลอย่างง่ายของ Amazon (Amazon S3) ที่เก็บข้อมูลอ็อบเจ็กต์

RStudio บน SageMaker

ในวันที่ 2 พฤศจิกายน 2021 AWS ร่วมมือกับ อาร์สตูดิโอ พีบีซี ประกาศ ความพร้อมทั่วไปของ RStudio บน SageMakerซึ่งเป็น RStudio Workbench IDE ในระบบคลาวด์ที่มีการจัดการเต็มรูปแบบรายแรกของอุตสาหกรรม ตอนนี้คุณสามารถนำใบอนุญาต RStudio ปัจจุบันของคุณมาเพื่อโยกย้ายสภาพแวดล้อม RStudio ที่จัดการด้วยตนเองของคุณไปยัง SageMaker ได้อย่างง่ายดายด้วยขั้นตอนง่ายๆ เพียงไม่กี่ขั้นตอน หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับความร่วมมือที่น่าตื่นเต้นนี้ โปรดดู ประกาศ RStudio บน Amazon SageMaker.

นอกจาก RStudio Workbench แล้ว ชุด RStudio สำหรับนักพัฒนา R ยังมี RStudio Connect และ RStudio Package Manager อีกด้วย RStudio Connect ได้รับการออกแบบมาเพื่อให้นักวิทยาศาสตร์ข้อมูลสามารถเผยแพร่ข้อมูลเชิงลึก แดชบอร์ด และเว็บแอปพลิเคชันได้. ทำให้ง่ายต่อการแบ่งปันข้อมูลเชิงลึกด้าน ML และวิทยาศาสตร์ข้อมูลจากงานที่ซับซ้อนของนักวิทยาศาสตร์ข้อมูล และส่งมอบให้อยู่ในมือของผู้มีอำนาจตัดสินใจ RStudio Connect ยังทำให้การโฮสต์และการจัดการเนื้อหาเป็นเรื่องง่ายและปรับขนาดได้สำหรับการใช้งานในวงกว้าง

ภาพรวมโซลูชัน

ในส่วนต่อไปนี้ เราจะพูดถึงวิธีที่เราสามารถนำเข้าข้อมูลดิบจากพื้นที่เก็บข้อมูลระยะไกลหรือบัคเก็ต S3 ใน RStudio บน SageMaker นอกจากนี้ยังสามารถเชื่อมต่อได้โดยตรงอีกด้วย บริการฐานข้อมูลเชิงสัมพันธ์ของ Amazon (Amazon RDS) และคลังข้อมูลเช่น อเมซอน Redshift (ดู การเชื่อมต่อ R กับ Amazon RedShift) โดยตรงจาก RStudio; อย่างไรก็ตาม นี่อยู่นอกขอบเขตของโพสต์นี้ หลังจากที่นำเข้าข้อมูลจากแหล่งที่มาต่างๆ สองสามแหล่งแล้ว เราจะประมวลผลและสร้างกรอบข้อมูล R สำหรับตาราง จากนั้นเราจะแปลงเฟรมข้อมูลตารางเป็นไฟล์ RTF และจัดเก็บผลลัพธ์กลับเข้าไปในบัคเก็ต S3 ผลลัพธ์เหล่านี้สามารถใช้เพื่อวัตถุประสงค์ในการยื่นตามกฎระเบียบได้ โดยที่แพ็คเกจ R ที่ใช้ในการโพสต์ได้รับการตรวจสอบความถูกต้องเพื่อใช้สำหรับการยื่นตามกฎระเบียบโดยลูกค้า

ตั้งค่า RStudio บน SageMaker

หากต้องการคำแนะนำในการตั้งค่า RStudio บน SageMaker ในสภาพแวดล้อมของคุณ โปรดดูที่ เริ่มต้นใช้งาน RStudio บน SageMaker. ตรวจสอบให้แน่ใจว่าบทบาทการดำเนินการของ RStudio บน SageMaker มีสิทธิ์เข้าถึงเพื่อดาวน์โหลดและอัปโหลดข้อมูลไปยังบัคเก็ต S3 ที่จัดเก็บข้อมูลไว้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับวิธีจัดการแพ็คเกจ R และเผยแพร่การวิเคราะห์ของคุณโดยใช้ RStudio บน SageMaker โปรดดูที่ ประกาศ RStudio ที่มีการจัดการเต็มรูปแบบบน SageMaker สำหรับนักวิทยาศาสตร์ข้อมูล.

นำเข้าข้อมูลเข้าสู่ RStudio

ในขั้นตอนนี้ เราจะนำเข้าข้อมูลจากแหล่งต่างๆ เพื่อให้พร้อมใช้งานสำหรับเซสชัน R ของเรา เรานำเข้าข้อมูลในรูปแบบ SAS XPT อย่างไรก็ตาม กระบวนการนี้จะคล้ายกันหากคุณต้องการนำเข้าข้อมูลในรูปแบบอื่น ข้อดีประการหนึ่งของการใช้ RStudio บน SageMaker ก็คือ หากข้อมูลต้นฉบับถูกจัดเก็บไว้ในบัญชี AWS ของคุณ SageMaker จะสามารถเข้าถึงข้อมูลได้โดยใช้ AWS Identity และการจัดการการเข้าถึง (IAM) บทบาท

เข้าถึงข้อมูลที่จัดเก็บไว้ในพื้นที่เก็บข้อมูลระยะไกล

ในขั้นตอนนี้ เราจะนำเข้าข้อมูล AdaM จาก พื้นที่เก็บข้อมูล GitHub ของ FDA. เราสร้างไดเรกทอรีท้องถิ่นที่เรียกว่า data ในสภาพแวดล้อม RStudio เพื่อจัดเก็บข้อมูลและดาวน์โหลดข้อมูลประชากร (dm.xpt) จากพื้นที่เก็บข้อมูลระยะไกล ในบริบทนี้ ไดเร็กทอรีในเครื่องหมายถึงไดเร็กทอรีที่สร้างขึ้นบนพื้นที่จัดเก็บ Amazon EFS ส่วนตัวของคุณซึ่งแนบมากับสภาพแวดล้อมเซสชัน R ของคุณเป็นค่าเริ่มต้น ดูรหัสต่อไปนี้:

######################################################
# Step 1.1 – Ingest Data from Remote Data Repository #
######################################################

# Remote Data Path 
raw_data_url = “https://github.com/FDA/PKView/raw/master/Installation%20Package/OCP/data/clinical/DRUG000/0000/m5/datasets/test001/tabulations/sdtm”
raw_data_name = “dm.xpt”

#Create Local Directory to store downloaded files
dir.create(“data”)
local_file_location <- paste0(getwd(),”/data/”)
download.file(raw_data_url, paste0(local_file_location,raw_data_name))

เมื่อขั้นตอนนี้เสร็จสมบูรณ์ คุณจะเห็น dm.xpt กำลังดาวน์โหลดโดยไปที่ ไฟล์, ข้อมูล, DM.XPT.

เข้าถึงข้อมูลที่จัดเก็บไว้ใน Amazon S3

ในขั้นตอนนี้ เราจะดาวน์โหลดข้อมูลที่จัดเก็บไว้ในบัคเก็ต S3 ในบัญชีของเรา เราได้คัดลอกเนื้อหาจากพื้นที่เก็บข้อมูล GitHub ของ FDA ไปยังบัคเก็ต S3 ที่มีชื่อว่า aws-sagemaker-rstudio สำหรับตัวอย่างนี้ ดูรหัสต่อไปนี้:

#####################################################
# Step 1.2 - Ingest Data from S3 Bucket             #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()

s3_bucket = "aws-sagemaker-rstudio"
s3_key = "DRUG000/test001/tabulations/sdtm/pp.xpt"

session$download_data(local_file_location, s3_bucket, s3_key)

เมื่อทำตามขั้นตอนเสร็จแล้วจะมองเห็น pp.xpt กำลังดาวน์โหลดโดยไปที่ ไฟล์, ข้อมูล, หน้า.xpt.

ประมวลผลข้อมูล XPT

ตอนนี้เรามีไฟล์ SAS XPT พร้อมใช้งานในสภาพแวดล้อม R แล้ว เราจำเป็นต้องแปลงไฟล์เหล่านั้นเป็นเฟรมข้อมูล R แล้วประมวลผล เราใช้ haven ไลบรารีเพื่ออ่านไฟล์ XPT เรารวมชุดข้อมูล CDISC SDTM dm และ pp เพื่อสร้างชุดข้อมูล ADPP จากนั้นเราสร้างตารางสถิติสรุปโดยใช้กรอบข้อมูล ADPP จากนั้นตารางสรุปจะถูกส่งออกในรูปแบบ RTF

ขั้นแรก ไฟล์ XPT จะถูกอ่านโดยใช้นามสกุล read_xpt ฟังก์ชั่นของห้องสมุดสวรรค์ จากนั้นชุดข้อมูลการวิเคราะห์จะถูกสร้างขึ้นโดยใช้ sqldf ฟังก์ชันของ sqldf ห้องสมุด. ดูรหัสต่อไปนี้:

########################################################
# Step 2.1 - Read XPT files. Create Analysis dataset.  #
########################################################

library(haven)
library(sqldf)


# Read XPT Files, convert them to R data frame
dm = read_xpt("data/dm.xpt")
pp = read_xpt("data/pp.xpt")

# Create ADaM dataset
adpp = sqldf("select a.USUBJID
                    ,a.PPCAT as ACAT
                    ,a.PPTESTCD
                    ,a.PPTEST
                    ,a.PPDTC
                    ,a.PPSTRESN as AVAL
                    ,a.VISIT as AVISIT
                    ,a.VISITNUM as AVISITN
                    ,b.sex
                from pp a 
           left join dm b 
                  on a.usubjid = b.usubjid
             ")

จากนั้น กรอบข้อมูลเอาท์พุตจะถูกสร้างขึ้นโดยใช้ฟังก์ชันจาก Tplyr และ dplyr ห้องสมุด:

########################################################
# Step 2.2 - Create output table                       #
########################################################

library(Tplyr)
library(dplyr)

t = tplyr_table(adpp, SEX) %>% 
  add_layer(
    group_desc(AVAL, by = "Area under the concentration-time curve", where= PPTESTCD=="AUC") %>% 
      set_format_strings(
        "n"        = f_str("xx", n),
        "Mean (SD)"= f_str("xx.x (xx.xx)", mean, sd),
        "Median"   = f_str("xx.x", median),
        "Q1, Q3"   = f_str("xx, xx", q1, q3),
        "Min, Max" = f_str("xx, xx", min, max),
        "Missing"  = f_str("xx", missing)
      )
  )  %>% 
  build()

output = t %>% 
  rename(Variable = row_label1,Statistic = row_label2,Female =var1_F, Male = var1_M) %>% 
  select(Variable,Statistic,Female, Male)

กรอบข้อมูลเอาต์พุตจะถูกจัดเก็บเป็นไฟล์ RTF ในโฟลเดอร์เอาต์พุตในสภาพแวดล้อม RStudio:

#####################################################
# Step 3 - Save the Results as RTF                  #
#####################################################
library(rtf)

dir.create("output")
rtf = RTF("output/tab_adpp.rtf")  
addHeader(rtf,title="Section 1 - Tables", subtitle="This Section contains all tables")
addParagraph(rtf, "Table 1 - Pharmacokinetic Parameters by Sex:n")
addTable(rtf, output)
done(rtf)

อัปโหลดเอาต์พุตไปยัง Amazon S3

หลังจากสร้างเอาต์พุตแล้ว เราจะใส่ข้อมูลกลับเข้าไปในบัคเก็ต S3 เราบรรลุเป้าหมายนี้ได้โดยการสร้างเซสชัน SageMaker อีกครั้ง หากเซสชันไม่ได้ใช้งานอยู่แล้ว และอัปโหลดเนื้อหาของโฟลเดอร์เอาต์พุตไปยังบัคเก็ต S3 โดยใช้ session$upload_data ฟังก์ชั่น:

#####################################################
# Step 4 - Upload outputs to S3                     #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()
s3_bucket = "aws-sagemaker-rstudio"
output_location = "output/"
s3_folder_name = "output"
session$upload_data(output_location, s3_bucket, s3_folder_name)

ด้วยขั้นตอนเหล่านี้ เราได้นำเข้าข้อมูล ประมวลผล และอัปโหลดผลลัพธ์เพื่อส่งให้กับหน่วยงานกำกับดูแล

ทำความสะอาด

เพื่อหลีกเลี่ยงไม่ให้เกิดค่าใช้จ่ายที่ไม่ได้ตั้งใจ คุณต้องออกจากเซสชันปัจจุบัน ที่มุมขวาบนของหน้า ให้เลือกไอคอนเปิด/ปิด การดำเนินการนี้จะหยุดอินสแตนซ์พื้นฐานโดยอัตโนมัติ และหยุดต้นทุนการประมวลผลที่ไม่ได้ตั้งใจ

ใช้ RStudio บน Amazon SageMaker เพื่อสร้างการส่งตามข้อบังคับสำหรับอุตสาหกรรมวิทยาศาสตร์ชีวภาพ PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.

ความท้าทาย

โพสต์ดังกล่าวได้สรุปขั้นตอนในการนำเข้าข้อมูลดิบที่จัดเก็บไว้ในบัคเก็ต S3 หรือจากพื้นที่เก็บข้อมูลระยะไกล อย่างไรก็ตาม มีแหล่งข้อมูลดิบอื่นๆ อีกมากมายสำหรับการทดลองทางคลินิก โดยหลักๆ แล้วคือข้อมูล eCRF (แบบฟอร์มรายงานผู้ป่วยทางอิเล็กทรอนิกส์) ที่จัดเก็บไว้ในระบบ EDC (การบันทึกข้อมูลทางอิเล็กทรอนิกส์) เช่น Oracle Clinical, Medidata Rave, OpenClinica หรือ Snowflake; ข้อมูลห้องปฏิบัติการ ข้อมูลจาก eCOA (การประเมินผลลัพธ์ทางคลินิก) และ ePRO (ผลลัพธ์ที่ผู้ป่วยรายงานทางอิเล็กทรอนิกส์) ข้อมูลในโลกแห่งความเป็นจริงจากแอพและอุปกรณ์ทางการแพทย์ และบันทึกสุขภาพอิเล็กทรอนิกส์ (EHRs) ที่โรงพยาบาล มีการประมวลผลล่วงหน้าที่สำคัญก่อนที่ข้อมูลนี้จะสามารถนำมาใช้สำหรับการยื่นตามกฎระเบียบได้ การสร้างตัวเชื่อมต่อไปยังแหล่งข้อมูลต่างๆ และรวบรวมไว้ในที่เก็บข้อมูลส่วนกลาง (CDR) หรือที่เก็บข้อมูลทางคลินิก ในขณะที่ยังคงรักษาการควบคุมการเข้าถึงที่เหมาะสม ถือเป็นความท้าทายที่สำคัญ

ความท้าทายสำคัญอีกประการหนึ่งที่ต้องเอาชนะคือการปฏิบัติตามกฎระเบียบ ระบบคอมพิวเตอร์ที่ใช้ในการสร้างผลลัพธ์การส่งตามกฎระเบียบจะต้องเป็นไปตามกฎระเบียบที่เหมาะสม เช่น 21 CFR ส่วนที่ 11, HIPAA, GDPR หรือข้อกำหนด GxP อื่น ๆ หรือแนวทาง ICH สิ่งนี้แปลเป็นการทำงานในสภาพแวดล้อมที่ผ่านการตรวจสอบและผ่านการรับรอง พร้อมด้วยการควบคุมการเข้าถึง การรักษาความปลอดภัย การสำรองข้อมูล และการตรวจสอบ นอกจากนี้ยังหมายความว่าแพ็คเกจ R ใด ๆ ที่ใช้ในการสร้างผลลัพธ์การยื่นตามกฎระเบียบจะต้องได้รับการตรวจสอบก่อนใช้งาน

สรุป

ในโพสต์นี้ เราพบว่าการส่งมอบหลักบางส่วนสำหรับการส่ง eCTD คือชุดข้อมูล CDISC SDTM, AdaM และ TLF โพสต์นี้สรุปขั้นตอนที่จำเป็นในการสร้างการส่งมอบตามกฎระเบียบเหล่านี้โดยการนำเข้าข้อมูลจากแหล่งข้อมูลสองสามแหล่งลงใน RStudio บน SageMaker ก่อน จากนั้นเราได้เห็นว่าเราสามารถประมวลผลข้อมูลที่นำเข้าในรูปแบบ XPT ได้อย่างไร แปลงเป็นเฟรมข้อมูล R เพื่อสร้าง SDTM, AdaM และ TLF จากนั้นอัปโหลดผลลัพธ์ไปยังบัคเก็ต S3 ในที่สุด

เราหวังว่าด้วยแนวคิดกว้างๆ ที่วางไว้ในโพสต์ โปรแกรมเมอร์เชิงสถิติและนักชีวสถิติสามารถเห็นภาพกระบวนการโหลด ประมวลผล และวิเคราะห์ข้อมูลการวิจัยการทดลองทางคลินิกใน RStudio บน SageMaker แบบ end-to-end ได้อย่างง่ายดาย และใช้การเรียนรู้เพื่อกำหนดแบบกำหนดเอง ขั้นตอนการทำงานที่เหมาะสมสำหรับการส่งตามกฎระเบียบของคุณ

คุณนึกถึงแอปพลิเคชันอื่นๆ ของการใช้ RStudio เพื่อช่วยนักวิจัย นักสถิติ และโปรแกรมเมอร์ R เพื่อทำให้ชีวิตของพวกเขาง่ายขึ้นหรือไม่ เราชอบที่จะได้ยินเกี่ยวกับความคิดของคุณ! และหากคุณมีคำถามใด ๆ โปรดแบ่งปันในส่วนความเห็น

แหล่งข้อมูล

สำหรับข้อมูลเพิ่มเติม โปรดไปที่ลิงก์ต่อไปนี้:


เกี่ยวกับผู้แต่ง

ใช้ RStudio บน Amazon SageMaker เพื่อสร้างการส่งตามข้อบังคับสำหรับอุตสาหกรรมวิทยาศาสตร์ชีวภาพ PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.โรหิต บางก้า เป็นผู้เชี่ยวชาญด้านอุตสาหกรรมการพัฒนาทางคลินิกระดับโลก ซึ่งประจำอยู่ที่ลอนดอน สหราชอาณาจักร เขาเป็นนักชีวสถิติโดยการฝึกอบรมและช่วยเหลือลูกค้าด้านการดูแลสุขภาพและวิทยาศาสตร์ชีวภาพปรับใช้โซลูชันการพัฒนาทางคลินิกที่เป็นนวัตกรรมบน AWS เขามีความหลงใหลเกี่ยวกับวิธีการใช้วิทยาศาสตร์ข้อมูล, AI/ML และเทคโนโลยีเกิดใหม่เพื่อแก้ไขปัญหาทางธุรกิจที่แท้จริงภายในอุตสาหกรรมการดูแลสุขภาพและวิทยาศาสตร์ชีวภาพ ในเวลาว่าง Rohit สนุกกับการเล่นสกี ทำบาร์บีคิว และใช้เวลากับครอบครัวและเพื่อนฝูง

ใช้ RStudio บน Amazon SageMaker เพื่อสร้างการส่งตามข้อบังคับสำหรับอุตสาหกรรมวิทยาศาสตร์ชีวภาพ PlatoBlockchain Data Intelligence ค้นหาแนวตั้ง AI.จอร์จิออส ชินาส เป็น Specialist Solutions Architect สำหรับ AI/ML ในภูมิภาค EMEA เขาอยู่ในลอนดอนและทำงานอย่างใกล้ชิดกับลูกค้าในสหราชอาณาจักรและไอร์แลนด์ Georgios ช่วยลูกค้าในการออกแบบและปรับใช้แอปพลิเคชันแมชชีนเลิร์นนิงในการผลิตบน AWS โดยมีความสนใจเป็นพิเศษในแนวทางปฏิบัติ MLOps และช่วยให้ลูกค้าสามารถดำเนินการแมชชีนเลิร์นนิงในวงกว้างได้ ในเวลาว่าง เขาสนุกกับการเดินทาง ทำอาหาร และใช้เวลากับเพื่อนและครอบครัว

ประทับเวลา:

เพิ่มเติมจาก AWS Machine Learning AWS