Gunakan RStudio Di Amazon SageMaker Untuk Membuat Pengajuan Peraturan Untuk Industri Ilmu Hayati

Diterbitkan Ulang Oleh Plato

Followers: 0

Perusahaan farmasi yang meminta persetujuan dari badan pengatur seperti Badan Pengawas Obat & Makanan AS (FDA) atau Badan Farmasi dan Alat Kesehatan Jepang (PMDA) untuk menjual obat mereka di pasar harus menyerahkan bukti untuk membuktikan bahwa obat mereka aman dan efektif untuk tujuan yang dimaksudkan. menggunakan. Sebuah tim dokter, ahli statistik, ahli kimia, ahli farmakologi, dan ilmuwan klinis lainnya meninjau data pengajuan uji klinis dan pelabelan yang diusulkan. Jika tinjauan menetapkan bahwa ada bukti statistik yang cukup untuk membuktikan bahwa manfaat kesehatan obat lebih besar daripada risikonya, obat tersebut disetujui untuk dijual.

Paket pengajuan uji klinis terdiri dari data tabulasi, data analisis, metadata uji coba, dan laporan statistik yang terdiri dari tabel statistik, daftar, dan gambar. Dalam kasus FDA AS, dokumen teknis umum elektronik (eCTD) adalah format standar untuk mengajukan aplikasi, amandemen, suplemen, dan laporan ke Pusat Evaluasi dan Penelitian Biologi (CBER) FDA dan Pusat Evaluasi dan Penelitian Obat ( CDER). Untuk FDA dan PMDA Jepang, merupakan persyaratan peraturan untuk mengirimkan data tabulasi dalam Model Tabulasi Data Standar CDISC (SDTM), data analisis dalam Model Dataset Analisis CDISC (ADAM), dan metadata uji coba dalam CDISC Define-XML (berdasarkan Model Data Operasional (ODM)).

Dalam posting ini, kami menunjukkan bagaimana kami dapat menggunakan RStudio di Amazon SageMaker untuk membuat kiriman penyerahan peraturan tersebut. Posting ini menjelaskan proses pengajuan uji klinis, bagaimana kami dapat mencerna data penelitian uji klinis, membuat tabulasi dan menganalisis data, dan kemudian membuat laporan statistik—tabel ringkasan, daftar data, dan angka (TLF). Metode ini dapat memungkinkan pelanggan farmasi untuk terhubung dengan mulus ke data klinis yang disimpan di lingkungan AWS mereka, memprosesnya menggunakan R, dan membantu mempercepat proses penelitian uji klinis.

Proses pengembangan obat

Proses pengembangan obat secara luas dapat dibagi menjadi lima langkah utama, seperti yang diilustrasikan pada gambar berikut.

Dibutuhkan rata-rata 10-15 tahun dan sekitar USD $1–3 miliar untuk satu obat untuk menerima persetujuan yang berhasil dari sekitar 10,000 molekul potensial. Selama fase awal penelitian (fase penemuan obat), kandidat obat yang menjanjikan diidentifikasi, yang bergerak lebih jauh ke penelitian praklinis. Selama fase praklinis, peneliti mencoba untuk mengetahui toksisitas obat dengan melakukan in vitro percobaan di lab dan in vivo percobaan pada hewan. Setelah uji praklinis, obat-obatan bergerak ke tahap penelitian uji klinis, di mana obat tersebut harus diuji pada manusia untuk memastikan keamanan dan kemanjurannya. Para peneliti merancang uji klinis dan merinci rencana studi dalam protokol uji klinis. Mereka mendefinisikan fase penelitian klinis yang berbeda—dari studi Fase 1 kecil untuk menentukan keamanan dan dosis obat, hingga uji coba Fase 2 yang lebih besar untuk menentukan kemanjuran dan efek samping obat, hingga uji coba Fase 3 dan 4 yang lebih besar untuk menentukan kemanjuran, keamanan, dan memantau reaksi yang merugikan. Setelah uji klinis manusia yang berhasil, sponsor obat mengajukan Aplikasi Obat Baru (NDA) untuk memasarkan obat tersebut. Badan pengatur meninjau semua data, bekerja dengan sponsor pada informasi pelabelan resep, dan menyetujui obat. Setelah persetujuan obat, badan pengatur meninjau laporan keamanan pasca-pasar untuk memastikan keamanan produk yang lengkap.

Pada tahun 1997, Clinical Data Interchange Standards Consortium (CDISC), sebuah organisasi nirlaba global yang terdiri dari perusahaan farmasi, CRO, biotek, lembaga akademik, penyedia layanan kesehatan, dan lembaga pemerintah, dimulai sebagai kelompok sukarelawan. CDISC telah menerbitkan standar data untuk merampingkan aliran data dari pengumpulan hingga pengiriman, dan memfasilitasi pertukaran data antara mitra dan penyedia. CDISC telah menerbitkan standar berikut:

CDASH (Harmonisasi Standar Akuisisi Data Klinis) – Standar untuk data yang dikumpulkan
SDTM (Model Tabulasi Data Studi) – Standar untuk mengirimkan data yang ditabulasi
ADaM (Model Analisis Data) – Standar untuk analisis data
KIRIM (Standar untuk Pertukaran Data Nonklinis) – Standar untuk data nonklinis
PRM (Model Representasi Protokol) – Standar untuk protokol

Standar ini dapat membantu peninjau terlatih menganalisis data dengan lebih efektif dan cepat menggunakan alat standar, sehingga mengurangi waktu persetujuan obat. Ini adalah persyaratan peraturan dari FDA AS dan PMDA Jepang untuk mengirimkan semua data yang ditabulasi menggunakan format SDTM.

R untuk pengiriman penelitian uji klinis

SAS dan R adalah dua perangkat lunak analisis statistik yang paling banyak digunakan dalam industri farmasi. Ketika pengembangan standar SDTM dimulai oleh CDISC, SAS hampir digunakan secara universal di industri farmasi dan di FDA. Namun, R mendapatkan popularitas yang luar biasa saat ini karena bersifat open source, dan paket serta pustaka baru terus ditambahkan. Siswa terutama menggunakan R selama akademik dan penelitian mereka, dan mereka mengambil keakraban dengan R untuk pekerjaan mereka. R juga menawarkan dukungan untuk teknologi baru seperti integrasi pembelajaran mendalam yang canggih.

Penyedia cloud seperti AWS kini telah menjadi platform pilihan bagi pelanggan farmasi untuk menghosting infrastruktur mereka. AWS juga menyediakan layanan terkelola seperti SageMaker, yang memudahkan pembuatan, pelatihan, dan penerapan model pembelajaran mesin (ML) di cloud. SageMaker juga memungkinkan akses ke RStudio IDE dari mana saja melalui browser web. Posting ini merinci bagaimana pemrogram statistik dan ahli biostatistik dapat mencerna data klinis mereka ke dalam lingkungan R, bagaimana kode R dapat dijalankan, dan bagaimana hasilnya disimpan. Kami menyediakan cuplikan kode yang memungkinkan ilmuwan data uji klinis menyerap file XPT ke dalam lingkungan R, membuat bingkai data R untuk SDTM dan ADaM, dan terakhir membuat TLF yang dapat disimpan dalam Layanan Penyimpanan Sederhana Amazon (Amazon S3) ember penyimpanan objek.

RStudio di SageMaker

Pada 2 November 2021, AWS bekerja sama dengan RStudio PBC mengumumkan ketersediaan umum RStudio di SageMaker, RStudio Workbench IDE pertama yang dikelola sepenuhnya di industri di cloud. Sekarang Anda dapat membawa lisensi RStudio Anda saat ini untuk dengan mudah memigrasikan lingkungan RStudio yang Anda kelola sendiri ke SageMaker hanya dalam beberapa langkah sederhana. Untuk mempelajari lebih lanjut tentang kolaborasi menarik ini, lihat Mengumumkan RStudio di Amazon SageMaker.

Bersama dengan RStudio Workbench, suite RStudio untuk pengembang R juga menawarkan RStudio Connect dan RStudio Package Manager. RStudio Connect dirancang untuk memungkinkan ilmuwan data mempublikasikan wawasan, dasbor, dan aplikasi web. Ini memudahkan untuk berbagi wawasan ML dan ilmu data dari pekerjaan rumit ilmuwan data dan menyerahkannya ke tangan pembuat keputusan. RStudio Connect juga membuat hosting dan pengelolaan konten menjadi sederhana dan skalabel untuk konsumsi luas.

Ikhtisar solusi

Di bagian berikut, kita membahas bagaimana kita bisa mengimpor data mentah dari repositori jarak jauh atau bucket S3 di RStudio di SageMaker. Ini juga memungkinkan untuk terhubung langsung ke Layanan Database Relasional Amazon (Amazon RDS) dan gudang data seperti Pergeseran Merah Amazon (Lihat Menghubungkan R dengan Amazon Redshift) langsung dari RStudio; namun, ini di luar cakupan posting ini. Setelah data diserap dari beberapa sumber berbeda, kami memprosesnya dan membuat R bingkai data untuk sebuah tabel. Kemudian kami mengonversi bingkai data tabel menjadi file RTF dan menyimpan hasilnya kembali dalam ember S3. Keluaran ini kemudian berpotensi digunakan untuk tujuan pengiriman peraturan, asalkan paket R yang digunakan di pos telah divalidasi untuk digunakan untuk pengiriman peraturan oleh pelanggan.

Siapkan RStudio di SageMaker

Untuk instruksi tentang pengaturan RStudio di SageMaker di lingkungan Anda, lihat Mulai dengan RStudio di SageMaker. Pastikan peran eksekusi RStudio di SageMaker memiliki akses untuk mengunduh dan mengunggah data ke bucket S3 tempat data disimpan. Untuk mempelajari lebih lanjut tentang cara mengelola paket R dan mempublikasikan analisis Anda menggunakan RStudio di SageMaker, lihat Mengumumkan RStudio Terkelola Sepenuhnya di SageMaker untuk Ilmuwan Data.

Serap data ke RStudio

Pada langkah ini, kami menyerap data dari berbagai sumber agar tersedia untuk sesi R kami. Kami mengimpor data dalam format SAS XPT; namun, prosesnya serupa jika Anda ingin menyerap data dalam format lain. Salah satu keuntungan menggunakan RStudio di SageMaker adalah jika data sumber disimpan di akun AWS Anda, maka SageMaker dapat mengakses data secara native menggunakan Identitas AWS dan Manajemen Akses (IAM).

Akses data yang disimpan dalam repositori jarak jauh

Pada langkah ini, kami mengimpor data ADaM dari Repositori GitHub FDA. Kami membuat direktori lokal yang disebut data di lingkungan RStudio untuk menyimpan data dan mengunduh data demografi (dm.xpt) dari repositori jarak jauh. Dalam konteks ini, direktori lokal merujuk ke direktori yang dibuat di penyimpanan Amazon EFS pribadi Anda yang dilampirkan secara default ke lingkungan sesi R Anda. Lihat kode berikut:

######################################################
# Step 1.1 – Ingest Data from Remote Data Repository #
######################################################

# Remote Data Path 
raw_data_url = “https://github.com/FDA/PKView/raw/master/Installation%20Package/OCP/data/clinical/DRUG000/0000/m5/datasets/test001/tabulations/sdtm”
raw_data_name = “dm.xpt”

#Create Local Directory to store downloaded files
dir.create(“data”)
local_file_location <- paste0(getwd(),”/data/”)
download.file(raw_data_url, paste0(local_file_location,raw_data_name))

Ketika langkah ini selesai, Anda dapat melihat dm.xpt sedang diunduh dengan menavigasi ke File, data, dm.xpt.

Mengakses data yang disimpan di Amazon S3

Pada langkah ini, kami mengunduh data yang disimpan dalam ember S3 di akun kami. Kami telah menyalin konten dari repositori GitHub FDA ke bucket S3 bernama aws-sagemaker-rstudio untuk contoh ini. Lihat kode berikut:

#####################################################
# Step 1.2 - Ingest Data from S3 Bucket             #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()

s3_bucket = "aws-sagemaker-rstudio"
s3_key = "DRUG000/test001/tabulations/sdtm/pp.xpt"

session$download_data(local_file_location, s3_bucket, s3_key)

Ketika langkah selesai, Anda dapat melihat pp.xpt sedang diunduh dengan menavigasi ke File, data, hal.xpt.

Memproses data XPT

Sekarang kita memiliki file SAS XPT yang tersedia di lingkungan R, kita perlu mengubahnya menjadi bingkai data R dan memprosesnya. Kami menggunakan haven perpustakaan untuk membaca file XPT. Kami menggabungkan kumpulan data CDISC SDTM dm dan pp untuk membuat kumpulan data ADPP. Kemudian kami membuat tabel statistik ringkasan menggunakan bingkai data ADPP. Tabel ringkasan kemudian diekspor dalam format RTF.

Pertama, file XPT dibaca menggunakan read_xpt fungsi perpustakaan surga. Kemudian dataset analisis dibuat menggunakan sqldf fungsi dari sqldf Perpustakaan. Lihat kode berikut:

########################################################
# Step 2.1 - Read XPT files. Create Analysis dataset.  #
########################################################

library(haven)
library(sqldf)


# Read XPT Files, convert them to R data frame
dm = read_xpt("data/dm.xpt")
pp = read_xpt("data/pp.xpt")

# Create ADaM dataset
adpp = sqldf("select a.USUBJID
                    ,a.PPCAT as ACAT
                    ,a.PPTESTCD
                    ,a.PPTEST
                    ,a.PPDTC
                    ,a.PPSTRESN as AVAL
                    ,a.VISIT as AVISIT
                    ,a.VISITNUM as AVISITN
                    ,b.sex
                from pp a 
           left join dm b 
                  on a.usubjid = b.usubjid
             ")

Kemudian, bingkai data keluaran dibuat menggunakan fungsi dari Tplyr dan dplyr perpustakaan:

########################################################
# Step 2.2 - Create output table                       #
########################################################

library(Tplyr)
library(dplyr)

t = tplyr_table(adpp, SEX) %>% 
  add_layer(
    group_desc(AVAL, by = "Area under the concentration-time curve", where= PPTESTCD=="AUC") %>% 
      set_format_strings(
        "n"        = f_str("xx", n),
        "Mean (SD)"= f_str("xx.x (xx.xx)", mean, sd),
        "Median"   = f_str("xx.x", median),
        "Q1, Q3"   = f_str("xx, xx", q1, q3),
        "Min, Max" = f_str("xx, xx", min, max),
        "Missing"  = f_str("xx", missing)
      )
  )  %>% 
  build()

output = t %>% 
  rename(Variable = row_label1,Statistic = row_label2,Female =var1_F, Male = var1_M) %>% 
  select(Variable,Statistic,Female, Male)

Bingkai data keluaran kemudian disimpan sebagai file RTF di folder keluaran di lingkungan RStudio:

#####################################################
# Step 3 - Save the Results as RTF                  #
#####################################################
library(rtf)

dir.create("output")
rtf = RTF("output/tab_adpp.rtf")  
addHeader(rtf,title="Section 1 - Tables", subtitle="This Section contains all tables")
addParagraph(rtf, "Table 1 - Pharmacokinetic Parameters by Sex:n")
addTable(rtf, output)
done(rtf)

Unggah keluaran ke Amazon S3

Setelah output dihasilkan, kami memasukkan data kembali ke dalam ember S3. Kita dapat mencapai ini dengan membuat sesi SageMaker lagi, jika sesi belum aktif, dan mengunggah konten folder output ke bucket S3 menggunakan session$upload_data fungsi:

#####################################################
# Step 4 - Upload outputs to S3                     #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()
s3_bucket = "aws-sagemaker-rstudio"
output_location = "output/"
s3_folder_name = "output"
session$upload_data(output_location, s3_bucket, s3_folder_name)

Dengan langkah-langkah ini, kami telah menyerap data, memprosesnya, dan mengunggah hasilnya agar tersedia untuk diserahkan kepada otoritas pengatur.

Membersihkan

Untuk menghindari timbulnya biaya yang tidak diinginkan, Anda harus keluar dari sesi Anda saat ini. Di sudut kanan atas halaman, pilih ikon daya. Ini akan secara otomatis menghentikan instans yang mendasarinya dan oleh karena itu berhenti menimbulkan biaya komputasi yang tidak diinginkan.

Tantangan

Postingan tersebut telah menguraikan langkah-langkah untuk menyerap data mentah yang disimpan dalam bucket S3 atau dari repositori jarak jauh. Namun, ada banyak sumber data mentah lain untuk uji klinis, terutama data eCRF (bentuk laporan kasus elektronik) yang disimpan dalam sistem EDC (pengambilan data elektronik) seperti Oracle Clinical, Medidata Rave, OpenClinica, atau Snowflake; data laboratorium; data dari eCOA (penilaian hasil klinis) dan ePRO (Electronic Patient-Reported Outcomes); data dunia nyata dari aplikasi dan perangkat medis; dan catatan kesehatan elektronik (EHRs) di rumah sakit. Pra-pemrosesan yang signifikan terlibat sebelum data ini dapat digunakan untuk pengajuan peraturan. Membangun konektor ke berbagai sumber data dan mengumpulkannya dalam repositori data terpusat (CDR) atau data lake klinis, sambil mempertahankan kontrol akses yang tepat, menimbulkan tantangan yang signifikan.

Tantangan utama lainnya yang harus diatasi adalah kepatuhan terhadap peraturan. Sistem komputer yang digunakan untuk membuat keluaran pengajuan peraturan harus mematuhi peraturan yang sesuai, seperti 21 CFR Bagian 11, HIPAA, GDPR, atau persyaratan GxP atau pedoman ICH lainnya. Ini berarti bekerja di lingkungan yang divalidasi dan memenuhi syarat dengan kontrol untuk akses, keamanan, pencadangan, dan kemampuan audit di tempat. Ini juga berarti bahwa setiap paket R yang digunakan untuk membuat keluaran penyerahan peraturan harus divalidasi sebelum digunakan.

Kesimpulan

Dalam posting ini, kami melihat bahwa beberapa kiriman utama untuk pengiriman eCTD adalah CDISC SDTM, dataset ADaM, dan TLF. Posting ini menguraikan langkah-langkah yang diperlukan untuk membuat kiriman pengiriman peraturan ini dengan terlebih dahulu menyerap data dari beberapa sumber ke RStudio di SageMaker. Kami kemudian melihat bagaimana kami dapat memproses data yang diserap dalam format XPT; mengubahnya menjadi bingkai data R untuk membuat SDTM, ADaM, dan TLF; dan akhirnya mengunggah hasilnya ke ember S3.

Kami berharap bahwa dengan ide-ide luas yang tercantum dalam posting, pemrogram statistik dan ahli biostatistik dapat dengan mudah memvisualisasikan proses ujung-ke-ujung pemuatan, pemrosesan, dan analisis data penelitian uji klinis ke RStudio di SageMaker dan menggunakan pembelajaran untuk menentukan kebiasaan alur kerja yang cocok untuk pengajuan peraturan Anda.

Dapatkah Anda memikirkan aplikasi lain menggunakan RStudio untuk membantu peneliti, ahli statistik, dan pemrogram R membuat hidup mereka lebih mudah? Kami akan senang mendengar tentang ide-ide Anda! Dan jika Anda memiliki pertanyaan, silakan bagikan di bagian komentar.

Sumber

Untuk informasi lebih lanjut, kunjungi tautan berikut:

Tentang penulis

Rohit Banga adalah Spesialis Industri Pengembangan Klinis Global yang berbasis di London, Inggris. Dia adalah ahli biostatistik dengan melatih dan membantu pelanggan Healthcare dan LifeScience menerapkan solusi pengembangan klinis inovatif di AWS. Dia bersemangat tentang bagaimana ilmu data, AI/ML, dan teknologi yang muncul dapat digunakan untuk memecahkan masalah bisnis nyata dalam industri Kesehatan dan LifeScience. Di waktu luangnya, Rohit menikmati bermain ski, BBQing, dan menghabiskan waktu bersama keluarga dan teman.

Gunakan RStudio di Amazon SageMaker untuk membuat pengiriman peraturan untuk industri ilmu hayati PlatoBlockchain Data Intelligence. Pencarian Vertikal. Ai. Georgios Schinas adalah Arsitek Solusi Spesialis untuk AI/ML di wilayah EMEA. Dia berbasis di London dan bekerja sama dengan pelanggan di Inggris dan Irlandia. Georgios membantu pelanggan merancang dan menerapkan aplikasi pembelajaran mesin dalam produksi di AWS dengan minat khusus pada praktik MLOps dan memungkinkan pelanggan melakukan pembelajaran mesin dalam skala besar. Di waktu luangnya, ia senang bepergian, memasak, dan menghabiskan waktu bersama teman dan keluarga.

Stempel Waktu: September 20, 2022September 21, 2022

Stempel Waktu: November 8, 2022

Gunakan RStudio di Amazon SageMaker untuk membuat pengiriman peraturan untuk industri ilmu hayati

Diterbitkan Ulang Oleh Plato

Proses pengembangan obat

R untuk pengiriman penelitian uji klinis

RStudio di SageMaker

Ikhtisar solusi

Siapkan RStudio di SageMaker

Serap data ke RStudio

Akses data yang disimpan dalam repositori jarak jauh

Mengakses data yang disimpan di Amazon S3

Memproses data XPT

Unggah keluaran ke Amazon S3

Membersihkan

Tantangan

Kesimpulan

Sumber

Tentang penulis

Lebih dari Pembelajaran Mesin AWS

Mengotomatiskan klasifikasi permintaan layanan TI dengan pengklasifikasi khusus Amazon Comprehend

Gunakan Amazon Lex untuk menangkap alamat jalan

“ID + Selfie” – Meningkatkan verifikasi identitas digital menggunakan AWS

Tentang Kami

Pencarian Vertikal & Ai

Platform

Tetap Berhubung

Akun