Χρησιμοποιήστε το RStudio στο Amazon SageMaker για να δημιουργήσετε ρυθμιστικές υποβολές για τη βιομηχανία βιοεπιστημών PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Χρησιμοποιήστε το RStudio στο Amazon SageMaker για να δημιουργήσετε ρυθμιστικές υποβολές για τον κλάδο των βιοεπιστημών

Οι φαρμακευτικές εταιρείες που ζητούν έγκριση από ρυθμιστικούς οργανισμούς όπως ο Οργανισμός Τροφίμων και Φαρμάκων των ΗΠΑ (FDA) ή ο Ιαπωνικός Οργανισμός Φαρμάκων και Ιατρικών Συσκευών (PMDA) για να πουλήσουν τα φάρμακά τους στην αγορά πρέπει να υποβάλουν στοιχεία που να αποδεικνύουν ότι το φάρμακό τους είναι ασφαλές και αποτελεσματικό για τον προορισμό του χρήση. Μια ομάδα ιατρών, στατιστικολόγων, χημικών, φαρμακολόγων και άλλων κλινικών επιστημόνων εξετάζει τα δεδομένα υποβολής κλινικών δοκιμών και την προτεινόμενη επισήμανση. Εάν η ανασκόπηση αποδείξει ότι υπάρχουν επαρκή στατιστικά στοιχεία που να αποδεικνύουν ότι τα οφέλη για την υγεία του φαρμάκου υπερτερούν των κινδύνων, το φάρμακο εγκρίνεται προς πώληση.

Το πακέτο υποβολής κλινικών δοκιμών αποτελείται από πινακοποιημένα δεδομένα, δεδομένα ανάλυσης, μεταδεδομένα δοκιμών και στατιστικές αναφορές που αποτελούνται από στατιστικούς πίνακες, καταλόγους και αριθμούς. Στην περίπτωση του FDA των ΗΠΑ, το ηλεκτρονικό κοινό τεχνικό έγγραφο (eCTD) είναι η τυπική μορφή για την υποβολή αιτήσεων, τροποποιήσεων, συμπληρωμάτων και αναφορών στο Κέντρο Βιολογικών Αξιολόγησης και Έρευνας (CBER) και στο Κέντρο Αξιολόγησης και Έρευνας Φαρμάκων του FDA ( CDER). Για τον FDA και το ιαπωνικό PMDA, είναι ρυθμιστική απαίτηση να υποβάλλονται πινακοποιημένα δεδομένα στο πρότυπο CDISC Data Tabulation Model (SDTM), δεδομένα ανάλυσης στο μοντέλο συνόλου δεδομένων ανάλυσης CDISC (ADaM) και μεταδεδομένα δοκιμής στο CDISC Define-XML (με βάση το μοντέλο λειτουργικών δεδομένων (ODM)).

Σε αυτήν την ανάρτηση, δείχνουμε πώς μπορούμε να χρησιμοποιήσουμε το RStudio Amazon Sage Maker για τη δημιουργία τέτοιων παραδοτέων ρυθμιστικής υποβολής. Αυτή η ανάρτηση περιγράφει τη διαδικασία υποβολής κλινικών δοκιμών, πώς μπορούμε να λαμβάνουμε δεδομένα έρευνας κλινικών δοκιμών, να συντάσσουμε και να αναλύουμε τα δεδομένα και, στη συνέχεια, να δημιουργούμε στατιστικές αναφορές — συνοπτικούς πίνακες, λίστες δεδομένων και ψηφία (TLF). Αυτή η μέθοδος μπορεί να επιτρέψει στους πελάτες φαρμακευτικών προϊόντων να συνδέονται απρόσκοπτα με κλινικά δεδομένα που είναι αποθηκευμένα στο περιβάλλον AWS τους, να τα επεξεργάζονται χρησιμοποιώντας το R και να επιταχύνουν τη διαδικασία έρευνας των κλινικών δοκιμών.

Διαδικασία ανάπτυξης φαρμάκων

Η διαδικασία ανάπτυξης φαρμάκων μπορεί γενικά να χωριστεί σε πέντε βασικά βήματα, όπως φαίνεται στο παρακάτω σχήμα.

Χρειάζονται κατά μέσο όρο 10-15 χρόνια και περίπου 1-3 δισεκατομμύρια δολάρια για ένα φάρμακο για να λάβει επιτυχή έγκριση από περίπου 10,000 πιθανά μόρια. Κατά τις πρώτες φάσεις της έρευνας (η φάση της ανακάλυψης φαρμάκων), εντοπίζονται πολλά υποσχόμενα φάρμακα, τα οποία προχωρούν περαιτέρω στην προκλινική έρευνα. Κατά τη διάρκεια της προκλινικής φάσης, οι ερευνητές προσπαθούν να ανακαλύψουν την τοξικότητα του φαρμάκου κάνοντας εκτέλεση in vitro πειράματα στο εργαστήριο και ίη νίνο πειράματα σε ζώα. Μετά τις προκλινικές δοκιμές, τα φάρμακα περνούν στη φάση της έρευνας των κλινικών δοκιμών, όπου πρέπει να δοκιμαστούν σε ανθρώπους για να εξακριβωθεί η ασφάλεια και η αποτελεσματικότητά τους. Οι ερευνητές σχεδιάζουν κλινικές δοκιμές και περιγράφουν λεπτομερώς το σχέδιο μελέτης στο πρωτόκολλο κλινικών δοκιμών. Καθορίζουν τις διαφορετικές φάσεις κλινικής έρευνας — από μικρές μελέτες Φάσης 1 για τον προσδιορισμό της ασφάλειας και της δοσολογίας του φαρμάκου, έως τις μεγαλύτερες δοκιμές Φάσης 2 για τον προσδιορισμό της αποτελεσματικότητας και των παρενεργειών του φαρμάκου, έως ακόμη μεγαλύτερες δοκιμές Φάσης 3 και 4 για τον προσδιορισμό της αποτελεσματικότητας, της ασφάλειας και των φαρμάκων και παρακολούθηση ανεπιθύμητων ενεργειών. Μετά από επιτυχείς κλινικές δοκιμές σε ανθρώπους, ο χορηγός φαρμάκου υποβάλλει μια νέα αίτηση φαρμάκου (NDA) για την εμπορία του φαρμάκου. Οι ρυθμιστικοί φορείς εξετάζουν όλα τα δεδομένα, συνεργάζονται με τον χορηγό σχετικά με τις πληροφορίες επισήμανσης συνταγών και εγκρίνουν το φάρμακο. Μετά την έγκριση του φαρμάκου, οι ρυθμιστικοί φορείς εξετάζουν τις αναφορές ασφάλειας μετά την κυκλοφορία για να διασφαλίσουν την πλήρη ασφάλεια του προϊόντος.

Το 1997, το Clinical Data Interchange Standards Consortium (CDISC), ένας παγκόσμιος, μη κερδοσκοπικός οργανισμός που αποτελείται από φαρμακευτικές εταιρείες, CROs, βιοτεχνολογία, ακαδημαϊκά ιδρύματα, παρόχους υγειονομικής περίθαλψης και κυβερνητικούς φορείς, ξεκίνησε ως εθελοντική ομάδα. Το CDISC έχει δημοσιεύσει πρότυπα δεδομένων για τον εξορθολογισμό της ροής δεδομένων από τη συλλογή έως τις υποβολές και τη διευκόλυνση της ανταλλαγής δεδομένων μεταξύ συνεργατών και παρόχων. Η CDISC έχει δημοσιεύσει τα ακόλουθα πρότυπα:

  • CDASH (Εναρμόνιση προτύπων απόκτησης κλινικών δεδομένων) – Πρότυπα για συλλεγόμενα δεδομένα
  • SDTM (Μοντέλο Πίνακα Δεδομένων Μελέτης) – Πρότυπα για την υποβολή πινακοποιημένων δεδομένων
  • ADaM (Μοντέλο ανάλυσης δεδομένων) – Πρότυπα για δεδομένα ανάλυσης
  • ΑΠΟΣΤΟΛΗ (Πρότυπο για την ανταλλαγή μη κλινικών δεδομένων) – Πρότυπα για μη κλινικά δεδομένα
  • PRM (Μοντέλο αναπαράστασης πρωτοκόλλου) – Πρότυπα για πρωτόκολλο

Αυτά τα πρότυπα μπορούν να βοηθήσουν τους εκπαιδευμένους αναθεωρητές να αναλύσουν τα δεδομένα πιο αποτελεσματικά και γρήγορα χρησιμοποιώντας τυπικά εργαλεία, μειώνοντας έτσι τους χρόνους έγκρισης φαρμάκων. Είναι μια κανονιστική απαίτηση από τον FDA των ΗΠΑ και το ιαπωνικό PMDA να υποβάλουν όλα τα δεδομένα σε πίνακα χρησιμοποιώντας τη μορφή SDTM.

R για υποβολές έρευνας κλινικών δοκιμών

Το SAS και το R είναι δύο από τα πιο χρησιμοποιούμενα λογισμικά στατιστικής ανάλυσης που χρησιμοποιούνται στη φαρμακευτική βιομηχανία. Όταν ξεκίνησε η ανάπτυξη των προτύπων SDTM από την CDISC, η SAS ήταν σχεδόν καθολική χρήση στη φαρμακευτική βιομηχανία και στον FDA. Ωστόσο, το R κερδίζει τεράστια δημοτικότητα στις μέρες μας επειδή είναι ανοιχτού κώδικα και προστίθενται συνεχώς νέα πακέτα και βιβλιοθήκες. Οι σπουδαστές χρησιμοποιούν κυρίως το R κατά τη διάρκεια των ακαδημαϊκών και της έρευνάς τους και χρησιμοποιούν αυτή την εξοικείωση με το R στις δουλειές τους. Το R προσφέρει επίσης υποστήριξη για αναδυόμενες τεχνολογίες, όπως προηγμένες ενσωματώσεις βαθιάς μάθησης.

Οι πάροχοι cloud όπως το AWS έχουν γίνει πλέον η πλατφόρμα επιλογής για τους πελάτες φαρμακευτικών προϊόντων για να φιλοξενήσουν την υποδομή τους. Το AWS παρέχει επίσης διαχειριζόμενες υπηρεσίες όπως το SageMaker, το οποίο καθιστά εύκολη τη δημιουργία, την εκπαίδευση και την ανάπτυξη μοντέλων μηχανικής εκμάθησης (ML) στο cloud. Το SageMaker επιτρέπει επίσης την πρόσβαση στο RStudio IDE από οπουδήποτε μέσω ενός προγράμματος περιήγησης ιστού. Αυτή η ανάρτηση περιγράφει λεπτομερώς τον τρόπο με τον οποίο οι στατιστικοί προγραμματιστές και οι βιοστατιστικοί μπορούν να απορροφήσουν τα κλινικά τους δεδομένα στο περιβάλλον R, πώς μπορεί να εκτελεστεί ο κώδικας R και πώς αποθηκεύονται τα αποτελέσματα. Παρέχουμε αποσπάσματα κώδικα που επιτρέπουν στους επιστήμονες δεδομένων κλινικών δοκιμών να απορροφούν αρχεία XPT στο περιβάλλον R, να δημιουργούν πλαίσια δεδομένων R για SDTM και ADaM και τέλος να δημιουργούν TLF που μπορεί να αποθηκευτεί σε Απλή υπηρεσία αποθήκευσης Amazon Κάδος αποθήκευσης αντικειμένων (Amazon S3).

RStudio στο SageMaker

Στις 2 Νοεμβρίου 2021, η AWS σε συνεργασία με RStudio PBC ανακοίνωσε τη γενική διαθεσιμότητα RStudio στο SageMaker, το πρώτο πλήρως διαχειριζόμενο RStudio Workbench IDE του κλάδου στο cloud. Τώρα μπορείτε να φέρετε την τρέχουσα άδεια RStudio για να μεταφέρετε εύκολα τα αυτοδιαχειριζόμενα περιβάλλοντα RStudio σας στο SageMaker με λίγα μόνο απλά βήματα. Για να μάθετε περισσότερα για αυτή τη συναρπαστική συνεργασία, ρίξτε μια ματιά Ανακοινώνουμε το RStudio στο Amazon SageMaker.

Μαζί με τον πάγκο εργασίας RStudio, η σουίτα RStudio για προγραμματιστές R προσφέρει επίσης RStudio Connect και RStudio Package Manager. Το RStudio Connect έχει σχεδιαστεί για να επιτρέπει στους επιστήμονες δεδομένων να δημοσιεύουν πληροφορίες, πίνακες εργαλείων και εφαρμογές ιστού. Διευκολύνει την κοινή χρήση γνώσεων σχετικά με την ML και την επιστήμη των δεδομένων από την περίπλοκη εργασία των επιστημόνων δεδομένων και την ανάθεση της στα χέρια των υπευθύνων λήψης αποφάσεων. Το RStudio Connect κάνει επίσης τη φιλοξενία και τη διαχείριση περιεχομένου απλή και επεκτάσιμη για ευρεία κατανάλωση.

Επισκόπηση λύσεων

Στις επόμενες ενότητες, συζητάμε πώς μπορούμε να εισάγουμε ακατέργαστα δεδομένα από ένα απομακρυσμένο αποθετήριο ή έναν κάδο S3 στο RStudio στο SageMaker. Είναι επίσης δυνατή η απευθείας σύνδεση με Υπηρεσία σχεσιακής βάσης δεδομένων Amazon (Amazon RDS) και αποθήκες δεδομένων όπως Amazon RedShift (Βλ. Σύνδεση R με το Amazon Redshift) απευθείας από το RStudio. Ωστόσο, αυτό είναι εκτός του πεδίου εφαρμογής αυτής της ανάρτησης. Αφού ληφθούν δεδομένα από μερικές διαφορετικές πηγές, τα επεξεργαζόμαστε και δημιουργούμε πλαίσια δεδομένων R για έναν πίνακα. Στη συνέχεια, μετατρέπουμε το πλαίσιο δεδομένων πίνακα σε αρχείο RTF και αποθηκεύουμε τα αποτελέσματα σε έναν κάδο S3. Αυτά τα αποτελέσματα μπορούν στη συνέχεια να χρησιμοποιηθούν για σκοπούς υποβολής κανονιστικών ρυθμίσεων, υπό την προϋπόθεση ότι τα πακέτα R που χρησιμοποιούνται στην ανάρτηση έχουν επικυρωθεί για χρήση για ρυθμιστικές υποβολές από τον πελάτη.

Ρυθμίστε το RStudio στο SageMaker

Για οδηγίες σχετικά με τη ρύθμιση του RStudio στο SageMaker στο περιβάλλον σας, ανατρέξτε στο Ξεκινήστε με το RStudio στο SageMaker. Βεβαιωθείτε ότι ο ρόλος εκτέλεσης του RStudio στο SageMaker έχει πρόσβαση για λήψη και αποστολή δεδομένων στον κάδο S3 στον οποίο αποθηκεύονται τα δεδομένα. Για να μάθετε περισσότερα σχετικά με τον τρόπο διαχείρισης πακέτων R και δημοσίευσης της ανάλυσής σας χρησιμοποιώντας το RStudio στο SageMaker, ανατρέξτε στο Ανακοινώνουμε το πλήρως διαχειριζόμενο RStudio στο SageMaker για Επιστήμονες Δεδομένων.

Απορρόφηση δεδομένων στο RStudio

Σε αυτό το βήμα, λαμβάνουμε δεδομένα από διάφορες πηγές για να τα κάνουμε διαθέσιμα για την περίοδο R. Εισάγουμε δεδομένα σε μορφή SAS XPT. Ωστόσο, η διαδικασία είναι παρόμοια εάν θέλετε να απορροφήσετε δεδομένα σε άλλες μορφές. Ένα από τα πλεονεκτήματα της χρήσης του RStudio στο SageMaker είναι ότι εάν τα δεδομένα προέλευσης είναι αποθηκευμένα στους λογαριασμούς σας AWS, τότε το SageMaker μπορεί να έχει εγγενή πρόσβαση στα δεδομένα χρησιμοποιώντας Διαχείριση ταυτότητας και πρόσβασης AWS (IAM) ρόλοι.

Πρόσβαση σε δεδομένα που είναι αποθηκευμένα σε απομακρυσμένο χώρο αποθήκευσης

Σε αυτό το βήμα, εισάγουμε δεδομένα ADaM από το Αποθετήριο GitHub του FDA. Δημιουργούμε έναν τοπικό κατάλογο που ονομάζεται data στο περιβάλλον RStudio για αποθήκευση των δεδομένων και λήψη δημογραφικών δεδομένων (dm.xpt) από το απομακρυσμένο αποθετήριο. Σε αυτό το πλαίσιο, ο τοπικός κατάλογος αναφέρεται σε έναν κατάλογο που δημιουργήθηκε στον ιδιωτικό αποθηκευτικό χώρο Amazon EFS που είναι συνδεδεμένος από προεπιλογή στο περιβάλλον περιόδου λειτουργίας R. Δείτε τον παρακάτω κώδικα:

######################################################
# Step 1.1 – Ingest Data from Remote Data Repository #
######################################################

# Remote Data Path 
raw_data_url = “https://github.com/FDA/PKView/raw/master/Installation%20Package/OCP/data/clinical/DRUG000/0000/m5/datasets/test001/tabulations/sdtm”
raw_data_name = “dm.xpt”

#Create Local Directory to store downloaded files
dir.create(“data”)
local_file_location <- paste0(getwd(),”/data/”)
download.file(raw_data_url, paste0(local_file_location,raw_data_name))

Όταν ολοκληρωθεί αυτό το βήμα, μπορείτε να δείτε dm.xpt γίνεται λήψη με πλοήγηση σε Αρχεία, ημερομηνία, dm.xpt.

Πρόσβαση σε δεδομένα που είναι αποθηκευμένα στο Amazon S3

Σε αυτό το βήμα, κατεβάζουμε δεδομένα που είναι αποθηκευμένα σε έναν κάδο S3 στον λογαριασμό μας. Έχουμε αντιγράψει περιεχόμενο από το αποθετήριο GitHub της FDA στον κάδο S3 με το όνομα aws-sagemaker-rstudio για αυτό το παράδειγμα. Δείτε τον παρακάτω κώδικα:

#####################################################
# Step 1.2 - Ingest Data from S3 Bucket             #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()

s3_bucket = "aws-sagemaker-rstudio"
s3_key = "DRUG000/test001/tabulations/sdtm/pp.xpt"

session$download_data(local_file_location, s3_bucket, s3_key)

Όταν ολοκληρωθεί το βήμα, μπορείτε να δείτε pp.xpt γίνεται λήψη με πλοήγηση σε Αρχεία, ημερομηνία, σελ.xpt.

Επεξεργασία δεδομένων XPT

Τώρα που έχουμε αρχεία SAS XPT διαθέσιμα στο περιβάλλον R, πρέπει να τα μετατρέψουμε σε πλαίσια δεδομένων R και να τα επεξεργαστούμε. Χρησιμοποιούμε το haven βιβλιοθήκη για την ανάγνωση αρχείων XPT. Συγχωνεύουμε σύνολα δεδομένων CDISC SDTM dm και pp για τη δημιουργία δεδομένων ADPP. Στη συνέχεια, δημιουργούμε έναν συνοπτικό στατιστικό πίνακα χρησιμοποιώντας το πλαίσιο δεδομένων ADPP. Στη συνέχεια, ο συνοπτικός πίνακας εξάγεται σε μορφή RTF.

Αρχικά, τα αρχεία XPT διαβάζονται χρησιμοποιώντας το read_xpt λειτουργία της βιβλιοθήκης του καταφυγίου. Στη συνέχεια δημιουργείται ένα σύνολο δεδομένων ανάλυσης χρησιμοποιώντας το sqldf λειτουργία του sqldf βιβλιοθήκη. Δείτε τον παρακάτω κώδικα:

########################################################
# Step 2.1 - Read XPT files. Create Analysis dataset.  #
########################################################

library(haven)
library(sqldf)


# Read XPT Files, convert them to R data frame
dm = read_xpt("data/dm.xpt")
pp = read_xpt("data/pp.xpt")

# Create ADaM dataset
adpp = sqldf("select a.USUBJID
                    ,a.PPCAT as ACAT
                    ,a.PPTESTCD
                    ,a.PPTEST
                    ,a.PPDTC
                    ,a.PPSTRESN as AVAL
                    ,a.VISIT as AVISIT
                    ,a.VISITNUM as AVISITN
                    ,b.sex
                from pp a 
           left join dm b 
                  on a.usubjid = b.usubjid
             ")

Στη συνέχεια, δημιουργείται ένα πλαίσιο δεδομένων εξόδου χρησιμοποιώντας συναρτήσεις από το Tplyr και dplyr βιβλιοθήκες:

########################################################
# Step 2.2 - Create output table                       #
########################################################

library(Tplyr)
library(dplyr)

t = tplyr_table(adpp, SEX) %>% 
  add_layer(
    group_desc(AVAL, by = "Area under the concentration-time curve", where= PPTESTCD=="AUC") %>% 
      set_format_strings(
        "n"        = f_str("xx", n),
        "Mean (SD)"= f_str("xx.x (xx.xx)", mean, sd),
        "Median"   = f_str("xx.x", median),
        "Q1, Q3"   = f_str("xx, xx", q1, q3),
        "Min, Max" = f_str("xx, xx", min, max),
        "Missing"  = f_str("xx", missing)
      )
  )  %>% 
  build()

output = t %>% 
  rename(Variable = row_label1,Statistic = row_label2,Female =var1_F, Male = var1_M) %>% 
  select(Variable,Statistic,Female, Male)

Στη συνέχεια, το πλαίσιο δεδομένων εξόδου αποθηκεύεται ως αρχείο RTF στο φάκελο εξόδου στο περιβάλλον RStudio:

#####################################################
# Step 3 - Save the Results as RTF                  #
#####################################################
library(rtf)

dir.create("output")
rtf = RTF("output/tab_adpp.rtf")  
addHeader(rtf,title="Section 1 - Tables", subtitle="This Section contains all tables")
addParagraph(rtf, "Table 1 - Pharmacokinetic Parameters by Sex:n")
addTable(rtf, output)
done(rtf)

Ανεβάστε εξόδους στο Amazon S3

Αφού δημιουργηθεί η έξοδος, επανατοποθετούμε τα δεδομένα σε έναν κάδο S3. Μπορούμε να το επιτύχουμε αυτό δημιουργώντας ξανά μια περίοδο λειτουργίας SageMaker, εάν μια περίοδος λειτουργίας δεν είναι ήδη ενεργή, και ανεβάζοντας τα περιεχόμενα του φακέλου εξόδου σε έναν κάδο S3 χρησιμοποιώντας το session$upload_data λειτουργία:

#####################################################
# Step 4 - Upload outputs to S3                     #
#####################################################
library("reticulate")

SageMaker = import('sagemaker')
session <- SageMaker$Session()
s3_bucket = "aws-sagemaker-rstudio"
output_location = "output/"
s3_folder_name = "output"
session$upload_data(output_location, s3_bucket, s3_folder_name)

Με αυτά τα βήματα, απορροφήσαμε δεδομένα, τα επεξεργαστήκαμε και ανεβάσαμε τα αποτελέσματα που θα διατεθούν για υποβολή στις ρυθμιστικές αρχές.

εκκαθάριση

Για να αποφύγετε τυχόν ακούσιες δαπάνες, πρέπει να τερματίσετε την τρέχουσα συνεδρία σας. Στην επάνω δεξιά γωνία της σελίδας, επιλέξτε το εικονίδιο λειτουργίας. Αυτό θα σταματήσει αυτόματα το υποκείμενο στιγμιότυπο και, ως εκ τούτου, θα σταματήσει να υφίσταται τυχόν ακούσιο κόστος υπολογισμού.

Χρησιμοποιήστε το RStudio στο Amazon SageMaker για να δημιουργήσετε ρυθμιστικές υποβολές για τη βιομηχανία βιοεπιστημών PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Προκλήσεις

Η ανάρτηση περιγράφει τα βήματα για την απορρόφηση ακατέργαστων δεδομένων που είναι αποθηκευμένα σε έναν κάδο S3 ή από ένα απομακρυσμένο χώρο αποθήκευσης. Ωστόσο, υπάρχουν πολλές άλλες πηγές ακατέργαστων δεδομένων για μια κλινική δοκιμή, κυρίως δεδομένα eCRF (ηλεκτρονικές φόρμες αναφοράς περιπτώσεων) που είναι αποθηκευμένα σε συστήματα EDC (ηλεκτρονική σύλληψη δεδομένων) όπως Oracle Clinical, Medidata Rave, OpenClinica ή Snowflake. εργαστηριακά δεδομένα· δεδομένα από eCOA (αξιολόγηση κλινικής έκβασης) και ePRO (ηλεκτρονικά αποτελέσματα που αναφέρονται από τον ασθενή). δεδομένα πραγματικού κόσμου από εφαρμογές και ιατρικές συσκευές· και ηλεκτρονικά αρχεία υγείας (ΗΜΥ) στα νοσοκομεία. Απαιτείται σημαντική προεπεξεργασία πριν αυτά τα δεδομένα μπορούν να χρησιμοποιηθούν για ρυθμιστικές υποβολές. Η δημιουργία συνδέσμων σε διάφορες πηγές δεδομένων και η συλλογή τους σε ένα κεντρικό αποθετήριο δεδομένων (CDR) ή μια λίμνη κλινικών δεδομένων, διατηρώντας παράλληλα τους κατάλληλους ελέγχους πρόσβασης, θέτει σημαντικές προκλήσεις.

Μια άλλη βασική πρόκληση που πρέπει να ξεπεραστεί είναι αυτή της κανονιστικής συμμόρφωσης. Το σύστημα υπολογιστή που χρησιμοποιείται για τη δημιουργία ρυθμιστικών αποτελεσμάτων υποβολής πρέπει να συμμορφώνεται με τους κατάλληλους κανονισμούς, όπως το 21 CFR Part 11, HIPAA, GDPR ή οποιεσδήποτε άλλες απαιτήσεις GxP ή οδηγίες ICH. Αυτό μεταφράζεται σε εργασία σε ένα επικυρωμένο και κατάλληλο περιβάλλον με ελέγχους για πρόσβαση, ασφάλεια, δημιουργία αντιγράφων ασφαλείας και δυνατότητα ελέγχου. Αυτό σημαίνει επίσης ότι τυχόν πακέτα R που χρησιμοποιούνται για τη δημιουργία εξόδων ρυθμιστικής υποβολής πρέπει να επικυρωθούν πριν από τη χρήση.

Συμπέρασμα

Σε αυτήν την ανάρτηση, είδαμε ότι μερικά από τα βασικά παραδοτέα για μια υποβολή eCTD ήταν το CDISC SDTM, τα σύνολα δεδομένων ADaM και το TLF. Αυτή η ανάρτηση περιέγραψε τα βήματα που απαιτούνται για τη δημιουργία αυτών των παραδοτέων ρυθμιστικών υποβολών, λαμβάνοντας πρώτα δεδομένα από μερικές πηγές στο RStudio στο SageMaker. Στη συνέχεια είδαμε πώς μπορούμε να επεξεργαστούμε τα δεδομένα που λαμβάνονται σε μορφή XPT. μετατρέψτε το σε πλαίσια δεδομένων R για να δημιουργήσετε SDTM, ADaM και TLF. και στη συνέχεια ανεβάστε τελικά τα αποτελέσματα σε έναν κάδο S3.

Ελπίζουμε ότι με τις ευρείες ιδέες που παρουσιάζονται στην ανάρτηση, οι στατιστικοί προγραμματιστές και οι βιοστατιστικοί μπορούν εύκολα να οπτικοποιήσουν τη διαδικασία φόρτωσης, επεξεργασίας και ανάλυσης ερευνητικών δεδομένων κλινικών δοκιμών στο RStudio στο SageMaker και να χρησιμοποιήσουν τις γνώσεις για να ορίσουν μια προσαρμοσμένη ροή εργασιών κατάλληλη για τις ρυθμιστικές υποβολές σας.

Μπορείτε να σκεφτείτε άλλες εφαρμογές χρήσης του RStudio για να βοηθήσετε ερευνητές, στατιστικολόγους και προγραμματιστές R να κάνουν τη ζωή τους πιο εύκολη; Θα θέλαμε να ακούσουμε για τις ιδέες σας! Και αν έχετε οποιεσδήποτε ερωτήσεις, μοιραστείτε τις στην ενότητα σχολίων.

Υποστηρικτικό υλικό

Για περισσότερες πληροφορίες, επισκεφθείτε τους ακόλουθους συνδέσμους:


Σχετικά με τους συγγραφείς

Χρησιμοποιήστε το RStudio στο Amazon SageMaker για να δημιουργήσετε ρυθμιστικές υποβολές για τη βιομηχανία βιοεπιστημών PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Ροχίτ Μπάνγκα είναι ειδικός στον κλάδο της παγκόσμιας κλινικής ανάπτυξης με έδρα το Λονδίνο, Ηνωμένο Βασίλειο. Εκπαιδεύεται ως βιοστατιστικός και βοηθά τους πελάτες της Healthcare και της LifeScience να αναπτύξουν καινοτόμες λύσεις κλινικής ανάπτυξης στο AWS. Είναι παθιασμένος με το πώς η επιστήμη των δεδομένων, η AI/ML και οι αναδυόμενες τεχνολογίες μπορούν να χρησιμοποιηθούν για την επίλυση πραγματικών επιχειρηματικών προβλημάτων στον κλάδο της Υγείας και της LifeScience. Στον ελεύθερο χρόνο του, ο Rohit του αρέσει να κάνει σκι, να κάνει μπάρμπεκιου και να περνά χρόνο με την οικογένεια και τους φίλους.

Χρησιμοποιήστε το RStudio στο Amazon SageMaker για να δημιουργήσετε ρυθμιστικές υποβολές για τη βιομηχανία βιοεπιστημών PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.Γεώργιος Σχινάς είναι Ειδικός Αρχιτέκτονας Λύσεων για AI/ML στην περιοχή EMEA. Έχει έδρα στο Λονδίνο και συνεργάζεται στενά με πελάτες στο Ηνωμένο Βασίλειο και την Ιρλανδία. Ο Georgios βοηθά τους πελάτες να σχεδιάσουν και να αναπτύξουν εφαρμογές μηχανικής εκμάθησης στην παραγωγή σε AWS με ιδιαίτερο ενδιαφέρον για τις πρακτικές MLOps και δίνοντας τη δυνατότητα στους πελάτες να εκτελούν μηχανική εκμάθηση σε κλίμακα. Στον ελεύθερο χρόνο του, του αρέσει να ταξιδεύει, να μαγειρεύει και να περνά χρόνο με φίλους και οικογένεια.

Σφραγίδα ώρας:

Περισσότερα από Μηχανική εκμάθηση AWS