Το πλαίσιο μηχανικής μάθησης ταξινομεί την πνευμονία στις ακτινογραφίες θώρακα

Το πλαίσιο μηχανικής μάθησης ταξινομεί την πνευμονία στις ακτινογραφίες θώρακα

Εικόνες ακτινογραφίας θώρακα
Στοιχεία δοκιμής Εικόνες ακτινογραφίας θώρακα που δείχνουν παραδείγματα φυσιολογικού πνεύμονα (αριστερά), βακτηριακής πνευμονίας (κέντρο) και ιογενούς πνευμονίας (δεξιά). (Ευγένεια: Mach. Μάθετε.: Επιστήμη. Τεχνολ. 10.1088/2632-2153/acc30f)

Η πνευμονία είναι μια δυνητικά θανατηφόρος πνευμονική λοίμωξη που εξελίσσεται ταχέως. Οι ασθενείς με συμπτώματα πνευμονίας – όπως ξηρός βήχας, δυσκολία στην αναπνοή και υψηλός πυρετός – λαμβάνουν γενικά μια εξέταση με στηθοσκόπιο των πνευμόνων, ακολουθούμενη από ακτινογραφία θώρακα για επιβεβαίωση της διάγνωσης. Η διάκριση μεταξύ βακτηριακής και ιογενούς πνευμονίας, ωστόσο, παραμένει μια πρόκληση, καθώς και οι δύο έχουν παρόμοια κλινική εικόνα.

Η μαθηματική μοντελοποίηση και η τεχνητή νοημοσύνη θα μπορούσαν να βοηθήσουν στη βελτίωση της ακρίβειας της διάγνωσης της νόσου από ακτινογραφικές εικόνες. Η βαθιά μάθηση έχει γίνει ολοένα και πιο δημοφιλής για την ταξινόμηση ιατρικών εικόνων και αρκετές μελέτες έχουν διερευνήσει τη χρήση μοντέλων συνελικτικού νευρωνικού δικτύου (CNN) για την αυτόματη αναγνώριση της πνευμονίας από εικόνες ακτίνων Χ θώρακα. Είναι κρίσιμο, ωστόσο, να δημιουργηθούν αποτελεσματικά μοντέλα που μπορούν να αναλύσουν μεγάλο αριθμό ιατρικών εικόνων χωρίς ψευδή αρνητικά.

Τώρα, ο KM Abubeker και ο S ​​Baskar στο Karpagam Academy of Higher Education στην Ινδία έχουν δημιουργήσει ένα νέο πλαίσιο μηχανικής μάθησης για την ταξινόμηση πνευμονίας των εικόνων ακτίνων Χ θώρακα σε μια μονάδα επεξεργασίας γραφικών (GPU). Περιγράφουν τη στρατηγική τους στο Μηχανική Μάθηση: Επιστήμη και Τεχνολογία.

Βελτιστοποίηση δεδομένων εκπαίδευσης

Η απόδοση ενός ταξινομητή βαθιάς μάθησης βασίζεται τόσο στο μοντέλο του νευρωνικού δικτύου όσο και στην ποιότητα των δεδομένων που χρησιμοποιούνται για την εκπαίδευση του δικτύου. Για την ιατρική απεικόνιση, η έλλειψη ενός αρκετά μεγάλου συνόλου δεδομένων είναι η κύρια αιτία της χαμηλότερης απόδοσης. Για να αντιμετωπίσουν αυτό το έλλειμμα, οι ερευνητές χρησιμοποίησαν την επαύξηση δεδομένων, στην οποία νέα δεδομένα εκπαίδευσης συντίθενται από υπάρχοντα δεδομένα (για παράδειγμα μέσω περιστροφών εικόνας, μετατοπίσεων και περικοπών) για να κάνουν το σύνολο δεδομένων πιο ολοκληρωμένο και διαφορετικό.

Μια άλλη μέθοδος που χρησιμοποιείται για την αντιμετώπιση της έλλειψης κατάλληλων δεδομένων κατάρτισης είναι η μεταφορά μάθησης – η βελτίωση της ικανότητας ενός μοντέλου να μαθαίνει μια νέα εργασία χρησιμοποιώντας υπάρχουσες γνώσεις που αποκτήθηκαν κατά την εκτέλεση μιας σχετικής εργασίας. Στην πρώτη φάση της μελέτης τους, οι Abubeker και Baskar χρησιμοποίησαν τη μάθηση μεταφοράς για να εκπαιδεύσουν εννέα υπερσύγχρονα νευρωνικά μοντέλα CNN για να αξιολογήσουν εάν μια ακτινογραφία θώρακος απεικονίζει ή όχι πνευμονία.

Για τα πειράματα, χρησιμοποίησαν εικόνες ακτίνων Χ θώρακα από δημόσια σύνολα δεδομένων RSNA Kaggle, συμπεριλαμβανομένων εικόνων για εκπαίδευση (1341 κατηγοριοποιημένες ως φυσιολογικές, 1678 ως βακτηριακή πνευμονία και 2197 ως ιογενή πνευμονία), δοκιμές (234 φυσιολογικές, 184 βακτηριακές πνευμονίες, 206 ιογενείς πνευμονίες ) και επικύρωση (76 φυσιολογική, 48 βακτηριακή πνευμονία, 56 ιογενής πνευμονία). Η εφαρμογή γεωμετρικής αύξησης στο σύνολο δεδομένων επέκτεινε το σύνολο σε 2571 φυσιολογικές εικόνες, 2019 βακτηριακές και 2625 ιογενείς εικόνες πνευμονίας.

Με βάση τα μέτρα απόδοσης, συμπεριλαμβανομένης της ακρίβειας, της ανάκλησης και της περιοχής κάτω από την καμπύλη ROC (AUROC, μια μέτρηση που συνοψίζει την απόδοση σε πολλά κατώφλια), οι ερευνητές επέλεξαν τα τρία μοντέλα CNN με κορυφαία απόδοση – DenseNet-160, ResNet-121 και VGGNet-16 – για επανεκπαίδευση με χρήση τεχνικής συνόλου.

Στρατηγική συνόλου

Αντί να βασίζονται σε ένα ενιαίο μοντέλο μηχανικής μάθησης, τα μοντέλα συνόλου συγκεντρώνουν τα συμπεράσματα πολλών μοντέλων για να ενισχύσουν τις μετρήσεις απόδοσης και να ελαχιστοποιήσουν τα σφάλματα. Οι ερευνητές ανέπτυξαν μια στρατηγική συνόλου βασισμένη στη μάθηση μεταφοράς που ονομάζεται B2-Net και τη χρησιμοποίησαν με τα τρία επιλεγμένα CNN για να δημιουργήσουν ένα τελικό μοντέλο. Εφάρμοσαν το τελικό μοντέλο B2-Net σε έναν υπολογιστή NVIDIA Jetson Nano GPU.

Μοντέλο B2-Net για την ταξινόμηση της πνευμονίας στις ακτινογραφίες θώρακα

Σημειώνουν ότι κατά τη διάρκεια της προπόνησης, ορισμένα μοντέλα είχαν καλύτερες επιδόσεις στον εντοπισμό φυσιολογικών εικόνων ακτίνων Χ, ενώ άλλα είχαν καλύτερη απόδοση στην αναγνώριση δειγμάτων ιικής και βακτηριακής πνευμονίας. Η στρατηγική του συνόλου χρησιμοποιεί μια τεχνική σταθμισμένης ψηφοφορίας για να παρέχει σε κάθε ταξινομητή έναν συγκεκριμένο βαθμό ισχύος με βάση προκαθορισμένα κριτήρια.

Τα επανεκπαιδευμένα μοντέλα επέδειξαν σημαντικές βελτιώσεις στη διαγνωστική ακρίβεια σε σχέση με τα βασικά μοντέλα. Η δοκιμή των μοντέλων σε ένα ισορροπημένο σύνολο δεδομένων αποκάλυψε ότι τα DenseNet-160, ResNet-121 και VGGNet-16 πέτυχαν τιμές AUROC 0.9801, 0.9822 και 0.9955, αντίστοιχα. Η προτεινόμενη προσέγγιση συνόλου B2-Net, ωστόσο, ξεπέρασε και τις τρεις, με AUROC 0.9977.

Οι ερευνητές αξιολόγησαν και επικύρωσαν το B2-Net και τα άλλα τρία μοντέλα χρησιμοποιώντας ένα υποσύνολο περίπου 600 εικόνων ακτίνων Χ θώρακα από το ομαδοποιημένο σύνολο δεδομένων. Το DenseNet-160 εντόπισε εσφαλμένα τρεις από τις εικόνες δοκιμής πνευμονίας, ενώ το VGGNet-16 και το ResNet-121 διέγνωσαν εσφαλμένα μία εικόνα ακτίνων Χ το καθένα. Συνολικά, η προτεινόμενη προσέγγιση B2-Net ξεπέρασε όλα τα άλλα μοντέλα, κάνοντας διάκριση μεταξύ φυσιολογικών περιπτώσεων, βακτηριακής πνευμονίας και ιογενούς πνευμονίας σε εικόνες ακτινογραφίας θώρακα με ακρίβεια 97.69% και ποσοστό ανάκλησης (το ποσοστό των αληθινών θετικών μεταξύ του συνολικού αριθμού θετικών) του 100%.

Οι Abubeker και Baskar εξηγούν ότι ενώ το ψευδώς αρνητικό ποσοστό είναι το πιο κρίσιμο κριτήριο για έναν ταξινομητή ιατρικής εικόνας, το προτεινόμενο μοντέλο B2-Net παρέχει την καλύτερη εναλλακτική για κλινικές εφαρμογές σε πραγματικό χρόνο. «Αυτή η προσέγγιση, ιδιαίτερα κατά τη διάρκεια των σημερινών παγκόσμιων κρουσμάτων COVID-19, θα μπορούσε να βοηθήσει τους ακτινολόγους να διαγνώσουν γρήγορα και αξιόπιστα την πνευμονία, επιτρέποντας έγκαιρη θεραπεία», γράφουν.

Στη συνέχεια, σχεδιάζουν να επεκτείνουν το μοντέλο τους για να ταξινομήσουν περισσότερες πνευμονικές διαταραχές, συμπεριλαμβανομένων των παραλλαγών της φυματίωσης και του COVID-19.

Σφραγίδα ώρας:

Περισσότερα από Κόσμος Φυσικής