Computer Vision με χρήση συνθετικών συνόλων δεδομένων με προσαρμοσμένες ετικέτες αναγνώρισης Amazon και Dassault Systèmes 3DEXCITE

Αναδημοσίευση από τον Πλάτωνα

Ακολουθούν: 0

Αυτή είναι μια ανάρτηση που συντάχθηκε με τον Bernard Paques, CTO του Storm Reply, και τον Karl Herkt, Ανώτερο Στρατηγό στο Dassault Systèmes 3DExcite.

Ενώ η όραση υπολογιστή μπορεί να είναι ζωτικής σημασίας για τη βιομηχανική συντήρηση, την κατασκευή, τα logistics και τις καταναλωτικές εφαρμογές, η υιοθέτησή της περιορίζεται από τη μη αυτόματη δημιουργία συνόλων δεδομένων εκπαίδευσης. Η δημιουργία εικόνων με ετικέτα σε ένα βιομηχανικό πλαίσιο γίνεται κυρίως με το χέρι, γεγονός που δημιουργεί περιορισμένες δυνατότητες αναγνώρισης, δεν κλιμακώνεται και έχει ως αποτέλεσμα το κόστος εργασίας και καθυστερήσεις στην υλοποίηση της επιχειρηματικής αξίας. Αυτό έρχεται σε αντίθεση με την επιχειρηματική ευελιξία που παρέχεται από τις γρήγορες επαναλήψεις στο σχεδιασμό προϊόντων, τη μηχανική προϊόντων και τη διαμόρφωση του προϊόντος. Αυτή η διαδικασία δεν προσαρμόζεται σε σύνθετα προϊόντα, όπως αυτοκίνητα, αεροπλάνα ή μοντέρνα κτίρια, επειδή σε αυτά τα σενάρια κάθε έργο σήμανσης είναι μοναδικό (που σχετίζεται με μοναδικά προϊόντα). Ως αποτέλεσμα, η τεχνολογία υπολογιστικής όρασης δεν μπορεί να εφαρμοστεί εύκολα σε μοναδικά έργα μεγάλης κλίμακας χωρίς μεγάλη προσπάθεια στην προετοιμασία δεδομένων, περιορίζοντας μερικές φορές την παράδοση περιπτώσεων χρήσης.

Σε αυτήν την ανάρτηση, παρουσιάζουμε μια νέα προσέγγιση όπου δημιουργούνται εξαιρετικά εξειδικευμένα συστήματα υπολογιστικής όρασης από αρχεία σχεδίασης και CAD. Ξεκινάμε με τη δημιουργία οπτικά σωστών ψηφιακών διδύμων και τη δημιουργία εικόνων με συνθετική ετικέτα. Στη συνέχεια σπρώχνουμε αυτές τις εικόνες σε Προσαρμοσμένες ετικέτες αναγνώρισης Amazon για να εκπαιδεύσετε ένα προσαρμοσμένο μοντέλο ανίχνευσης αντικειμένων. Χρησιμοποιώντας την υπάρχουσα πνευματική ιδιοκτησία με λογισμικό, κάνουμε την όραση υπολογιστών προσιτή και σχετική με μια ποικιλία βιομηχανικών πλαισίων.

Η προσαρμογή των συστημάτων αναγνώρισης συμβάλλει στην επίτευξη επιχειρηματικών αποτελεσμάτων

Τα εξειδικευμένα συστήματα υπολογιστικής όρασης που παράγονται από ψηφιακά δίδυμα έχουν συγκεκριμένα πλεονεκτήματα, τα οποία μπορούν να απεικονιστούν στις ακόλουθες περιπτώσεις χρήσης:

Ιχνηλασιμότητα για μοναδικά προϊόντα – Η Airbus, η Boeing και άλλοι κατασκευαστές αεροσκαφών εκχωρούν μοναδικά Αριθμοί σειράς κατασκευαστή (MSN) σε κάθε αεροσκάφος που παράγουν. Αυτό διαχειρίζεται σε όλη τη διαδικασία παραγωγής, προκειμένου να παραχθεί τεκμηρίωση αξιοπλοΐας και να πάρεις άδειες πτήσης. ΕΝΑ ψηφιακό δίδυμο (ένα εικονικό τρισδιάστατο μοντέλο που αντιπροσωπεύει ένα φυσικό προϊόν) μπορεί να προέλθει από τη διαμόρφωση κάθε MSN και δημιουργεί ένα κατανεμημένο σύστημα όρασης υπολογιστή που παρακολουθεί την πρόοδο αυτού του MSN σε βιομηχανικές εγκαταστάσεις. Η προσαρμοσμένη αναγνώριση αυτοματοποιεί τη διαφάνεια που παρέχεται στις αεροπορικές εταιρείες και αντικαθιστά τα περισσότερα σημεία ελέγχου που εκτελούνται χειροκίνητα από τις αεροπορικές εταιρείες. Η αυτοματοποιημένη διασφάλιση ποιότητας σε μοναδικά προϊόντα μπορεί να εφαρμοστεί σε αεροσκάφη, αυτοκίνητα, κτίρια, ακόμη και σε βιοτεχνικές παραγωγές.
Συμφραζόμενη επαυξημένη πραγματικότητα – Τα συστήματα όρασης υπολογιστών επαγγελματικού επιπέδου μπορούν να καλύπτουν περιορισμένα τοπία, αλλά με υψηλότερες δυνατότητες διάκρισης. Για παράδειγμα, στη βιομηχανική συντήρηση, η εύρεση ενός κατσαβιδιού σε μια εικόνα είναι άχρηστη. πρέπει να αναγνωρίσετε το μοντέλο του κατσαβιδιού ή ακόμα και τον σειριακό αριθμό του. Σε τέτοια περιορισμένα περιβάλλοντα, τα προσαρμοσμένα συστήματα αναγνώρισης υπερτερούν των γενικών συστημάτων αναγνώρισης επειδή είναι πιο σχετικά με τα ευρήματά τους. Τα προσαρμοσμένα συστήματα αναγνώρισης επιτρέπουν ακριβείς βρόχους ανάδρασης μέσω αφιερωμένη επαυξημένη πραγματικότητα παραδίδεται σε HMI ή σε φορητές συσκευές.
Έλεγχος ποιότητας από άκρο σε άκρο - Με μηχανική συστημάτων, μπορείτε να δημιουργήσετε ψηφιακά δίδυμα μερικών κατασκευών και να δημιουργήσετε συστήματα όρασης υπολογιστή που προσαρμόζονται στις διάφορες φάσεις των διαδικασιών παραγωγής και παραγωγής. Οι οπτικοί έλεγχοι μπορούν να συνδυαστούν με σταθμούς εργασίας κατασκευής, επιτρέποντας την επιθεώρηση από άκρο σε άκρο και τον έγκαιρο εντοπισμό ελαττωμάτων. Προσαρμοσμένη αναγνώριση για επιθεώρηση από άκρο σε άκρο αποτρέπει αποτελεσματικά τη διαδοχή ελαττωμάτων στις γραμμές συναρμολόγησης. Η μείωση του ποσοστού απόρριψης και η μεγιστοποίηση της παραγωγής είναι ο απώτερος στόχος.
Ευέλικτη ποιοτική επιθεώρηση – Η σύγχρονη ποιοτική επιθεώρηση πρέπει να προσαρμοστεί στις παραλλαγές του σχεδιασμού και στην ευέλικτη κατασκευή. Οι παραλλαγές στο σχεδιασμό προέρχονται από βρόχους ανατροφοδότησης σχετικά με τη χρήση του προϊόντος και τη συντήρηση του προϊόντος. Ευέλικτη κατασκευή είναι μια βασική ικανότητα για μια στρατηγική κατά παραγγελία και ευθυγραμμίζεται με την αρχή της λιτής κατασκευής της βελτιστοποίησης κόστους. Με την ενσωμάτωση παραλλαγών σχεδιασμού και επιλογών διαμόρφωσης σε ψηφιακά δίδυμα, η προσαρμοσμένη αναγνώριση επιτρέπει τη δυναμική προσαρμογή των συστημάτων υπολογιστικής όρασης στα σχέδια παραγωγής και τις παραλλαγές σχεδιασμού.

Βελτιώστε την όραση υπολογιστή με το Dassault Systèmes 3DEXCITE που υποστηρίζεται από το Amazon Rekognition

Στο πλαίσιο της Dassault Systèmes, μιας εταιρείας με βαθιά εξειδίκευση στα digital twins που είναι επίσης ο δεύτερος μεγαλύτερος ευρωπαϊκός επεξεργαστής λογισμικού, η ομάδα 3DEXCITE εξερευνά μια διαφορετική διαδρομή. Όπως εξηγεί ο Karl Herkt, «Τι θα γινόταν αν ένα νευρικό μοντέλο εκπαιδευμένο από συνθετικές εικόνες μπορούσε να αναγνωρίσει ένα φυσικό προϊόν;» Η 3DEXCITE έλυσε αυτό το πρόβλημα συνδυάζοντας την τεχνολογία της με την υποδομή AWS, αποδεικνύοντας τη σκοπιμότητα αυτής της περίεργης προσέγγισης. Είναι επίσης γνωστό ως ανίχνευση αντικειμένων μεταξύ τομέων, όπου το μοντέλο ανίχνευσης μαθαίνει από εικόνες με ετικέτα από τον τομέα προέλευσης (συνθετικές εικόνες) και κάνει προβλέψεις στον τομέα στόχο χωρίς ετικέτα (φυσικά στοιχεία).

Η Dassault Systèmes 3DEXCITE και η ομάδα AWS Prototyping ένωσαν τις δυνάμεις τους για να δημιουργήσουν ένα σύστημα επίδειξης που αναγνωρίζει μέρη ενός βιομηχανικού κιβωτίου ταχυτήτων. Αυτό το πρωτότυπο κατασκευάστηκε σε 3 εβδομάδες και το εκπαιδευμένο μοντέλο πέτυχε βαθμολογία F98 1%. Το μοντέλο αναγνώρισης έχει εκπαιδευτεί εξ ολοκλήρου από μια σωλήνωση λογισμικού, η οποία δεν διαθέτει εικόνες πραγματικού εξαρτήματος. Από τη σχεδίαση και τα αρχεία CAD ενός βιομηχανικού κιβωτίου ταχυτήτων, η 3DEXCITE δημιούργησε οπτικά σωστά ψηφιακά δίδυμα. Δημιούργησαν επίσης χιλιάδες εικόνες με συνθετική ετικέτα από τα ψηφιακά δίδυμα. Στη συνέχεια χρησιμοποίησαν Προσαρμοσμένες Ετικέτες Αναγνώρισης για να εκπαιδεύσουν ένα εξαιρετικά εξειδικευμένο νευρωνικό μοντέλο από αυτές τις εικόνες και παρείχαν ένα σχετικό API αναγνώρισης. Κατασκεύασαν έναν ιστότοπο για να επιτρέπουν την αναγνώριση από οποιαδήποτε κάμερα web ενός φυσικού τμήματος του κιβωτίου ταχυτήτων.

Αναγνώριση Amazon είναι μια υπηρεσία τεχνητής νοημοσύνης που χρησιμοποιεί τεχνολογία βαθιάς εκμάθησης για να σας επιτρέπει να εξάγετε ουσιαστικά μεταδεδομένα από εικόνες και βίντεο—συμπεριλαμβανομένης της αναγνώρισης αντικειμένων, ατόμων, κειμένου, σκηνών, δραστηριοτήτων και δυνητικά ακατάλληλου περιεχομένου—χωρίς να απαιτείται εξειδίκευση στη μηχανική μάθηση (ML). Το Amazon Rekognition παρέχει επίσης εξαιρετικά ακριβείς δυνατότητες ανάλυσης προσώπου και αναζήτησης προσώπου που μπορείτε να χρησιμοποιήσετε για να εντοπίσετε, να αναλύσετε και να συγκρίνετε πρόσωπα για μια μεγάλη ποικιλία επαλήθευσης χρηστών, καταμέτρησης ατόμων και περιπτώσεων χρήσης ασφαλείας. Τέλος, με τις Προσαρμοσμένες Ετικέτες Αναγνώρισης, μπορείτε να χρησιμοποιήσετε τα δικά σας δεδομένα για να δημιουργήσετε μοντέλα ανίχνευσης αντικειμένων και ταξινόμησης εικόνων.

Ο συνδυασμός της τεχνολογίας Dassault Systèmes για τη δημιουργία εικόνων με συνθετική ετικέτα με προσαρμοσμένες ετικέτες αναγνώρισης για όραση υπολογιστή παρέχει μια επεκτάσιμη ροή εργασιών για συστήματα αναγνώρισης. Η ευκολία χρήσης είναι ένας σημαντικός θετικός παράγοντας εδώ, επειδή η προσθήκη Προσαρμοσμένων Ετικετών Αναγνώρισης στη συνολική γραμμή λογισμικού δεν είναι δύσκολη—είναι τόσο απλή όσο η ενσωμάτωση ενός API σε μια ροή εργασίας. Δεν χρειάζεται να είστε επιστήμονας ML. απλά στείλτε τα καταγεγραμμένα καρέ στο AWS και λάβετε ένα αποτέλεσμα που μπορείτε να εισαγάγετε σε μια βάση δεδομένων ή να εμφανίσετε σε ένα πρόγραμμα περιήγησης Ιστού.

Αυτό υπογραμμίζει περαιτέρω τη δραματική βελτίωση σε σχέση με τη μη αυτόματη δημιουργία συνόλων δεδομένων εκπαίδευσης. Μπορείτε να επιτύχετε καλύτερα αποτελέσματα πιο γρήγορα και με μεγαλύτερη ακρίβεια, χωρίς να χρειάζεστε δαπανηρές, περιττές ώρες εργασίας. Με τόσες πολλές πιθανές περιπτώσεις χρήσης, ο συνδυασμός Dassault Systèmes και προσαρμοσμένων ετικετών αναγνώρισης έχει τη δυνατότητα να παρέχει στις σημερινές επιχειρήσεις σημαντική και άμεση απόδοση επένδυσης (ROI).

Επισκόπηση λύσεων

Το πρώτο βήμα σε αυτή τη λύση είναι η απόδοση των εικόνων που δημιουργούν το σύνολο δεδομένων εκπαίδευσης. Αυτό γίνεται από την πλατφόρμα 3DEXCITE. Μπορούμε να δημιουργήσουμε τα δεδομένα ετικετών μέσω προγραμματισμού χρησιμοποιώντας σενάρια. Amazon SageMaker Ground Αλήθεια παρέχει ένα εργαλείο σχολιασμού για εύκολη επισήμανση εικόνων και βίντεο για εργασίες ταξινόμησης και ανίχνευσης αντικειμένων. Για να εκπαιδεύσετε ένα μοντέλο στο Amazon Rekognition, το αρχείο ετικετών πρέπει να συμμορφώνεται με τη μορφή Ground Truth. Αυτές οι ετικέτες είναι σε JSON, συμπεριλαμβανομένων πληροφοριών όπως το μέγεθος εικόνας, οι συντεταγμένες πλαισίου οριοθέτησης και τα αναγνωριστικά κλάσεων.

Στη συνέχεια, ανεβάστε τις συνθετικές εικόνες και το μανιφέστο στο Απλή υπηρεσία αποθήκευσης Amazon (Amazon S3), όπου οι Προσαρμοσμένες Ετικέτες Αναγνώρισης μπορούν να τις εισάγουν ως στοιχεία του συνόλου δεδομένων εκπαίδευσης.

Για να επιτρέψουμε στο Rekognition Custom Labels να δοκιμάσει τα μοντέλα σε σχέση με ένα σύνολο εικόνων πραγματικών εξαρτημάτων, παρέχουμε ένα σύνολο εικόνων των πραγματικών εξαρτημάτων του κινητήρα που λαμβάνονται με μια κάμερα και τις ανεβάζουμε στο Amazon S3 για χρήση ως το σύνολο δεδομένων δοκιμής.

Τέλος, το Rekognition Custom Labels εκπαιδεύει το καλύτερο μοντέλο ανίχνευσης αντικειμένων χρησιμοποιώντας το συνθετικό σύνολο δεδομένων εκπαίδευσης και δοκιμής δεδομένων που αποτελείται από εικόνες πραγματικών αντικειμένων και δημιουργεί το τελικό σημείο με το μοντέλο που μπορούμε να χρησιμοποιήσουμε για την εκτέλεση της αναγνώρισης αντικειμένων στην εφαρμογή μας.

Το παρακάτω διάγραμμα απεικονίζει τη ροή εργασιών επίλυσης:

Δημιουργήστε συνθετικές εικόνες

Οι συνθετικές εικόνες δημιουργούνται από την πλατφόρμα 3Dexperience, η οποία είναι προϊόν της Dassault Systèmes. Αυτή η πλατφόρμα σάς επιτρέπει να δημιουργείτε και να αποδίδετε φωτορεαλιστικές εικόνες με βάση το αρχείο CAD (σχεδίαση με τη βοήθεια υπολογιστή) του αντικειμένου. Μπορούμε να δημιουργήσουμε χιλιάδες παραλλαγές σε λίγες ώρες αλλάζοντας τις διαμορφώσεις μετασχηματισμού εικόνας στην πλατφόρμα.

Σε αυτό το πρωτότυπο, επιλέξαμε τα ακόλουθα πέντε οπτικά διακριτά μέρη κιβωτίου ταχυτήτων για ανίχνευση αντικειμένων. Περιλαμβάνουν περίβλημα γραναζιού, σχέση μετάδοσης, κάλυμμα ρουλεμάν, φλάντζα και ατέρμονα γρανάζι.

Χρησιμοποιήσαμε τις ακόλουθες μεθόδους αύξησης δεδομένων για να αυξήσουμε την ποικιλομορφία της εικόνας και να κάνουμε τα συνθετικά δεδομένα πιο φωτορεαλιστικά. Βοηθά στη μείωση του σφάλματος γενίκευσης του μοντέλου.

Zoom in / out – Αυτή η μέθοδος μεγεθύνει ή σμικρύνει τυχαία το αντικείμενο στις εικόνες.
Περιστροφή – Αυτή η μέθοδος περιστρέφει το αντικείμενο σε εικόνες και μοιάζει σαν μια εικονική κάμερα να βγάζει τυχαίες φωτογραφίες του αντικειμένου από γωνίες 360 μοιρών.
Βελτιώστε την εμφάνιση και την αίσθηση του υλικού – Εντοπίσαμε ότι για ορισμένα εξαρτήματα ταχυτήτων η εμφάνιση του υλικού είναι λιγότερο ρεαλιστική στην αρχική απόδοση. Προσθέσαμε ένα μεταλλικό εφέ για να βελτιώσουμε τις συνθετικές εικόνες.
Χρησιμοποιήστε διαφορετικές ρυθμίσεις φωτισμού – Σε αυτό το πρωτότυπο, προσομοιώσαμε δύο συνθήκες φωτισμού:
- Αποθήκη – Ρεαλιστική κατανομή φωτός. Οι σκιές και οι αντανακλάσεις είναι πιθανές.
- στούντιο – Ένα ομοιογενές φως τοποθετείται γύρω από το αντικείμενο. Αυτό δεν είναι ρεαλιστικό, αλλά δεν υπάρχουν σκιές ή αντανακλάσεις.
Χρησιμοποιήστε μια ρεαλιστική θέση για τον τρόπο προβολής του αντικειμένου σε πραγματικό χρόνο – Στην πραγματική ζωή, ορισμένα αντικείμενα, όπως η φλάντζα και το κάλυμμα του ρουλεμάν, τοποθετούνται γενικά σε μια επιφάνεια και το μοντέλο ανιχνεύει τα αντικείμενα με βάση την επάνω και την κάτω όψη. Επομένως, αφαιρέσαμε τις εικόνες εκπαίδευσης που δείχνουν τη λεπτή άκρη των εξαρτημάτων, που ονομάζεται επίσης θέση άκρης, και αυξήσαμε τις εικόνες των αντικειμένων σε επίπεδη θέση.
Προσθέστε πολλά αντικείμενα σε μία εικόνα – Σε πραγματικά σενάρια, πολλά εξαρτήματα ταχυτήτων θα μπορούσαν να εμφανιστούν όλα σε μία προβολή, επομένως ετοιμάσαμε εικόνες που περιέχουν πολλά μέρη ταχυτήτων.

Στην πλατφόρμα 3Dexperience, μπορούμε να εφαρμόσουμε διαφορετικά φόντο στις εικόνες, τα οποία μπορούν να βοηθήσουν στην περαιτέρω αύξηση της ποικιλομορφίας των εικόνων. Λόγω χρονικού περιορισμού, δεν το εφαρμόσαμε σε αυτό το πρωτότυπο.

Εισαγάγετε το συνθετικό σύνολο δεδομένων εκπαίδευσης

Στο ML, τα δεδομένα με ετικέτα σημαίνει ότι τα δεδομένα εκπαίδευσης σημειώνονται για να εμφανίσουν τον στόχο, που είναι η απάντηση που θέλετε να προβλέψει το μοντέλο ML σας. Τα δεδομένα με ετικέτα που μπορούν να καταναλωθούν από τις προσαρμοσμένες ετικέτες αναγνώρισης θα πρέπει να συμμορφώνονται με τις απαιτήσεις του αρχείου δήλωσης Ground Truth. Ένα αρχείο δήλωσης αποτελείται από μία ή περισσότερες γραμμές JSON. κάθε γραμμή περιέχει τις πληροφορίες για μια μεμονωμένη εικόνα. Για συνθετικά δεδομένα εκπαίδευσης, οι πληροφορίες επισήμανσης μπορούν να δημιουργηθούν μέσω προγραμματισμού με βάση το αρχείο CAD και τις διαμορφώσεις μετασχηματισμού εικόνας που αναφέραμε προηγουμένως, γεγονός που εξοικονομεί σημαντική χειροκίνητη προσπάθεια για εργασία ετικετών. Για περισσότερες πληροφορίες σχετικά με τις απαιτήσεις για την επισήμανση μορφών αρχείων, ανατρέξτε στο Δημιουργήστε ένα αρχείο δήλωσης και Εντοπισμός αντικειμένων σε αρχεία δήλωσης. Το παρακάτω είναι ένα παράδειγμα επισήμανσης εικόνων:

{ "source-ref": "s3://<bucket>/<prefix>/multiple_objects.png", "bounding-box": { "image_size": [ { "width": 1024, "height": 1024, "depth": 3 } ], "annotations": [ { "class_id": 1, "top": 703, "left": 606, "width": 179, "height": 157 }, { "class_id": 4, "top": 233, "left": 533, "width": 118, "height": 139 }, { "class_id": 0, "top": 592, "left": 154, "width": 231, "height": 332 }, { "class_id": 3, "top": 143, "left": 129, "width": 268, "height": 250 } ] }, "bounding-box-metadata": { "objects": [ { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 }, { "confidence": 1 } ], "class-map": { "0": "Gear_Housing", "1": "Gear_Ratio", "3": "Flange", "4": "Worm_Gear" }, "type": "groundtruth/object-detection", "human-annotated": "yes", "creation-date": "2021-06-18T11:56:01", "job-name": "3DEXCITE" }
}

Αφού προετοιμαστεί το αρχείο δήλωσης, το ανεβάζουμε σε έναν κάδο S3 και, στη συνέχεια, δημιουργούμε ένα σύνολο δεδομένων εκπαίδευσης στις Προσαρμοσμένες Ετικέτες Αναγνώρισης επιλέγοντας την επιλογή Εισαγάγετε εικόνες με ετικέτα από το Amazon SageMaker Ground Truth.

Μετά την εισαγωγή του αρχείου δήλωσης, μπορούμε να προβάλουμε τις πληροφορίες ετικετών οπτικά στην κονσόλα Amazon Rekognition. Αυτό μας βοηθά να επιβεβαιώσουμε ότι το αρχείο δήλωσης δημιουργήθηκε και εισήχθη. Πιο συγκεκριμένα, τα πλαίσια οριοθέτησης θα πρέπει να ευθυγραμμίζονται με τα αντικείμενα στις εικόνες και τα αναγνωριστικά κλάσεων των αντικειμένων θα πρέπει να αντιστοιχίζονται σωστά.

Δημιουργήστε το σύνολο δεδομένων δοκιμής

Οι δοκιμαστικές εικόνες καταγράφονται στην πραγματική ζωή με τηλέφωνο ή κάμερα από διαφορετικές γωνίες και συνθήκες φωτισμού, επειδή θέλουμε να επικυρώσουμε την ακρίβεια του μοντέλου, που εκπαιδεύσαμε χρησιμοποιώντας συνθετικά δεδομένα, σε σχέση με τα πραγματικά σενάρια. Μπορείτε να ανεβάσετε αυτές τις δοκιμαστικές εικόνες σε έναν κάδο S3 και, στη συνέχεια, να τις εισαγάγετε ως σύνολα δεδομένων στις προσαρμοσμένες ετικέτες αναγνώρισης. Ή μπορείτε να τα ανεβάσετε απευθείας σε σύνολα δεδομένων από τον τοπικό σας υπολογιστή.

Το Rekognition Custom Labels παρέχει ενσωματωμένη δυνατότητα σχολιασμού εικόνας, η οποία έχει παρόμοια εμπειρία με το Ground Truth. Μπορείτε να ξεκινήσετε την εργασία επισήμανσης κατά την εισαγωγή δεδομένων δοκιμής. Για μια περίπτωση χρήσης ανίχνευσης αντικειμένων, τα πλαίσια οριοθέτησης θα πρέπει να δημιουργηθούν σφιχτά γύρω από τα αντικείμενα ενδιαφέροντος, κάτι που βοηθά το μοντέλο να μάθει ακριβώς τις περιοχές και τα εικονοστοιχεία που ανήκουν στα αντικείμενα-στόχους. Επιπλέον, θα πρέπει να επισημάνετε κάθε παρουσία των αντικειμένων-στόχων σε όλες τις εικόνες, ακόμη και εκείνες που είναι εν μέρει εκτός προβολής ή αποκλεισμένες από άλλα αντικείμενα, διαφορετικά το μοντέλο προβλέπει περισσότερα ψευδώς αρνητικά.

Δημιουργήστε το μοντέλο ανίχνευσης αντικειμένων μεταξύ τομέων

Το Rekognition Custom Labels είναι μια πλήρως διαχειριζόμενη υπηρεσία. απλά πρέπει να παρέχετε τα σύνολα δεδομένων τρένου και δοκιμής. Εκπαιδεύει ένα σύνολο μοντέλων και επιλέγει το με την καλύτερη απόδοση με βάση τα δεδομένα που παρέχονται. Σε αυτό το πρωτότυπο, προετοιμάζουμε τα συνθετικά σύνολα δεδομένων εκπαίδευσης επαναληπτικά πειραματιζόμενοι με διαφορετικούς συνδυασμούς των μεθόδων αύξησης εικόνας που αναφέραμε προηγουμένως. Δημιουργείται ένα μοντέλο για κάθε σύνολο δεδομένων εκπαίδευσης στις Προσαρμοσμένες Ετικέτες Αναγνώρισης, το οποίο μας επιτρέπει να συγκρίνουμε και να βρίσκουμε το βέλτιστο σύνολο δεδομένων εκπαίδευσης για αυτήν την περίπτωση χρήσης ειδικά. Κάθε μοντέλο έχει τον ελάχιστο αριθμό εικόνων εκπαίδευσης, περιέχει καλή ποικιλία εικόνων και παρέχει την καλύτερη ακρίβεια μοντέλου. Μετά από 15 επαναλήψεις, πετύχαμε βαθμολογία F1 98% ακρίβειας μοντέλου χρησιμοποιώντας περίπου 10,000 συνθετικές εικόνες εκπαίδευσης, που είναι 2,000 εικόνες ανά αντικείμενο κατά μέσο όρο.

Αποτελέσματα συμπερασμάτων μοντέλου

Η παρακάτω εικόνα δείχνει το μοντέλο αναγνώρισης Amazon που χρησιμοποιείται σε μια εφαρμογή συμπερασμάτων σε πραγματικό χρόνο. Όλα τα εξαρτήματα εντοπίζονται σωστά με υψηλή εμπιστοσύνη.

Υπολογιστική όραση με χρήση συνθετικών συνόλων δεδομένων με προσαρμοσμένες ετικέτες Amazon Rekognition και Dassault Systèmes 3DEXCITE PlatoBlockchain Data Intelligence. Κάθετη αναζήτηση. Ολα συμπεριλαμβάνονται.

Συμπέρασμα

Σε αυτήν την ανάρτηση, δείξαμε πώς να εκπαιδεύσουμε ένα μοντέλο όρασης υπολογιστή σε καθαρά συνθετικές εικόνες και πώς το μοντέλο μπορεί ακόμα να αναγνωρίσει αξιόπιστα αντικείμενα του πραγματικού κόσμου. Αυτό εξοικονομεί σημαντική χειροκίνητη προσπάθεια συλλογής και επισήμανσης των δεδομένων εκπαίδευσης. Με αυτήν την εξερεύνηση, η Dassault Systèmes επεκτείνει την επιχειρηματική αξία των μοντέλων προϊόντων 3D που δημιουργήθηκαν από σχεδιαστές και μηχανικούς, επειδή μπορείτε πλέον να χρησιμοποιείτε δεδομένα CAD, CAE και PLM σε συστήματα αναγνώρισης εικόνων στον φυσικό κόσμο.

Για περισσότερες πληροφορίες σχετικά με τις βασικές λειτουργίες και τις θήκες χρήσης των Προσαρμοσμένων Ετικετών Αναγνώρισης, ανατρέξτε Προσαρμοσμένες ετικέτες αναγνώρισης Amazon. Εάν οι εικόνες σας δεν φέρουν εγγενή ετικέτα με Ground Truth, όπως συνέβη σε αυτό το έργο, βλ. Δημιουργία αρχείου δήλωσης για να μετατρέψετε τα δεδομένα ετικετών σας στη μορφή που μπορούν να χρησιμοποιήσουν οι προσαρμοσμένες ετικέτες αναγνώρισης.

Σχετικά με τους Συγγραφείς

Woody Borraccino είναι επί του παρόντος Senior Machine Learning Specialist Solution Architect στο AWS. Με έδρα το Μιλάνο της Ιταλίας, ο Woody εργάστηκε στην ανάπτυξη λογισμικού πριν ενταχθεί στην AWS το 2015, όπου η ανάπτυξη του είναι το πάθος του για τις τεχνολογίες Computer Vision και Spatial Computing (AR/VR/XR). Το πάθος του επικεντρώνεται πλέον στην καινοτομία του μετασύμπαντος. Ακολούθησέ τον linkedin.

Γινγκ Χου, PhD, είναι Αρχιτέκτονας Μηχανικής Μάθησης Πρωτότυπων στην AWS. Οι κύριοι τομείς ενδιαφερόντων της είναι το Deep Learning, το Computer Vision, το NLP και η πρόβλεψη δεδομένων χρονοσειρών. Στον ελεύθερο χρόνο της, της αρέσει να διαβάζει μυθιστορήματα και να κάνει πεζοπορία σε εθνικά πάρκα στο Ηνωμένο Βασίλειο.

Μπερνάρ Πακές είναι επί του παρόντος CTO της Storm Reply που επικεντρώνεται σε βιομηχανικές λύσεις που αναπτύσσονται στο AWS. Με έδρα το Παρίσι της Γαλλίας, ο Bernard εργάστηκε στο παρελθόν ως Αρχιτέκτονας Λύσεων και ως Κύριος Σύμβουλος στην AWS. Οι συνεισφορές του στον εκσυγχρονισμό των επιχειρήσεων καλύπτουν το AWS for Industrial, το AWS CDK, και αυτά προέρχονται πλέον από τα συστήματα Green IT και φωνής. Ακολούθησέ τον Twitter.

Καρλ Χερκτ είναι επί του παρόντος Ανώτερος Στρατηγός στην Dassault Systèmes 3DExcite. Με έδρα το Μόναχο της Γερμανίας, δημιουργεί καινοτόμες υλοποιήσεις υπολογιστικής όρασης που προσφέρουν απτά αποτελέσματα. Ακολούθησέ τον LinkedIn.

Σφραγίδα ώρας: Μαρτίου 14, 2022

Σφραγίδα ώρας: 6 Δεκεμβρίου 2023

Computer vision με χρήση συνθετικών συνόλων δεδομένων με προσαρμοσμένες ετικέτες Amazon Rekognition και Dassault Systèmes 3DEXCITE

Αναδημοσίευση από τον Πλάτωνα

Η προσαρμογή των συστημάτων αναγνώρισης συμβάλλει στην επίτευξη επιχειρηματικών αποτελεσμάτων

Βελτιώστε την όραση υπολογιστή με το Dassault Systèmes 3DEXCITE που υποστηρίζεται από το Amazon Rekognition

Επισκόπηση λύσεων

Δημιουργήστε συνθετικές εικόνες

Εισαγάγετε το συνθετικό σύνολο δεδομένων εκπαίδευσης

Δημιουργήστε το σύνολο δεδομένων δοκιμής

Δημιουργήστε το μοντέλο ανίχνευσης αντικειμένων μεταξύ τομέων

Αποτελέσματα συμπερασμάτων μοντέλου

Συμπέρασμα

Σχετικά με τους Συγγραφείς

Περισσότερα από Μηχανική εκμάθηση AWS

Κλιμακώστε το συμπέρασμα YOLOv5 με τα τελικά σημεία του Amazon SageMaker και το AWS Lambda

Ξεπεράστε τα γλωσσικά εμπόδια με το Amazon Transcribe, το Amazon Translate και το Amazon Polly

Εκπαιδεύστε αποτελεσματικά, συντονίστε και αναπτύξτε προσαρμοσμένα σύνολα χρησιμοποιώντας το Amazon SageMaker | Υπηρεσίες Ιστού της Amazon

Οργανώστε την ανάπτυξη μηχανικής μάθησης χρησιμοποιώντας κοινόχρηστους χώρους στο SageMaker Studio για συνεργασία σε πραγματικό χρόνο

Δημιουργήστε τυχαία και στρωματοποιημένα δείγματα δεδομένων με το Amazon SageMaker Data Wrangler

Δημιουργήστε προσαρμοσμένα, συμβατά σενάρια εφαρμογής IaC για AWS Landing Zone χρησιμοποιώντας το Amazon Bedrock | Υπηρεσίες Ιστού της Amazon

Σχετικά με μας

Κάθετη αναζήτηση & Ai

Πλατφόρμα

Μείνετε συνδεδεμένοι

Λογαριασμός