Chronomika to firma technologiczno-bio, która wykorzystuje biomarkery — wymierne informacje pochodzące z analizy cząsteczek — obok technologii, aby zdemokratyzować wykorzystanie nauki i danych w celu poprawy życia ludzi. Ich celem jest analiza próbek biologicznych i dostarczanie przydatnych informacji, które pomogą ci podejmować decyzje — we wszystkim, gdzie ważna jest wiedza o tym, co niewidoczne. Platforma firmy Chronomics umożliwia dostawcom bezproblemowe wdrażanie diagnostyki w domu na dużą skalę — bez poświęcania wydajności i dokładności. Przetworzył już miliony testów za pośrednictwem tej platformy i zapewnia wysokiej jakości diagnostykę.
Podczas pandemii COVID-19 firma Chronomics sprzedawała testy przepływu bocznego (LFT) do wykrywania COVID-19. Użytkownicy rejestrują test na platformie, wgrywając zdjęcie kasety testowej i wprowadzając ręczny odczyt testu (pozytywny, negatywny lub nieważny). Wraz ze wzrostem liczby testów i użytkowników ręczne sprawdzanie, czy raportowany wynik zgadza się z wynikiem na zdjęciu testu, szybko stało się niepraktyczne. Firma Chronomics chciała zbudować skalowalne rozwiązanie, które wykorzystuje wizję komputerową do weryfikacji wyników.
W tym poście dzielimy się tym, jak wykorzystano Chronomics Amazon Rekognition do automatycznego wykrywania wyników testu bocznego przepływu COVID-19.
Przygotowanie danych
Poniższy obraz przedstawia zdjęcie kasety testowej przesłanej przez użytkownika. Zbiór danych składa się z obrazów takich jak ten. Obrazy te należy sklasyfikować jako pozytywne, negatywne lub nieważne, zgodnie z wynikiem testu na COVID-19.
Główne wyzwania związane ze zbiorem danych były następujące:
- Niezrównoważony zbiór danych – Zbiór danych był bardzo wypaczony. Ponad 90% próbek pochodziło z klasy negatywnej.
- Niewiarygodne dane wejściowe użytkownika – Odczyty zgłaszane ręcznie przez użytkowników nie były wiarygodne. Około 40% odczytów nie zgadzało się z faktycznym wynikiem z obrazka.
Aby stworzyć zestaw danych treningowych wysokiej jakości, inżynierowie Chronomics postanowili wykonać następujące kroki:
- Adnotacja ręczna – Ręcznie wybierz i oznacz 1,000 obrazów, aby zapewnić równomierną reprezentację trzech klas
- Powiększanie obrazu – Rozszerz oznaczone obrazy, aby zwiększyć liczbę do 10,000 XNUMX
Powiększanie obrazu przeprowadzono za pomocą Albumentacje, biblioteka Pythona typu open source. Przeprowadzono szereg transformacji, takich jak obrót, zmiana skali i jasność, aby wygenerować 9,000 syntetycznych obrazów. Te syntetyczne obrazy zostały dodane do oryginalnych obrazów, aby utworzyć wysokiej jakości zestaw danych.
Budowa niestandardowego modelu wizji komputerowej z Amazon Rekognition
Inżynierowie Chronomics zwrócili się w stronę Etykiety niestandardowe Amazon Rekognition, funkcja Amazon Rekognition z funkcjami AutoML. Po dostarczeniu obrazów szkoleniowych może automatycznie ładować i sprawdzać dane, wybierać odpowiednie algorytmy, trenować model i dostarczać metryki wydajności modelu. To znacznie przyspiesza proces szkolenia i wdrażania komputerowego modelu wizyjnego, co czyni Chronomics głównym powodem przyjęcia Amazon Rekognition. Dzięki Amazon Rekognition byliśmy w stanie uzyskać bardzo dokładny model w ciągu 3–4 tygodni, zamiast spędzać 4 miesiące na próbach zbudowania niestandardowego modelu w celu osiągnięcia pożądanej wydajności.
Na poniższym diagramie przedstawiono potok szkolenia modelu. Obrazy z adnotacjami zostały najpierw wstępnie przetworzone przy użyciu pliku AWS Lambda funkcjonować. Ten etap wstępnego przetwarzania zapewnił, że obrazy były w odpowiednim formacie pliku, a także wykonał kilka dodatkowych kroków, takich jak zmiana rozmiaru obrazu i konwersja obrazu z RGB na skalę szarości. Zaobserwowano, że poprawia to wydajność modelu.
Po przeszkoleniu modelu można go wdrożyć do wnioskowania za pomocą jednego kliknięcia lub wywołania interfejsu API.
Wydajność modelu i dostrajanie
Model uzyskał dokładność 96.5% i wynik F1 97.9% na zestawie obrazów poza próbką. Wynik F1 to miara, która wykorzystuje zarówno precyzję, jak i pamięć do pomiaru wydajności klasyfikatora. The Interfejs API DetectCustomLabels służy do wykrywania etykiet dostarczonego obrazu podczas wnioskowania. Interfejs API zwraca również pewność, jaką Rekognition Custom Labels ma co do dokładności przewidywanej etykiety. Poniższy wykres przedstawia rozkład wyników ufności przewidywanych etykiet dla obrazów. Oś x przedstawia wynik ufności pomnożony przez 100, a oś y to liczba predykcji w skali logarytmicznej.
Ustawiając próg wyniku ufności, możemy odfiltrować prognozy, które mają niższą ufność. Próg 0.99 dał dokładność 99.6%, a 5% przewidywań zostało odrzuconych. Próg 0.999 dał dokładność 99.87%, przy odrzuceniu 27% przewidywań. Aby zapewnić odpowiednią wartość biznesową, firma Chronomics wybrała próg 0.99, aby zmaksymalizować dokładność i zminimalizować odrzucanie prognoz. Aby uzyskać więcej informacji, zobacz Analizowanie obrazu z przeszkolonym modelem.
Odrzucone prognozy mogą być również kierowane do człowieka w pętli za pomocą Amazon AI Augmented (Amazon A2I) do ręcznego przetwarzania obrazu. Aby uzyskać więcej informacji o tym, jak to zrobić, patrz Użyj Amazon Augmented AI z Amazon Rekognition.
Poniższy obraz przedstawia przykład, w którym model poprawnie zidentyfikował test jako nieważny z ufnością 0.999.
Wnioski
W tym poście pokazaliśmy łatwość, z jaką firma Chronomics szybko zbudowała i wdrożyła skalowalne rozwiązanie oparte na wizji komputerowej, które wykorzystuje Amazon Rekognition do wykrywania wyniku testu przepływu bocznego COVID-19. The Interfejs API rozpoznawania Amazon bardzo ułatwia praktykom przyspieszenie procesu budowy komputerowych modeli wizyjnych.
Dowiedz się, jak trenować komputerowe modele wizyjne dla konkretnego przypadku biznesowego, odwiedzając witrynę Pierwsze kroki z niestandardowymi etykietami Amazon Rekognition oraz przeglądając ww Przewodnik po etykietach niestandardowych Amazon Rekognition.
O autorach
Mattia Spinelli jest starszym inżynierem uczenia maszynowego w Chronomics, firmie biomedycznej. Platforma firmy Chronomics umożliwia dostawcom bezproblemowe wdrażanie diagnostyki domowej na dużą skalę — wszystko to bez utraty wydajności i dokładności.
Pinak Panigrahi współpracuje z klientami w celu tworzenia rozwiązań opartych na uczeniu maszynowym w celu rozwiązywania strategicznych problemów biznesowych w AWS. Kiedy nie zajmuje się uczeniem maszynowym, można go spotkać na spacerze, czytaniu książki lub nadrabianiu zaległości sportowych.
Jay'a Rao jest głównym architektem rozwiązań w AWS. Lubi udzielać klientom wskazówek technicznych i strategicznych oraz pomagać im w projektowaniu i wdrażaniu rozwiązań w AWS.
Paszmeńska tajemnica jest Senior Product Managerem w AWS. Poza pracą Paszmina lubi wędrówki pełne przygód, fotografię i spędzanie czasu z rodziną.
- AI
- ai sztuka
- generator sztuki ai
- masz robota
- Amazon Rekognition
- sztuczna inteligencja
- certyfikacja sztucznej inteligencji
- sztuczna inteligencja w bankowości
- robot sztucznej inteligencji
- roboty sztucznej inteligencji
- oprogramowanie sztucznej inteligencji
- Uczenie maszynowe AWS
- blockchain
- konferencja blockchain ai
- pomysłowość
- sztuczna inteligencja konwersacyjna
- konferencja kryptograficzna
- Rozwiązania dla klientów
- Dall's
- głęboka nauka
- google to
- Średni (200)
- Life Sciences
- uczenie maszynowe
- plato
- Platon Ai
- Analiza danych Platona
- Gra Platona
- PlatoDane
- platogaming
- skala ai
- składnia
- zefirnet