Wielu dostawców oprogramowania jako usługi (SaaS) z różnych branż dodaje funkcje uczenia maszynowego (ML) i sztucznej inteligencji (AI) do swoich ofert SaaS, aby uwzględnić przypadki użycia, takie jak spersonalizowane rekomendacje produktów, wykrywanie oszustw i dokładna ochrona popytu. Niektórzy dostawcy SaaS chcą samodzielnie budować takie funkcje ML i AI i wdrażać je w środowisku wielodostępnym. Jednak inni, którzy mają bardziej zaawansowanych klientów, chcą umożliwić swoim klientom samodzielne budowanie modeli ML i używanie ich do rozszerzania SaaS o dodatkowe możliwości lub zastępowania domyślnej implementacji niektórych funkcji.
W tym poście omawiamy, jak ulepszyć swoją ofertę SaaS za pomocą środowiska pracy do nauki danych obsługiwanego przez Studio Amazon SageMaker.
Załóżmy, że niezależny dostawca oprogramowania (ISV) o nazwie XYZ ma wiodącą ofertę CRM SaaS, z której korzystają miliony klientów do analizowania zachowań zakupowych klientów. Marketer z firmy FOO (klient XYZ) chce znaleźć kupujących ze skłonnością do rezygnacji, aby mogli zoptymalizować ROI swoich programów utrzymania klientów, kierując reklamy do takich kupujących. Wcześniej do oceny takich klientów wykorzystywali prostą analizę statystyczną w CRM. Teraz chcą jeszcze bardziej poprawić ROI za pomocą technik ML. XYZ może ulepszyć swoje CRM dla swoich klientów, korzystając z rozwiązania wyjaśnionego w tym poście i umożliwić zespołowi ds. analizy danych FOO samodzielne budowanie modeli na podstawie ich danych.
Klienci SaaS zainteresowani tym przypadkiem użycia chcą mieć dostęp do środowiska pracy do nauki danych w ramach SaaS, dzięki któremu mogą z łatwością uzyskać dostęp do swoich danych znajdujących się w SaaS, analizować je, wyodrębniać trendy oraz budować, trenować i wdrażać niestandardowe Modele ML. Chcą bezpiecznej integracji między środowiskiem pracy Data Science Workbench a SaaS, dostępu do kompleksowego i szerokiego zestawu funkcji Data Science i ML oraz możliwości importowania dodatkowych zestawów danych i łączenia ich z danymi wyodrębnionymi z SaaS w celu uzyskania przydatnych informacji.
Poniższy diagram ilustruje aktualną architekturę oferty CRM SaaS firmy XYZ.
Ta architektura składa się z następujących elementów:
- Warstwa front-endu – Ta warstwa jest hostowana na Usługa Amazon Simple Storage (Amazonka S3). Amazon CloudFront jest używany jako globalna sieć dostarczania treści i Amazon Cognito służy do uwierzytelniania i autoryzacji użytkownika. Ta warstwa obejmuje trzy aplikacje internetowe:
- Lądowanie i rejestracja – Publiczna strona, którą klienci mogą znaleźć i użyć do zarejestrowania się w rozwiązaniu CRM. Rejestracja uruchamia proces rejestracji, który polega na stworzeniu nowego najemcy w systemie dla klienta.
- Aplikacja CRM – Używany przez klientów do zarządzania możliwościami, zarządzania własnymi klientami i nie tylko. Opiera się na Amazon Cognito do uwierzytelniania i autoryzacji użytkowników.
- Administrator CRM – Używany przez dostawcę SaaS do zarządzania i konfigurowania najemców.
- Warstwa zaplecza – Ta warstwa jest zaimplementowana jako dwa zestawy mikroserwisów uruchomionych Elastyczna usługa Amazon Kubernetes (Amazon EKS):
- Usługi SaaS – Obejmuje usługi rejestracji, zarządzania najemcami i zarządzania użytkownikami. Pełniejsze wdrożenie obejmowałoby dodatkowe usługi w zakresie rozliczeń i pomiarów.
- Usługi aplikacyjne – Obejmuje usługi zarządzania klientami, zarządzania szansami i katalogiem produktów. Zestaw ten może zawierać dodatkowe usługi oparte na funkcjonalnościach biznesowych dostarczanych przez rozwiązanie CRM.
W kolejnych sekcjach wpisu omówiono, jak zbudować nową wersję CRM SaaS z wbudowanym środowiskiem do nauki danych.
Przegląd rozwiązania
Używamy pliki Amazon Sage Maker aby sprostać wymaganiom naszego rozwiązania. SageMaker to najbardziej kompletna, kompleksowa usługa dla ML. Jest to zarządzana usługa dla analityków danych i programistów, która pomaga usunąć niezróżnicowane obciążenie związane z ML, dzięki czemu możesz mieć więcej czasu, zasobów i energii, aby skupić się na swojej firmie.
Funkcje SageMaker obejmują SageMaker Studio — pierwsze w pełni zintegrowane środowisko programistyczne (IDE) dla ML. Zapewnia pojedynczy interfejs graficzny oparty na sieci Web, w którym można wykonać wszystkie kroki programowania ML wymagane do kompilowania, trenowania, dostrajania, debugowania, wdrażania i monitorowania modeli. Daje analitykom danych wszystkie narzędzia, których potrzebują, aby przenieść modele ML z eksperymentów do produkcji bez opuszczania środowiska IDE.
SageMaker Studio jest osadzone w SaaS jako środowisko pracy do analizy danych — możesz je uruchomić, wybierając łącze w SaaS i uzyskać dostęp do różnych możliwości SageMaker. Możesz użyć SageMaker Studio do przetwarzania i analizowania własnych danych przechowywanych w SaaS oraz wydobywania spostrzeżeń. Możesz również użyć interfejsów API SageMaker, aby zbudować i wdrożyć model ML, a następnie zintegrować procesy i przepływy pracy SaaS z wdrożonym modelem ML w celu dokładniejszego przetwarzania danych.
Ten post dotyczy kilku kwestii wymaganych do rozwiązania:
- Podejście dla wielu najemców i konfiguracja kont – Jak odizolować lokatorów. W tej sekcji omówiono również proponowaną strukturę kont.
- Zaopatrzenie i automatyzacja – Jak zautomatyzować udostępnianie środowiska pracy Data Science.
- Integracja i zarządzanie tożsamością – Integracja między SaaS i SageMaker Studio oraz integracja z dostawcą tożsamości (IdP).
- Zarządzanie danymi – Ekstrakcja danych i sposób ich udostępniania w środowisku Data Science Workbench.
Omawiamy te koncepcje w kontekście rozwiązania CRM SaaS wyjaśnionego na początku wpisu. Poniższy diagram przedstawia ogólny widok architektury rozwiązania.
Jak pokazano na poprzednim schemacie, kluczową zmianą w architekturze jest wprowadzenie następujących komponentów:
- Usługa zarządzania danymi – Odpowiedzialny za wyodrębnianie danych klienta SaaS z magazynu danych SaaS i przekazywanie ich do środowiska analitycznego danych.
- Usługa zarządzania warsztatem nauki danych – Odpowiedzialny za udostępnianie środowiska do nauki danych dla klientów SaaS i uruchamianie go w ramach SaaS.
- Środowisko pracy do nauki danych – Oparty na SageMaker Studio i działa na oddzielnym koncie AWS. Zawiera również zasobnik S3, który przechowuje dane wyodrębnione z magazynu danych SaaS.
Korzyści płynące z tego rozwiązania obejmują:
- Klienci SaaS mogą wykonywać różne zadania związane z analizą danych i ML, uruchamiając SageMaker Studio z SaaS w osobnej karcie i używając go jako środowiska pracy do analizy danych, bez konieczności ponownego uwierzytelniania. Nie muszą budować oddzielnej platformy do nauki danych i nią zarządzać.
- Klienci SaaS mogą łatwo wyodrębniać dane znajdujące się w magazynie danych SaaS i udostępniać je wbudowanemu środowisku do nauki o danych bez konieczności posiadania umiejętności inżynierii danych. Ponadto łatwiej jest zintegrować zbudowany przez nich model ML z SaaS.
- Klienci SaaS mogą uzyskać dostęp do najszerszego i najbardziej kompletnego zestawu funkcji ML zapewnianych przez SageMaker.
Podejście dla wielu najemców i konfiguracja konta
W tej sekcji opisano, jak udostępnić SageMaker Studio dla różnych dzierżawców lub klientów SaaS (dzierżawcy i klienci SaaS są używani zamiennie, ponieważ są blisko spokrewnieni — każdy klient SaaS ma dzierżawcę). Poniższy diagram przedstawia konfigurację wielu kont, która obsługuje udostępnianie zabezpieczonego i izolowanego środowiska SageMaker dla każdej dzierżawy. Proponowana struktura jest zgodna z najlepszymi praktykami AWS dotyczącymi konfiguracji wielu kont. Aby uzyskać więcej informacji, zobacz Organizowanie środowiska AWS za pomocą wielu kont.
Używamy pliki Wieża kontroli AWS w celu wdrożenia proponowanej konfiguracji wielu kont. AWS Control Tower zapewnia strukturę do konfigurowania i rozszerzania dobrze zaprojektowanego, wielokontowego środowiska AWS w oparciu o najlepsze praktyki w zakresie bezpieczeństwa i zgodności. AWS Control Tower korzysta z wielu innych usług AWS, w tym Organizacje AWS, Katalog usług AWS, Tworzenie chmury AWS, aby zbudować strukturę konta i zastosować poręcze. Poręczami mogą być polityki kontroli usług organizacji AWS lub Konfiguracja AWS zasady. Account Factory, funkcja AWS Control Tower, która umożliwia standaryzację nowych kont z odpowiednimi punktami odniesienia dla scentralizowanego rejestrowania i audytu, jest używana do automatyzacji udostępniania nowych kont dla środowisk SageMaker klientów w ramach procesu onboardingu. Odnosić się do Wieża kontrolna AWS — skonfiguruj i zarządzaj środowiskiem AWS z wieloma kontami aby uzyskać więcej informacji na temat AWS Control Tower i sposobu, w jaki korzysta z innych usług AWS pod maską, aby skonfigurować i zarządzać konfiguracją wielu kont.
Wszystkie konta obsługujące środowiska SageMaker klientów znajdują się we wspólnej jednostce organizacyjnej (OU), aby umożliwić stosowanie wspólnych barier ochronnych i automatyzacji, w tym konfigurację podstawową, która tworzy domenę SageMaker Studio, wiadro S3, w którym znajdują się zestawy danych wyodrębnione z magazynu danych SaaS, wiele kont AWS Zarządzanie tożsamością i dostępem (IAM) role, które umożliwiają dostęp do komponentów SageMaker z poziomu SaaS i nie tylko.
Izolacja najemców
W kontekście SaaS można rozważyć różne strategie izolacji najemców:
- Model silosu – Każdy najemca prowadzi całkowicie wyciszony stos zasobów
- Model basenu – Ta sama infrastruktura i zasoby są współdzielone przez najemców
- Model mostu – Rozwiązanie obejmujące mieszankę modeli silosów i basenów
Patrz: Raport dotyczący strategii izolacji najemców SaaS Aby uzyskać więcej informacji na temat strategii izolacji dzierżawców SaaS.
Model silosu jest używany dla SageMaker — oddzielna lub niezależna domena SageMaker Studio jest udostępniana każdemu klientowi na osobnym koncie jako jego instancja środowiska pracy Data Science. Model silosu upraszcza konfigurację bezpieczeństwa i izolację. Zapewnia również inne korzyści, takie jak uproszczenie obliczania kosztów związanych z wykorzystaniem przez najemcę różnych możliwości programu SageMaker.
Podczas gdy strategia izolacji silosu jest używana w środowisku SageMaker, model puli jest używany w przypadku innych komponentów (takich jak usługa zarządzania środowiskiem roboczym analizy danych). Ustanowienie izolacji w modelu silosu, w którym każdy najemca działa we własnej infrastrukturze (w tym przypadku na koncie AWS) jest znacznie prostsze w porównaniu z modelem puli, w którym infrastruktura jest współdzielona. Wspomniany wcześniej oficjalny dokument zawiera wskazówki dotyczące ustanawiania izolacji za pomocą modelu puli. W tym poście stosujemy następujące podejście:
- Użytkownik zostaje przekierowany do dostawcy tożsamości (w tym przypadku Amazon Cognito) w celu uwierzytelnienia. Użytkownik wprowadza swoją nazwę użytkownika i hasło, a po pomyślnym uwierzytelnieniu dostawca tożsamości zwraca token zawierający informacje o użytkowniku i identyfikator dzierżawy. Fronton zawiera zwrócony token w kolejnych żądaniach HTTP wysyłanych przez fronton do mikrousług.
- Gdy mikrousługa odbiera żądanie, wyodrębnia identyfikator dzierżawy z tokenu zawartego w żądaniu HTTP i przyjmuje rolę uprawnień, która odpowiada dzierżawcy. Przyjęte uprawnienia roli IAM są ograniczone do zasobów specyficznych dla dzierżawcy. Dlatego nawet jeśli deweloper mikrousługi popełnił błąd w kodzie i próbował uzyskać dostęp do zasobów należących do innego dzierżawcy, przyjęta rola uprawnień nie pozwala na kontynuowanie tej akcji.
- Rola uprawnień odpowiadająca najemcy jest tworzona w ramach rejestracji i dołączania najemcy.
Inne podejścia do ustanawiania izolacji w trybie puli obejmują dynamiczne generowanie zasad i ról, które są przyjmowane przez mikrousługę w czasie wykonywania. Aby uzyskać więcej informacji, zapoznaj się z Raport dotyczący strategii izolacji najemców SaaS. Inną alternatywą jest użycie zasad ABAC IAM — patrz Jak wdrożyć izolację dzierżawców SaaS za pomocą ABAC i AWS IAM by uzyskać więcej szczegółów.
Zaopatrzenie i automatyzacja
Jak pokazano wcześniej, używamy AWS Organizations, AWS Service Catalog i AWS CloudFormation StackSets do wdrożenia wymaganej konfiguracji wielu kont. Ważnym aspektem tego jest utworzenie nowego konta AWS dla każdego klienta do hostowania środowiska SageMaker oraz jak w pełni zautomatyzować ten proces.
StackSet do obsługi administracyjnej SageMaker na koncie klienta jest tworzony na koncie zarządzania — celem StackSet jest jednostka organizacyjna ML. Po utworzeniu nowego konta w jednostce organizacyjnej ML, stos oparty na szablonie powiązanym ze StackSet zdefiniowanym na koncie zarządzania jest automatycznie tworzony na nowym koncie.
Udostępnianie środowiska SageMaker dzierżawcy to wieloetapowy proces, który trwa kilka minut. Dlatego też Amazon DynamoDB tabela jest tworzona do przechowywania stanu udostępniania środowiska SageMaker.
Poniższy diagram przedstawia przepływ dla aprowizacji środowiska pracy Data Science.
Mikrousługa zarządzania środowiskiem roboczym analizy danych koordynuje różne działania związane z udostępnianiem środowiska roboczego analizy danych dla klientów SaaS. Nazywa Katalog Usług AWS ProvisionProduct
API do inicjowania tworzenia konta AWS.
Jak wspomniano wcześniej, StackSet dołączony do ML OU wyzwala utworzenie domeny SageMaker Studio i innych zasobów na koncie klienta, gdy tylko konto zostanie utworzone w ML OU w wyniku wywołania katalogu usług AWS ProvisionProduct
API. Innym sposobem na osiągnięcie tego jest użycie Katalogu usług AWS — możesz stworzyć produkt do obsługi środowiska SageMaker Studio i dodać go do portfolio. Następnie portfel jest udostępniany wszystkim kontom AWS w ramach jednostki organizacyjnej ML. Mikrousługa zarządzania środowiskiem roboczym nauki danych musi wykonać jawne wywołanie interfejsu API katalogu usług AWS po zakończeniu tworzenia konta AWS, aby uruchomić tworzenie środowiska SageMaker Studio. Katalog usług AWS jest bardzo przydatny, jeśli potrzebujesz obsługiwać wiele wariantów środowiska pracy do nauki danych — użytkownik wybiera z listy wariantów, a mikrousługa zarządzania środowiskiem pracy nauki danych odwzorowuje wybór użytkownika na produkt zdefiniowany w katalogu usług AWS. Następnie przywołuje ProvisionProduct
API z odpowiednim identyfikatorem produktu.
Po utworzeniu konta AWS, a CreateManagedAccount
wydarzenie jest publikowane przez AWS Control Tower do Most zdarzeń Amazona. W EventBridge skonfigurowano regułę do wysłania CreateManagedAccount
wydarzenia do Usługa Amazon Simple Queue (Amazon SQS). Mikrousługa zarządzania środowiskiem roboczym nauki danych odpytuje kolejkę SQS, pobiera CreateManagedAccount
zdarzeń i wywołuje usługę zarządzania dzierżawą w celu dodania utworzonego numeru konta AWS (część komunikatu o zdarzeniu) do metadanych dzierżawy.
Stan żądań aprowizacji środowiska pracy analizy danych jest przechowywany w tabeli DynamoDB, dzięki czemu użytkownicy mogą zapytać o to w dowolnym momencie.
Integracja i zarządzanie tożsamością
Ta sekcja koncentruje się na integracji między SaaS i SageMaker Studio (która obejmuje uruchamianie SageMaker Studio z poziomu SaaS) oraz zarządzaniu tożsamością. W tym rozwiązaniu używamy Amazon Cognito jako dostawcy tożsamości, ale jeśli SaaS jest już zintegrowany z innym dostawcą tożsamości obsługującym OAuth 2.0/OpenID Connect, możesz nadal go używać, ponieważ obowiązuje ten sam projekt.
SageMaker Studio obsługuje uwierzytelnianie przez Jednokrotne logowanie AWS (AWS SSO) i IAM. Biorąc pod uwagę, że organizacja AWS w tym przypadku jest zarządzana przez dostawcę SaaS, prawdopodobnie logowanie jednokrotne AWS jest połączone z IdP dostawcy SaaS, a nie IdP klienta SaaS. Dlatego używamy uprawnień do uwierzytelniania użytkowników uzyskujących dostęp do SageMaker Studio.
Uwierzytelnianie użytkowników uzyskujących dostęp do SageMaker Studio za pomocą IAM wiąże się z utworzeniem profilu użytkownika dla każdego użytkownika w domenie SageMaker i mapowaniem ich tożsamości w Amazon Cognito na utworzony profil użytkownika. Jednym z prostych sposobów na osiągnięcie tego jest użycie nazwy użytkownika w Amazon Cognito jako nazwy profilu użytkownika w domenie SageMaker Studio. SageMaker zapewnia CreateUserProfile
API, którego można użyć do programowego tworzenia profilu użytkownika dla użytkownika przy pierwszej próbie uruchomienia SageMaker Studio.
W odniesieniu do uruchamiania SageMaker Studio z poziomu SaaS, SageMaker ujawnia CreatePresignedDomainUrl
API, które generuje wcześniej podpisany adres URL dla SageMaker Studio. Wygenerowany wstępnie podpisany adres URL jest przekazywany do interfejsu użytkownika w celu uruchomienia programu SageMaker Studio w innej karcie przeglądarki.
Poniższy diagram przedstawia architekturę ustanawiania integracji między SaaS i SageMaker Studio.
Mikrousługa zarządzania środowiskiem roboczym nauki danych obsługuje generowanie wstępnie podpisanego adresu URL, który jest używany do uruchamiania programu SageMaker Studio, który istnieje na koncie klienta. Wywołuje mikrousługę zarządzania dzierżawą, aby pobrać numer konta AWS, który odpowiada identyfikatorowi dzierżawcy zawartemu w żądaniu, przejmuje rolę uprawnień na tym koncie z wymaganymi uprawnieniami i wywołuje SageMaker CreatePresignedDomainUrl
API do generowania wcześniej podpisanego adresu URL.
Jeśli użytkownik uruchamia SageMaker Studio po raz pierwszy, należy najpierw utworzyć dla niego profil użytkownika. Osiąga się to, dzwoniąc do SageMaker CreateUserProfile
API.
Użytkownicy mogą używać środowiska analizy danych do przetwarzania danych na dużą skalę, trenowania modelu ML i używania go do wnioskowania wsadowego oraz tworzenia wzbogaconych zestawów danych. Mogą również używać go do budowania i trenowania modelu ML, hostowania tego modelu ML na Hosting zarządzany przez SageMakeri wywołaj go z SaaS, aby zrealizować przypadek użycia, taki jak wspomniany na początku postu (zastępując prostą funkcję analizy statystycznej, która przewiduje odejście klientów, zaawansowaną funkcją opartą na ML, dla której klient sam buduje model). Poniższy diagram przedstawia jedno podejście do osiągnięcia tego celu.
Analityk danych klienta SaaS uruchamia środowisko pracy do analizy danych (SageMaker Studio) i używa go do wstępnego przetwarzania wyodrębnionych danych przy użyciu Przetwarzanie SageMaker (alternatywnie możesz użyć Poskramiacz danych SageMaker). Decydują, którego algorytmu ML użyć i inicjują Szkolenie SageMakera zadanie trenowania modelu za pomocą wstępnie przetworzonych danych. Następnie dokonują niezbędnej oceny modelu w notatniku SageMaker Studio, a jeśli są zadowoleni z wyników, używają hostingu zarządzanego SageMaker do wdrażania i hostowania utworzonego modelu ML.
Po wdrożeniu ML analityk danych przechodzi do SaaS i podaje szczegóły punktu końcowego SageMaker obsługującego model ML. Spowoduje to wywołanie mikrousługi zarządzania dzierżawą w celu dodania szczegółów punktu końcowego SageMaker do informacji o dzierżawie. Następnie po nawiązaniu połączenia z mikrousługą zarządzania klientami wywołuje ona mikrousługę zarządzania dzierżawą w celu pobrania informacji o dzierżawie, w tym numeru konta AWS i szczegółów punktu końcowego SageMaker. Następnie przyjmuje rolę uprawnień na koncie klienta z wymaganymi uprawnieniami, wywołuje punkt końcowy SageMaker w celu obliczenia prawdopodobieństwa odejścia klienta i uwzględnia dane wyjściowe w komunikacie odpowiedzi.
Punkt końcowy ML wywoływany przez mikrousługę zarządzania klientami jest dynamiczny (pobierany z usługi zarządzania dzierżawą), ale interfejs jest stały i jest wstępnie zdefiniowany przez dostawcę SaaS – obejmuje to format (np. aplikacja/json), funkcje, które SaaS wysyła do modelu ML, ich kolejność, a także dane wyjściowe. Od klienta SaaS oczekuje się, że zbuduje model ML zgodny z interfejsem zdefiniowanym przez dostawcę SaaS. Szczegóły interfejsu i przykładowe żądanie/odpowiedź zostaną przedstawione klientowi SaaS na stronie aplikacji, co pozwoli mu nadpisać implementację własnym modelem ML. Mikrousługa SaaS (mikrousługa zarządzania klientami na powyższym diagramie) wykonuje wymaganą transformację i serializację w celu uzyskania funkcji oczekiwanych przez punkt końcowy ML w określonym formacie, wywołuje punkt końcowy ML, wykonuje wymaganą deserializację i transformację, a następnie dołącza dane wyjściowe wnioskowania w odpowiedzi zwróconej przez mikroserwis.
Może się zdarzyć, że klient SaaS chce wykluczyć funkcje, które nie są istotne dla jego modelu, lub dodać funkcje oprócz tego, co przekazał SaaS. Można to osiągnąć, wykorzystując dźwignię Użyj własnego kodu wnioskowania, gdzie mają pełną kontrolę nad kodem wnioskowania.
Zarządzanie danymi
W tej sekcji omówiono proponowaną architekturę tworzenia mikrousługi zarządzania danymi, która jest jednym z podejść, które można zastosować, aby umożliwić klientom SaaS dostęp do danych znajdujących się w magazynie danych SaaS. Mikrousługa zarządzania danymi odbiera żądania ekstrakcji danych od analityków danych i uruchamia te żądania w kontrolowany sposób, aby uniknąć negatywnego wpływu na wydajność magazynu danych SaaS. Mikrousługa jest również odpowiedzialna za kontrolę dostępu do magazynu danych SaaS (które elementy danych są zawarte w wyciągu danych) oraz maskowanie i anonimizację danych, jeśli jest to wymagane.
Poniższy diagram przedstawia potencjalny projekt mikrousługi zarządzania danymi.
Mikrousługa zarządzania danymi jest podzielona na dwa składniki:
- Zarządzanie danymi – Odbiera żądanie pobrania danych, umieszcza je w kolejce i wysyła potwierdzenie jako odpowiedź
- Pracownik zarządzania danymi – Pobiera żądanie z kolejki i przetwarza je, wywołując Klej AWS praca
To rozdzielenie umożliwia niezależne skalowanie dwóch komponentów i kontrolowanie obciążenia magazynu danych SaaS, niezależnie od ilości żądań ekstrakcji danych.
Zadanie AWS Glue wyodrębnia dane z repliki dla bazy danych transakcji, a nie z podstawowej instancji bazy danych. Zapobiega to negatywnemu wpływowi żądań ekstrakcji danych na wydajność SaaS.
Zadanie AWS Glue przesyła wyodrębnione dane do zasobnika S3 na koncie AWS utworzonym dla określonego klienta. Dlatego składnik procesu roboczego zarządzania danymi musi wywołać mikrousługę zarządzania dzierżawą, aby pobrać numer konta AWS, który jest częścią informacji o dzierżawie.
Stan żądań ekstrakcji danych jest przechowywany w tabeli DynamoDB, dzięki czemu użytkownicy mogą zapytać o to w dowolnym momencie.
Wnioski
W tym poście pokazaliśmy, jak zbudować środowisko pracy do nauki danych w ramach SaaS przy użyciu SageMaker Studio. Omówiliśmy takie aspekty, jak struktura konta AWS, izolacja dzierżawców, wyodrębnianie danych z magazynu danych SaaS i udostępnianie ich w środowisku Data Science, uruchamianie SageMaker Studio z poziomu SaaS, zarządzanie tożsamościami i wreszcie udostępnianie środowiska Data Science w zautomatyzowanym sposób korzystania z usług takich jak AWS Control Tower, AWS Organizations i AWS CloudFormation.
Mamy nadzieję, że pomoże to rozszerzyć wykorzystanie ML w SaaS i zapewnić klientom bardziej elastyczne rozwiązanie, które pozwoli im korzystać z udostępnianych im przez Ciebie możliwości ML, a także samodzielnie budować funkcje ML.
O autorach
Islam Mahgoub jest architektem rozwiązań w AWS z 15-letnim doświadczeniem w architekturze aplikacji, integracji i technologii. W AWS pomaga klientom budować nowe rozwiązania natywne dla chmury i modernizować ich starsze aplikacje z wykorzystaniem usług AWS. Poza pracą islam lubi spacerować, oglądać filmy i słuchać muzyki.
Giuseppe Angelo Porcellego jest głównym specjalistą ds. rozwiązań w zakresie uczenia maszynowego dla Amazon Web Services. Dzięki kilkuletniemu doświadczeniu w inżynierii oprogramowania i ML, współpracuje z klientami dowolnej wielkości, aby dogłębnie zrozumieć ich potrzeby biznesowe i techniczne oraz projektować rozwiązania AI i uczenia maszynowego, które najlepiej wykorzystują AWS Cloud i stos Amazon Machine Learning. Pracował przy projektach z różnych dziedzin, w tym MLOps, Computer Vision, NLP oraz obejmujących szeroki zestaw usług AWS. W wolnym czasie Giuseppe lubi grać w piłkę nożną.
Arunprasath Shankar jest specjalistą ds. rozwiązań w zakresie sztucznej inteligencji i uczenia maszynowego (AI / ML) w AWS, pomagając globalnym klientom skutecznie i wydajnie skalować rozwiązania AI w chmurze. W wolnym czasie Arun lubi oglądać filmy science fiction i słuchać muzyki klasycznej.
- Coinsmart. Najlepsza w Europie giełda bitcoinów i kryptowalut.
- Platoblockchain. Web3 Inteligencja Metaverse. Wzmocniona wiedza. DARMOWY DOSTĘP.
- CryptoJastrząb. Radar Altcoin. Bezpłatna wersja próbna.
- Źródło: https://aws.amazon.com/blogs/machine-learning/enhance-your-saas-offering-with-a-data-science-workbench-powered-by-amazon-sagemaker-studio/
- "
- &
- 100
- O nas
- dostęp
- Konto
- dokładny
- osiągnięty
- w poprzek
- Działania
- zajęcia
- Dodatkowy
- adres
- zaawansowany
- AI
- algorytm
- Wszystkie kategorie
- już
- Amazonka
- Amazon Web Services
- analiza
- Inne
- api
- Pszczoła
- Aplikacja
- Zastosowanie
- aplikacje
- Stosowanie
- podejście
- architektura
- sztuczny
- sztuczna inteligencja
- Sztuczna inteligencja (AI)
- Sztuczna inteligencja i uczenie maszynowe
- Uwierzytelnianie
- autoryzacja
- zautomatyzowane
- Automatyzacja
- dostępny
- AWS
- tło
- Baseline
- Początek
- Korzyści
- BEST
- Najlepsze praktyki
- billing
- przeglądarka
- budować
- Budowanie
- biznes
- wezwanie
- możliwości
- Etui
- zmiana
- Chmura
- kod
- wspólny
- sukcesy firma
- w porównaniu
- spełnienie
- składnik
- systemu
- konsumować
- konsumpcja
- zawiera
- zawartość
- kontynuować
- kontrola
- Koszty:
- tworzy
- Tworzenie
- Klientów
- dane
- zarządzanie danymi
- analiza danych
- nauka danych
- naukowiec danych
- Baza danych
- dostawa
- Kreowanie
- rozwijać
- Wnętrze
- Wykrywanie
- Deweloper
- deweloperzy
- oprogramowania
- różne
- dyskutować
- Nie
- domena
- domeny
- dynamiczny
- z łatwością
- Punkt końcowy
- energia
- Inżynieria
- Wzbogacony
- Wchodzi
- Środowisko
- zapewniają
- wydarzenie
- wydarzenia
- Rozszerzać
- spodziewany
- doświadczenie
- rozciągać się
- Wyciągi
- fabryka
- Cecha
- Korzyści
- W końcu
- i terminów, a
- pierwszy raz
- pływ
- Skupiać
- obserwuj
- następujący
- piłka nożna
- format
- Framework
- oszustwo
- Darmowy
- pełny
- Funkcjonalność
- Generować
- Globalne
- będzie
- Zaoszczędzić
- mający
- pomaga
- W jaki sposób
- How To
- HTTPS
- tożsamość
- zarządzanie tożsamością
- wdrożenia
- realizowane
- ważny
- podnieść
- zawierać
- włączony
- Włącznie z
- przemysłowa
- Informacja
- Infrastruktura
- spostrzeżenia
- integrować
- zintegrowany
- integracja
- Inteligencja
- Interfejs
- izolacja
- IT
- Praca
- przystąpić
- Klawisz
- uruchomić
- uruchamia
- wodowanie
- prowadzący
- nauka
- Dziedzictwo
- Ograniczony
- LINK
- Lista
- Słuchanie
- załadować
- maszyna
- uczenie maszynowe
- Dokonywanie
- i konserwacjami
- zarządzający
- Mapy
- miliony
- ML
- model
- modele
- większość
- Kino
- Muzyka
- sieć
- notatnik
- numer
- oferuje
- Oferty
- Wprowadzenie
- Szanse
- Okazja
- organizacja
- organizacji
- Inne
- Hasło
- jest gwarancją najlepszej jakości, które mogą dostarczyć Ci Twoje monitory,
- Platforma
- polityka
- basen
- teczka
- pierwotny
- Główny
- wygląda tak
- procesów
- produkować
- Wytworzony
- Produkt
- Produkcja
- Profil
- Programy
- projektowanie
- ochrona
- zapewniać
- zapewnia
- zakup
- Rejestracja
- wymagany
- wymagania
- Zasoby
- odpowiedź
- odpowiedzialny
- Efekt
- powraca
- ROI
- reguły
- bieganie
- Skala
- nauka
- Naukowiec
- Naukowcy
- bezpieczne
- bezpieczeństwo
- usługa
- Usługi
- zestaw
- shared
- Prosty
- Rozmiar
- umiejętności
- So
- Tworzenie
- Oprogramowanie jako usługa
- Inżynieria oprogramowania
- Rozwiązania
- dzielić
- stos
- Stan
- statystyczny
- Rynek
- przechowywanie
- sklep
- sklep
- strategie
- Strategia
- studio
- udany
- wsparcie
- podpory
- system
- cel
- zadania
- zespół
- Techniczny
- Techniki
- Technologia
- Przez
- czas
- żeton
- narzędzia
- Top
- transakcje
- Transformacja
- Trendy
- ui
- zrozumieć
- posługiwać się
- Użytkownicy
- Zobacz i wysłuchaj
- wizja
- Tom
- chodzący
- sieć
- Aplikacje internetowe
- usługi internetowe
- Web-based
- Co
- Księga zasad
- KIM
- w ciągu
- bez
- Praca
- pracował
- działa
- lat