Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services

Die Fähigkeit, Modelle für maschinelles Lernen (ML) schnell zu erstellen und bereitzustellen, wird in der heutigen datengesteuerten Welt immer wichtiger. Allerdings erfordert die Erstellung von ML-Modellen viel Zeit, Mühe und Fachwissen. Von der Datenerfassung und -bereinigung bis hin zum Feature-Engineering, der Modellerstellung, der Optimierung und der Bereitstellung dauert es oft Monate, bis Entwickler ML-Projekte abschließen. Und es kann schwierig sein, erfahrene Datenwissenschaftler zu finden.

Hier wird die AWS-Suite aus Low-Code- und No-Code-ML-Diensten zu einem unverzichtbaren Werkzeug. Mit nur wenigen Klicks nutzen Amazon SageMaker-Leinwandkönnen Sie die Leistungsfähigkeit von ML nutzen, ohne Code schreiben zu müssen.

Als strategischer Systemintegrator mit umfassender ML-Erfahrung nutzt Deloitte die No-Code- und Low-Code-ML-Tools von AWS, um ML-Modelle für die Kunden von Deloitte und für interne Vermögenswerte effizient zu erstellen und bereitzustellen. Mit diesen Tools kann Deloitte ML-Lösungen entwickeln, ohne Modelle und Pipelines manuell codieren zu müssen. Dies kann dazu beitragen, die Projektabwicklungsfristen zu verkürzen und Deloitte in die Lage zu versetzen, mehr Kundenarbeit zu übernehmen.

Im Folgenden sind einige spezifische Gründe aufgeführt, warum Deloitte diese Tools verwendet:

  • Zugänglichkeit für Nicht-Programmierer – No-Code-Tools ermöglichen die Erstellung von ML-Modellen auch Nicht-Programmierern. Teammitglieder mit lediglich Domänenkenntnissen und sehr geringen Programmierkenntnissen können ML-Modelle entwickeln.
  • Schnelle Einführung neuer Technologien – Die Verfügbarkeit und ständige Verbesserung gebrauchsfertiger Modelle und AutoML tragen dazu bei, dass Benutzer ständig erstklassige Technologie nutzen.
  • Kostengünstige Entwicklung – No-Code-Tools tragen dazu bei, den Kosten- und Zeitaufwand für die Entwicklung von ML-Modellen zu reduzieren und sie für Kunden zugänglicher zu machen, was ihnen helfen kann, eine höhere Kapitalrendite zu erzielen.

Darüber hinaus bieten diese Tools eine umfassende Lösung für schnellere Arbeitsabläufe und ermöglichen Folgendes:

  • Schnellere Datenaufbereitung – SageMaker Canvas verfügt über über 300 integrierte Transformationen und die Möglichkeit, natürliche Sprache zu verwenden, die die Datenvorbereitung beschleunigen und Daten für die Modellerstellung vorbereiten kann.
  • Schnellerer Modellbau – SageMaker Canvas bietet gebrauchsfertige Modelle oder Amazon AutoML Technologie, die es Ihnen ermöglicht, mit nur wenigen Klicks benutzerdefinierte Modelle auf Unternehmensdaten zu erstellen. Dies trägt dazu bei, den Prozess im Vergleich zu Codierungsmodellen von Grund auf zu beschleunigen.
  • Einfachere Bereitstellung – SageMaker Canvas bietet die Möglichkeit, produktionsbereite Modelle auf einem bereitzustellen Amazon Sagmaker Endpunkt mit wenigen Klicks und registrieren Sie ihn gleichzeitig Amazon SageMaker-Modellregistrierung.

Vishveshwara Vasa, Cloud-CTO für Deloitte, sagt:

„Durch die No-Code-ML-Dienste von AWS wie SageMaker Canvas und SageMaker Data Wrangler haben wir bei Deloitte Consulting neue Effizienzen erschlossen und die Geschwindigkeit der Entwicklung und Bereitstellungsproduktivität in unseren kundenorientierten und internen Projekten um 30–40 % gesteigert.“

In diesem Beitrag demonstrieren wir die Leistungsfähigkeit der Erstellung eines End-to-End-ML-Modells ohne Code mit SageMaker Canvas, indem wir Ihnen zeigen, wie Sie ein Klassifizierungsmodell erstellen, um vorherzusagen, ob ein Kunde mit einem Kredit in Verzug gerät. Durch die genauere Vorhersage von Kreditausfällen kann das Modell einem Finanzdienstleistungsunternehmen dabei helfen, Risiken zu verwalten, Kredite angemessen zu bewerten, Abläufe zu verbessern, zusätzliche Dienstleistungen anzubieten und sich einen Wettbewerbsvorteil zu verschaffen. Wir zeigen, wie SageMaker Canvas Ihnen dabei helfen kann, schnell von Rohdaten zu einem bereitgestellten binären Klassifizierungsmodell für die Vorhersage von Kreditausfällen zu gelangen.

SageMaker Canvas bietet umfassende Datenvorbereitungsfunktionen, die von unterstützt werden Amazon SageMaker Data Wrangler im SageMaker Canvas-Arbeitsbereich. Dadurch können Sie alle Phasen eines Standard-ML-Workflows, von der Datenvorbereitung bis zur Modellerstellung und -bereitstellung, auf einer einzigen Plattform durchlaufen.

Die Datenvorbereitung ist typischerweise die zeitintensivste Phase des ML-Workflows. Um den Zeitaufwand für die Datenvorbereitung zu reduzieren, können Sie mit SageMaker Canvas Ihre Daten mithilfe von über 300 integrierten Transformationen vorbereiten. Alternative, Sie können Eingabeaufforderungen in natürlicher Sprache schreibenB. „Löschen Sie die Zeilen für Spalte c, die Ausreißer sind“, und erhalten Sie den für diesen Datenvorbereitungsschritt erforderlichen Codeausschnitt. Anschließend können Sie dies mit wenigen Klicks zu Ihrem Datenvorbereitungs-Workflow hinzufügen. Wie Sie das nutzen, zeigen wir Ihnen in diesem Beitrag ebenfalls.

Lösungsüberblick

Das folgende Diagramm beschreibt die Architektur für ein Kreditausfallklassifizierungsmodell unter Verwendung der Low-Code- und No-Code-Tools von SageMaker.

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Beginnen Sie mit einem Datensatz, der Details zu Kreditausfalldaten enthält Amazon Simple Storage-Service (Amazon S3) verwenden wir SageMaker Canvas, um Erkenntnisse über die Daten zu gewinnen. Anschließend führen wir Feature-Engineering durch, um Transformationen anzuwenden, z. B. kategoriale Features zu kodieren, nicht benötigte Features zu löschen und mehr. Als nächstes speichern wir die bereinigten Daten wieder in Amazon S3. Wir verwenden den bereinigten Datensatz, um ein Klassifizierungsmodell zur Vorhersage von Kreditausfällen zu erstellen. Dann haben wir ein produktionsreifes Modell für die Inferenz.

Voraussetzungen:

Stellen Sie sicher, dass Folgendes gilt Voraussetzungen abgeschlossen sind und dass Sie die aktiviert haben Canvas Fertigmodelle Option beim Einrichten der SageMaker-Domäne. Wenn Sie Ihre Domain bereits eingerichtet haben, Bearbeiten Sie Ihre Domain-Einstellungen und geh zu Canvas-Einstellungen um das zu ermöglichen Aktivieren Sie Canvas Ready-to-use-Modelle Möglichkeit. Zusätzlich einrichten und Erstellen Sie die SageMaker Canvas-Anwendung, dann anfordern und aktivieren Anthropischer Claude-Modellzugang on Amazonas Grundgestein.

Datensatz

Wir verwenden einen öffentlichen Datensatz von kaggle das Informationen über Finanzkredite enthält. Jede Zeile im Datensatz stellt einen einzelnen Kredit dar und die Spalten enthalten Details zu jeder Transaktion. Laden Sie diesen Datensatz herunter und speichern Sie ihn in einem S3-Bucket Ihrer Wahl. In der folgenden Tabelle sind die Felder im Datensatz aufgeführt.

Spaltenname Dateityp Beschreibung
Person_age ganze Zahl Alter der Person, die einen Kredit aufgenommen hat
Person_income ganze Zahl Einkommen des Kreditnehmers
Person_home_ownership Schnur Wohneigentumsstatus (Eigentum oder Miete)
Person_emp_length Dezimal Anzahl der Jahre, in denen sie beschäftigt sind
Loan_intent Schnur Grund des Darlehens (persönlich, medizinisch, pädagogisch usw.)
Loan_grade Schnur Kreditnote (A–E)
Loan_int_rate Dezimal Zinssatz
Loan_amnt ganze Zahl Gesamtbetrag des Darlehens
Loan_status ganze Zahl Ziel (unabhängig davon, ob es ausgefallen ist oder nicht)
Loan_percent_income Dezimal Kreditbetrag im Verhältnis zum Prozentsatz des Einkommens
Cb_person_default_on_file ganze Zahl Frühere Standardeinstellungen (falls vorhanden)
Cb_person_credit_history_length Schnur Länge ihrer Kredithistorie

Vereinfachen Sie die Datenvorbereitung mit SageMaker Canvas

Die Datenvorbereitung kann in ML-Projekten bis zu 80 % des Aufwands ausmachen. Eine ordnungsgemäße Datenvorbereitung führt zu einer besseren Modellleistung und genaueren Vorhersagen. SageMaker Canvas ermöglicht die interaktive Datenerkundung, -transformation und -vorbereitung, ohne dass SQL- oder Python-Code geschrieben werden muss.

Führen Sie die folgenden Schritte aus, um Ihre Daten vorzubereiten:

  1. Wählen Sie in der SageMaker Canvas-Konsole Datenaufbereitung im Navigationsbereich.
  2. Auf dem Erstellen Menü, wählen Sie Dokument.
  3. Aussichten für DatensatznameGeben Sie einen Namen für Ihren Datensatz ein.
  4. Auswählen Erstellen.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
  5. Wählen Sie Amazon S3 als Datenquelle und verbinden Sie es mit dem Datensatz.
  6. Erstellen Sie nach dem Laden des Datensatzes einen Datenfluss mit diesem Datensatz.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
  7. Wechseln Sie zur Registerkarte „Analysen“ und erstellen Sie eine Datenqualitäts- und Insights-Bericht.

Dies ist ein empfohlener Schritt zur Analyse der Qualität des Eingabedatensatzes. Die Ausgabe dieses Berichts liefert sofortige ML-gestützte Erkenntnisse wie Datenverzerrung, Duplikate in den Daten, fehlende Werte und vieles mehr. Der folgende Screenshot zeigt ein Beispiel des generierten Berichts für den Kreditdatensatz.

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Durch die Generierung dieser Erkenntnisse in Ihrem Namen liefert Ihnen SageMaker Canvas eine Reihe von Problemen in den Daten, die in der Datenvorbereitungsphase behoben werden müssen. Um die beiden wichtigsten von SageMaker Canvas identifizierten Probleme auszuwählen, müssen Sie die kategorialen Merkmale kodieren und die doppelten Zeilen entfernen, damit die Qualität Ihres Modells hoch ist. Mit SageMaker Canvas können Sie beides und noch mehr in einem visuellen Workflow erledigen.

  1. Zuerst One-Hot-Codierung durchführen loan_intent, loan_grade und person_home_ownership
  2. Sie können das fallen lassen cb_person_cred_history_length Spalte, da diese Spalte die geringste Vorhersagekraft hat, wie im Datenqualitäts- und Einblicksbericht gezeigt.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
    SageMaker Canvas hat kürzlich eine hinzugefügt Chatten Sie mit Daten Möglichkeit. Diese Funktion nutzt die Leistungsfähigkeit von Foundation-Modellen, um Abfragen in natürlicher Sprache zu interpretieren und Python-basierten Code zu generieren, um Feature-Engineering-Transformationen anzuwenden. Diese Funktion wird von Amazon Bedrock unterstützt und kann so konfiguriert werden, dass sie vollständig in Ihrer VPC ausgeführt wird, sodass Daten niemals Ihre Umgebung verlassen.
  3. Um diese Funktion zum Entfernen doppelter Zeilen zu verwenden, wählen Sie das Pluszeichen neben dem aus Spalte löschen transformieren, dann wählen Chatten Sie mit Daten.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
  4. Geben Sie Ihre Abfrage in natürlicher Sprache ein (z. B. „Entfernen Sie doppelte Zeilen aus dem Datensatz“).
  5. Überprüfen Sie die generierte Transformation und wählen Sie aus Zu den Schritten hinzufügen um die Transformation zum Fluss hinzuzufügen.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
  6. Exportieren Sie abschließend die Ausgabe dieser Transformationen nach Amazon S3 oder optional Amazon SageMaker Feature Store um diese Funktionen projektübergreifend zu nutzen.

Sie können auch einen weiteren Schritt hinzufügen, um ein Amazon S3-Ziel für den Datensatz zu erstellen und so den Workflow für einen großen Datensatz zu skalieren. Das folgende Diagramm zeigt den SageMaker Canvas-Datenfluss nach dem Hinzufügen visueller Transformationen.

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Sie haben den gesamten Datenverarbeitungs- und Feature-Engineering-Schritt mithilfe visueller Arbeitsabläufe in SageMaker Canvas abgeschlossen. Dies trägt dazu bei, die Zeit, die ein Dateningenieur für die Bereinigung und Vorbereitung der Daten für die Modellentwicklung aufwendet, von Wochen auf Tage zu reduzieren. Der nächste Schritt besteht darin, das ML-Modell zu erstellen.

Erstellen Sie ein Modell mit SageMaker Canvas

Amazon SageMaker Canvas bietet einen durchgängigen Workflow ohne Code zum Erstellen, Analysieren, Testen und Bereitstellen dieses binären Klassifizierungsmodells. Führen Sie die folgenden Schritte aus:

  1. Erstellen Sie einen Datensatz in SageMaker Canvas.
  2. Geben Sie entweder den S3-Speicherort an, der zum Exportieren der Daten verwendet wurde, oder den S3-Speicherort, der sich am Ziel des SageMaker Canvas-Jobs befindet.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
    Jetzt können Sie das Modell erstellen.
  3. Auswählen Modelle im Navigationsbereich und wählen Sie Neues Modell.
  4. Benennen Sie das Modell und wählen Sie es aus Vorausschauende Analyse als Modelltyp.
  5. Wählen Sie den im vorherigen Schritt erstellten Datensatz aus.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
    Der nächste Schritt ist die Konfiguration des Modelltyps.
  6. Wählen Sie die Zielspalte und der Modelltyp wird automatisch als festgelegt 2-Kategorie-Vorhersage.
  7. Wählen Sie Ihren Build-Typ, Standardaufbau or Schneller Aufbau.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
    SageMaker Canvas zeigt die voraussichtliche Erstellungszeit an, sobald Sie mit der Erstellung des Modells beginnen. Der Standardaufbau dauert normalerweise zwischen 2 und 4 Stunden. Sie können die Schnellerstellungsoption für kleinere Datensätze verwenden, die nur 2–15 Minuten dauert. Für diesen speziellen Datensatz sollte es etwa 45 Minuten dauern, bis der Modellaufbau abgeschlossen ist. SageMaker Canvas hält Sie über den Fortschritt des Erstellungsprozesses auf dem Laufenden.
  8. Nachdem das Modell erstellt wurde, können Sie sich die Modellleistung ansehen.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
    SageMaker Canvas bietet je nach Modelltyp verschiedene Metriken wie Genauigkeit, Präzision und F1-Score. Der folgende Screenshot zeigt die Genauigkeit und einige andere erweiterte Metriken für dieses binäre Klassifizierungsmodell.
  9. Der nächste Schritt besteht darin, Testvorhersagen zu treffen.
    Mit SageMaker Canvas können Sie Stapelvorhersagen für mehrere Eingaben oder eine einzelne Vorhersage treffen, um die Modellqualität schnell zu überprüfen. Der folgende Screenshot zeigt eine Beispielinferenz.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.
  10. Der letzte Schritt besteht darin, das trainierte Modell bereitzustellen.
    SageMaker Canvas stellt das Modell auf SageMaker-Endpunkten bereit, und jetzt steht Ihnen ein Produktionsmodell für die Inferenz bereit. Der folgende Screenshot zeigt den bereitgestellten Endpunkt.
    Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Nachdem das Modell bereitgestellt wurde, können Sie es über das AWS SDK oder aufrufen AWS-Befehlszeilenschnittstelle (AWS CLI) oder führen Sie API-Aufrufe an eine beliebige Anwendung Ihrer Wahl durch, um das Risiko eines potenziellen Kreditnehmers sicher vorherzusagen. Weitere Informationen zum Testen Ihres Modells finden Sie unter Rufen Sie Echtzeit-Endpunkte auf.

Aufräumen

Um zusätzliche Kosten zu vermeiden, Melden Sie sich von SageMaker Canvas ab or Löschen Sie die SageMaker-Domäne das entstand. Zusätzlich, Löschen Sie den SageMaker-Modellendpunkt und Löschen Sie den Datensatz, der auf Amazon S3 hochgeladen wurde.

Zusammenfassung

No-Code-ML beschleunigt die Entwicklung, vereinfacht die Bereitstellung, erfordert keine Programmierkenntnisse, erhöht die Standardisierung und senkt die Kosten. Diese Vorteile machten No-Code-ML für Deloitte attraktiv, um sein ML-Serviceangebot zu verbessern, und sie haben die Zeitpläne für die Erstellung ihres ML-Modells um 30–40 % verkürzt.

Deloitte ist ein strategischer globaler Systemintegrator mit über 17,000 zertifizierten AWS-Praktikern auf der ganzen Welt. Durch die Teilnahme am AWS-Kompetenzprogramm wird die Messlatte weiterhin höher gelegt 25 Kompetenzen, darunter maschinelles Lernen. Verbinden Sie sich mit Deloitte um mit der Nutzung der No-Code- und Low-Code-Lösungen von AWS in Ihrem Unternehmen zu beginnen.


Über die Autoren

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Chida Sadayappan leitet die Cloud-KI/Machine-Learning-Praxis von Deloitte. Er bringt umfassende Erfahrung als Thought-Leadership in Engagements ein und ist erfolgreich darin, Führungskräften dabei zu helfen, mithilfe von KI/ML branchenübergreifend Leistungsverbesserungs- und Modernisierungsziele zu erreichen. Chida ist eine Multi-Tech-Unternehmerin und begeisterte Community-Builderin im Startup- und Entwickler-Ökosystem.

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Kuldeep Singh, ein leitender globaler KI/ML-Leiter bei AWS mit über 20 Jahren Erfahrung in der Technologiebranche, kombiniert seine Vertriebs- und Unternehmerkenntnisse gekonnt mit einem tiefen Verständnis für KI, ML und Cybersicherheit. Er zeichnet sich dadurch aus, dass er strategische globale Partnerschaften schmiedet und transformative Lösungen und Strategien in verschiedenen Branchen vorantreibt, wobei der Schwerpunkt auf generativer KI und GSIs liegt.

Steigerung der Entwicklerproduktivität: Wie Deloitte Amazon SageMaker Canvas für maschinelles Lernen ohne Code/Low-Code nutzt | Amazon Web Services PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Kasi Muthu ist Senior Partner Solution Architect mit Schwerpunkt auf Daten und KI/ML bei AWS mit Sitz in Houston, TX. Es ist ihm eine Leidenschaft, Partner und Kunden bei der Beschleunigung ihrer Cloud-Datenreise zu unterstützen. Er ist ein vertrauenswürdiger Berater auf diesem Gebiet und verfügt über umfangreiche Erfahrung in der Architektur und dem Aufbau skalierbarer, belastbarer und leistungsstarker Workloads in der Cloud. Außerhalb der Arbeit verbringt er gerne Zeit mit seiner Familie.

Zeitstempel:

Mehr von AWS Maschinelles Lernen