Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten

Amazon SageMaker-Autopilot erstellt, trainiert und optimiert automatisch die besten Modelle für maschinelles Lernen (ML) basierend auf Ihren Daten, während Sie die volle Kontrolle und Transparenz behalten. Wir haben kürzlich angekündigt Unterstützung für Zeitreihendaten in Autopilot. Sie können Autopilot verwenden, um Regressions- und Klassifizierungsaufgaben für Zeitreihendaten oder Sequenzdaten im Allgemeinen zu bewältigen. Zeitreihendaten sind eine spezielle Art von Sequenzdaten, bei denen Datenpunkte in gleichmäßigen Zeitintervallen erfasst werden.

Die manuelle Aufbereitung der Daten, die Auswahl des richtigen ML-Modells und die Optimierung seiner Parameter ist selbst für einen erfahrenen Praktiker eine komplexe Aufgabe. Obwohl es automatisierte Ansätze gibt, die die besten Modelle und ihre Parameter finden können, können diese normalerweise keine Daten verarbeiten, die als Sequenzen vorliegen, wie z. B. Netzwerkverkehr, Stromverbrauch oder Haushaltsausgaben, die im Laufe der Zeit aufgezeichnet werden. Da diese Daten die Form von Beobachtungen annehmen, die zu unterschiedlichen Zeitpunkten erfasst wurden, können aufeinanderfolgende Beobachtungen nicht als unabhängig voneinander behandelt werden und müssen als Ganzes verarbeitet werden. Sie können Autopilot für eine Vielzahl von Problemen im Zusammenhang mit sequentiellen Daten verwenden. Sie können beispielsweise den im Laufe der Zeit aufgezeichneten Netzwerkverkehr klassifizieren, um böswillige Aktivitäten zu identifizieren, oder anhand ihrer Kredithistorie feststellen, ob Einzelpersonen für eine Hypothek in Frage kommen. Sie stellen einen Datensatz bereit, der Zeitreihendaten enthält, und Autopilot erledigt den Rest, verarbeitet die sequenziellen Daten durch spezialisierte Feature-Transformationen und findet das beste Modell für Sie.

Autopilot eliminiert das schwere Heben beim Erstellen von ML-Modellen und hilft Ihnen, das beste ML-Modell basierend auf Ihren Daten automatisch zu erstellen, zu trainieren und zu optimieren. Autopilot führt mehrere Algorithmen auf Ihren Daten aus und optimiert ihre Hyperparameter auf einer vollständig verwalteten Recheninfrastruktur. In diesem Beitrag zeigen wir, wie Sie es verwenden können Autopilot um Klassifikations- und Regressionsprobleme auf Zeitreihendaten zu lösen. Anweisungen zum Erstellen und Trainieren eines Autopilot-Modells finden Sie unter Kundenabwanderungsvorhersage mit Amazon SageMaker Autopilot.

Zeitreihendatenklassifizierung mit Autopilot

Als laufendes Beispiel betrachten wir ein Mehrklassenproblem auf der Zeitreihe Datensatz UWaveGestureLibraryX, die äquidistante Messwerte von Beschleunigungssensoren enthält, während eine von acht vordefinierten Handgesten ausgeführt wird. Der Einfachheit halber betrachten wir nur die X-Dimension des Beschleunigungsmessers. Die Aufgabe besteht darin, ein Klassifizierungsmodell zu erstellen, um die Zeitreihendaten aus den Sensormesswerten den vordefinierten Gesten zuzuordnen. Die folgende Abbildung zeigt die ersten Zeilen des Datensatzes im CSV-Format. Die gesamte Tabelle besteht aus 896 Zeilen und zwei Spalten: Die erste Spalte ist eine Gestenbezeichnung und die zweite Spalte ist eine Zeitreihe von Sensormesswerten.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Konvertieren Sie Daten mit Amazon SageMaker Data Wrangler in das richtige Format

Zusätzlich zu numerischen, kategorialen und Standardtextspalten akzeptiert Autopilot jetzt auch eine Sequenzeingabespalte. Wenn Ihre Zeitreihendaten diesem Format nicht folgen, können Sie sie einfach konvertieren Amazon SageMaker Data Wrangler. Data Wrangler reduziert die Zeit, die zum Sammeln und Vorbereiten von Daten für ML benötigt wird, von Wochen auf Minuten. Mit Data Wrangler können Sie den Prozess der Datenvorbereitung und des Feature-Engineering vereinfachen und jeden Schritt des Datenvorbereitungs-Workflows abschließen, einschließlich Datenauswahl, -bereinigung, -exploration und -visualisierung über eine einzige visuelle Oberfläche. Betrachten Sie zum Beispiel denselben Datensatz, aber in einem anderen Eingabeformat: Jede Geste (angegeben durch ID) ist eine Folge von äquidistanten Messungen des Beschleunigungsmessers. Bei vertikaler Speicherung enthält jede Zeile einen Zeitstempel und einen Wert. Die folgende Abbildung vergleicht diese Daten in ihrem ursprünglichen Format und einem Sequenzformat.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Um dieses Dataset mit Data Wrangler in das zuvor beschriebene Format zu konvertieren, laden Sie das Dataset aus Amazon Simple Storage-Service (Amazon S3). Dann nutzen Sie die Zeitreihe Gruppieren nach Transform, wie im folgenden Screenshot gezeigt, und exportieren Sie die Daten im CSV-Format zurück nach Amazon S3.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Wenn das Dataset im vorgesehenen Format vorliegt, können Sie mit Autopilot fortfahren. Informationen zu anderen Zeitreihentransformatoren von Data Wrangler finden Sie unter Bereiten Sie Zeitreihendaten mit Amazon SageMaker Data Wrangler vor.

Starten Sie einen AutoML-Job

Wie bei anderen von Autopilot unterstützten Eingabetypen ist jede Zeile des Datensatzes eine andere Beobachtung und jede Spalte ein Feature. In diesem Beispiel haben wir eine einzelne Spalte mit Zeitreihendaten, aber Sie können mehrere Zeitreihenspalten haben. Sie können auch mehrere Spalten mit unterschiedlichen Eingabetypen haben, z. B. Zeitreihen, Text und Zahlen.

Zu Erstellen Sie ein Autopilot-Experiment, platzieren Sie das Dataset in einem S3-Bucket und erstellen Sie darin ein neues Experiment Amazon SageMaker-Studio. Wie im folgenden Screenshot gezeigt, müssen Sie den Namen des Experiments, den S3-Speicherort des Datasets, den S3-Speicherort für die Ausgabeartefakte und den vorherzusagenden Spaltennamen angeben.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Autopilot analysiert die Daten, generiert ML-Pipelines und führt standardmäßig 250 Iterationen der Hyperparameteroptimierung für diese Klassifizierungsaufgabe aus. Wie in der folgenden Modellrangliste gezeigt, erreicht Autopilot eine Genauigkeit von 0.821, und Sie können das beste Modell mit nur einem Klick einsetzen.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Darüber hinaus generiert Autopilot a Bericht zur Datenexploration, wo Sie Ihre Daten visualisieren und untersuchen können.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Transparenz ist grundlegend für Autopilot. Sie können generierte ML-Pipelines im Kandidatendefinitionsnotizbuch überprüfen und ändern. Der folgende Screenshot zeigt, wie Autopilot eine Reihe von Pipelines empfiehlt und den Zeitreihentransformator kombiniert TSFeatureExtractor mit verschiedenen ML-Algorithmen, wie z. B. Gradienten-verstärkten Entscheidungsbäumen und linearen Modellen. Die TSFeatureExtractor extrahiert Hunderte von Zeitreihenmerkmalen für Sie, die dann in die nachgelagerten Algorithmen eingespeist werden, um Vorhersagen zu treffen. Die vollständige Liste der Zeitreihenfunktionen finden Sie unter Überblick über extrahierte Merkmale.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.

Zusammenfassung

In diesem Beitrag haben wir gezeigt, wie Sie SageMaker Autopilot verwenden, um Zeitreihenklassifizierungs- und Regressionsprobleme mit nur wenigen Klicks zu lösen.

Weitere Informationen zum Autopiloten finden Sie unter Amazon SageMaker-Autopilot. Informationen zu verwandten Funktionen von SageMaker finden Sie unter Amazon SageMaker Data Wrangler.


Über die Autoren

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Nikita Iwkin ist ein angewandter Wissenschaftler, Amazon SageMaker Data Wrangler.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Anne Milbert ist ein Softwareentwicklungsingenieur, der an Amazon SageMaker Automatic Model Tuning arbeitet.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Valerio Perrone ist ein Applied Science Manager, der an Amazon SageMaker Automatic Model Tuning und Autopilot arbeitet.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai.Meghana Satish ist ein Softwareentwicklungsingenieur, der an Amazon SageMaker Automatic Model Tuning arbeitet.

Amazon SageMaker Autopilot unterstützt jetzt Zeitreihendaten PlatoBlockchain Data Intelligence. Vertikale Suche. Ai. Ali Takbiri ist ein auf KI/ML spezialisierter Lösungsarchitekt und hilft Kunden durch den Einsatz von maschinellem Lernen bei der Lösung ihrer geschäftlichen Herausforderungen in der AWS Cloud.

Zeitstempel:

Mehr von AWS Maschinelles Lernen