10 niesamowitych wizualizacji uczenia maszynowego, które powinieneś znać w 2023 roku

Yellowbrick do tworzenia wykresów uczenia maszynowego z mniejszą ilością kodu

Photo by Dawid Pisnoy on Unsplash

Wizualizacja danych odgrywa ważną rolę w uczeniu maszynowym.

Przypadki użycia wizualizacji danych w uczeniu maszynowym obejmują:

  • Strojenie hiperparametrów
  • Ocena wydajności modelu
  • Walidacja założeń modelu
  • Znajdowanie wartości odstających
  • Wybór najważniejszych cech
  • Identyfikacja wzorców i korelacji między cechami

Wizualizacje bezpośrednio związane z powyższymi kluczowymi rzeczami w uczeniu maszynowym to tzw wizualizacje uczenia maszynowego.

Tworzenie wizualizacji uczenia maszynowego jest czasami skomplikowanym procesem, ponieważ wymaga dużej ilości kodu do napisania nawet w Pythonie. Ale dzięki open-source Pythona Żółta cegła biblioteki nawet złożone wizualizacje uczenia maszynowego można tworzyć przy użyciu mniejszej ilości kodu. Ta biblioteka rozszerza interfejs API Scikit-learn i zapewnia funkcje wysokiego poziomu do diagnostyki wizualnej, które nie są dostarczane przez Scikit-learn.

Dzisiaj omówię szczegółowo następujące typy wizualizacji uczenia maszynowego, przypadki ich użycia oraz implementację Yellowbrick.

Wizualizacje Yellowbrick ML
-----------------------------
01. Główny wykres składowy
02. Krzywa walidacyjna
03. Krzywa uczenia się
04. Działka Łokcia
05. Fabuła sylwetki
06. Wykres braku równowagi klas
07. Działka pozostałości
08. Wykres błędu przewidywania
09. Wykres odległości Cooka
10. Wykres ważności funkcji

Instalacja

Instalację Yellowbrick można wykonać, uruchamiając jedno z poniższych poleceń.

  • pypeć instalator pakietu:
pip zainstaluj Yellowbrick
  • Conda instalator pakietu:
conda install -c Districtdatalabs Yellowbrick

Korzystanie z Yellowbrick

Wizualizatory Yellowbrick mają składnię podobną do Scikit-learn. Wizualizator to obiekt, który uczy się na podstawie danych w celu utworzenia wizualizacji. Jest często używany z estymatorem Scikit-learn. Aby wytrenować wizualizator, wywołujemy jego metodę fit().

Zapisywanie fabuły

Aby zapisać wykres utworzony za pomocą wizualizatora Yellowbrick, wywołujemy metodę show() w następujący sposób. Spowoduje to zapisanie wykresu jako pliku PNG na dysku.

wizualizator.show(outpath="nazwa_fabuły_plot.png")

Stosowanie

Wykres składowych głównych przedstawia dane wielowymiarowe na wykresie punktowym 2D lub 3D. Dlatego ten wykres jest niezwykle przydatny do identyfikowania ważnych wzorców w danych wielowymiarowych.

Implementacja Yellowbrick

Tworzenie tej działki metodą tradycyjną jest skomplikowane i czasochłonne. Musimy najpierw zastosować PCA do zbioru danych, a następnie użyć biblioteki matplotlib do utworzenia wykresu punktowego.

Zamiast tego możemy użyć klasy wizualizatora PCA firmy Yellowbrick, aby osiągnąć tę samą funkcjonalność. Wykorzystuje metodę analizy głównych składowych, zmniejsza wymiarowość zbioru danych i tworzy wykres punktowy z 2 lub 3 liniami kodu! Wszystko, co musimy zrobić, to określić kilka argumentów słów kluczowych w klasie PCA().

Weźmy przykład, aby lepiej to zrozumieć. Tutaj używamy tzw rak piersi zbiór danych (patrz Cytat na końcu), który ma 30 obiektów i 569 próbek dwóch klas (Złośliwy i Łagodny). Ze względu na dużą wielowymiarowość danych (30 cech) niemożliwe jest wykreślenie oryginalnych danych na wykresie punktowym 2D lub 3D, chyba że zastosujemy PCA do zbioru danych.

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator PCA firmy Yellowbrick do utworzenia dwuwymiarowego wykresu punktowego 2-wymiarowego zestawu danych.

(Kod autorstwa autora)
Wykres głównych komponentów — 2D (Zdjęcie autorstwa autora)

Możemy również stworzyć wykres punktowy 3D poprzez ustawienie projection=3w klasie PCA().

(Kod autorstwa autora)
Wykres głównych komponentów — 3D (Zdjęcie autorstwa autora)

Do najważniejszych parametrów wizualizatora PCA należą:

  • skala: logiczny, domyślny True. Wskazuje, czy dane powinny być skalowane, czy nie. Powinniśmy skalować dane przed uruchomieniem PCA. Dowiedz się więcej o tutaj.
  • występ: int, domyślnie 2. Kiedy projection=2, tworzony jest wykres punktowy 2D. Kiedy projection=3, tworzony jest wykres punktowy 3D.
  • zajęcia: lista, domyślna None. Wskazuje etykiety klas dla każdej klasy w y. Nazwy klas będą etykietami legendy.

Stosowanie

Krzywa walidacji przedstawia wpływ a pojedynczy hiperparametr w pociągu i zbiorze walidacyjnym. Patrząc na krzywą możemy określić stany overfitting, underfitting i just-right modelu dla zadanych wartości danego hiperparametru. Gdy istnieje wiele hiperparametrów do dostrojenia jednocześnie, nie można użyć krzywej sprawdzania poprawności. Instated, możesz użyć wyszukiwania siatki lub wyszukiwania losowego.

Implementacja Yellowbrick

Tworzenie krzywej walidacji tradycyjną metodą jest złożone i czasochłonne. Zamiast tego możemy użyć wizualizatora ValidationCurve firmy Yellowbrick.

Aby wykreślić krzywą walidacji w Yellowbirck, zbudujemy losowy klasyfikator lasu, używając tego samego rak piersi zbiór danych (patrz Cytat na końcu). Wykreślimy wpływ maksymalna głębokość hiperparametr w losowym modelu lasu.

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator ValidationCurve firmy Yellowbrick do utworzenia krzywej sprawdzania poprawności przy użyciu rak piersi zestaw danych.

(Kod autorstwa autora)
Krzywa walidacyjna (Zdjęcie autorstwa autora)

Model zaczyna się przepasowywać po maksymalna głębokość wartość 6. Kiedy max_depth=6, model bardzo dobrze pasuje do danych treningowych, a także dobrze uogólnia nowe, niewidoczne dane.

Do najważniejszych parametrów wizualizatora ValidationCurve należą:

  • taksator: Może to być dowolny model Scikit-learn ML, taki jak drzewo decyzyjne, las losowy, maszyna wektora wsparcia itp.
  • nazwa_parametru: Jest to nazwa hiperparametru, który chcemy monitorować.
  • zakres_parametrów: Obejmuje to możliwe wartości dla nazwa_parametru.
  • życiorys: int, określa liczbę powtórzeń dla walidacji krzyżowej.
  • punktacja: strunowy, zawiera metodę oceny modelu. do klasyfikacji, precyzja jest preferowany.

Stosowanie

Krzywa uczenia przedstawia błędy lub dokładności uczenia i walidacji w funkcji liczby epok lub liczby instancji szkoleniowych. Możesz pomyśleć, że zarówno krzywe uczenia się, jak i walidacji wyglądają tak samo, ale liczba iteracji jest wykreślona na osi x krzywej uczenia się, podczas gdy wartości hiperparametru są wykreślone na osi x krzywej walidacji.

Zastosowania krzywej uczenia się obejmują:

  • Krzywa uczenia służy do wykrywania niedopasowanie, nadmierne dopasowanie i dokładnie warunki modelu.
  • Krzywa uczenia się służy do identyfikacji sniska zbieżność, oscylacyjny, oscylujące z rozbieżnością i właściwa konwergencja scenariusze podczas znajdowania optymalnej szybkości uczenia się sieci neuronowej lub modelu ML.
  • Krzywa uczenia się służy do sprawdzenia, ile nasz model zyskuje na dodaniu większej liczby danych treningowych. W przypadku użycia w ten sposób oś x pokazuje liczbę wystąpień szkoleniowych.

Implementacja Yellowbrick

Tworzenie krzywej uczenia się metodą tradycyjną jest złożone i czasochłonne. Zamiast tego możemy użyć wizualizatora LearningCurve firmy Yellowbrick.

Aby wykreślić krzywą uczenia się w Yellowbirck, zbudujemy klasyfikator wektora nośnego, używając tego samego rak piersi zbiór danych (patrz Cytat na końcu).

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator LearningCurve firmy Yellowbrick do utworzenia krzywej sprawdzania poprawności przy użyciu rak piersi zestaw danych.

(Kod autorstwa autora)
Krzywa uczenia się (Zdjęcie autorstwa autora)

Model nie odniesie korzyści z dodania większej liczby instancji szkoleniowych. Model został już przeszkolony z 569 instancjami treningowymi. Dokładność sprawdzania poprawności nie poprawia się po 175 wystąpieniach szkoleniowych.

Do najważniejszych parametrów wizualizatora LearningCurve należą:

  • taksator: Może to być dowolny model Scikit-learn ML, taki jak drzewo decyzyjne, las losowy, maszyna wektora wsparcia itp.
  • życiorys: int, określa liczbę powtórzeń dla walidacji krzyżowej.
  • punktacja: strunowy, zawiera metodę oceny modelu. do klasyfikacji, precyzja jest preferowany.

Stosowanie

Wykres Elbow służy do wyboru optymalnej liczby skupień w grupowaniu K-średnich. Model najlepiej pasuje do punktu, w którym na wykresie liniowym występuje kolano. Łokieć jest punktem przegięcia na wykresie.

Implementacja Yellowbrick

Tworzenie wykresu Elbow tradycyjną metodą jest skomplikowane i czasochłonne. Zamiast tego możemy użyć KElbowVisualizer firmy Yellowbrick.

Aby wykreślić krzywą uczenia się w Yellowbirck, zbudujemy model grupowania K-średnich przy użyciu irys zbiór danych (patrz Cytat na końcu).

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać KElbowVisualizer firmy Yellowbrick do utworzenia wykresu Elbow przy użyciu irys zestaw danych.

(Kod autorstwa autora)
Działka Łokcia (Zdjęcie autorstwa autora)

Połączenia łokieć występuje przy k=4 (oznaczone linią przerywaną). Wykres wskazuje, że optymalna liczba skupień dla modelu to 4. Innymi słowy, model jest dobrze dopasowany do 4 skupień.

Do najważniejszych parametrów KElbowVisualizera należą:

  • taksator: Instancja modelu k-średnich
  • k: int lub krotka. Jeśli liczba całkowita, obliczy wyniki dla klastrów w zakresie (2, k). Jeśli jest krotką, obliczy wyniki dla klastrów w danym zakresie, na przykład (3, 11).

Stosowanie

Wykres sylwetki służy do wyboru optymalnej liczby klastrów w grupowaniu K-średnich, a także do wykrywania nierównowagi klastrów. Ten wykres zapewnia bardzo dokładne wyniki niż wykres Elbow.

Implementacja Yellowbrick

Tworzenie wykresu sylwetki metodą tradycyjną jest skomplikowane i czasochłonne. Zamiast tego możemy użyć programu SilhouetteVisualizer firmy Yellowbrick.

Aby utworzyć wykres sylwetki w Yellowbirck, zbudujemy model grupowania K-średnich przy użyciu irys zbiór danych (patrz Cytat na końcu).

Poniższe bloki kodu wyjaśniają, w jaki sposób możemy wykorzystać narzędzie SilhouetteVisualizer firmy Yellowbrick do tworzenia wykresów sylwetek przy użyciu irys zbiór danych z różnymi wartościami k (liczba klastrów).

k = 2

(Kod autorstwa autora)
Wykres sylwetki z 2 skupieniami (k=2), (Zdjęcie autora)

Zmieniając liczbę klastrów w klasie KMeans(), możemy wykonać powyższy kod w różnym czasie, aby utworzyć wykresy sylwetki, gdy k=3, k=4 i k=5.

k = 3

Wykres sylwetki z 3 skupieniami (k=3), (Zdjęcie autora)

k = 4

Wykres sylwetki z 4 skupieniami (k=4), (Zdjęcie autora)

k = 5

Wykres sylwetki z 4 skupieniami (k=5), (Zdjęcie autora)

Wykres sylwetki zawiera jeden kształt noża na klaster. Każdy kształt noża jest tworzony przez słupki reprezentujące wszystkie punkty danych w klastrze. Tak więc szerokość kształtu noża reprezentuje liczbę wszystkich wystąpień w klastrze. Długość paska reprezentuje współczynnik sylwetki dla każdego wystąpienia. Linia przerywana wskazuje wynik sylwetki — Źródło: Praktyczne grupowanie K-średnich (napisane przeze mnie).

Wykres z mniej więcej równymi szerokościami kształtów noży mówi nam, że klastry są dobrze zrównoważone i mają mniej więcej taką samą liczbę instancji w każdym klastrze — jedno z najważniejszych założeń w grupowaniu metodą K-średnich.

Kiedy słupki w kształcie noża wydłużają linię przerywaną, klastry są dobrze rozdzielone — kolejne ważne założenie w grupowaniu K-średnich.

Gdy k=3, klastry są dobrze zrównoważone i dobrze rozdzielone. Tak więc optymalna liczba klastrów w naszym przykładzie to 3.

Do najważniejszych parametrów SilhouetteVisualizera należą:

  • taksator: Instancja modelu k-średnich
  • zabarwienie: ciąg, zbiór kolorów używanych dla każdego kształtu noża. „yellowbrick” lub jeden z ciągów map kolorów Matplotlib, takich jak „Accent”, „Set1” itp.

Stosowanie

Wykres nierównowagi klas wykrywa nierównowagę klas w kolumnie docelowej w zestawach danych klasyfikacji.

Nierównowaga klas ma miejsce, gdy jedna klasa ma znacznie więcej instancji niż druga klasa. Na przykład zbiór danych dotyczący wykrywania spamu w wiadomościach e-mail zawiera 9900 instancji dla kategorii „Nie spam” i tylko 100 instancji dla kategorii „Spam”. W modelu nie uda się uchwycić klasy mniejszościowej (tzw Spam Kategoria). W rezultacie model nie będzie trafny w przewidywaniu klasy mniejszościowej w przypadku wystąpienia nierównowagi klasowej — Źródło: 20 największych błędów uczenia maszynowego i głębokiego uczenia się, które potajemnie zdarzają się za kulisami (napisane przeze mnie).

Implementacja Yellowbrick

Tworzenie wykresu nierównowagi klas metodą tradycyjną jest złożone i czasochłonne. Zamiast tego możemy użyć wizualizatora ClassBalance firmy Yellowbrick.

Aby wykreślić wykres nierównowagi klasowej w Yellowbirck, użyjemy rak piersi zbiór danych (zbiór danych klasyfikacyjnych, zob Cytat na końcu).

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator ClassBalance firmy Yellowbrick do utworzenia wykresu niezrównoważenia klas za pomocą rak piersi zestaw danych.

(Kod autorstwa autora)
Wykres braku równowagi klas (Zdjęcie autorstwa autora)

Istnieje ponad 200 przypadków w Złośliwy class i ponad 350 instancji w Łagodny klasa. W związku z tym nie widzimy tu dużej nierównowagi klasowej, chociaż instancje nie są równomiernie rozłożone między obie klasy.

Do najważniejszych parametrów wizualizatora ClassBalance należą:

  • etykiety: list, nazwy unikalnych klas w kolumnie docelowej.

Stosowanie

Wykres reszt w regresji liniowej służy do określenia, czy reszty (wartości obserwowane - wartości przewidywane) są nieskorelowane (niezależne) poprzez analizę wariancji błędów w modelu regresji.

Wykres reszt jest tworzony przez wykreślenie reszt względem przewidywań. Jeśli istnieje jakikolwiek wzorzec między przewidywaniami a resztami, potwierdza to, że dopasowany model regresji nie jest doskonały. Jeśli punkty są losowo rozmieszczone wokół osi x, model regresji jest dobrze dopasowany do danych.

Implementacja Yellowbrick

Tworzenie wykresu reszt metodą tradycyjną jest złożone i czasochłonne. Zamiast tego możemy użyć wizualizatora ResidualsPlot firmy Yellowbrick.

Aby wykreślić wykres reszt w Yellowbirck, użyjemy Reklama (Reklama.csv, Patrz Cytat na końcu) zbiór danych.

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator ResidualsPlot firmy Yellowbrick do utworzenia wykresu reszt za pomocą Reklama zestaw danych.

(Kod autorstwa autora)
Działka pozostałości (Zdjęcie autorstwa autora)

Na wykresie reszt wyraźnie widać pewien rodzaj nieliniowego wzorca między przewidywaniami a resztami. Dopasowany model regresji nie jest doskonały, ale jest wystarczająco dobry.

Do najważniejszych parametrów wizualizatora ResidualsPlot należą:

  • taksator: Może to być dowolny regresor Scikit-learn.
  • historia: logiczny, domyślny True. Czy wykreślić histogram reszt, który służy do sprawdzenia innego założenia — Reszty mają w przybliżeniu rozkład normalny ze średnią 0 i ustalonym odchyleniem standardowym.

Stosowanie

Wykres błędu przewidywania w regresji liniowej jest metodą graficzną używaną do oceny modelu regresji.

Wykres błędu prognozy jest tworzony przez zestawienie prognoz z rzeczywistymi wartościami docelowymi.

Jeśli model dokonuje bardzo dokładnych prognoz, punkty powinny znajdować się na linii pod kątem 45 stopni. W przeciwnym razie punkty są rozproszone wokół tej linii.

Implementacja Yellowbrick

Tworzenie wykresu błędu predykcji metodą tradycyjną jest złożone i czasochłonne. Zamiast tego możemy użyć wizualizatora PredictionError firmy Yellowbrick.

Aby wykreślić wykres błędu przewidywania w Yellowbirck, użyjemy Reklama (Reklama.csv, Patrz Cytat na końcu) zbiór danych.

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator błędu PredictionError firmy Yellowbrick do utworzenia wykresu reszt za pomocą Reklama zestaw danych.

(Kod autorstwa autora)
Wykres błędu przewidywania (Zdjęcie autorstwa autora)

Punkty nie leżą dokładnie na linii 45 stopni, ale model jest wystarczająco dobry.

Do najważniejszych parametrów wizualizatora PredictionError należą:

  • taksator: Może to być dowolny regresor Scikit-learn.
  • tożsamość: logiczny, domyślny True. Czy narysować linię 45 stopni.

Stosowanie

Odległość Cooka mierzy wpływ instancji na regresję liniową. Instancje o dużym wpływie są uważane za wartości odstające. Zestaw danych z dużą liczbą wartości odstających nie nadaje się do regresji liniowej bez wstępnego przetwarzania. Po prostu wykres odległości Cooka służy do wykrywania wartości odstających w zbiorze danych.

Implementacja Yellowbrick

Tworzenie wykresu odległości Cooka metodą tradycyjną jest skomplikowane i czasochłonne. Zamiast tego możemy użyć wizualizatora CooksDistance firmy Yellowbrick.

Aby wykreślić wykres odległości Cooka w Yellowbirck, użyjemy Reklama (Reklama.csv, Patrz Cytat na końcu) zbiór danych.

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator CooksDistance firmy Yellowbrick do utworzenia wykresu odległości Cooka za pomocą Reklama zestaw danych.

(Kod autorstwa autora)
Wykres odległości Cooka (Zdjęcie autorstwa autora)

Istnieją obserwacje, które wydłużają linię progową (poziomą czerwoną). Są to osoby odstające. Powinniśmy więc przygotować dane przed wykonaniem jakiegokolwiek modelu regresji.

Do najważniejszych parametrów wizualizatora CooksDistance należą:

  • remis_próg: logiczny, domyślny True. Czy narysować linię progową.

Stosowanie

Wykres ważności funkcji służy do wybrania minimalnych wymaganych ważnych funkcji do stworzenia modelu ML. Ponieważ nie wszystkie funkcje wnoszą taki sam wkład do modelu, możemy usunąć z modelu mniej ważne funkcje. Zmniejszy to złożoność modelu. Proste modele są łatwe do nauczenia i interpretacji.

Wykres ważności funkcji przedstawia względną ważność każdej cechy.

Implementacja Yellowbrick

Tworzenie wykresu ważności cech metodą tradycyjną jest złożone i czasochłonne. Zamiast tego możemy użyć wizualizatora FeatureImportances firmy Yellowbrick.

Aby wykreślić wykres ważności funkcji w Yellowbirck, użyjemy rak piersi zbiór danych (patrz Cytat na końcu), który zawiera 30 funkcji.

Poniższy kod wyjaśnia, w jaki sposób możemy wykorzystać wizualizator FeatureImportances firmy Yellowbrick do utworzenia wykresu ważności funkcji przy użyciu rak piersi zestaw danych.

(Kod autorstwa autora)
Wykres ważności funkcji (Zdjęcie autorstwa autora)

Nie wszystkie 30 funkcji w zbiorze danych ma znaczący udział w modelu. Możemy usunąć cechy z małymi słupkami ze zbioru danych i ponownie dopasować model do wybranych cech.

Do najważniejszych parametrów wizualizatora FeatureImportances należą:

  • taksator: Każdy Estymator Scikit-learn, który obsługuje oba feature_importances_ atrybut lub coef_ atrybutów.
  • względny: logiczny, domyślny True. Czy wykreślić względną ważność jako wartość procentową. Jeśli False, pokazany jest nieprzetworzony wynik liczbowy ważności funkcji.
  • absolutny: logiczny, domyślny False. Czy brać pod uwagę tylko wielkość współczynników, unikając znaków ujemnych.
  1. Wykres składowych głównych: PCA(), Użycie — Wizualizuje wielowymiarowe dane na wykresie punktowym 2D lub 3D, którego można użyć do identyfikacji ważnych wzorców w danych wielowymiarowych.
  2. Krzywa walidacji: Krzywa walidacji(), Użycie — Wykreśla wpływ a pojedynczy hiperparametr w pociągu i zbiorze walidacyjnym.
  3. Krzywa uczenia się: Krzywa uczenia(), Użycie — Wykrywa niedopasowanie, nadmierne dopasowanie i dokładnie warunki modelu, identyfikuje sniska zbieżność, oscylacyjny, oscylujące z rozbieżnością i właściwa konwergencja scenariuszy podczas znajdowania optymalnego tempa uczenia się sieci neuronowej, pokazuje, jak bardzo nasz model zyskuje na dodaniu większej ilości danych uczących.
  4. Działka łokciowa: KElbowVisualizer(), Użycie — Wybiera optymalną liczbę klastrów w grupowaniu K-średnich.
  5. Fabuła sylwetki: Wizualizator sylwetki(), Użycie — wybiera optymalną liczbę klastrów w klastrach K-średnich, wykrywa nierównowagę klastrów w klastrach K-średnich.
  6. Wykres nierównowagi klas: Bilans klasy(), Użycie — Wykrywa brak równowagi klas w kolumnie docelowej w zbiorach danych klasyfikacji.
  7. Wykres resztkowy: wykres reszt(), Użycie — Określa, czy reszty (wartości obserwowane – wartości przewidywane) są nieskorelowane (niezależne) poprzez analizę wariancji błędów w modelu regresji.
  8. Wykres błędu prognozy: Błąd prognozy(), Użycie — Graficzna metoda używana do oceny modelu regresji.
  9. Wykres odległości Cooka: KucharzOdległość(), Użycie — Wykrywa wartości odstające w zbiorze danych na podstawie odległości instancji Cooka.
  10. Wykres ważności funkcji: FunkcjeImportances(), Użycie — wybiera minimalną wymaganą liczbę ważnych funkcji w oparciu o względne znaczenie każdej funkcji w celu utworzenia modelu ML.

To koniec dzisiejszego wpisu.

Daj mi znać, jeśli masz jakieś pytania lub uwagi.

Czytaj dalej (zalecane)

  • Yellowbrick do wizualizacji znaczenia funkcji przy użyciu jednego wiersza kodu
  • Wyjaśnienie krzywej walidacji — wykreśl wpływ pojedynczego hiperparametru
  • Wykreślanie krzywej uczenia się w celu analizy wydajności uczenia się sieci neuronowej
  • Praktyczne grupowanie K-średnich

Wesprzyj mnie jako pisarza

Mam nadzieję, że podobała Ci się lektura tego artykułu. Jeśli chcesz wesprzeć mnie jako pisarza, rozważ to zapisanie się na członkostwo aby uzyskać nieograniczony dostęp do Medium. Kosztuje to tylko 5 USD miesięcznie, a ja otrzymam część Twojej składki członkowskiej.

Dziękuję bardzo za ciągłe wsparcie! Do zobaczenia w następnym artykule. Życzę wszystkim miłej nauki!

Informacje o zbiorze danych dotyczących raka piersi

  • Cytat: Dua, D. i Graff, C. (2019). Repozytorium uczenia maszynowego UCI [http://archive.ics.uci.edu/ml]. Irvine, Kalifornia: Uniwersytet Kalifornijski, Szkoła Informacji i Informatyki.
  • Źródło: https://archive.ics.uci.edu/ml/datasets/breast+cancer+wisconsin+(diagnostic)
  • Licencja: dr Williama H. ​​Wolberga (Oddział Chirurgii Ogólnej
    Uniwersytet Wisconsin), W. Nicka Street (Wydział Informatyki
    University of Wisconsin) i Olvi L. Mangasarianin (Computer Sciences Dept. University of Wisconsin) posiada prawa autorskie do tego zbioru danych. Nick Street przekazał ten zestaw danych opinii publicznej pod nazwą Creative Commons Uznanie autorstwa 4.0 Licencja międzynarodowa (CC BY 4.0). Możesz dowiedzieć się więcej o różnych typach licencji na zestawy danych tutaj.

Informacje o zbiorze danych tęczówki

  • Cytat: Dua, D. i Graff, C. (2019). Repozytorium uczenia maszynowego UCI [http://archive.ics.uci.edu/ml]. Irvine, Kalifornia: Uniwersytet Kalifornijski, Szkoła Informacji i Informatyki.
  • Źródło: https://archive.ics.uci.edu/ml/datasets/iris
  • Licencja: RA Fishera posiada prawa autorskie do tego zbioru danych. Michael Marshall podarował ten zestaw danych opinii publicznej pod nazwą Licencja Creative Commons Dedykacja Domeny Publicznej (Wózki CC0). Możesz dowiedzieć się więcej o różnych typach licencji na zestawy danych tutaj.

Informacje o zbiorze danych reklam

Referencje

10 niesamowitych wizualizacji uczenia maszynowego, które powinieneś znać w 2023 roku 10 na stronie https://towardsdatascience.com/feed

<!–

->

Znak czasu:

Więcej z Konsultanci Blockchain