Kurze Einführung in NumPy

Einige Grundkenntnisse der NumPy-Bibliothek und der Ufuncs

Photo by Erik McLean on Unsplash

NumPy steht für Numerical Python und ist ein Python Bibliothek zum Arbeiten mit Arrays. Mit Hilfe dieser Arrays können Elemente der linearen Algebra, wie beispielsweise Vektoren und Matrizen, dargestellt werden Python. Da ein Großteil der Bibliothek in C geschrieben ist, können damit auch bei großen Matrizen besonders effiziente und schnelle Berechnungen durchgeführt werden.

Python bietet eine Vielzahl von Datenstrukturen, mit denen Daten ohne zusätzliche Bibliotheken gespeichert werden können. Allerdings sind diese Strukturen, wie z Python-Listensind für mathematische Operationen nur sehr schlecht geeignet. Zwei hinzufügen Listen Die Element-für-Element-Auflistung von Zahlen kann bei der Verarbeitung großer Datenmengen schnell zu Leistungseinbußen führen.

Aus diesem Grund wurde NumPy entwickelt, da es die Möglichkeit bietet, numerische Operationen schnell und effizient durchzuführen. Besonders wichtig sind Berechnungen aus dem Bereich der linearen Algebra, etwa Matrizenmultiplikationen.

NumPy kann wie viele andere Bibliotheken mit pip direkt von einem Notebook aus installiert werden. Verwenden Sie dazu den Befehl „pip install“ zusammen mit dem Modulnamen. Dieser Zeile muss ein Ausrufezeichen vorangestellt werden, damit das Notebook erkennt, dass es sich um einen Terminalbefehl handelt:

War die Installation erfolgreich, kann das Modul einfach importiert und im Notebook genutzt werden. Um beim Programmieren etwas Zeit zu sparen und nicht jedes Mal NumPy eingeben zu müssen, wird hier oft die Abkürzung „np“ verwendet:

NumPy-Arrays sind eine gültige Alternative zu herkömmlichen Python-Listen. Sie bieten die Möglichkeit, mehrdimensionale Datensammlungen zu speichern. In den meisten Fällen werden Zahlen gespeichert und die Arrays als Vektoren oder Matrizen verwendet. Ein eindimensionaler Vektor könnte beispielsweise so aussehen:

Neben den verschiedenen Funktionen von NumPy-Arrays, die wir in einem separaten Beitrag behandeln werden, sind zur Unterscheidung noch die möglichen Dimensionalitäten wichtig:

Folgende Dimensionalitäten werden unterschieden:

  • 0D – Array: Dies ist einfach ein Skalar, also eine einzelne Zahl oder ein einzelner Wert.
  • 1D – Array: Dies ist ein Vektor als eine Folge von Zahlen oder Werten in einer Dimension.
  • 2D – Array: Dieser Array-Typ ist eine Matrix, also eine Sammlung mehrerer 1D-Arrays.
  • 3D – Array: Mehrere Matrizen bilden einen sogenannten Tensor. Diese haben wir in unserem Artikel näher erläutert TensorFlow.

Abhängig von der Quelle gibt es mehrere grundlegende Unterschiede zwischen NumPy-Arrays und Python-Listen. Zu den am häufigsten genannten gehören:

  1. Speicherverbrauch: Arrays werden so programmiert, dass sie einen bestimmten Teil des Speichers belegen. Dort liegen dann alle Elemente des Arrays. Die Elemente von a Liste, hingegen können in der Erinnerung weit voneinander entfernt sein. Infolgedessen a Liste verbraucht mehr Speicher als ein identisches Array.
  2. Schnelligkeit: Arrays können auch viel schneller verarbeitet werden als Listen aufgrund ihres geringeren Speicherverbrauchs. Dies kann bei Objekten mit mehreren Millionen Elementen einen erheblichen Unterschied machen.
  3. Funktionalität: Arrays bieten deutlich mehr Funktionalitäten, ermöglichen beispielsweise elementweise Operationen, Listen hingegen nicht.

Die sogenannten „Universal Functions“ (kurz: ufuncs) dienen dazu, bestimmte Operationen nicht Element für Element, sondern direkt für das gesamte Array ausführen zu müssen. In der Computerprogrammierung spricht man von der sogenannten Vektorisierung, wenn Befehle direkt für den gesamten Vektor ausgeführt werden.

Das geht nicht nur deutlich schneller beim Programmieren, sondern führt auch zu schnelleren Berechnungen. In NumPy werden mehrere dieser Universal Functions angeboten, die für vielfältige Operationen genutzt werden können. Zu den bekanntesten zählen:

  • Mit „add()“ können Sie mehrere Arrays Element für Element zusammenfassen.
  • „subtract()“ ist das genaue Gegenteil und subtrahiert das Array Element für Element.
  • „multiply()“ multipliziert zwei Arrays Element für Element.
  • „matmul()“ bildet das Matrixprodukt zweier Arrays. Beachten Sie, dass dies in den meisten Fällen nicht das gleiche Ergebnis liefert wie „multiply()“.
  • NumPy steht für Numerical Python und ist eine Python-Bibliothek für die Arbeit mit Arrays.
  • Mit Hilfe dieser Arrays können Elemente der linearen Algebra, wie beispielsweise Vektoren und Matrizen, in Python dargestellt werden.
  • Da ein Großteil der Bibliothek in C geschrieben ist, können damit auch bei großen Matrizen besonders effiziente und schnelle Berechnungen durchgeführt werden.
  • NumPy-Arrays sind mit Python-Listen vergleichbar, sind diesen jedoch hinsichtlich Speicherbedarf und Verarbeitungsgeschwindigkeit deutlich überlegen.

Kurze Einführung in NumPy, neu veröffentlicht aus der Quelle https://towardsdatascience.com/3short-introduction-to-numpy-3a65ec23eaba?source=rss—-7f60cf5620c9—4 über https://towardsdatascience.com/feed

<!–

->

Zeitstempel:

Mehr von Blockchain-Berater