Brève introduction à NumPy

Quelques connaissances de base de la bibliothèque NumPy et des ufuncs

Photo par Erik Mc Lean on Unsplash

NumPy signifie Numerical Python et est un Python bibliothèque pour travailler avec des tableaux. À l'aide de ces tableaux, des éléments de l'algèbre linéaire, tels que des vecteurs et des matrices, peuvent être représentés sous forme de Python. Puisqu’une grande partie de la bibliothèque est écrite en C, elle peut effectuer des calculs particulièrement efficaces et rapides même avec de grandes matrices.

Python offre une variété de structures de données qui peuvent être utilisées pour stocker des données sans bibliothèques supplémentaires. Cependant, ces structures, comme listes Python, ne sont que très mal adaptés aux opérations mathématiques. En ajoutant deux listes La combinaison de nombres élément par élément peut rapidement nuire aux performances lorsqu'il s'agit de traiter de grandes quantités de données.

C'est pour cette raison que NumPy a été développé, car il offre la possibilité d'effectuer des opérations numériques de manière rapide et efficace. Les calculs issus du domaine de l'algèbre linéaire, tels que les multiplications matricielles, sont particulièrement importants.

NumPy, comme beaucoup d'autres bibliothèques, peut être installé directement depuis un notebook à l'aide de pip. Pour ce faire, utilisez la commande « pip install » avec le nom du module. Cette ligne doit être précédée d'un point d'exclamation pour que le notebook reconnaisse qu'il s'agit d'une commande de terminal :

Si l'installation a réussi, le module peut simplement être importé et utilisé dans le notebook. L'abréviation « np » est souvent utilisée ici pour gagner un peu de temps en cours de programmation et ne pas avoir à saisir NumPy à chaque fois :

Les tableaux NumPy sont une alternative valable aux tableaux conventionnels listes Python. Ils offrent la possibilité de stocker des collections de données multidimensionnelles. Dans la plupart des cas, les nombres sont stockés et les tableaux sont utilisés comme vecteurs ou matrices. Par exemple, un vecteur unidimensionnel pourrait ressembler à ceci :

Outre les différentes fonctions des tableaux NumPy, que nous aborderons dans un article séparé, les dimensionnalités possibles sont toujours importantes pour la différenciation :

On distingue les dimensionnalités suivantes :

  • 0D — Tableau: Il s'agit simplement d'un scalaire, c'est-à-dire d'un nombre ou d'une valeur unique.
  • 1D — Tableau: Il s'agit d'un vecteur, sous la forme d'une chaîne de nombres ou de valeurs dans une dimension.
  • 2D — Tableau: Ce type de tableau est une matrice, c'est-à-dire une collection de plusieurs tableaux 1D.
  • 3D — Tableau: Plusieurs matrices forment ce qu'on appelle un tenseur. Nous les avons expliqués plus en détail dans notre article sur TensorFlow.

Selon la source, il existe plusieurs différences fondamentales entre les tableaux NumPy et listes Python. Parmi les plus fréquemment cités figurent :

  1. Consommation de mémoire: Les tableaux sont programmés de telle manière qu'ils occupent une certaine partie de la mémoire. Tous les éléments du tableau s’y trouvent alors. Les éléments d'un liste, en revanche, peuvent être très éloignés en mémoire. En conséquence, un liste consomme plus de mémoire qu'un tableau identique.
  2. Vitesse: Les tableaux peuvent également être traités beaucoup plus rapidement que listes en raison de leur faible consommation de mémoire. Cela peut faire une différence significative pour des objets comportant plusieurs millions d’éléments.
  3. Fonctionnalités: Les tableaux offrent beaucoup plus de fonctionnalités, par exemple, ils permettent des opérations élément par élément, contrairement aux listes.

Les soi-disant « Fonctions universelles » (abréviation : ufuncs) sont utilisées pour ne pas avoir à exécuter certaines opérations élément par élément, mais directement pour l'ensemble du tableau. En programmation informatique, on parle de vectorisation lorsque les commandes sont exécutées directement pour l'ensemble du vecteur.

Ceci est non seulement beaucoup plus rapide en programmation, mais conduit également à des calculs plus rapides. Dans NumPy, plusieurs de ces fonctions universelles sont proposées, qui peuvent être utilisées pour diverses opérations. Parmi les plus connus figurent :

  • Avec « add() » vous pouvez résumer plusieurs tableaux élément par élément.
  • "subtract()" est exactement le contraire et soustrait le tableau élément par élément.
  • « multiply() » multiplie deux tableaux élément par élément.
  • « matmul() » forme le produit matriciel de deux tableaux. Notez que dans la plupart des cas, cela ne donnera pas le même résultat que « multiply() ».
  • NumPy signifie Numerical Python et est une bibliothèque Python permettant de travailler avec des tableaux.
  • À l'aide de ces tableaux, des éléments de l'algèbre linéaire, tels que des vecteurs et des matrices, peuvent être représentés en Python.
  • Comme une grande partie de la bibliothèque est écrite en C, elle peut effectuer des calculs particulièrement efficaces et rapides, même avec de grandes matrices.
  • Les tableaux NumPy sont comparables aux listes Python mais leur sont nettement supérieurs en termes de besoins en mémoire et de vitesse de traitement.

Brève introduction à NumPy republiée à partir de la source https://towardsdatascience.com/3short-introduction-to-numpy-3a65ec23eaba?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Horodatage:

Plus de Consultants en blockchain