Kort introduksjon til NumPy

Noen grunnleggende kunnskaper om NumPy-biblioteket og ufuncs

Photo by Erik Mclean on Unsplash

NumPy står for Numerical Python og er en Python bibliotek for arbeid med matriser. Ved hjelp av disse matrisene kan elementer fra lineær algebra, som vektorer og matriser, representeres i Python. Siden en stor del av biblioteket er skrevet i C, kan det utføre spesielt effektive og raske beregninger selv med store matriser.

Python tilbyr en rekke datastrukturer som kan brukes til å lagre data uten ekstra biblioteker. Imidlertid er disse strukturene, som f.eks Python-lister, er bare svært dårlig egnet for matematiske operasjoner. Legger til to lister av tall element for element kan fort være skadelig for ytelsen når man arbeider med store datamengder.

Av denne grunn ble NumPy utviklet, da det gir muligheten til å utføre numeriske operasjoner raskt og effektivt. Spesielt viktig er beregninger fra feltet lineær algebra, for eksempel matrisemultiplikasjoner.

NumPy, som mange andre biblioteker, kan installeres direkte fra en bærbar PC ved hjelp av pip. For å gjøre dette, bruk kommandoen "pip install" sammen med modulnavnet. Denne linjen må innledes med et utropstegn slik at den bærbare datamaskinen gjenkjenner at det er en terminalkommando:

Hvis installasjonen var vellykket, kan modulen enkelt importeres og brukes i den bærbare datamaskinen. Forkortelsen "np" brukes ofte her for å spare litt tid i løpet av programmeringen og for ikke å måtte skrive inn NumPy hver gang:

NumPy-matriser er et gyldig alternativ til konvensjonelle Python-lister. De tilbyr muligheten til å lagre flerdimensjonale samlinger av data. I de fleste tilfeller lagres tall og matrisene brukes som vektorer eller matriser. For eksempel kan en endimensjonal vektor se slik ut:

Foruten de forskjellige funksjonene til NumPy-matriser, som vi vil dekke i et eget innlegg, er de mulige dimensjonalitetene fortsatt viktige for differensiering:

Følgende dimensjonaliteter skilles ut:

  • 0D — Array: Dette er rett og slett en skalar, dvs. et enkelt tall eller verdi.
  • 1D — Array: Dette er en vektor, som en streng med tall eller verdier i én dimensjon.
  • 2D — Array: Denne typen array er en matrise, det vil si en samling av flere 1D — arrays.
  • 3D — Array: Flere matriser danner en såkalt tensor. Vi har forklart disse mer detaljert i vår artikkel om tensorflow.

Avhengig av kilden er det flere grunnleggende forskjeller mellom NumPy-matriser og Python-lister. Blant de mest nevnte er:

  1. Minneforbruk: Matriser er programmert på en slik måte at de opptar en viss del av minnet. Alle elementene i matrisen er da plassert der. Elementene i en liste, derimot, kan være langt fra hverandre i minnet. Som et resultat, a liste bruker mer minne enn en identisk matrise.
  2. Speed: Matriser kan også behandles mye raskere enn lister på grunn av deres lavere minneforbruk. Dette kan utgjøre en betydelig forskjell for objekter med flere millioner elementer.
  3. Funksjonalitet: Matriser tilbyr betydelig flere funksjoner, for eksempel tillater de element-for-element-operasjoner, mens lister ikke gjør det.

De såkalte "Universal Functions" (kort: ufuncs) brukes for ikke å måtte utføre bestemte operasjoner element for element, men direkte for hele arrayet. I dataprogrammering snakker man om såkalt vektorisering når kommandoer utføres direkte for hele vektoren.

Dette er ikke bare mye raskere i programmering, men fører også til raskere beregninger. I NumPy tilbys flere av disse universelle funksjonene, som kan brukes til en rekke operasjoner. Blant de mest kjente er:

  • Med "add()" kan du summere flere arrays element for element.
  • "subtract()" er det stikk motsatte og trekker arrayet element for element.
  • "multiply()" multipliserer to matriser element for element.
  • "matmul()" danner matriseproduktet av to matriser. Merk at i de fleste tilfeller vil dette ikke gi samme resultat som "multiply()".
  • NumPy står for Numerical Python og er et Python-bibliotek for arbeid med arrays.
  • Ved hjelp av disse matrisene kan elementer fra lineær algebra, som vektorer og matriser, representeres i Python.
  • Siden mye av biblioteket er skrevet i C, kan det utføre spesielt effektive og raske beregninger selv med store matriser.
  • NumPy-matriser er sammenlignbare med Python-lister, men er betydelig bedre enn dem når det gjelder minnekrav og prosesseringshastighet.

Kort introduksjon til NumPy publisert på nytt fra kilde https://towardsdatascience.com/3short-introduction-to-numpy-3a65ec23eaba?source=rss—-7f60cf5620c9—4 via https://towardsdatascience.com/feed

<!–

->

Tidstempel:

Mer fra Blockchain-konsulenter