Tömbök (numpy)

Ebben a Notebookban bemutatjuk az tömböket illetve hogyan kell a pythonban adatfájlokat beolvasni.

%pylab inline

Populating the interactive namespace from numpy and matplotlib

Adattömbök, matematikai eszközök, adatfájlok kezelése¶

A pythonban a numpy csomag felel az adatok beolvasásáért, matematikai operációk elvégezésért (mint a gyökvonás, szinusz ...)

Tömbök¶

A programozásban létrehozhatunk mátrixokat, melyeket adattömböknek hívunk. Ezek bármennyi dimenziósak lehetnek.

a = array([1, 2, 3])      # hozzunk létre egy 1 dimenziós tömböt
print(type(a))            # Írassuk ki "a" típusát: "<type 'numpy.ndarray'>"
print(a.shape)            # Nézzük meg a formáját: "(3,)"

<class 'numpy.ndarray'>
(3,)

A python és a legtöbb programozási nyelv nullától kezdi a tömbök indexelését. Azaz az első elem indexe 0, a másodiké 1 és így tovább. Egy 10 elemű tömbnek az utolsó eleme 9-es indexet visel (Elemszám-1)!

Így kell elképzelni az adattömböket:

print(a[0], a[1], a[2])   # Írassuk ki a tömb, első (0.-ik), második, ás harmadik elemét
a[0] = 5                  # Átírjuk az első (nulladik) elem értékét
print(a)                  # Nézzük meg a megváltozott "a" vektort

1 2 3
[5 2 3]

b = array([[1,2,3],[4,5,6]])    # Készítsünk 2 dimenziós tömböt
print(b.shape)                     # Kiíratjuk az alakját
print(b[0, 0], b[0, 1], b[1, 0])   # Írjunk ki pár elemet a tömbből

(2, 3)
1 2 4

"Almátrixok"¶

A pythonban ki tudunk egy tömbből venni résztömböket. De vigyázzunk, mert a résztömbön végzett művelet a szülőtömb adott elemein is elvégződik.

    # Készítsük els következő 2 dimenziós (3 sor, 4 oszlop) tömböt
    # [[ 1  2  3  4]
    #  [ 5  6  7  8]
    #  [ 9 10 11 12]]
a = array([[1,2,3,4], [5,6,7,8], [9,10,11,12]])
print(a[0, 1])   # Írassuk ki a 0. sor, 1. oszlopának elem(eit): 2

    # Hozzuk létre a mátrix következő almátrixát (ami 2*2 nagyságú)
    # [[2 3]
    #  [6 7]]
    # Azaz a mátrixból a 0-tól 2-ig levő adatsorok, illetve függőlegesen 1-tól 3-ig levő adatoszlopok kivétele
    # Vegyük észre, hogy a felső határ már nincs benne az adatsorban!
b = a[0:2, 1:3]

    # Változtassuk meg a b mátrix [0,0]-ás elemének értékét
b[0, 0] = 77

    # Ellenőrizzük az a mátrixban a "b[0,0]" helyen levő értéket (a[0,1]-as hely)
print(a[0, 1])

2
77

Számsorok generálása és tömbbe rendezése¶

Lehetőség van adott hosszú sorokat gyártani, melyekből tömb készíthető. Nézzük néhány példát erre:

a = arange(15) # Készítsünk egy 15 elemű listát 
print(a)

[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]

a = arange(15)   # Készítsünk egy 15 elemű listát 
a = a.reshape(3, 5) # Rendezzük a listát 3*5-s tömbbe
a                   # Nézzük meg az eredményt

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

a.shape

(3, 5)

a.size # Megadja mekkora a tömb mérete (mennyi adat van benne)

15

a.ndim

2

type(a)

numpy.ndarray

a.dtype.name # Megnézi milyen tipusú adatok vannak a tömbben

'int64'

b = array([6.25, -0.25, 8.])
b

array([ 6.25, -0.25,  8.  ])

type(b)

numpy.ndarray

b.dtype.name

'float64'

c = array( [ [1,2], [3,4] ], dtype=complex )
c

array([[ 1.+0.j,  2.+0.j],
       [ 3.+0.j,  4.+0.j]])

c.dtype.name

'complex128'

zeros( (3,4) ) #Készítsünk egy 3*4-es tömböt, mely tele van nullával

array([[ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.],
       [ 0.,  0.,  0.,  0.]])

ones( (2,3,4), dtype=int16 ) # Készítsünk egy 3 dimenziós tömböt, csupa egyesből

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int16)

a = arange(15, 100, 5) # Készítsünk egy listát 15-től, 100-ig, 5-sével 
print(a)

[15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95]

arange( 30, 10, -5 )

array([30, 25, 20, 15])

arange( 10, 30, -5 ) #Ez üres lista, de NINCS hibaüzenet!!!

array([], dtype=int64)

arange( 0, 2, 0.3 )

array([ 0. ,  0.3,  0.6,  0.9,  1.2,  1.5,  1.8])

linspace( 0, 2, 9 ) # Készítsünk egy 9 elemű listát 0 és 2 között. Egyenlő lépésközzel.

array([ 0.  ,  0.25,  0.5 ,  0.75,  1.  ,  1.25,  1.5 ,  1.75,  2.  ])

Matematikai függvények¶

Bővebb leírás itt található: https://docs.scipy.org/doc/numpy/reference/routines.math.html

x = linspace( 0, 2*pi, 100 ) # A pi-nek a neve "pi"
x

array([ 0.        ,  0.06346652,  0.12693304,  0.19039955,  0.25386607,
        0.31733259,  0.38079911,  0.44426563,  0.50773215,  0.57119866,
        0.63466518,  0.6981317 ,  0.76159822,  0.82506474,  0.88853126,
        0.95199777,  1.01546429,  1.07893081,  1.14239733,  1.20586385,
        1.26933037,  1.33279688,  1.3962634 ,  1.45972992,  1.52319644,
        1.58666296,  1.65012947,  1.71359599,  1.77706251,  1.84052903,
        1.90399555,  1.96746207,  2.03092858,  2.0943951 ,  2.15786162,
        2.22132814,  2.28479466,  2.34826118,  2.41172769,  2.47519421,
        2.53866073,  2.60212725,  2.66559377,  2.72906028,  2.7925268 ,
        2.85599332,  2.91945984,  2.98292636,  3.04639288,  3.10985939,
        3.17332591,  3.23679243,  3.30025895,  3.36372547,  3.42719199,
        3.4906585 ,  3.55412502,  3.61759154,  3.68105806,  3.74452458,
        3.8079911 ,  3.87145761,  3.93492413,  3.99839065,  4.06185717,
        4.12532369,  4.1887902 ,  4.25225672,  4.31572324,  4.37918976,
        4.44265628,  4.5061228 ,  4.56958931,  4.63305583,  4.69652235,
        4.75998887,  4.82345539,  4.88692191,  4.95038842,  5.01385494,
        5.07732146,  5.14078798,  5.2042545 ,  5.26772102,  5.33118753,
        5.39465405,  5.45812057,  5.52158709,  5.58505361,  5.64852012,
        5.71198664,  5.77545316,  5.83891968,  5.9023862 ,  5.96585272,
        6.02931923,  6.09278575,  6.15625227,  6.21971879,  6.28318531])

f = sin(x) # vegyük az előbb generált adatsornak a szinuszát
plot(f)   # majd ábárzoljuk

[<matplotlib.lines.Line2D at 0x7f5b48d6b240>]

plot(cos(x))

[<matplotlib.lines.Line2D at 0x7f5b47836240>]

plot(tan(x))

[<matplotlib.lines.Line2D at 0x7f5b48b45278>]

plot(tanh(x))

[<matplotlib.lines.Line2D at 0x7f5b45f704e0>]

plot(arctan(x))

[<matplotlib.lines.Line2D at 0x7f5b48724320>]

B = arange(3)
B

array([0, 1, 2])

exp(B) # Emeljük "e"-adra a B elemeit

array([ 1.        ,  2.71828183,  7.3890561 ])

sqrt(B) # Gyökvonás neve 'sqrt'

array([ 0.        ,  1.        ,  1.41421356])

C = array([2., -1., 4.])
add(B, C) # Össze is adhatunk elemenként 2 tömböt

array([ 2.,  0.,  6.])

Kétváltozós függvények ábrázolása (felületi ábrák)¶

Ha kétváltozós függvényt szeretnénk ábrázolni, akkor ahhoz a mintavételezést a numpy csomag meshgrid() függvényével tehetjük meg az alábbi szintaxis szerint:

xrange=linspace(-3,3,100)   # határok és pontok száma az x irányba
yrange=linspace(-3,3,100)   # határok és pontok száma az y irányba
x,y=meshgrid(xrange,yrange) # mintavételezés az x és y síkban

Két változós függvényt a pcolormesh() matplotlib függvény segítségével tudunk ábrázolni.

A fent definiált x és y tömbök segítségével például az $ f(x,y)=e^{-(x^2+y^2)} $ kétdimenziós Gauss-görbét az alábbi módon ábrázolhatjuk:

pcolormesh(x,y,exp(-(x**2+y**2)))

<matplotlib.collections.QuadMesh at 0x7f5b477edfd0>

Hogy egy adott szín mit jelent, azt a colorbar() függvény segítségével tudhatjuk meg.

pcolormesh(x,y,exp(-(x**2+y**2)))
colorbar()

<matplotlib.colorbar.Colorbar at 0x7f5b45efbe80>

Kétváltozós függvényeket szokás kontúrok segítségével is ábrázolni. Egy kontúrvonal azokat a pontokat tartalmazza, ahol az adott két változós függvény ugyanazt az értéket veszi fel. A contour() függvény segítségével tudunk kontúrábrákat generálni:

contour(x,y,exp(-(x**2+y**2)))

<matplotlib.contour.QuadContourSet at 0x7f5b45ee7fd0>

Ha csak megadott kontúrértékekre vagyunk kíváncsiak, akkor azt a levels kulcsszó használatával tehetjük meg.

contour(x,y,exp(-(x**2+y**2)), levels=linspace(0,1,20))

<matplotlib.contour.QuadContourSet at 0x7f5b4393f908>

Ábra mentése¶

A legenerált ábrákat a savefig() paranccsal tudjuk kimenteni képfile-okba.

plot(x,y)
savefig('az_en_abram.pdf')