Чисельні методи. Лабораторний практикум/Коротка довідка з NumPy

Чисельні методи. Лабораторний практикум

NumPy - бібліотека мови Python для роботи з гомогенними багатовимірними масивами даних, які індексуються додатніми цілими числами. Гомогенність даних дозволяє значно оптимізувати роботу в порівнянні з стандартними списками мови.

Основний тип даних відповідно - array.

На базі NumPy написано майже усе науково-технічне програмне забеспечення мовою Python, зокрема

українське ПЗ OpenOpt (чисельна оптимізація, автоматичне диференціювання, розв’язування систем рівнянь)
SciPy (інтеграція, інтерполяція, статистика і т.і.)
науково-інженерні Python-дистрибутиви PythonXY, SAGE (вільні аналоги до MATLAB, Maple, MathCad, Mathematica і т.і.)
багато іншого софта, що можна подивитись зокрема тут і тут

Огляд

import numpy as np

Тут і далі всі об'єкти які беруться з numpy будуть починатись з "np". Щоб було ясно, що звідки.
Якщо навіть "np" вам писати занадто довго, ви можете використовувати "from numpy import func1, func2, ..." або "from numpy import *" (тобто усе).
Тепер спробуємо створити різні масиви:

>>> a=np.array([3,4,5]) # зі списку
>>> a
array([3, 4, 5])
>>> b=np.arange(4) # цілі числа від 0 включно до n невключно
>>> b
array([0, 1, 2, 3])
>>> c=np.linspace(-np.pi,np.pi,5) # 5 рівномірно розміщених на проміжку [-pi,pi] чисел
>>> c
array([-3.14159265, -1.57079633,  0.        ,  1.57079633,  3.14159265])

Як і списки, їх можна обрізати, індексувати, та ітерувати крізь них:

>>> b=b[:-1]
>>> b
array([0, 1, 2])
>>> for x in b:
...     print x
... 
0
1
2
>>> b[1]
1

Як і над математичними векторами, над масивами можна виконувати різні операції:

>>> d=a**2+b
>>> d
array([ 9, 17, 27])

Крім одновимірних масивів бувають і двовимірні, і скільки завгодно вимірні. Розмірність задається кортежем shape:

>>> a=np.arange(8)
>>> a
array([0, 1, 2, 3, 4, 5, 6, 7])
>>> a.shape=2,2,2
>>> a
array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])
>>> a=np.arange(9)
>>> a.shape=3,3
>>> a
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> np.arange(100).shape
(100,)

Можна виконувати операції з масивами різних розмірностей, якщо тільки в них співпадають відповідні розміри:

>>> a
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
>>> d
array([ 9, 17, 27])
>>> a+d
array([[ 9, 18, 29],
       [12, 21, 32],
       [15, 24, 35]])

>>> a=np.arange(12)
>>> a.shape=3,4
>>> a
array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11]])
>>> b
array([0, 1, 2])
>>> a+b
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: shape mismatch: objects cannot be broadcast to a single shape
>>> b.shape=3,1
>>> b
array([[0],
       [1],
       [2]])
>>> a+b
array([[ 0,  1,  2,  3],
       [ 5,  6,  7,  8],
       [10, 11, 12, 13]])

При індексуванні багатовимірного масиву індекси розділяють комами:

>>> a[1,2]
6

Основи

Клас в якому зберігаються масиви називається ndarray, і він має наступні поля:

ndarray.ndim: кількість вимірів масиву. (кількість елементів в полі shape)
ndarray.shape: розміри масиву. Кортеж що зберігає розмір вздовж кожного виміру.
ndarray.size: кількість елементів в масиві. ( дорівнює добутку всіх чисел в shape )
ndarray.dtype: об'єкт що описує тип елементів масиву. Можна задати якийсь з стандартних типів, чи заданий в NumPy, як наприклад: bool_, character, int_, int8, int16, int32, int64, float_, float8, float16, float32, float64, complex_, complex64, object_.
ndarray.itemsize: розмір кожного елементу масиву в байтах. Наприклад розмір елемента типу float64 має розмір 8 (=64/8). Еквівалентне до ndarray.dtype.itemsize.
ndarray.data: Власне дані що зберігаються в масиві. Чіпати руками це поле нам не прийдеться.

Створення

Окрім списків масиви можуть створюватись і з складніших структур:

>>> a = np.array( ([1,2,3] , [4,5,6]) )
>>> a
array([[1, 2, 3],
       [4, 5, 6]])

Також можна явно задати тип списку:

>>> np.array( ([1,2,3] , [4,5,6]) , dtype=complex)
array([[ 1.+0.j,  2.+0.j,  3.+0.j],
       [ 4.+0.j,  5.+0.j,  6.+0.j]])

Є функції, які ствоюють нові масиви з нічого:

>>> np.zeros( (2,2) ) #Створити масив заповнений нулями
array([[ 0.,  0.],
       [ 0.,  0.]])
>>> np.ones( (4,1) ) #Створити масив заповнений одиничками
array([[ 1.],
       [ 1.],
       [ 1.],
       [ 1.]])
>>> np.empty( (2,3) ) #Створити масив. (Він буде забитий всяким сміттям з пам'яті)
array([[  3.05135778e-267,   6.36598737e-314,   1.01855798e-312],
       [  1.27319747e-313,   1.27319747e-313,   1.27319747e-313]])

Також можна створити масив з функції. Наприклад красиву табличку множення:

>>> def f(x,y):
...     return (x+1)*(y+1)
... 
>>> a=np.fromfunction(f,(9,9),dtype=int)
>>> a
array([[ 1,  2,  3,  4,  5,  6,  7,  8,  9],
       [ 2,  4,  6,  8, 10, 12, 14, 16, 18],
       [ 3,  6,  9, 12, 15, 18, 21, 24, 27],
       [ 4,  8, 12, 16, 20, 24, 28, 32, 36],
       [ 5, 10, 15, 20, 25, 30, 35, 40, 45],
       [ 6, 12, 18, 24, 30, 36, 42, 48, 54],
       [ 7, 14, 21, 28, 35, 42, 49, 56, 63],
       [ 8, 16, 24, 32, 40, 48, 56, 64, 72],
       [ 9, 18, 27, 36, 45, 54, 63, 72, 81]])

Базові операції

Базові операції з масивами виконуються поелементно. Створюється новий масив, в який і записується результат:

>>> a=np.arange(4)*10
>>> a
array([ 0, 10, 20, 30])
>>> a=20-a
>>> a
array([ 20,  10,   0, -10])
>>> b=np.arange(4)**2
>>> b
array([0, 1, 4, 9])
>>> 10*np.sin(a)
array([ 9.12945251, -5.44021111,  0.        ,  5.44021111])
>>> a<10
array([False, False,  True,  True], dtype=bool)

Як вже було сказано, всі операції виконуються поелементно. Це ж стосується і множення. Якщо нам потрібно перемноження матриць, то використовують функцію dot:

>>> A
array([[ 1.,  0.],
       [ 0.,  2.]])
>>> B
array([[ 1.,  1.],
       [ 1.,  1.]])
>>> A*B
array([[ 1.,  0.],
       [ 0.,  2.]])
>>> np.dot(A,B)
array([[ 1.,  1.],
       [ 2.,  2.]])

Щоб не створювати нових масивів, операції можна об'єднувати з присвоєнням:

>>> a
array([0, 1, 2])
>>> a+=10
>>> a
array([10, 11, 12])

При здійсненні операцій з різними типами даних, результат приводиться до ширшого. Це називається upcasting.

Такі операції як сума, мінімум та максимум є методами класу масиву:

>>> a
array([10, 11, 12])
>>> a.sum()
33
>>> a.min()
10
>>> a.max()
12

Порівняння

>>> a = np.arange(10)
>>> b = np.arange(10)
>>> a == b
array([ True,  True,  True,  True,  True,  True,  True,  True,  True,  True], dtype=bool)
>>> b[5]=10
>>> a == b
array([ True,  True,  True,  True,  True, False,  True,  True,  True,  True], dtype=bool) 
# тепер масиви відрізняються одним елементом
>>> (a == b).all() # чи всі елементи True?
False
>>> (a == b).any() # чи є хоч один True?
True

Вирізання, індексування, ітерації

З одновимірними масивами поводяться зовсім так само як і зі списками. З багатовимірними не набагато складніше:

>>> a                          # Масив, в якому перша цифра означає рядок, друга стовпець.
array([[ 0,  1,  2,  3,  4,  5],
       [10, 11, 12, 13, 14, 15],
       [20, 21, 22, 23, 24, 25],
       [30, 31, 32, 33, 34, 35],
       [40, 41, 42, 43, 44, 45],
       [50, 51, 52, 53, 54, 55]])
>>> a[1]                              # Другий рядок
array([10, 11, 12, 13, 14, 15])
>>> a[:,1]                           # Другий стовпець
array([ 1, 11, 21, 31, 41, 51]) 
>>> a[1:-1,1:-1]                 # Викидаємо всі крайні елементи
array([[11, 12, 13, 14],
       [21, 22, 23, 24],
       [31, 32, 33, 34],
       [41, 42, 43, 44]])

Ітерація відбувається починаючи з першого виміру:

>>> for row in a:
...     print row
... 
[0 1 2 3 4 5]
[10 11 12 13 14 15]
[20 21 22 23 24 25]
[30 31 32 33 34 35]
[40 41 42 43 44 45]
[50 51 52 53 54 55]

А також можна проітерувати поелементно, за допомогою об'єкта flat:

>>> for element in a.flat:
...     print element,
... 
0 1 2 3 4 5 10 11 12 13 14 15 20 21 22 23 24 25 30 31 32 33 34 35 40 41 42 43 44 45 50 51 52 53 54 55

Розмірність

Транспозиція матриці робиться за допомогою метода transpose. Розгортанння в одновимірний за допомогою ravel:

>>> a
array([[ 0,  1,  2],
       [10, 11, 12],
       [20, 21, 22]])
>>> a.ravel()
array([ 0,  1,  2, 10, 11, 12, 20, 21, 22])
>>> a.transpose()
array([[ 0, 10, 20],
       [ 1, 11, 21],
       [ 2, 12, 22]])

Міняти розмірність масивів можна методами resize, та reshape. Різниця між ними в тому, що resize змінює сам масив, а reshape повертає новий масив як результат функції. Також resize працює не завжди, а коли йому не доводиться перевиділяти пам'ять ( чи щось подібне. мені він пише ValueError: resize only works on single-segment arrays ).

Хочете приклад? Та відкрийте середовище, і самі спробуйте! Що все за вас мають робити? :)

Конкатенація

Масивами можна конкатенувати вертикально, і горизонтально:

>>> a=np.ones((2,2))
>>> b=np.zeros((2,2))
>>> np.vstack((a,b))
array([[ 1.,  1.],
       [ 1.,  1.],
       [ 0.,  0.],
       [ 0.,  0.]])
>>> np.hstack((a,b))
array([[ 1.,  1.,  0.,  0.],
       [ 1.,  1.,  0.,  0.]])

Корисно, коли треба зліпити розширену матрицю, чи щось подібне.

Розрізання

Матриці можна розрізати. Теж вертикально чи горизонтально. Функціям hsplit чи vsplit передають матрицю для розрізання, і кількість рівних частин на які будуть різати, чи кортеж з набором номерів рядків (стовпців) з яких починається новий масив. Пояснення заплутане, приклад зрозуміліший:

>>> a=np.fromfunction(lambda x,y:y,(2,10),dtype=int)
>>> a
array([[0, 1, 2, 3, 4, 5, 6, 7, 8, 9],
       [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]])
>>> np.hsplit(a,2)
[array([[0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4]]), array([[5, 6, 7, 8, 9],
       [5, 6, 7, 8, 9]])]
>>> np.hsplit(a,(2,4,7))
[array([[0, 1],
       [0, 1]]), array([[2, 3],
       [2, 3]]), array([[4, 5, 6],
       [4, 5, 6]]), array([[7, 8, 9],
       [7, 8, 9]])]

Копії

З копіями треба акуратно. Звичайне присвоєння не створює копії, що може призвести до деяких помилок:

>>> a=np.arange(3) 
>>> b=a
>>> a
array([0, 1, 2]) 
>>> b
array([0, 1, 2]) # Ну прямо точна копія
>>> b[1]=10
>>> b
array([ 0, 10,  2]) # Що і очікувалось
>>> a
array([ 0, 10,  2]) # А ось і приїхали.

Щоб такого не відбувалось копії можна робити явно:

>>> b=np.copy(a)
>>> b
array([ 0, 10,  2])
>>> a
array([ 0, 10,  2])
>>> a[1]=0
>>> a
array([0, 0, 2])
>>> b
array([ 0, 10,  2])

Хоча така фіча може бути й корисна:

>>> a
array([[ 0,  1,  2],
       [10, 10, 10],
       [20, 10, 10]])
>>> b=a[1:,1:]
>>> b
array([[10, 10],
       [10, 10]])
>>> b[:]=0
>>> a
array([[ 0,  1,  2],
       [10,  0,  0],
       [20,  0,  0]])

Джерела