# Занятие 4
### Лекторы: Ярослав Петрик, Тихонова Полина

*Составлено с использованием материалов курса лекций «Программирование на языке Python для сбора и анализа данных» Щурова И.В., НИУ ВШЭ*

##  Функции

Функции — это такие участки кода, которые изолированы от остальный программы и выполняются только тогда, когда вызываются. 

Мы уже встречались с функциями, например max(), len(), print(). Они все обладают общим свойством: они могут принимать параметры (один или несколько, или 0 параметров), и они могут возвращать значение (хотя могут и не возвращать). Например, функция max() принимает один параметр и возвращает значение (наибольшее число). Функция print() принимает произвольное число параметров и ничего не возвращает.

#### Зачем нужны функции?
Во-первых, это организация рутинных действий: если в ходе работы нам часто приходится выполнять одинковые действия, то вместо того, чтобы копировать код из одного места в другое, лучше создать функцию: то есть такую штуку, которая бы одним словом заменила целый набор действий! Базовые функции в питоне, которые используются ну оочень часто, конечно же, уже прописаны из коробки (те же len(), min()...), еще некоторая часть прописана в сторонних библиотеках (о них мы поговорим на след. занятиях).
Но бывает, что необходимо зафиксировать некоторый специфический набор действий, вот тогда-то и приходится писать функции самим.

Еще одна причина - организация работы. Например, вам предстоит решить очень большую и сложную задачу (ну или просто большую). По началу, вы можете даже не представлять как к ней подступится, но ответ прост: ешьте слона по кусочкам. То есть разбейте эту задачу на более мелкие подзадачи, а при необходимости разбейте еще раз. И каждую маленькую подзадачку решайте отдельно и реализуйте в виде функций. Чтобы потом собирать решение исходной задачи как из кирпичиков - из написанных ранее функций. Так у вас будет меньше шансов запутаться в своем же коде, а ваше решение будет гораздо более прозрачным и простым.


Что ж, попробуем написать свою первую функцию! В качестве примера, возьмем нашу несчастную последовательность фибоначчи.

Для начала вспомним алгоритм нахождения k-того числа фибоначчи:

In [18]:
k = 10
a = 1
b = 1
h = 1
for i in range(k):
    if i < 2:
        h = 1
    else:
        h = a + b
        a = b
        b = h
print(b)

55


Для единообразия,  здесь мы не исключаем первые 2 шага из цикла.

А теперь напишем функцию, вычисляющую k-ое число фибоначчи. Она выглядит так:

In [19]:
def fibonachi(k):
    a = 1
    b = 1
    h = 1
    for i in range(k):
        if i < 2:
            h = 1
        else:
            h = a + b
            a = b
            b = h
    return h

При выполнении этой ячейки вроде бы ничего не произошло — по крайней мере, Python не выдал никакого вывода. Так и должно быть. На самом деле, в этот момент Python достал большую чёрную записную книжку на странице на букву f (это метафора, на самом деле нет никаких страниц) и записал в неё: «если меня попросят выполнить функцию fibonachi, нужно сделать вот такие действия». Теперь мы можем *вызывать* функцию `fibonachi`, передавая ей параметр.

In [20]:
fibonachi(7)

13

И даже использовать её в более сложных выражениях:

In [21]:
fibonachi(7)+fibonachi(17)

1610

Посмотрим более внимательно на то, что происходит, когда Python вычисляет значение выражения `fibonachi(7)`. В первую очередь он открывает свою записную книжку и ищет там функцию `fibonachi`. Находит (поскольку раньше мы её туда записали). Дальше он смотрит на первую строчку определения функции (это так называемая *сигнатура*):

```python
def fibonachi(k):
```

Здесь он видит, что функция `fibonachi()` имеет аргумент, который называется `k`. Python помнит, что мы вызвали `fibonachi(7)`, то есть значение аргумента должно быть равно 7. Таким образом, дальше он выполняет строчку (которую мы не писали)
```python
k = 7
```

После чего выполняет остальные строчки из *тела функции*:
```python
a = 1
    b = 1
    h = 1
    for i in range(k):
        if i < 2:
            h = 1
        else:
            h = a + b
            a = b
            b = h
```

Наконец он доходит до строчки
```python
return h
```
В этот момент переменная `h` имеет значение 13. Слово `return` означает, что Python должен вернуться к строчке, в которой был вызов `fibonachi(7)`, и заменить там `fibonachi(7)` на 13 (то, что написано после `return`). На этом вызов функции завершён.

### Возвращаемые значения и побочные эффекты

Давайте а нарисую такую схему:

![Схема работы функции](http://math-info.hse.ru/f/2015-16/all-py/func.svg)

Функция — это такая машинка, которая что-то получает на вход (аргументы), что-то выдаёт на выход (возвращаемое значение), а ещё может попутно что-то сделать с окружающей реальностью (побочные эффекты). 
> Представьте себе кофейный автомат, который на вход принимает деньги, возвращает кофе, но ещё при каждом запуске отправляет компании-производителю письмо с информацией о том, какой кофе был заказан последним. Вот эта отправка письма и будет побочным эффектом.

Давайте посмотрим на примере, в чём разница между возвращаемым значением и побочным эффектом. Напишем функцию, которая приветствует пользователя.

In [13]:
def hello(name):
    return "Hello, "+name+"!"

In [14]:
s = hello("World")

In [15]:
s

'Hello, World!'

В переменной `s` сейчас — результат выполнения функции `hello()`, которой на вход передали аргумент `name`, равный `"World"`.

А теперь давайте напишем другую функцию, которая не *возвращает* строчку, а печатает её.

In [16]:
def say_hello(name):
    print("Hello, "+name+"!")

В этой функции вообще нет команды `return`, но Python поймёт, что из функции надо возвращаться в основную программу в тот момент, когда строчки в функции закончились. В данном случае в функции только одна строка.

In [17]:
s = say_hello("Harry")

Hello, Harry!


Обратите внимание: теперь при выполнении `s = say_hello("Harry")` строчка выводится на печать. Это и есть *побочный эффект* выполнения функции `say_hello`. Что лежит в переменной `s`?

In [18]:
s

In [19]:
print(s)

None


В ней лежит *ничего*. Это специальный объект `None`, который испоьзуется, когда какое-то значение нужно присвоить переменной, но никакого значения нет. В данном случае его нет, потому что функция ничего не вернула. Возвращаемого значения у `say_hello()` нет. Так бывает.

### Более сложные ситуации с функциями

Функции могут вызывать другие функции. Например, вместо того, чтобы копировать строчку `"Hello, "+name+"!"` из функции `hello()` в функцию `say_hello()`, просто вызовем `hello()` из `say_hello()`.

In [1]:
def new_say_hello(name):
    '''
    Function, which print Hello, %name%!
    
    name - type: str
    return None
    '''
    print(hello(name))

In [19]:
new_say_hello("Harry")

Hello, Harry!


In [2]:
new_say_hello??

В тройных кавычках сразу после сигнатуры функции обычно приводится её описание (так называемая `docstring`). Это комментарий для людей, которые будут использовать вашу функцию в будущем. Даже если это будете вы сами, скорее всего, через месяц вы уже забудете, что именно делает эта функция, какие аргументы принимает и какие значения возвращает. Написать всё это сразу бывает очень полезно. Чтобы посмотреть на эту справку, можно набрать название вашей функции, открывающую скобку и нажать *Shift+Tab* или *?*.
Чтобы посмотреть не только информацию о функции, но и ее код наберите название вашей функции и *??*

После выполнения строчки `return` выполнение функции прекращается. Давайте рассмотрим ещё один пример: вычислим модуль некоторого числа. Код для этой функции может иметь такой вид:

In [22]:
def my_abs(x):
    if x > 0:
        return x
    else:
        return -x

In [23]:
my_abs(-5)

5

Это самое простое решение: если число положительное, то возвращается оно само, а если отрицательное, то возвращается оно с обратным знаком (`-x`). 
Можно было бы написать эту функцию и таким образом:

In [24]:
def my_abs(x):
    print("New my_abs")
    # если функция с таким названием уже была, то Python про неё забудет и запишет вместо этого новую функцию
    # чтобы убедиться в этом создадим побочный эффект: print, объявляющий о том, что это действительно новая функция
    if x > 0:
        return x
    return -x

In [25]:
my_abs(-6)

New my_abs


6

Здесь происходит следующее: если число положительное, то срабатывает `return x` и после этого выполнение функции прекращается, до строчки `return -x` дело не доходит. А если число отрицательное, то наборот, срабатывает только строчка `return -x` (из-за оператора `if`).

### Локальные и глобальные переменные

Внутри функции могут создаваться и использоваться различные переменные. Чтобы это не создавало проблем, переменные, определенные внутри функции, не видны извне. Давайте рассмотрим пример:

In [23]:
h = 10

def fibonachi(k):
    a = 1
    b = 1
    h = 1
    print('In the function, h =', h)
    for i in range(k):
        if i < 2:
            h = 1
        else:
            h = a + b
            a = b
            b = h
    return h

h = 10
print(h)
print(fibonachi(5))
print("Out of function")
print(h)

10
In the function, h = 1
5
Out of function
10


[pythontutor](http://pythontutor.com/visualize.html#mode=edit)

Тем не менее, иногда нам всё-таки хочется, чтобы функция имела доступ к какой-то внешней переменной. Допустим, мы хотим написать функцию, которая будет приветствовать пользователя, используя язык, указанный им в настройках. Она могла бы выглядеть таким образом:

In [36]:
def hello_lang(name, lang):
    if lang == 'ru':
        print("Привет,",name)
    else:
        print("Hello,",name)

In [37]:
hello_lang("Ivan", 'ru')

Привет, Ivan


In [38]:
hello_lang("Ivan", 'en')

Hello, Ivan


Проблема в том, что функций, которым нужно знать, какой язык выбран, может быть очень много, и каждый раз передавать им вручную значение переменной `lang` отдельным параметром довольно мучительно. Оказывается, можно этого избежать:

In [39]:
def hello_lang(name):
    if lang == 'ru':
        print("Привет,",name)
    else:
        print("Hello,",name)
        
lang = 'ru'
print("Hello world")
hello_lang('Ivan')

lang = 'en'
hello_lang('John')

Hello world
Привет, Ivan
Hello, John


Как видите, сейчaс поведение функции зависит от того, чему равняется переменная `lang`, определенная вне функции. Может быть и в функции `fibonachi()` можно было обратиться к переменной `h` до того момента, как мы положили в неё число 1? Давайте попробуем:

In [25]:
def fibonachi(k):
    print("In the function, before assignment, h =", h)
    a = 1
    b = 1
    h = 1    
    for i in range(k):
        if i < 2:
            h = 1
        else:
            h = a + b
            a = b
            b = h
    print('In the function, h =', h)
    return h

In [26]:
fibonachi(3)

UnboundLocalError: local variable 'h' referenced before assignment

В этом случае Python выдаёт ошибку: локальная переменная `f` использовалась до присвоения значения. В чём разница между этим кодом и предыдущим?

Оказывается, Python очень умный: прежде, чем выполнить функцию, он анализирует её код и определяет, какая из переменных является локальной, а какая глобальной. В качестве глобальных переменных по умолчанию используются те, которые не меняются в теле функции (то есть такие, к которым не применяются операторы типа приравнивания или `+=`). Иными словами, по умолчанию глобальные переменные доступны только для чтения, но не для модификации изнутри функции.

Ситуация, при которой функция модифицирует глобальную переменную, обычно не очень желательна: функции должны быть изолированы от кода, который из запускает, иначе вы быстро перестанете понимать, что делает ваша программа. Тем не менее, иногда модификация глобальных переменных необходима. Например, мы хотим написать функцию, которая будет устанавливать значение языка пользовавателя. Она может выглядеть примерно так:

In [77]:
def set_lang():
    global lang
    useRussian = input("Would you like to speak Russian (Y/N): ")
    if useRussian == 'Y':
        lang = 'ru'
    else:
        lang = 'en'

In [78]:
lang = 'en'
print(lang)
set_lang()
print(lang)

en
Would you like to speak Russian (Y/N): Y
en


А если уберем global lang:

In [None]:
def set_lang():
    useRussian = input("Would you like to speak Russian (Y/N): ")
    if useRussian == 'Y':
        lang = 'ru'
    else:
        lang = 'en'

In [None]:
lang = 'en'
print(lang)
set_lang()
print(lang)

### Передача аргументов
Есть разные способы передавать аргументы функции. С одним из них мы уже знакомы:

In [81]:
def hello(name, title):
    print("Hello", title, name)

In [82]:
hello("Potter", "Mr.")

Hello Mr. Potter


В некоторым случаях мы хотим, чтобы какие-то аргументы можно было не указывать. Скажем, мы хотим иметь возможность вызвать функцию `hello()`, определённую выше, не указывая `title`. В этом случае сейчас нам выдадут ошибку:

In [83]:
hello("Harry")

TypeError: hello() missing 1 required positional argument: 'title'

Это неудивительно: мы сказали, что функция `hello()` должна использовать аргумент `title`, но не передали его — какое же значение тогда использовать? Для преодоления этой трудности используютя значения по умолчанию (default values).

In [84]:
def hello(name, title=""):
    print("Hello", title, name)
hello("Harry")

Hello  Harry


In [85]:
hello("Smith", "Mrs.")

Hello Mrs. Smith


Аргументы можно передавать, указывая их имена.

In [86]:
hello("Smith", title = "Mr.")

Hello Mr. Smith


In [87]:
hello(name = "Smith", title= "Mr.")

Hello Mr. Smith


В этом случае порядок будет неважен.

In [89]:
hello(title= "Mr.", name = "Smith")

Hello Mr. Smith


Ещё бывают функции, которые принимают неограниченное число аргументов. Например, так ведёт себя функция `print()`.

In [61]:
print(8, 7, 5, 'hello', 8)

8 7 5 hello 8


Как она устроена? Примерно вот так:

In [75]:
def my_print(*args):
    for x in args:
        print(x)

In [78]:
my_print(6, 8, 9, 'hello', 88, 55)

6
8
9
hello
88
55


Обратите внимание на звёздочку перед `args` в сигнатуре функции. Давайте посмотрим повнимательнее, как работает этот код:

In [91]:
def test(*args):
    print(args)
test(1,2,3, 'hello')

(1, 2, 3, 'hello')


Оказывается, что в `args` теперь лежит так называемые *кортеж* (неизменяемый список, его возращает dict.items()), состоящий из элементов, которые мы передали функции. 

In [95]:
def test1(*args):
    print(args)
test1(1, 2, 3)

def test2(args):
    print(args)
test2( (1,2,3) )

(1, 2, 3)
(1, 2, 3)


Можно комбинировать списочные переменные и обычные (при условии, что переменная со звёздочкой только одна и она стоит после обычных переменных):

In [96]:
def my_print(sep, *args):
    for x in args:
        print(x, end = sep)


In [102]:
my_print('----', 7, 8, 9, 'hello')

7----8----9----hello----

Аналогично, можно задавать неопределенное количество переменных со значениями по умолчанию, такие переменные записываются в словарь с одноименным названием:

In [7]:
def test(**kwargs):
    print(kwargs)

In [8]:
test(a=1, b=2)

{'a': 1, 'b': 2}


___
### Информация со звездочкой *

### Генераторы

Возвращаясь к последовательности Фибоначчи...

Вообще в реальной жизни, нам навряд ли нужно какое-то одно конкретное (к примеру 17 число последовательсти), или некоторое количество чисел фибоначчи из случайных мест. Скорее всего нам нужно будет перебирать все элементы последовательности от 1 до k и проделывать с ними какие-то действия. В таком случае мы можем модифицировать нашу функцию так, чтобы она выдавала не одно число, а список из первых k чисел фиббоначи:

In [95]:
def fibonachi_to_list(k):
    a = 1
    b = 1
    fib = [a, b]
    for i in range(2, k):
#         print('action')
        h = a + b
        a = b
        b = h
        fib.append(h)
    return fib

In [96]:
fibonachi_to_list(10)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

Однако, опять же, далеко не всегда нам необходимо иметь сразу все числа последовательности. Часто нам нужны эти числа по одному, по очереди. А с ростом k, список будет занимать все больше и больше памяти - соответственно, список в такой ситуации будет не самой эффективной структурой. Вот бы научить фунцию останавливаться после одного шага цикла и запоминать текущее состояние. А при повторном вызове продолжить работу с момента остановки. Тогда мы бы смогли бы смогли вызвать число последовательности фибоначчи, выполнить необходимые действия, вызвать следующее число и т.д.

И....О чудо! Мы можем сделать именно так! Для этого нам просто в нашей исходной функции нужно поменять слово return на yield и внести его в цикл...

In [97]:
def fibonachi(k):
    a = 1
    b = 1
    h = 1
    for i in range(k):
#         print('action')
        if i < 2:
            h = 1
        else:
            h = a + b
            a = b
            b = h
    return h

In [99]:
def fibonachi_gen(k):
    a = 1
    b = 1
    for i in range(k):
#         print('action')
        if i < 2:
            h = 1
        else:
            h = a + b
            a = b
            b = h
        yield h

In [100]:
k = 10
fibonachi(k), fibonachi_to_list(k),  fibonachi_gen(k)

(55,
 [1, 1, 2, 3, 5, 8, 13, 21, 34, 55],
 <generator object fibonachi_gen at 0x0000024542367200>)

In [101]:
for k in range(1, 10+1):
    print(fibonachi(k))

1
1
2
3
5
8
13
21
34
55


In [102]:
k = 10
fibonachi_to_list(k)

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

In [122]:
k = 10
gen = fibonachi_gen(k)
for num in gen:
    print(num)

1
1
2
3
5
8
13
21
34
55


***При этом генератор "живет" только один раз. Его нельзя вызвать дважды!***

In [123]:
for num in gen:
    print(num)

Чтобы посмотреть затратность алгоритмов, добавим (раскомметируем) print('action') в цикл в каждую функцию...

Полагаю, разница очевидна.

____
## Бонус - скоропись
Пишем в одну строку условия, циклы, генераторы, функции, создаем словари и списки.

### *Условия*

Задача. Пользователь вводит число - нам необходимо сохрнить модуль этого числа.

In [117]:
num = int(input())
num = num if num > 0 else -num
print(num)

5
5


### *Списки*

Например, задача: создать список квадратов чисел от 0 до 10. <br>
**Стандартное решение:**

In [105]:
l = []
for i in range(11):
    l.append(i**2)
l

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

**Решение в одну строчку:**<br>
В принципе, все тоже самое: квадратные скобки, for...

In [None]:
l = [i**2 for i in range(11)]

### *Словари*

Попробуем аналогичное: создадим словарь, где ключи - числа от 0 до 10, значения - их квадраты. <br>
**Стандартное решение:**

In [108]:
d = {}
for i in range(11):
    d[i] = i**2
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}

**В одну строчку**

In [109]:
d = {i:i**2 for i in range(11)}
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}

В однострочные циклы также можно добавить и условия!
Например, у нас есть список слов. Создадим из слов длины > 3 словарь, где ключи - сами слова, значения - их длины.

In [110]:
words = ["быть", 'или', 'не', 'быть']
d = {word:len(word) for word in words if len(word) > 3}
d

{'быть': 4}

**Но!**<br>
Если мы захотим включать слова длиной <=3, но присваивать им значения None, мы должны будем перенести if перед циклом: 

In [114]:
words = ["быть", 'или', 'не', 'быть']
d = {word:(len(word) if len(word) > 3 else None) for word in words }  # Для наглядности происходящего поставлены скобочки
d

{'быть': 4, 'или': None, 'не': None}

### *Генераторы*

Недавно мы говорили о том, что генераторы позволяют нам выдавать элементы списка поочередно и таким образом, экономить память. Но списки мы только что научились писать в одну строчку...а генераторы?

А генераторы пишутся точно также как и списки, и словари, только в круглых скобочках:

In [118]:
# Создадим генератор, возвращающий квадраты чисел от 0 до 10
g = (i**2 for i in range(11))
g

<generator object <genexpr> at 0x00000245423952B0>

In [119]:
list(g)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

#### Еще один пример использования однострочных записей <br>
Необязательно что-то создавать... Можно использовать однострочные записи для выполнения действий, чтобы не расписывать цикл в несколько строк, например.

In [124]:
[print(i) for i in range(5)]

0
1
2
3
4


[None, None, None, None, None]

**Что здесь происходит? **<br>
Мы в цикле выполняем функцию print(), которая печатает на экран цифры от 0 до 5.
Как мы знаем, эта функция только печатает на экран, но ничего не возвращает. Ничего на языке питона - это None.
И вот этими пустотами (None) мы заполняем список.
Поскольку мы не присваиваем этот список никакой переменной, то ячейка просто возвращает нам его.
Чтобы ячейка ничего не возвращала, поставьте в конце последней строки ;

Однако, у однострочных выражений существует альтернатива - map() + lambda-функции.

### ***lambda, map(), filter()***

lambda-функции - существуют и в других языках программирования. По сути, это такие выражения, которые позволяют записывать небольшие функции в одну строчку. <br>
lambda-функции могут выполнять всего лишь одно действие, но на вход можно подавать сколько угодно переменных.
Посмотрим как они записываются...

In [3]:
g = lambda x: x**2
g

<function __main__.<lambda>>

In [4]:
g(4)

16

Эта запись аналогична:

In [5]:
def g(x):
    return x**2

Как мы видим, с использованием lambda-функции, код сократился, хотя, как вы можете справедливо заметить некритично.
И в действительность отдельно сами по себе lambda-функции используются редко! Однако, они становятся мощным инструментов в совокпуности с такими функциями как map(), filter(), reduce(). <br>
Разберем каждую из этих фунцкий подробнее.

*** map(func, list)*** - на вход подается функция (обычно как раз в виде lambda-выражения) и список. Функция map применяет заданную фунцкию последовательно ко всем элементом списка и возвращет значения функции в список. Например,

In [7]:
list(map(lambda x:x**2, range(5)))

[0, 1, 4, 9, 16]

In [11]:
map(lambda x:print(x), range(5))

<map at 0x2a7d3e3c7b8>

Это эквивалентно:

In [9]:
def g(x):
    return x**2
l = []
for i in range(5):
    l.append(g(i))
l

[0, 1, 4, 9, 16]

Как видите теперь однострочные выражения сильно упрощают нам жизнь!

*** filter(func, list)*** - на вход также подается функция (обычно как раз в виде lambda-выражения) и список. Функция filter делает то же самое, что и map, за одним исключением: в список попадают только  те элементы, для которых значение функции ==  True (или не равно 0, None).  Например,

In [15]:
list(filter(lambda x:x%2 == 0, range(5)))

[0, 2, 4]

In [14]:
list(filter(lambda x:x**2, range(5)))

[1, 2, 3, 4]

:)