## Занятие №3

### Лекторы: Ярослав Петрик, Тихонова Полина

*Составлено с использованием материалов курса лекций «Программирование на языке Python для сбора и анализа данных» Щурова И.В., НИУ ВШЭ *

### Ввод-вывод списков
Для решения домашних заданий, да и вообще в жизни, нам нужно уметь преобразовывать списки в строки и наоборот. Рассмотрим несколько примеров.
#### Превращение строки в список
Возьмём строку, состояющую из слов, разделённых пробелами (может быть не одним) и символами конца строки.

In [99]:
s = "hello world    this is    a\ntest"
print(s)

Если мы хотим работать с отдельными словами, входящими в эту строку, то её нужно разделить на отдельные слова — то есть получить список, состоящий из слов, которые входят в эту строку. Для этого можно использовать метод `split()`.

In [101]:
s.split()

['hello', 'world', 'this', 'is', 'a', 'test']

Итак, мы получили ровно то, что хотели. Заметим, что в качестве разделителя в этом случае использовались пробелы (один или несколько), а также любые *пробельные символы*, в число которых входит символ табуляции (у нас его не было) и символ перевода строки `\n`. Разделители в элементы получающегося списка не попадают.

**Важно!** Метод `split()` не меняет строку (вообще говоря строку в принципе нельзя поменять):

In [104]:
s = "hello world    this is    a\ntest"
s.split()
print(s)

hello world    this is    a
test


В коде выше вторая строка не приводит ни к какому эффекту — вы создали список и мгновенно его забыли, а строка осталась неизменной. Если вы хотите что-то дальше делать со списком, полученным в результате применения `split()`, а не просто на него полюбоваться и забыть навсегда, то нужно, например, сохранить его в виде какой-то переменной:

In [105]:
words = s.split()
# теперь результат выполнения s.split() сохранён в переменную words
for word in words:
    print(word)

hello
world
this
is
a
test


У метода `split()` есть необязательный параметр — разделитель. Если он указан, то строчка разбивается по тому разделителю, который ему передан.

In [107]:
s.split("    ")

['hello world', 'this is', 'a\ntest']

Мы передали в качестве разделителя четыре пробела и теперь строка разделяется по ним, а один пробел или символ перевода строки не воспринимается как разделитель.

Допустим, мы хотим ввести несколько чисел через запятую и вывести каждое из них, увеличенное на 1. Можно попробовать такой код:

In [111]:
s = input("Введите несколько чисел, разделённых запятыми: ")
elements = s.split(",")
for n in elements:
    print(n+1)

Введите несколько чисел, разделённых запятыми: 2, 5, 10


TypeError: Can't convert 'int' object to str implicitly

Как нетрудно догадаться, он не работает: после разделения строки получается список, состоящий из строк. Чтобы превратить эти строки в числа, нужно использовать `int`. Вообще говоря, есть методы, которые позволяют довольно просто превратить все элементы списка в числа, но пока мы до них не дошли, будем обрабатывать в цикле каждый элемент в отдельности.

In [112]:
s = input("Введите несколько чисел, разделённых запятыми: ")
elements = s.split(",")
for n in elements:
    n = int(n)
    print(n+1)

Введите несколько чисел, разделённых запятыми: 2, 3, 99
3
4
100


Теперь работает!

#### Вывод списка в строчку

Решим теперь обратную задачу: есть список, мы хотим его вывести в каком-то виде. Есть разные способы это сделать. Например, можно просто распечатать:

In [113]:
elements = ["one", "two", "three"]
print(elements)

['one', 'two', 'three']


Тут элементы списка заключатся в скобки, а каждая строчка дополнительно ещё и в кавычки. Можно распечатать поэлементно в цикле, как в примере выше:

In [115]:
for el in elements:
    print(el)

one
two
three


Так он выводится в столбик, потому что `print()` по умолчанию добавляет символ перевода строки `\n` в конце каждой выводимой строчки. Если мы хотим вывести элементы списка как-то иначе, например, в строчку, но без скобок, запятых и кавычек, то нужно использовать другие способы.

Первым из них является применение метода `join()`. Это метод строки, который позволяет склеить элементы списка с помощью какоего-то «клея». В некотором роде, это такой «`split()` наоборот».

In [120]:
print(" ".join(elements))

one two three


In [121]:
print(":".join(elements))

one:two:three


In [122]:
print("----".join(elements))

one----two----three


Это удобный метод, но у него есть ограничение: он требует, чтобы список, который ему подали на вход, состоял из строк. Если среди его элементов есть другие объекты, он ломается.

In [124]:
numbers = [6, 9, 10]
", ".join(numbers)

TypeError: sequence item 0: expected str instance, int found

Эту проблему можно обойти (мы позже будем говорить про `map()` и списочные включения (list comprehensions)), но сейчас обсудим другой подход к выводу списков, основнный на функции `print()`.

Напомним, что если передать функции `print` список, то он его распечатает в квадратных скобках через запятую.

In [126]:
print(numbers)

[6, 9, 10]


А если передать отдельные элементы списка, то он их распечатает без скобок и разделяя пробелом (вообще говоря, любым символом — это настраивается с помощью параметра `sep`).

In [127]:
print(numbers[0], numbers[1], numbers[2])

6 9 10


Строчка выше даёт тот результат, который мы хотели, но она будет работать только в том случае, когда в списке ровно три элемента: если элементов больше, выведены будут только три, если меньше, то возникнет ошибка. К счастью, в Python есть конструкция, которая позволяет «раздеть» список — передать все его элементы какой-то функции через запятую. Это делается с помощью звёздочки (`*`).

In [128]:
print(*numbers)

6 9 10


Звёздочка как бы убирает квадратные скобки вокруг элементов списка. Сравните:

In [130]:
print(*[5, 8, 9, 11, "Hello"])

5 8 9 11 Hello


In [131]:
print(5, 8, 9, 11, "Hello")

5 8 9 11 Hello


Если вы хотите использовать не пробел, а какой-нибудь разделитель, то это тоже возможно:

In [132]:
print(*numbers, sep = ', ')

6, 9, 10


### Проверка условий
В ходе выполнения программы иногда требуется в зависимости от каких-то условий выполнять тот или иной фрагмент кода. Например, если пользователь ввёл не те данные, которые от него просили (хотели положительное число, а получили отрицательное), то надо вывести ошибку и попросить ввести данные снова. Решение этой задачи разбивается на несколько шагов: сначала нужно проверить некоторое условие, а потом в зависимости от результата этой проверки выбрать, какой код выполнять. Давайте начнём с проверки условий.

In [148]:
6 < 8

True

Здесь мы спросили «Правда ли, что 6 меньше 8?». «Воистину так» — ответил Python на своём заморском языке. Слово `True`, которое он выдал — это не просто слово, означающее «истина», а специальное логическое значение. Его ещё называют «булевским» (по имени одного из основателей математической логики [Джоджа Буля](https://ru.wikipedia.org/wiki/%D0%91%D1%83%D0%BB%D1%8C,_%D0%94%D0%B6%D0%BE%D1%80%D0%B4%D0%B6)). Оно бывает всего двух видов: либо истина (`True`), либо ложь (`False`). Третьего не дано.

In [149]:
8 > 9

False

Результат проверки можно записать в переменную.

In [150]:
condition = 6 < 8

In [151]:
condition

True

Говорят, что переменная `condition` теперь булевская (`bool`).

In [153]:
type(condition)

bool

Можно проверять равенство двух величин. Правда ли, что 7 равно 7?

In [155]:
7 == 7

True

Обратите внимание: здесь нужно написать символ равенства два раза, потому что один знак равно — это операция присвоения («присвоить то, что справа, тому, что слева»), а операция проверки равенства — это совсем другая штука. Например.

In [156]:
a = 5

Положили в `a` число `5`. Такая операция ничего не вернула.

In [157]:
a = 7

Теперь положили в `a` число 7.

In [159]:
a == 5

False

Теперь спросили, правда ли, что `a` равняется пяти. Получили `False`.

Надо сказать, что сравнение работает достаточно разумным образом. Например, число `7` и число `7.0` — это, строго говоря, разные объекты (первое — это целое число, второе — число с плавающей запятой), но понятно, что как числа это один и тот же объект. Поэтому сравнение выдаст `True`.

In [160]:
7 == 7.0

True

### Оператор if

Хорошо, мы научились проверять разнообразные условия. Теперь нужно менять поведение программы в зависимости от результатов такой проверки. Например, мы хотим ввести число с клавиатуры и в случае, если оно оказалось отрицательным, сообщить об ошибке. Для этого нужно использовать конструкцию `if`.

In [162]:
a = int(input("Введите положительное число: "))
if a < 0:
    print("Ошибка!")
    print("Число не является положительным!")
print("Вы ввели", a)

Введите положительное число: -4
Ошибка!
Число не является положительным!
Вы ввели -4


Нужно обратить внимание на несколько вещей: во-первых, после `if` указывается условие, а после условия обязательно ставится двоеточие (как и в циклах), дальше идёт блок команд, которые выполняются в том случае, если условие верно (то есть является `True`). Как и в циклах, этот блок команд должен быть выделен отступом. Команды, не входящие в блок (в данном случае это последняя строчка) выполняются в любом случае.

Допустим, мы хотим обработать отдельно обе ситуации: когда условие выполняется и когда оно не выполняется. Для этого нужно использовать ключевое слово `else`.

In [163]:
a = int(input("Введите положительное число: "))
if a < 0:
    print("Ошибка!")
    print("Число не является положительным!")
else:
    print("Как хорошо!")
    print("Вы ввели положительное число!")
print("Вы ввели", a)

Введите положительное число: 22
Как хорошо!
Вы ввели положительное число!
Вы ввели 22


Конструкция `if-else` работает как альтернатива: выполняется либо один фрагмент кода (после `if` — если условие верно), либо другой (после `else` — если неверно). Иногда нужно проверить несколько условий подряд.

In [164]:
a = int(input("Введите какое-нибудь число: "))
if a > 100:
    print("Это очень большое число")
elif a > 10:
    print("Это больше число")
else:
    print("Это маленькое число")

Введите какое-нибудь число: 123
Это очень большое число


Здесь используется ключевое слово `elif`, являющееся объединением слов `else` и `if`. Логика такая: сначала выполняется первое условие (`a > 100`), если оно верно, то выполняется код после `if`, если неверно, то проверяется следующее условие (`a > 10`), если оно верно, то выполняется код после `elif`, если неверно, то выполняется код после `else`. Команда `else`, если она есть, всегда должна идти в конце. Блоков `elif` может быть много. Условия проверяются по очереди, начиная от первого; как только какое-то из условий оказывается верным, выполняется соответствующий блок и проверка остальных условий не производится.

### Сложные условия
Допустим, нам нужно проверить выполнение нескольких условий. Скажем, мы хотим получить число от 0 до 100 — числа меньше 0 или больше 100 нас не устраивают. Это можно было бы сделать с помощью нескольких вложенных операторов `if` примерно так.

In [165]:
a = int(input("Пожалуйста, введите число от 0 до 100: "))
if a <= 100:
    if a >= 0:
        print("Спасибо, мне нравится ваше число")
    else:
        print("Вы ошиблись, это не число от 0 до 100")
else:
    print("Вы ошиблись, это не число от 0 до 100")

Пожалуйста, введите число от 0 до 100: 101
Вы ошиблись, это не число от 0 до 100


Этот код довольно громоздок, строчку с сообщением об ошибке пришлось скопировать дважды. Не очень хорошо. Оказывается, можно реализовать тот же функционал проще.

In [166]:
a = int(input("Пожалуйста, введите число от 0 до 100: "))
if a <= 100 and a >= 0:
    print("Спасибо, мне нравится ваше число")
else:
    print("Вы ошиблись, это не число от 0 до 100")


Пожалуйста, введите число от 0 до 100: 22
Спасибо, мне нравится ваше число


Здесь используется ключевое слово `and`, обозначающее операцию *логического И*. Оно делает следующее: проверяет левое условие (в данном случае `a <= 100`), проверяет правое условие (`a >= 100`) и если оба этих условия выполняются (то есть имеют значение `True`), то и результат выполнения `and` оказывается `True`; если же хотя бы одно из них не выполняется (то есть имеет значение `False`), то и результат выполнения `and` является `False`. Таким образом мы можем проверить в точности интересующее нас условие.

> Строго говоря, если левый аргумент `and` оказывается ложью, то правый даже не вычисляется: зачем тратить время, если уже понятно, что возвращать надо ложь?

Можно было бы переписать этот код другим способом, используя логическое ИЛИ (`or`):

In [167]:
a = int(input("Пожалуйста, введите число от 0 до 100: "))
if a > 100 or a < 0:
    print("Вы ошиблись, это не число от 0 до 100")
else:
    print("Спасибо, мне нравится ваше число")


Пожалуйста, введите число от 0 до 100: 22
Спасибо, мне нравится ваше число


Результат выполнения `or` является истиной в том случае, если хотя бы один аргумент является истиной. Наконец, есть третий логический оператор — это отрицание (`not`). Он имеет всего один аргумент и возвращает истину, если этот аргумент является ложью, и наоборот.

In [168]:
a = int(input("Пожалуйста, введите число от 0 до 100: "))
if not (a <= 100 and a >= 0):
    print("Вы ошиблись, это не число от 0 до 100")
else:
    print("Спасибо, мне нравится ваше число")


Пожалуйста, введите число от 0 до 100: 22
Спасибо, мне нравится ваше число


Можно проверить, как работают логические команды, просто подставляя в качестве аргументов `True` или `False`:

In [169]:
True or False

True

In [170]:
False and True

False

Можно даже задать Python известный вопрос: быть или не быть?

In [172]:
to_be = False
to_be or not to_be

True

Что будет, если `to_be` сделать равным `True`?

### Цикл while

До сих пор получив неправильное число (не удовлетворяющее нашим условиям) мы могли лишь поругать пользователя и развести руками. На самом деле программы обычно ведут себя иначе: они заставляют пользователя ввести правильное число, требуя этого снова и снова, пока он не капитулирует.

Чтобы добиться такого эффекта (а заодно довести пользователя до белого каления) нужно использовать цикл `while`. В прошлый раз мы обсуждали цикл `for`, используемый для того, чтобы перебрать элементы некоторого списка, или, в качестве частного случая — выполнить некоторую операцию какое-то конечное (заранее известное) число раз. Цикл `while` нужен, если мы хотим выполнять что-то до тех пор, пока выполняется некоторое условие. Например, пока рак на горе не свистнет. Это делается следующим образом.

In [174]:
a = int(input("Введите число от 0 до 100: "))
while a>100 or a<0:
    print("Неверно! Это не число от 0 до 100")
    a = int(input("Введите число от 0 до 100: "))
print("Ну хорошо")

Введите число от 0 до 100: -2
Неверно! Это не число от 0 до 100
Введите число от 0 до 100: -5
Неверно! Это не число от 0 до 100
Введите число от 0 до 100: 101
Неверно! Это не число от 0 до 100
Введите число от 0 до 100: 88
Ну хорошо


Другой пример: проверка пароля.

In [175]:
correct_passwd = ';ugliugliug'
passwd = input("Please, enter password: ")
while passwd != correct_passwd:
    print("Access denied")
    passwd = input("Please, enter password: ")
print("Access granted")

Please, enter password: 12345
Access denied
Please, enter password: mypassword
Access denied
Please, enter password: ;ugliugliug
Access granted


Этот код не очень изящный, потому что нам приходится дважды писать строку с `input()`. Ситуация, при которой нам приходится копировать какие-то строчки кода, обычно означает, что допущена ошибка в проектировании. Можно сделать это более изящно с помощью команды `break` — она позволяет выйти из цикла. Следующий пример также демонстрирует бесконечный цикл: по идее `while True:` должен выполняться до тех пор, пока `True` это `True`, то есть вечно. Но мы выйдем раньше с помощью `break`.

In [176]:
correct_passwd = ';ugliugliug'
while True:
    passwd = input("Please, enter password: ")
    if passwd == correct_passwd:
        print("Access granted")
        break
    else:
        print("Access denied")

Please, enter password: ;ugliugliug
Access granted


Команду `break` можно использовать для выхода из любого цикла. Вот пример для цикла `for`:

In [177]:
numbers = [6, 8, 9, 6, -7, 9]
for i in numbers:
    if i<0:
        print("Negative number detected!!!!111111odin")
        break
    print(i+1)

7
9
10
7
Negative number detected!!!!111111odin


### Ещё немного про строки

Я давно собирался рассказать про методы для работы со строками. Вообще этих методов существует много и про все не расскажу, но некоторые из них мы сейчас обсудим.

In [3]:
s = "hello world, hello"
new_s = s.replace("hello", "Hi")
print(new_s)
print(s)

Hi world, Hi
hello world, hello


Вот так, например, можно заменить подстроку в строке. Обратите внимание: строка является неизменяемым типом данных, поэтому, в отличие от методов списков типа `append()` методы строк никогда не меняют саму строку (это вообще невозможно), а вместо этого создают новую строку и возвращают результат.

Если вы хотели заменить только несколько первых вхождений (например, только первое слово `hello`, но не второе), можно было добавить третий аргумент метода `replace` — он показывает, сколько раз нужно произвести замену.

In [4]:
"hello world, hello".replace("hello", "Hi", 1)

'Hi world, hello'

Вот так можно найти подстроку в строке:

In [5]:
s.index("world")

6

In [6]:
s.find("world")

6

Оба метода возвращают индекс первого символа подстроки. Разница состоит в том, что если index() не сможет найти подстроку вообще, он выдаст ошибку (exception), а если с аналогичной проблемой столкнётся find(), то он вернёт число -1 в качестве индекса.

Кстати, проверить, входит ли подстрока в строку, можно ещё вот так:


In [7]:
"world" in s

True

А вот так можно посчитать, сколько подстрок в строке встречается:


In [8]:
s.count("o")

3

Подробности можно найти в [официциальной справке](https://docs.python.org/3/library/string.html).

### Форматирование строк

Зачастую требуется вставить значение каких-то переменных в какую-то строчку. Пример, который нам уже встречался.

In [10]:
name = "Alice"
grade = 5
print("Student", name,"has grade", grade)

Student Alice has grade 5


С помощью `print()` можно вывести такую строку на печать, но если бы мы хотели передать её какой-то другой функции, то надо было бы придумывать что-то другое. И это другое уже придумано!

Есть два распространённых способа подставлять значение переменных в строку (это часто называется *интерполяцией*, хотя не имеет никакого отношения к одноименной математической операции). Первый способ более классический.

In [11]:
new_str = "Student %s has grade %i" % (name, grade)
print(new_str)

Student Alice has grade 5


Здесь используется оператор `%`, который для строк делает следующую операцию: берёт строку слева от него, находит там все «поля для подстановки» (*placeholders*) — в данном случае это `%s` и `%i`, после чего берёт переменные, перечисленные справа от него (это может быть одна переменная или кортеж из нескольких переменных, как в данном случае) и подставляет их последовательно — первую переменную на место первого placeholder, вторую на место второго и т.д.

Буквы в обозначениях placeholders означают тип переменной: в данном случае `%s` — это строка, а `%i` — целое число. Вот ещё несколько примеров:

In [12]:
print("The number is %i" % 2.3)
print("The number is %f" % 2) # f значит float
print("The number is %.2f" % 2.1393) # два знака после точки
print("The number is %04i" % 3) # дополнить до четырёх знаков нулями


The number is 2
The number is 2.000000
The number is 2.14
The number is 0003


При использовании оператор `%` нужно быть осторожным: он имеет приоритет по сравнению с арифметическими операциями, поэтому вы можете получить неожиданный результат, если не поставите скобки:

In [13]:
print("a = %i" % 3*3)

a = 3a = 3a = 3


Здесь произошло следующее: сначала выполнился код `"a = %i" % 3`, а потом результат умножился на 3 (что для строчек эквивалентно трёхкратному повторению). Если вы хотели подставить результат выполнения `3*3`, то нужно было сделать вот так:

In [15]:
print("a = %i" % (3*3))

a = 9


Второй способ форматирования («новый») заключается в использовании метода `format()`. Он действует примерно так:

In [17]:
"hello, {0}, this is {1}, again {0}, {var}".format(7, 9, var="test")

'hello, 7, this is 9, again 7, test'

Здесь не приходится явно указывать типы данных (подставляется строковое представление переменной). Одно и то же значение может использоваться несколько раз (к ним можно обращаться по номерам и именам. Впрочем, можно и не указывать явно номера — тогда переменые будут подставляться по очереди:

In [19]:
"Fist var: {}, the second one: {}".format(8, 1)

'Fist var: 8, the second one: 1'

Форматирование может быть довольно сложным и никто не в силах запомнить все тонкости. Неплохая документация на эту тему (как по оператору `%`, так и по методу `format()`) собрана [здесь](https://pyformat.info/).

### Спасибо за внимание!