Черновики! пока


Питон

Начало

Python\01_intro.pdf

IDLE, PyCharm. Комментарии. Целые числа. Задача 3n+1. p-счастливые билеты.

float. Структура. Границы. Особые значения. boolean. Дата и время.

циклы, условия, файлы

Python\02_for_list.pdf

cycle, if, Строки, Списки, Треугольник Паскаля, Сортировка, Файлы.

Теория чисел

Python\03_numb_th.pdf

Модуль:Python\hnumber_theory.py

Прямая проверка простоты. Решето Эратосфена. Метод Ферма. Факторизация целых чисел.

Модуль hnumber_theory. Задачи.

Классы. На примере эллиптических кривых

Python\04_classes.pdf

Модуль:Python\elliptic_curve.py

Математическое введение: эллиптические кривые.

Модуль elliptic_curve. ГОСТ Р 34.10-2018.

Как это устоено? Определение класса. Переменные класса и экземляра.

Строковое представление объекта. Сложение и умножение точек.

Примеры.

Простейшая графика

Python\05_graphics.pdf

Модуль tkinter. matplotlib. scatter, plot, savefig, legend.

numpy

Python\06_numpy.pdf

Типы данных: bool, int, float,... . Действия с массивами. Вырезки.

Нормализация столбцов матрицы, бинаризация столбцов, удаление нулевых столбцов.

Матрица Гильберта. svd-разложение.

Случайные числа

Python\07_zRnd.pdf

Псевдослучайные числа. Период рекуррентной последовательности

Случайные величины. Функция и плотность распределения. МО, дисперсия, среднеквадратичное отклонение.

Список СВ.

Статистика

Python\08_zStat.pdf

Выборочное среднее и дисперсия.

Вектора СВ На Питоне.

Доверительный интервал для МО и дисперсии.

Проверка статистической гипотезы.

Распределение хи-квадрат. Критерий Пирсона.


Машинное обучение

\a\book_new\MO\978-5-7996-3015-7_2020.pdf Ебург, основы МО

Линейная регрессия

ML\20_lin_regr.pdf

Данные: 20_lin_regr.7z,

Линейные модели. Ошибки: MSE, RMSE, MAE, MAPE.

dim=0, dim=1, чистка данных. dim>1

ЕГЭ в Португалии-2006

ML\21_portugal.pdf

Данные: school2006.7z,

Описание данных.

Простое решение.

Правим Y, возраст.

Читаем дополнительные данные.

Сокращение размерности.

Метод ближайших соседей.

Бинарная классификация

ML\22_lin_regr_bin.pdf

Данные: UCI_Australian.7z,

Бинарная классификация. UCI_Australian.7z. Матрица ошибок. ROC-кривая. AUC (площадь под кривой).

PCA: Метод главных компонент.

Доп.картинки с ROC-кривыми с разным уровнем сокращенея размерности:

и анимация при разном PCA:

Рекламная кампания банка (bank_contest2011.7z)

ML\23_bank_2011.pdf

Данные: bank_contest2011.7z ,

Бинаризация признаков. Удаление нулевых столбцов. На Питоне. ROC-кривая. AUC.

Решающие деревья

ML\24_tree.pdf

Данные: entropy0.7z,

Энтропия текста. Код Хаффмана. Дерево Фано. На Питоне.

Кластеризация

ML\25_cluster.pdf

Данные: cluster01.csv,

Метрики. Метод k-средних. DBSCAN. Графовые методы.

Временные ряды

ML\26_time_series.pdf

Данные:
brent.npz,
wti.npz,
gold_sb.npz,
hotWater.npz,
GermanE.npz,
mpi_roof_2008.npz,

Примеры исходных данные (6 штук). Их чтение. Исправление неполадок.
Скользящее окно (Rolling window).
Ковариационная функция.
Экспоненциальное сглаживание.
Прогноз через регрессию на 1 шаг и рекурсию.

Линейные рекуррентные последовательности

ML\27_lin_recurr.pdf

Определение. Комплексные корни. Простая регрессия для временного ряда.

Прогноз с помощью простой регресси на k шагов на Питоне. Примеры.

ARIMA

ML\28_ARIMA.pdf

Сглаживание. Полиномиальное сглаживание. Стационарность. ARIMA.

Обработка текстов

ML\29_text.pdf

Данные:
astro.fb2,

Словари. Частотный словарь.
Кодировки текстов. Чтение файла.
С-комментарии. Частоты идентификаторов в программе.
NLP(Natural language processing). Стемминг Портера. pymorphy2.
LibRusEc. word2vec. Локальный контекст.

Нейронные сети

Одиночный нейрон

ML\41_neuro1.pdf

Данные:
neuron_AB.csv,

Нейрон. Обучение одного нейрона. Функция потерь.
Минимизация функции одной переменной.
Численное нахождение производной.
Проблема локальных минимумов.
Градиент.
Минимизация функции двух переменных.
Функция Розенброка.
Минимизация функции от n переменных.
На примере UCI_Australian.csv, ROC кривая.

Используемые наборы данных

ML\42_neuro2.pdf

Данные:
4circles.csv ,
spiral_02_03.csv, spiral_02_05.csv,
sky_data.csv ,
mnist_std.npz ,
CIFAR10_std.npz ,

4 круга, спирали на плоскости, астро-данные, MNIST, CIFAR-10

Однослойные сети, классификация, на numpy

ML\43_neuro3.pdf
SoftMax.
Загрузка данных.
Целевая функция и её градиент.
Градиентный спуск.

Однослойные сети, результаты

ML\44_neuro4.pdf
4circle, Спираль, astro, MNIST, CIFAR

zTeach.exe, визуализация простого примера

ML\45_neuro5.pdf
Многослойные сети
zTeach.exe. Пример обучения. Результаты.

TensorFlow

ML\46_tf1.pdf
Установка, Подготовка данных, Построение полносвязной модели и её параметры, обучение, результат на всех тестовых данных.
Разбивка train/test, batches, функции активации, методы обучения.
Двухслойная полносвязная сеть. Результаты на всех исходных данных. Задание.

Задача регрессии, визуализация

ML\47_tf2.pdf
Визуализация процесса обучания на примере двумерных входных данных.
Из картинки - обучающую матрицу.
Чтение и нормализация обучающией матрицы.
Вывод на экран текущего результата обучения. callback-функции.
Построение модели. Обучение. Результаты.

Свёртка матриц

ML\48_tf3.pdf
Одномерные примеры: сглаживание вектора, дифферецнирование → свертка.
Свойства операции свёртки.
Свёртка в двумерном случае.

Свёрточные нейросети

ML\49_tf4.pdf
Свёрточный нейрон. Свёрточный слой нейронов.
MNIST, Подготовка данных. Построение модели. Обучение. Результаты.
Задание: повторить для CIFAR-10.