Commit 0575e100 by PLN (Algolia)

ML101: TP1

parent 855e62ce
...@@ -13,26 +13,144 @@ paginate: true ...@@ -13,26 +13,144 @@ paginate: true
--- ---
## Perceptron ## Perceptron
<!-- Base fondamentale -->
<!-- Little more than a learning thermostat -->
> _perceptron may eventually be able to learn, make decisions, and translate languages._
**Frank Rosenblatt**, 1958
Was researched until Minsky's killer book Perceptrons:
> acknowledge some of the perceptrons' strengths while also showing major limitations
...until Marvin Minsky's book
## _Perceptrons_ (1969)
![bg right:38% fit](
-> Focus on "Symbolic systems"
-> huge limits to perceptrons abilities
-> killed the field: almost stopped research on the connectionnist paradigm for the next fifteen years, until it gets a REVIVAL
- Pour aller plus loin: [_WP History of AI | Perceptrons and the attack on connectionism_](
![bg fit](
<!-- Mark I Perceptron machine, 1958 | Cornell University Library website -->
It was connected to a camera with 20×20 cadmium sulfide photocells to make a 400-pixel image.
The main visible feature is a patch panel that set different combinations of input features.
To the right, arrays of potentiometers that implemented the adaptive weights. -->
# Formalisme: un Perceptron
<!-- _backgroundColor:
_color: -->
$$ f(\mathbf{x}) = \begin{cases}1 & \text{if }\ \mathbf{w} \cdot \mathbf{x} + b > 0,\\0 & \text{otherwise}\end{cases} $$
# Intuition: apprentissage d'un Perceptron
<!-- _backgroundColor:
_color: -->
![bg right 95%](
<!-- Diagram by Elizabeth Goodspeed -->
$$ f(\mathbf{x}) = \begin{cases}1 & \text{if }\ \mathbf{w} \cdot \mathbf{x} + b > 0,\\0 & \text{otherwise}\end{cases} $$
![bg 90%](*ZafDv3VUm60Eh10OeJu1vw.png)
![bg left fit](*ZafDv3VUm60Eh10OeJu1vw.png)
<!-- Image credit: Shruti Jadon, Introduciton to Different Activation Functions for Deep Learning -->
- Aller plus loin: [CodeX - Ansh David: _intro to Perceptrons and different type of activation functions_
## Multi Layer Perceptron
![bg right:55% fit](
<!-- Image credit & reference: Raschka, Sebastian (2018) MLxtend: Providing machine learning and data science utilities and extensions to Python's scientific computing stack.
## MLP == Neural Network!
--- ---
## Neural Network ## Recurrent Neural Networks
<!-- Recurrence -> loops -> temporal & dynamic behavior -->
<!-- internal state as input == kind of 'memory'
-> Works for understanding streams of stuff, e.g. cursive handwriting, or stock market data, or audio -> speech to text, music analysis, etc
![bg fit right](
- See [The Unreasonable Effectiveness of RNNs](
--- ---
<!-- how can RNNS handle long term dependencies?” -->
<!-- Let's learn from Christopher Olah:
co-founders of Anthropic, an AI lab focused on the safety of large models. Previously, I led interpretability research at OpenAI
worked at Google Brain
co-founded Distill, a scientific journal focused on outstanding communication.
- See [Understanding LSTM networks]( by **Christopher Olah**
--- ---
## Deep Learning: # Deep Learning
--- ---
### Layers, Layers, Layers! ### Layers, Layers, Layers!
### Convolutions, Capsules and other tricks
--- ---
### Attention! It's all you need ### Attention! It's all you need
--- ---
![bg right fit](
--- ---
### Language Models ### Language Models
- [BERT: Bidirectional
Encoder Representations from Transformers](
--- ---
### Genetic Algorithms ### Genetic Algorithms
--- ---
...@@ -42,11 +160,26 @@ paginate: true ...@@ -42,11 +160,26 @@ paginate: true
# Pratique : Choisir un Modèle # Pratique : Choisir un Modèle
--- ---
### Selon la data
# Supervisé ou non ?
![bg 93%](*p3zNp9D8YFmX32am.webp)
<!-- Reference et source: -->
### Selon l'objectif
- [Overview of Supervised ML Algorithms](
--- ---
### Selon les ressources
--- ---
### Selon l'usage
### Selon le tooling à disposition
...@@ -15,7 +15,7 @@ paginate: true ...@@ -15,7 +15,7 @@ paginate: true
--- ---
## De manière continue ## De manière continue
--- ---
### Quand la data chanfge ### Quand la data change
--- ---
### Quand le modèle évolue ### Quand le modèle évolue
--- ---
...@@ -69,3 +69,4 @@ PyLint ...@@ -69,3 +69,4 @@ PyLint
Black Black
PyDantic PyDantic
MyPy MyPy
...@@ -8,6 +8,12 @@ paginate: true ...@@ -8,6 +8,12 @@ paginate: true
footer: "ML101 | TP0: Introduction | Paul-Louis Nech | INTECH 2022-2023" footer: "ML101 | TP0: Introduction | Paul-Louis Nech | INTECH 2022-2023"
--- ---
li {
font-size: 0.8em;
# <!-- fit --> TP1: Introduction # <!-- fit --> TP1: Introduction
<!-- ### Définitions & Histoire du ML <!-- ### Définitions & Histoire du ML
### méthodes et outils ; ### méthodes et outils ;
...@@ -42,7 +48,7 @@ Sur l'intranet ou à ...@@ -42,7 +48,7 @@ Sur l'intranet ou à
###### Faites une phrase avec vos propres mots pour définir ce que veut dire: ###### Faites une phrase avec vos propres mots pour définir ce que veut dire:
- "Apprendre" - "Apprendre"
- "Deep Learning" - "Machine Learning"
- "Précision et Rappel" - "Précision et Rappel"
- "Overfit" - "Overfit"
...@@ -87,8 +93,8 @@ Lisez un peu sur cette personne, puis partagez ici quelque-chose qu'elle a dit o ...@@ -87,8 +93,8 @@ Lisez un peu sur cette personne, puis partagez ici quelque-chose qu'elle a dit o
### Lvl 3: Jouer avec des Image Models ### Lvl 3: Jouer avec des Image Models
- Ouvrez "ThisPersonDoesNotExist" et dites en quelques mots votre impression sur la qualité des images générées. - Ouvrez "[ThisPersonDoesNotExist](" et dites en quelques mots votre impression sur la qualité des images générées.
- Ouvrez "ThisXDoesNotExist", choisissez un autre modèle, et commentez sa qualité. - Ouvrez "[ThisXDoesNotExist](", choisissez un autre modèle, et commentez sa qualité.
--- ---
from datasets import load_dataset, DatasetDict, Dataset
from torchvision.transforms import Compose, ColorJitter, ToTensor
import matplotlib.pyplot as plt
import numpy as np
def main():
# Load
dataset = load_dataset("mnist")
# Inspect
# print(dataset)
# dataset["train"][0]['image'].show()
# dataset["test"][0]['image'].show()
# Prepare labels mapping to be able to go from id to label
labels = dataset["train"].features["label"].names
label2id, id2label = {}, {}
for i, label in enumerate(labels):
label2id[label] = str(i)
id2label[i] = label
# Now check e.g. label for image 2:
print(f"Image 2 is labelled {id2label[2]}")
def use_image_multi_class_classification():
from transformers import AutoFeatureExtractor, AutoModelForImageClassification
extractor = AutoFeatureExtractor.from_pretrained("autoevaluate/image-multi-class-classification")
model = AutoModelForImageClassification.from_pretrained("autoevaluate/image-multi-class-classification")
if __name__ == '__main__':
\ No newline at end of file
\ No newline at end of file
marp: true
theme: uncover
color: #eee
colorSecondary: #333
backgroundColor: #111
paginate: true
footer: "ML101 | TP1: Choisir un modèle | Paul-Louis Nech | INTECH 2022-2023"
li {
font-size: 0.8em;
# <!-- fit --> TP1: Choisir un modèle
Théorie : méthodes
Pratique : choisir un modèle
adapté à son problème
Objectifs :
- Acquérir une intuition des différences entre grandes familles de modèles de Machine Learnig
- Savoir choisir choisir un modèle adapté à son problème
Format: Rendu écrit (fichier Markdown ou Doc avec une section par _Level_)
Sur l'intranet ou à
<br />
**DEADLINE : 23 Janvier 23:59:59**
<br />
> _Le cachet de mon mailserver faisant foi_.
## Lvl 0: La base
![bg right:35% w:300](
<!-- Image credit: World of Warcraft Tutorial boar -->
###### Faites une phrase avec vos propres mots pour définir ce que veut dire:
- "Apprentissage Supervisé"
- "Apprentissage Non Supervisé"
- "Layer"
- ""
## Lvl 1: Intro to Neural Nets by Google
- [Google Colab: Exercises - Intro to Neural Nets](
:rocket: simple linear regression model VS Neural network :rocket:
## Lvl 1.1 : baseline
**Terminez les sections jusqu'à "_Build a linear regression model as a baseline_"**
<br />
- Partagez les métriques `loss` et `mean_squared_error` obtenues avec votre baseline de régression linéaire
Evaluate the linear regression model against the test set:
300/300 [==============================] - 1s 2ms/step - loss: 0.4018 - mean_squared_error: 0.4018
[0.40178823471069336, 0.40178823471069336]
## Lvl 1.2 : beat the baseline :metal:
**Terminez les sections jusqu'à "_Call the functions to build and train a deep neural net_"**
<br />
- Partagez les premières métriques `loss` et `mean_squared_error` obtenues avec votre modèle de réseau de neurones
Evaluate the new model against the test set:
3/3 [==============================] - 0s 7ms/step - loss: 0.3705 - mean_squared_error: 0.3705
[0.3705473244190216, 0.3705473244190216]
## Lvl 2 : now beat yourself :smiling_imp:
**Terminez les sections jusqu'à "_Task 2: Optimize the deep neural network's topography_"**
<br />
- Partagez la définition finale de votre réseau de neurones
- Partagez votre :muscle: **meilleur résultat** :muscle: de métriques `loss` et `mean_squared_error` obtenues avec votre modèle de réseau de neurones
- Répondez en quelques mots : qu'est-ce qui affectait la performance de votre réseau de neurones ? Quel impact sur sa vitesse d'apprentissage ?
## Lvl 3 : now beat the real world
Comment faire mieux sur le _test_ set, et pas seulement bien apprendre le _training set_ ?
**Terminez la dernière section "_Task 3: Regularize the deep neural network_"**
<br />
## Lvl 3.1 : high score, real world
- Partagez votre :brain: **meilleur résultat en situation réelle** :brain: de métriques `loss` et `mean_squared_error` obtenues avec votre modèle de réseau de neurones régularisé
## Bonus: Mais alors mon modèle d'avant il vaut quoi ?
- Répondez en quelques mots : en quoi la régularisation est utile ? Qu'en concluez vous sur votre évaluation initiale du modèle (les "meilleures métriques du Lvl 2?)
marp: true
theme: uncover
color: #eee
colorSecondary: #333
backgroundColor: #111
paginate: true
footer: "ML101 | TP1: Choisir un modèle | Paul-Louis Nech | INTECH 2022-2023"
li {
font-size: 0.8em;
# <!-- fit --> TP1: Choisir un modèle
Théorie : méthodes
Pratique : choisir un modèle
adapté à son problème
Objectifs :
- Théorie : outils fondamentaux
- Pratique : entrainer un modèle
Format: Rendu écrit (fichier Markdown ou Doc avec une section par _Level_)
Sur l'intranet ou à
<br />
**DEADLINE : 24 Janvier 23:59:59**
<br />
> _Le cachet de mon mailserver faisant foi_.
## Lvl 0: La base
![bg right:35% w:300](
<!-- Image credit: World of Warcraft Tutorial boar -->
###### Faites une phrase avec vos propres mots pour définir ce que veut dire:
## Lvl 1: Multi-class classification with MNIST
- [Google Colab: Exercises - Multi-Class Classification with MNIST](
:rocket: simple linear regression model VS Neural network :rocket:
from diffusers import DDPMPipeline
def main():
image_pipe = DDPMPipeline.from_pretrained("google/ddpm-celebahq-256")"cuda")
if __name__ == '__main__':
\ No newline at end of file
Markdown is supported
0% or
You are about to add 0 people to the discussion. Proceed with caution.
Finish editing this message first!
Please register or to comment