# L3 Analyse Numérique – TP4

[Dequay A](mailto:antoine.dequay@ens-rennes.fr) &
[Le Barbenchon P](mailto:pierre.le-barbenchon@ens-rennes.fr). TP ENS Rennes

[Boutin B](mailto:benjamin.boutin@univ-rennes1.fr). Cours et TP Université de Rennes 1 - UFR Mathématiques  

Dans ce TP, nous étudierons la méthode des moindres carrés qui permet d'“approcher” une solution de $Ax= b$ lorsque $A$ n'est pas inversible puis nous étudierons les méthodes de gradient.

**IMPORTANT :** L'Exercice 2 est à rendre par mail (à Pierre Le Barbenchon ET Antoine Dequay) avant le dimanche 19 mars à 23h59 en format .ipynb afin que nous puissions exécuter les cellules de votre notebook, vous pouvez nous envoyer tout le TP, nous ne regarderons que l'Exercice 2. Pour les questions dont les réponses ne contiennent pas de code, vous avez le choix entre joindre une photo/un pdf de votre réponse, ou écrire directement en $\LaTeX$ à l'intérieur d'un bloc de texte (tutoriel disponible [ici](https://jupyter-notebook.readthedocs.io/en/latest/examples/Notebook/Working%20With%20Markdown%20Cells.html?highlight=latex#LaTeX-equations) et [ici](https://www.youtube.com/watch?v=_slr5F9dfZ4&list=PLaidQL63zBcKzwKesj3Ef_mSqZnFSDAj8)).


- Exercice 1. Moindres carrés.
- Exercice 2. Minimum d'une fonctionnelle quadratique strictement convexe.

Nous importons avant tout quelques librairies qui seront utiles.

In [1]:
from math import *
import numpy as np
import matplotlib.pyplot as plt

## Exercice 1. Moindres carrés

On souhaite déterminer la linéarisation de l'expression trigonométrique 
$
\cos^5x\,(1+\sin^3x),% = \dfrac{1}{128}\Big(80\cos(x)+40\cos(3x)+8\cos(5x)+6\sin(2x)+2\sin(4x)-2\sin(6x)-\sin(8x)\Big).
$
c'est à dire les coefficients rationnels $(a_j)_{0\leq j\leq d}$ et $(b_j)_{1\leq j \leq d}$ tels que 
$$
\cos^5x\,(1+\sin^3x) = a_0 + \sum_{j=1}^d a_j \cos (jx) + b_j \sin (jx)
$$


### Question 1)

Considérer un entier $N$ suffisamment grand et constituer le vecteur colonne $F$ de taille $N$ comme suit:

```python
X = 2*pi/N*np.arange(N)
F = np.cos(X)**5*(1+np.sin(X)**3)
```

On doit trouver le résultat suivant :
$$
\begin{aligned}
\cos^5(x)(1+\sin^3(x)) &=  \dfrac{1}{128}\Bigl[80\cos(x) + 40\cos(3x) + 8\cos(5x) + 6\sin(2x) + 2\sin(4x) -2\sin(6x) -\sin(8x)\Bigr]
\end{aligned}
$$

### Question 2)

Définir une fonction ```base(d,X)``` prenant en argument un entier ```d``` supérieur ou égal à 1, et un vecteur colonne ```X``` de taille notée $N$, et renvoyant la matrice suivante
$$
\texttt{A} = \begin{pmatrix}
1 & \cos \texttt{X}_1 & \cdots &\cos \texttt{d}\texttt{X}_1 & \sin \texttt{X}_1 & \cdots &\sin \texttt{d}\texttt{X}_1\\
1 & \cos \texttt{X}_2  & \cdots &\cos \texttt{d}\texttt{X}_2 & \sin \texttt{X}_2 & \cdots &\sin \texttt{d}\texttt{X}_2\\
\vdots & \vdots & & \vdots &\vdots & & \vdots  \\
1 & \cos \texttt{X}_\texttt{N} & \cdots &\cos \texttt{d}\texttt{X}_\texttt{N} & \sin \texttt{X}_\texttt{N} & \cdots &\sin \texttt{d}\texttt{X}_\texttt{N}\\
\end{pmatrix}
$$

### Question 3) 

Pour des valeurs de ```d``` de plus en plus grandes, déterminer le vecteur ```C``` de taille ```2d+1```, solution au sens des moindres carrés de l'équation
$
\texttt{A}\, \texttt{C} = \texttt{F}.
$ On utilisera la commande ```np.linalg.lstsq(a,b,rcond=None)[0]``` qui renvoie la solution $x$ de $ax=b$ au sens des moindres carrés.

### Question 4)

On considère désormais une valeur ```d``` pour laquelle la norme du résidu $\|\texttt{A}\, \texttt{C} - \texttt{F}\|$ est jugée suffisamment petite. Déterminer une expression rationnelle des coefficients de la solution retenue ```C``` et la linéarisation recherchée.

### Question 5)

Déterminer numériquement la matrice symétrique définie positive intervenant dans l'équation normale.

### Question 6)

Linéariser également l'expression $(1+\cos^3(2x) + \sin^3(2x))\cos^{10}(x)$.

On doit trouver le résultat suivant :
$$
\begin{aligned}
(1+\cos^3(2x) + \sin^3(2x))\cos^{10}(x) &=  \dfrac{1}{4096}
\Bigl[ 1683 + 2926\cos(2x) + 1936\cos(4x) + 1002\cos(6x) + 428\cos(8 
 x)\\ &+ 158\cos(10x) + 48\cos(12x) + 10\cos(14x) + \cos(16x) + 286\sin(2x) \\ &+ 286\sin(4x) + 78\sin( 
 6x)  -78\sin(8x)  -90\sin(10x)  -42\sin(12x) \\
 & -10\sin(14x)  -\sin(16x)\Bigr]
 \end{aligned}$$

## Exercice 2. Minimum d'une fonctionnelle quadratique strictement convexe


Soit $n$ un entier naturel non-nul et $J:\mathbb R^n \rightarrow \mathbb R$ une fonctionnelle prenant la forme
\begin{equation}
    J(x) = \frac{1}{2} \langle Ax,x\rangle - \langle b,x\rangle,
\end{equation}
où $b\in\mathbb R^n$ et $A\in S_n^{++}(\mathbb R)$. Dans ce cadre, il est connu (cf. cours) que la fonctionnelle $J$ admet un minimum global sur $\mathbb R^n$, atteint en un unique point $x\in\mathbb R^n$ solution de l'équation $\nabla J(x)= 0$ où $\nabla J(x) := Ax-b$.






### Question 1)

On considère pour premier exemple les données suivantes:
$$
b=\begin{pmatrix}0\\0\end{pmatrix},\qquad A=\begin{pmatrix}1 & 0\\0 & \tfrac{1}{20}\end{pmatrix}.
$$

Ecrire une fonction ```gradient_pas_fixe(A,b,x0,rho,itmax,eps)``` qui renvoie les itérés $(x_k)_{k\geq 0}$ obtenus par la <i>méthode du gradient à pas fixe</i>, partant de l'initialisation $x_0={}^t(1,1)\in\mathbb R^2$ en utilisant les deux conditions :
- ```itmax``` le nombre d'itérations maximal.
- ```eps``` epsilon l'erreur maximal qu'on s'autorise à la fin de l'algorithme.

<b>Méthode du gradient à pas fixe</b> $\rho>0$
$$
\begin{cases}
x_0\in\mathbb{R}^n\\
x_{k+1}=x_k-\rho \nabla J(x_k).%,\quad k\geq 0.
\end{cases}
$$

### Question 2)
Représenter les itérations successives dans le plan $\mathbb R^2$ pour ```itmax = 100``` et ```eps = 0.01```. Pour le pas $\rho$, on choisira par exemple successivement les valeurs parmi $\{0.10,1,1.98\}$. Sur une autre figure on tracera également l'évolution du résidu $\|Ax_k-b\|_2$ en fonction de $k$ pour chacun des cas.

### Question 3)

Dans cette question et les suivantes, on se place en dimension $n=20$ avec les données suivantes:
$$
b = \begin{pmatrix}1 \\ 0 \\ \vdots \\ 0\\ 1\end{pmatrix}
,\qquad 
    A = 
    (n+1)^2\begin{pmatrix}
      2 & -1 &  0 & \ldots & 0 \\
      -1 & 2 & -1 &  \ddots & \vdots  \\
      0  & \ddots & \ddots & \ddots & 0 \\
      \vdots & \ddots & -1 & 2 & -1  \\
    0 & \ldots & 0 & -1 & 2
  \end{pmatrix}.
$$
Tester de nouveau la convergence de l'algorithme du <i>gradient à pas fixe</i> en traçant le résidu pour quelques valeurs du pas $\rho$. Vérifier numériquement que la valeur du pas pour laquelle la vitesse de convergence semble maximale est
$$\rho_c = \tfrac{2}{\lambda_{\min} + \lambda_{\max}}, \textrm{ avec }\lambda_{\min}=\min(\mathrm{spec}(A)) \textrm{ et }\lambda_{\max}=\max(\mathrm{spec}(A)).$$




### Question 4)

Retenir le choix $\rho=\rho_c$ et vérifier numériquement que la convergence est alors au plus géométrique, de raison $r \overset{def}{=}\tfrac{\kappa -1}{\kappa + 1}$, où $\kappa$ est le conditionnement de $A$ en norme 2, à savoir ici $\kappa = \mathrm{cond}_2(A)=\lambda_{\max}/\lambda_{\min}$, autrement dit vérifier numériquement que 
$$\|Ax_k-b\| \leqslant C r^k.$$


### Question 5)

<b>Méthode du gradient à pas optimal</b>
$$
\begin{cases}
x_0\in\mathbb{R}^n\\
\rho_k=\mathrm{argmin}_{\rho\in\mathbb R}J(x_k-\rho\nabla J(x_k)),\\%\quad k\geq 0\\
x_{k+1}=x_k-\rho_k\nabla J(x_k).%,\quad k\geq 0.
\end{cases}
$$



Dans la <i>méthode du gradient à pas optimal</i>, démontrer que le pas optimal $\rho_k$, solution d'un problème de minimisation monodimensionnel, est:
$$
\rho_k = \dfrac{\langle R_k,R_k\rangle}{\langle A R_k,R_k\rangle},\quad \textrm{ où } R_k=Ax_k-b.
$$

<i>Réponse à rédiger ici</i>

 ### Question 6) 

Programmer la <i>méthode du gradient à pas optimal</i> pour le problème de la Question <b>3)</b> avec de nouveau les deux conditions d'arrêt.


### Question 7)

Vérifier que l'algorithme converge au plus géométriquement, avec une raison égale à $r \overset{def}{=}\tfrac{\kappa -1}{\kappa + 1}$, autrement dit que
$$\|Ax_k - b\| \leqslant C r^k.$$

### Question 8)

Programmer la <i>méthode du gradient conjugué</i> pour le problème de la Question <b>3)</b> avec de nouveau les deux conditions d'arrêt.

**Méthode du gradient conjugué pour une fonctionnelle quadratique**
$$
\begin{aligned}
\textit{Initialisation :}~~~& x_0\in\mathbb R^n\\% \textit{donn\'e}, $\varepsilon$\textit{ donn\'e}\\
&r_0=b-A\cdot x_0 &\textit{(r\'esidu initial)}\\
&p_0=r_0 &\textit{(direction de descente initiale)}\\
&\theta_0=\langle p_0,r_0\rangle \\
\\
\textit{It\'erations : }k\ge 0~~~
&\alpha_k=\theta_k/\langle A p_k\,,\,p_k\rangle  
&\textit{(pas de descente)}\\ 
&x_{k+1}=x_k+\alpha_k\,p_k 
&\textit{(mise \`a jour de la solution)}\\
&r_{k+1}=r_k-\alpha_k\,A p_k
&\textit{(résidu à l'itération } k+1)\\
%&\textit{Arr\^et des it\'erations} : $\Vert r^{(k+1)}\Vert\le\varepsilon$ ?\\

&\theta_{k+1}=\langle r_{k+1},r_{k+1}\rangle\\
&\beta_{k+1}=\theta_{k+1}/\theta_k\\
&p_{k+1}=r_{k+1}+\beta_{k+1}\,p_k
&\textit{(nouvelle direction de descente)}
\end{aligned}$$


### Question 9) 

Vérifier numériquement que la méthode converge en réalité en au plus $n$ itérations.