corrections

Vincent Timofti · Vincent Timofti · commit 69f39f9facbb · 2014-06-26T18:09:11.000+02:00
diff --git a/rapport/rapport.tex b/rapport/rapport.tex
@@ -53,14 +53,14 @@ \section{Introduction}
 audio pouvant servir d'identifiant unique. Le crit�re d'identifiabilt� est en g�n�ral celui de
 l'oreille humaine, \emph{ie} deux signaux consid�r�s comme identiques � l'�coute doivent avoir une
 empreinte acoustique similaire. Par cons�quent le syst�me de construction d'empreinte doit �tre
-robuste aux petites d�formations qui n'alt�rent pas l'identifiabilit� du signal. D�formation telles
+robuste aux petites d�formations qui n'alt�rent pas l'identifiabilit� du signal. D�formations telles
 que l'ajout de bruit, la r�verb�ration, la distortion\dots
 
 De plus, un syst�me efficace sera aussi robuste aux d�calage temporels, c'est � dire qu'il sera
-capable d'identifier un extrait de signal, m�me si celui si n'est pas align� temporelement avec le
+capable d'identifier un extrait de signal, m�me si celui si n'est pas align� temporellement avec le
 signal utilis� pour l'apprentissage de l'empreinte.
 
-Le syt�me d'identification par empreinte doit aussi �tre rapide et capable d'identifier un extrait
+Le syst�me d'identification par empreinte doit aussi �tre rapide et capable d'identifier un extrait
 parmi un tr�s grand nombre de signaux. Ceci pose deux contraintes majeures pour notre syst�me :
 \begin{itemize}
 	\item La base de donn�e contenant les empreintes ne doit pas �tre de taille trop importante.
@@ -83,23 +83,23 @@ \section{Principe de base}
 \label{sec:principe_base}
 
 \subsection{Recherche du plus proche voisin}
-On d�fini une collection $\chi = \{x_1,x_2,\dots,x_L\}$ de $L$ signaux audios et un requ�te $q$ (un
+On d�fini une collection $\chi = \{x_1,x_2,\dots,x_L\}$ de $L$ signaux audios et une requ�te $q$ (un
 nouvel extrait appartenant ou non � la base). On cherche alors l'�l�ment de $\chi$ le plus proche de
 $q$, c'est � dire son \emph{plus proche voisin}. Le probl�me revient alors � d�terminer une mesure
 de \emph{proximit�} $d(x,y)$ entre deux signaux $x$ et $y$ tel que l'expression suivante donne le
 \emph{plus proche voisin} de $q$ : \[ \argmin_{x \in \chi} d(x,q) \]
 
 Bien entendu, le calcul de la mesure de proximit� doit �tre le moins complexe possible. Impossible
-donc d'effecture $L$ comparaison entre $q$ et les �l�ments de la collection. D'autant plus qu'en
+donc d'effectuer $L$ comparaison entre $q$ et les �l�ments de la collection. D'autant plus qu'en
 pratique $q$ ne sera qu'un extrait du signal audio correspondant.
 
 
 \subsection{Indexation}
 
 \subsubsection{Descripteurs locaux}
 L'id�e derri�re les deux algorithmes que nous pr�sentons ici est d'utiliser des descripteurs locaux
-pour la cr�ation de l'empreinte acoustique d'un signal. Ces descripteurs s�l�ctionnent une partie de
-l'information temporel et fr�quentielle cens� �tre caract�ristique du signal donn�.
+pour la cr�ation de l'empreinte acoustique d'un signal. Ces descripteurs s�lectionnent une partie de
+l'information temporel et fr�quentielle cens�e �tre caract�ristique du signal donn�.
 
 On utilise ainsi ces descripteurs pour les signaux de r�f�rence et la requ�te. La fusion des
 r�sultats de recherche des descripteurs de la requ�te nous permet alors de retrouver le signal ayant
@@ -137,19 +137,19 @@ \subsubsection{Table de hachage}
 \subsection{Recherche}
 \label{sec:recherche_hist}
 
-Pour effecuter une recherche de similarit� pour une requ�t $q$, on va calculer des descripteurs
+Pour effectuer une recherche de similarit� pour une requ�te $q$, on va calculer des descripteurs
 locaux de la m�me mani�re que pour l'apprentissage de la base. Chaque cl� $c_j$ calcul�e fait alors
 l'objet d'une recherche dans la base et renvoie donc les couples $(t_j^l,k_j^l)$ associ�s � cette cl�,
 si celle ci existe. Connaissant le temps d'apparition $t_j$ de la cl�, on peut en d�duire le
-d�calage temporel de cette cl� avec chaque occurence : $\tau_j^l =t_j^l - t_j$. Pour �viter d'�tre
+d�calage temporel de cette cl� avec chaque occurrence : $\tau_j^l =t_j^l - t_j$. Pour �viter d'�tre
 trop pr�cis quant au d�calage, on quantifiera souvent $\tau_j^l$ par une valeur assez importante.
 
 On pourrait alors �tablir le d�compte du nombre de cl� en commun entre la requ�te et chaque signal,
 mais on traiterait alors chaque descripteur local ind�pendamment les uns des autres. Il est donc
 plus int�ressant de prendre en compte le d�calage temporel.
 
 On construit alors les histogrammes $\mathbf{H}_k(\tau) \, : \, \mathbb{Z} \rightarrow \mathbb{N}$
-qui contienent pour chaque indice $k \in [0,\dots,L-1]$ le nombre de cl�s ayant un d�calage $\tau$
+qui contiennent pour chaque indice $k \in [0,\dots,L-1]$ le nombre de cl�s ayant un d�calage $\tau$
 comme montr� en figure~\ref{fig:ex_hist}.
 
 
@@ -182,7 +182,7 @@ \subsection{Spectrogramme}
 
 \subsection{Extraction de pics d'intensit�}
 
-Le spectrogramme est d�coup� selon un quadrillage 10x10. Dans chaque case du quadrillage nous extrayons le point d'intensit� maximale, qui d�finira un pic. Nous avons donc 100 pics d'itensit� par trame de 5 secondes. Un pic est d�fini par sa position (sa fr�quence et l'instant � laquel il appara�t) :
+Le spectrogramme est d�coup� selon un quadrillage 10x10. Dans chaque case du quadrillage nous extrayons le point d'intensit� maximale, qui d�finira un pic. Nous avons donc 100 pics d'intensit� par trame de 5 secondes. Un pic est d�fini par sa position (sa fr�quence et l'instant � laquelle il appara�t) :
 
 \begin{equation}
 	p_i = (f_i, t_i)
@@ -205,10 +205,10 @@ \subsection{Couplage des pics}
 \end{split} 
 \end{equation}
 
-Pour constituer un couple les pics pr�cedents doivent satisfaire 2 conditions :
+Pour constituer un couple les pics pr�c�dents doivent satisfaire 2 conditions :
 \begin{itemize}
 	\item $ t_2 > t_1 $
-	\item la distance euclidi�nne entre les 2 pics doit �tre inf�rieur � un certain seuil d (le nombre de cl� que l'on prendra pour une trame d�pendra de ce seuil)
+	\item la distance euclidienne entre les 2 pics doit �tre inf�rieur � un certain seuil d (le nombre de cl� que l'on prendra pour une trame d�pendra de ce seuil)
 \end{itemize}
 
 Nous obtenons finalement une liste de cl�s pour chaque trame.
@@ -229,15 +229,15 @@ \subsection{Couplage des pics}
 l'information fr�quentielle et temporelle.
 
 \subsection{Formulation math�matiques}
-Soit un espace de Hilbert $\mathcal H$, un dicionnaire d'�l�ments $d_\gamma \in \mathcal H$ et un
+Soit un espace de Hilbert $\mathcal H$, un dictionnaire d'�l�ments $d_\gamma \in \mathcal H$ et un
 �l�ment $x \in \mathcal H$, l'algorithme \bsc{mp} va construire une approximation de $x$ : $\tilde x_n =
 \sum_{i=1}^{n}\alpha_i d_{\gamma^i}$ apr�s $n$ it�rations.
 
 L'algorithme est un algorithme it�ratif en deux �tapes. Initialement on d�fini le \textbf{r�siduel}
 $R^0x = x$, l'ensemble des �l�ments du dictionnaire s�lectionn�s $\Gamma^0 = \emptyset$. Lors de la
 $n^{\text{i�me}}$ it�ration, on proc�de alors comme suivant :
 \begin{itemize}
-	\item S�lection : on s�lectionne un �lement du dictionnaire $d_{\gamma^n}$ selon un crit�re
+	\item S�lection : on s�lectionne un �l�ment du dictionnaire $d_{\gamma^n}$ selon un crit�re
 		de $\mathcal C$.
 	\item Mise � jour : on met � jour l'approximation selon une r�gle $\mathcal A$ et on recalcule
 		le r�siduel.
@@ -255,7 +255,7 @@ \subsection{Couplage des pics}
 
 Pour notre impl�mentation, nous choisissons un dictionnaire redondant constitu� d'une union de
 bases \bsc{mdct} (\emph{Modified Discrete Cosine Transform}). La \bsc{mdct} est une transform�e
-bas�e sur la tranfrom�e en consinys discrete.
+bas�e sur la transform�e en consinus discrete.
 
 Pour un vecteur $x$ de taille $N=PK$ (\emph{ie} $x$ est compos� de $P$ segments de taille $K$). La
 \bsc{mdct} de taille $L = 2K$ s'�crit comme une matrice de transformation $\mathbf{T}$ de taille $N
@@ -284,7 +284,7 @@ \subsection{Couplage des pics}
 \end{align}
 
 Les conditions~\ref{eq:win_1} et~\ref{eq:win_3} assurent la conservation aux bords du signal.
-La fen�tre que nous utilisons pour le mathcalcul de \bsc{mdct} est d�finie par :
+La fen�tre que nous utilisons pour le calcul de \bsc{mdct} est d�finie par :
 \[
 	w[u] = \sin\left[\frac\pi L \left( u + \frac 12 \right)\right]
 \]
@@ -297,7 +297,7 @@ \subsection{Couplage des pics}
 	\caption{Atome d'une union de base \bsc{mdct}}
 	\label{fig:atom}
 \end{figure}
-En utilisant un dicitonnaire d'union de bases \bsc{mdct} avec diff�rentes tailles de f�netres, on
+En utilisant un dictionnaire d'union de bases \bsc{mdct} avec diff�rentes tailles de fen�tres, on
 peut alors utiliser des atomes de tailles diff�rentes pour �tre plus pr�cis dans notre algorithme
 \bsc{mp}.
 
@@ -327,24 +327,24 @@ \subsection{Couplage des pics}
 effectuer de l�g�res modification dans le d�roulement de l'algorithme.
 
 \subsubsection{S�lection}
-� chaque it�ration, il est n�cessaire de calculer la tranform�e \bsc{mdct} du r�siduel lors de
+� chaque it�ration, il est n�cessaire de calculer la transform�e \bsc{mdct} du r�siduel lors de
 l'�tape de s�lection. Ceci peut devenir co�teux en temps de calcul si l'on a un grand nombre
 d'it�rations.
 
-Cependant il n'est pas n�cessaire de calculer la tranform�e pour tout le signal, en effet seul la
+Cependant il n'est pas n�cessaire de calculer la transform�e pour tout le signal, en effet seul la
 partie temporel correspondant � l'atome s�lectionn� est affect�e par la mise � jour. Il n'est donc
-pas n�cessaire de recalculer la transform�e correspondant aux atomes qui ne sont pas correl�s avec
+pas n�cessaire de recalculer la transform�e correspondant aux atomes qui ne sont pas corr�l�s avec
 l'atome s�lectionn�.
 
 On modifie donc la fonction de calcul de \bsc{mdct}, pour ne mettre � jour que la partie du signal
 o� les atomes pourrait �tre affect� par le changement de r�siduel.
 
 
 \subsubsection{Masque}
-L'algorithme \bsc{mp} � tendance � s�lectionner les atomes la o� il y a beacoup d'�nergie, ils sont
+L'algorithme \bsc{mp} � tendance � s�lectionner les atomes la o� il y a beaucoup d'�nergie, ils sont
 donc en g�n�ral proches fr�quentiellement et temporellement.
 
-L'id�e est donc de changement le crit�re de s�lection en utilsant un masque :
+L'id�e est donc de changement le crit�re de s�lection en utilisant un masque :
 \[
 	\mathcal{C_M}(R^nx,\mathcal D) = \argmax_{d_i \in \mathcal D}(|\langle
 	R^nx,d_i \rangle|\mathcal M(d_i|\Gamma^n))
@@ -372,12 +372,12 @@ \subsubsection{Masque}
 \subsection{Construction des cl�s}
 \label{sec:mp_cles}
 
-Dans cette deuxi�me m�thode nous utilsons donc l'algorithme \emph{Matching Pursuit} pour construire
+Dans cette deuxi�me m�thode nous utilisons donc l'algorithme \emph{Matching Pursuit} pour construire
 nos cl�s.  On d�coupe notre signal d'entr�e en trames de 5 secondes, puis on extrait les un nombre
 $n$ d'atomes en utilisant l'algorithme \bsc{mp} avec un dictionnaire compos� de trois tailles
-d'atome diff�rentes (128,1024 et 8192 �chantillons).  On va ensuite apairer chaque atomes avec $p$
+d'atome diff�rentes (128,1024 et 8192 �chantillons).  On va ensuite appairer chaque atomes avec $p$
 de ses plus proches voisins dans le plan temps-fr�quence, en ne consid�rant que ceux
-apparaisant apr�s l'atome choisi. La figure \label{fig:mp_pairs} montre un exemple d'apairage avec
+apparaissant apr�s l'atome choisi. La figure \label{fig:mp_pairs} montre un exemple d'appairage avec
 $p=1$.
 \begin{figure}[htbp]
 	\centering
@@ -404,7 +404,7 @@ \section{Performances}
 Afin de tester les deux m�thodes, nous utilisons un base d'apprentissage de 100 morceaux de quelques
 minutes. Ces morceaux sont ensuite utilis�s pour construire les bases de donn�e pour chaque m�thode.
 Les bases sont construite gr�ce au syst�me de gestion de base de donn�e SQLite. Les cl�s sont
-caclul�es sur 40 bits gr�ce � fonction de hachage \bsc{sha}-1 (on conserve les 40 premiers bits sur
+calcul�es sur 40 bits gr�ce � fonction de hachage \bsc{sha}-1 (on conserve les 40 premiers bits sur
 les 160 donn�s par \bsc{sha}-1.
 
 \subsection{M�thode par spectrogramme}
@@ -449,11 +449,11 @@ \section{Performances}
 \vspace{0.4cm}
 
 \label{sec:base_modif}
-Pour la deuxi�me exp�rimentation la biblioth�que musicale est modifi�e de la fa�on suivante : on ajoute � chaque musique du bruit blanc ($\sigma^2=0.005$), de la r�verberation et un applique un passe-haut (fr�quence de coupure : 500 Hz) de fa�on � obtenir un effet microphone. Ces modifications sont r�alis�es avec l'outil en ligne de commande SoX : 
+Pour la deuxi�me exp�rimentation la biblioth�que musicale est modifi�e de la fa�on suivante : on ajoute � chaque musique du bruit blanc ($\sigma^2=0.005$), de la r�verb�ration et un applique un passe-haut (fr�quence de coupure : 500 Hz) de fa�on � obtenir un effet microphone. Ces modifications sont r�alis�es avec l'outil en ligne de commande SoX : 
 
 \texttt{sox input\_file.wav ouput\_file.wav highpass 500 reverb whitenoise vol 0.005}
 
-Nous effectuons ensuite des tests identifques � la premi�re exp�rimentation mais sur la biblioth�que modifi�e.
+Nous effectuons ensuite des tests identiques � la premi�re exp�rimentation mais sur la biblioth�que modifi�e.
 
 \begin{figure}[htbp]
     \center
@@ -489,7 +489,7 @@ \subsubsection{Bases de test}
 Pour tester l'efficacit� de la m�thode bas�e sur l'algorithme \emph{Matching Pursuit} nous
 construisons 12 bases diff�rentes en suivant le protocole suivant:
 \begin{itemize}
-	\item Les morceaux sont d�coup�s en trames de 5 secondes avec lequels on construit les
+	\item Les morceaux sont d�coup�s en trames de 5 secondes avec lesquels on construit les
 		cl�s comme d�crit en section~\ref{sec:mp_cles}.
 	\item Chaque base extrait un nombre d'atome diff�rent $n$ pour la construction des cl�s.
 	\item Pour chaque atomes on construit au maximum 3 paires diff�rentes, on a donc environ
@@ -576,7 +576,7 @@ \subsubsection{Bases de test}
 \subsubsection{Resistance au bruit}
 
 Les conditions normales d'�coute imposent souvent de nombreuses modifications (bruit,distortions,
-modifications du spectre,r�verberation,\ldots).
+modifications du spectre,r�verb�ration,\ldots).
 Nous nous proposons ici de tester la r�sistance au bruit avec le protocole suivant:
 \begin{itemize}
 	\item On utilise la base construite avec 25 atomes par trame de 5 secondes.
@@ -603,7 +603,7 @@ \subsubsection{Resistance au bruit}
 Comme d�crit dans la section~\ref{sec:base_modif}, nous avons construit une autre base de musique en
 modifiant la base originale. Ces signaux sont cens�s imiter l'impression auditive lorsqu'on �coute
 les morceaux gr�ce � des haut-parleurs de qualit� moyenne. On obtient alors un taux de
-reconnaissance de 72.5\% en utilsant le m�me protocole que pr�c�dement.
+reconnaissance de 72.5\% en utilisant le m�me protocole que pr�c�demment.
 
 \nocite{*}
 \bibliographystyle{plain}

-Original file line number
+Diff line change
 audio pouvant servir d'identifiant unique. Le critère d'identifiabilté est en général celui de
 l'oreille humaine, \emph{ie} deux signaux considérés comme identiques à l'écoute doivent avoir une
 empreinte acoustique similaire. Par conséquent le système de construction d'empreinte doit être
 -robuste aux petites déformations qui n'altèrent pas l'identifiabilité du signal. Déformation telles
 +robuste aux petites déformations qui n'altèrent pas l'identifiabilité du signal. Déformations telles
 que l'ajout de bruit, la réverbération, la distortion\dots
 De plus, un système efficace sera aussi robuste aux décalage temporels, c'est à dire qu'il sera
 -capable d'identifier un extrait de signal, même si celui si n'est pas aligné temporelement avec le
 +capable d'identifier un extrait de signal, même si celui si n'est pas aligné temporellement avec le
 signal utilisé pour l'apprentissage de l'empreinte.
 -Le sytème d'identification par empreinte doit aussi être rapide et capable d'identifier un extrait
 +Le système d'identification par empreinte doit aussi être rapide et capable d'identifier un extrait
 parmi un très grand nombre de signaux. Ceci pose deux contraintes majeures pour notre système :
 \begin{itemize}
 	\item La base de donnée contenant les empreintes ne doit pas être de taille trop importante.
 \label{sec:principe_base}
 \subsection{Recherche du plus proche voisin}
 -On défini une collection $\chi = \{x_1,x_2,\dots,x_L\}$ de $L$ signaux audios et un requête $q$ (un
 +On défini une collection $\chi = \{x_1,x_2,\dots,x_L\}$ de $L$ signaux audios et une requête $q$ (un
 nouvel extrait appartenant ou non à la base). On cherche alors l'élément de $\chi$ le plus proche de
 $q$, c'est à dire son \emph{plus proche voisin}. Le problème revient alors à déterminer une mesure
 de \emph{proximité} $d(x,y)$ entre deux signaux $x$ et $y$ tel que l'expression suivante donne le
 \emph{plus proche voisin} de $q$ : \[ \argmin_{x \in \chi} d(x,q) \]
 Bien entendu, le calcul de la mesure de proximité doit être le moins complexe possible. Impossible
 -donc d'effecture $L$ comparaison entre $q$ et les éléments de la collection. D'autant plus qu'en
 +donc d'effectuer $L$ comparaison entre $q$ et les éléments de la collection. D'autant plus qu'en
 pratique $q$ ne sera qu'un extrait du signal audio correspondant.
 \subsection{Indexation}
 \subsubsection{Descripteurs locaux}
 L'idée derrière les deux algorithmes que nous présentons ici est d'utiliser des descripteurs locaux
 -pour la création de l'empreinte acoustique d'un signal. Ces descripteurs séléctionnent une partie de
 -l'information temporel et fréquentielle censé être caractéristique du signal donné.
 +pour la création de l'empreinte acoustique d'un signal. Ces descripteurs sélectionnent une partie de
 +l'information temporel et fréquentielle censée être caractéristique du signal donné.
 On utilise ainsi ces descripteurs pour les signaux de référence et la requête. La fusion des
 résultats de recherche des descripteurs de la requête nous permet alors de retrouver le signal ayant
 \subsection{Recherche}
 \label{sec:recherche_hist}
 -Pour effecuter une recherche de similarité pour une requêt $q$, on va calculer des descripteurs
 +Pour effectuer une recherche de similarité pour une requête $q$, on va calculer des descripteurs
 locaux de la même manière que pour l'apprentissage de la base. Chaque clé $c_j$ calculée fait alors
 l'objet d'une recherche dans la base et renvoie donc les couples $(t_j^l,k_j^l)$ associés à cette clé,
 si celle ci existe. Connaissant le temps d'apparition $t_j$ de la clé, on peut en déduire le
 -décalage temporel de cette clé avec chaque occurence : $\tau_j^l =t_j^l - t_j$. Pour éviter d'être
 +décalage temporel de cette clé avec chaque occurrence : $\tau_j^l =t_j^l - t_j$. Pour éviter d'être
 trop précis quant au décalage, on quantifiera souvent $\tau_j^l$ par une valeur assez importante.
 On pourrait alors établir le décompte du nombre de clé en commun entre la requête et chaque signal,
 mais on traiterait alors chaque descripteur local indépendamment les uns des autres. Il est donc
 plus intéressant de prendre en compte le décalage temporel.
 On construit alors les histogrammes $\mathbf{H}_k(\tau) \, : \, \mathbb{Z} \rightarrow \mathbb{N}$
 -qui contienent pour chaque indice $k \in [0,\dots,L-1]$ le nombre de clés ayant un décalage $\tau$
 +qui contiennent pour chaque indice $k \in [0,\dots,L-1]$ le nombre de clés ayant un décalage $\tau$
 comme montré en figure~\ref{fig:ex_hist}.
 \subsection{Extraction de pics d'intensité}
 -Le spectrogramme est découpé selon un quadrillage 10x10. Dans chaque case du quadrillage nous extrayons le point d'intensité maximale, qui définira un pic. Nous avons donc 100 pics d'itensité par trame de 5 secondes. Un pic est défini par sa position (sa fréquence et l'instant à laquel il apparaît) :
 +Le spectrogramme est découpé selon un quadrillage 10x10. Dans chaque case du quadrillage nous extrayons le point d'intensité maximale, qui définira un pic. Nous avons donc 100 pics d'intensité par trame de 5 secondes. Un pic est défini par sa position (sa fréquence et l'instant à laquelle il apparaît) :
 \begin{equation}
 	p_i = (f_i, t_i)
 \end{split}
 \end{equation}
 -Pour constituer un couple les pics précedents doivent satisfaire 2 conditions :
 +Pour constituer un couple les pics précédents doivent satisfaire 2 conditions :
 \begin{itemize}
 	\item $ t_2 > t_1 $
 -	\item la distance euclidiènne entre les 2 pics doit être inférieur à un certain seuil d (le nombre de clé que l'on prendra pour une trame dépendra de ce seuil)
 +	\item la distance euclidienne entre les 2 pics doit être inférieur à un certain seuil d (le nombre de clé que l'on prendra pour une trame dépendra de ce seuil)
 \end{itemize}
 Nous obtenons finalement une liste de clés pour chaque trame.
 l'information fréquentielle et temporelle.
 \subsection{Formulation mathématiques}
 -Soit un espace de Hilbert $\mathcal H$, un dicionnaire d'éléments $d_\gamma \in \mathcal H$ et un
 +Soit un espace de Hilbert $\mathcal H$, un dictionnaire d'éléments $d_\gamma \in \mathcal H$ et un
 élément $x \in \mathcal H$, l'algorithme \bsc{mp} va construire une approximation de $x$ : $\tilde x_n =
 \sum_{i=1}^{n}\alpha_i d_{\gamma^i}$ après $n$ itérations.
 L'algorithme est un algorithme itératif en deux étapes. Initialement on défini le \textbf{résiduel}
 $R^0x = x$, l'ensemble des éléments du dictionnaire sélectionnés $\Gamma^0 = \emptyset$. Lors de la
 $n^{\text{ième}}$ itération, on procède alors comme suivant :
 \begin{itemize}
 -	\item Sélection : on sélectionne un élement du dictionnaire $d_{\gamma^n}$ selon un critère
 +	\item Sélection : on sélectionne un élément du dictionnaire $d_{\gamma^n}$ selon un critère
 		de $\mathcal C$.
 	\item Mise à jour : on met à jour l'approximation selon une règle $\mathcal A$ et on recalcule
 		le résiduel.
 Pour notre implémentation, nous choisissons un dictionnaire redondant constitué d'une union de
 bases \bsc{mdct} (\emph{Modified Discrete Cosine Transform}). La \bsc{mdct} est une transformée
 -basée sur la tranfromée en consinys discrete.
 +basée sur la transformée en consinus discrete.
 Pour un vecteur $x$ de taille $N=PK$ (\emph{ie} $x$ est composé de $P$ segments de taille $K$). La
 \bsc{mdct} de taille $L = 2K$ s'écrit comme une matrice de transformation $\mathbf{T}$ de taille $N
 \end{align}
 Les conditions~\ref{eq:win_1} et~\ref{eq:win_3} assurent la conservation aux bords du signal.
 -La fenêtre que nous utilisons pour le mathcalcul de \bsc{mdct} est définie par :
 +La fenêtre que nous utilisons pour le calcul de \bsc{mdct} est définie par :
 \[
 	w[u] = \sin\left[\frac\pi L \left( u + \frac 12 \right)\right]
 \]
 	\caption{Atome d'une union de base \bsc{mdct}}
 	\label{fig:atom}
 \end{figure}
 -En utilisant un dicitonnaire d'union de bases \bsc{mdct} avec différentes tailles de fênetres, on
 +En utilisant un dictionnaire d'union de bases \bsc{mdct} avec différentes tailles de fenêtres, on
 peut alors utiliser des atomes de tailles différentes pour être plus précis dans notre algorithme
 \bsc{mp}.
 effectuer de légères modification dans le déroulement de l'algorithme.
 \subsubsection{Sélection}
 -À chaque itération, il est nécessaire de calculer la tranformée \bsc{mdct} du résiduel lors de
 +À chaque itération, il est nécessaire de calculer la transformée \bsc{mdct} du résiduel lors de
 l'étape de sélection. Ceci peut devenir coûteux en temps de calcul si l'on a un grand nombre
 d'itérations.
 -Cependant il n'est pas nécessaire de calculer la tranformée pour tout le signal, en effet seul la
 +Cependant il n'est pas nécessaire de calculer la transformée pour tout le signal, en effet seul la
 partie temporel correspondant à l'atome sélectionné est affectée par la mise à jour. Il n'est donc
 -pas nécessaire de recalculer la transformée correspondant aux atomes qui ne sont pas correlés avec
 +pas nécessaire de recalculer la transformée correspondant aux atomes qui ne sont pas corrélés avec
 l'atome sélectionné.
 On modifie donc la fonction de calcul de \bsc{mdct}, pour ne mettre à jour que la partie du signal
 où les atomes pourrait être affecté par le changement de résiduel.
 \subsubsection{Masque}
 -L'algorithme \bsc{mp} à tendance à sélectionner les atomes la où il y a beacoup d'énergie, ils sont
 +L'algorithme \bsc{mp} à tendance à sélectionner les atomes la où il y a beaucoup d'énergie, ils sont
 donc en général proches fréquentiellement et temporellement.
 -L'idée est donc de changement le critère de sélection en utilsant un masque :
 +L'idée est donc de changement le critère de sélection en utilisant un masque :
 \[
 	\mathcal{C_M}(R^nx,\mathcal D) = \argmax_{d_i \in \mathcal D}(|\langle
 	R^nx,d_i \rangle|\mathcal M(d_i|\Gamma^n))
 \subsection{Construction des clés}
 \label{sec:mp_cles}
 -Dans cette deuxième méthode nous utilsons donc l'algorithme \emph{Matching Pursuit} pour construire
 +Dans cette deuxième méthode nous utilisons donc l'algorithme \emph{Matching Pursuit} pour construire
 nos clés.  On découpe notre signal d'entrée en trames de 5 secondes, puis on extrait les un nombre
 $n$ d'atomes en utilisant l'algorithme \bsc{mp} avec un dictionnaire composé de trois tailles
 -d'atome différentes (128,1024 et 8192 échantillons).  On va ensuite apairer chaque atomes avec $p$
 +d'atome différentes (128,1024 et 8192 échantillons).  On va ensuite appairer chaque atomes avec $p$
 de ses plus proches voisins dans le plan temps-fréquence, en ne considérant que ceux
 -apparaisant après l'atome choisi. La figure \label{fig:mp_pairs} montre un exemple d'apairage avec
 +apparaissant après l'atome choisi. La figure \label{fig:mp_pairs} montre un exemple d'appairage avec
 $p=1$.
 \begin{figure}[htbp]
 	\centering
 Afin de tester les deux méthodes, nous utilisons un base d'apprentissage de 100 morceaux de quelques
 minutes. Ces morceaux sont ensuite utilisés pour construire les bases de donnée pour chaque méthode.
 Les bases sont construite grâce au système de gestion de base de donnée SQLite. Les clés sont
 -caclulées sur 40 bits grâce à fonction de hachage \bsc{sha}-1 (on conserve les 40 premiers bits sur
 +calculées sur 40 bits grâce à fonction de hachage \bsc{sha}-1 (on conserve les 40 premiers bits sur
 les 160 donnés par \bsc{sha}-1.
 \subsection{Méthode par spectrogramme}
 \vspace{0.4cm}
 \label{sec:base_modif}
 -Pour la deuxième expérimentation la bibliothèque musicale est modifiée de la façon suivante : on ajoute à chaque musique du bruit blanc ($\sigma^2=0.005$), de la réverberation et un applique un passe-haut (fréquence de coupure : 500 Hz) de façon à obtenir un effet microphone. Ces modifications sont réalisées avec l'outil en ligne de commande SoX :
 +Pour la deuxième expérimentation la bibliothèque musicale est modifiée de la façon suivante : on ajoute à chaque musique du bruit blanc ($\sigma^2=0.005$), de la réverbération et un applique un passe-haut (fréquence de coupure : 500 Hz) de façon à obtenir un effet microphone. Ces modifications sont réalisées avec l'outil en ligne de commande SoX :
 \texttt{sox input\_file.wav ouput\_file.wav highpass 500 reverb whitenoise vol 0.005}
 -Nous effectuons ensuite des tests identifques à la première expérimentation mais sur la bibliothèque modifiée.
 +Nous effectuons ensuite des tests identiques à la première expérimentation mais sur la bibliothèque modifiée.
 \begin{figure}[htbp]
     \center
 Pour tester l'efficacité de la méthode basée sur l'algorithme \emph{Matching Pursuit} nous
 construisons 12 bases différentes en suivant le protocole suivant:
 \begin{itemize}
 -	\item Les morceaux sont découpés en trames de 5 secondes avec lequels on construit les
 +	\item Les morceaux sont découpés en trames de 5 secondes avec lesquels on construit les
 		clés comme décrit en section~\ref{sec:mp_cles}.
 	\item Chaque base extrait un nombre d'atome différent $n$ pour la construction des clés.
 	\item Pour chaque atomes on construit au maximum 3 paires différentes, on a donc environ
 \subsubsection{Resistance au bruit}
 Les conditions normales d'écoute imposent souvent de nombreuses modifications (bruit,distortions,
 -modifications du spectre,réverberation,\ldots).
 +modifications du spectre,réverbération,\ldots).
 Nous nous proposons ici de tester la résistance au bruit avec le protocole suivant:
 \begin{itemize}
 	\item On utilise la base construite avec 25 atomes par trame de 5 secondes.
 Comme décrit dans la section~\ref{sec:base_modif}, nous avons construit une autre base de musique en
 modifiant la base originale. Ces signaux sont censés imiter l'impression auditive lorsqu'on écoute
 les morceaux grâce à des haut-parleurs de qualité moyenne. On obtient alors un taux de
 -reconnaissance de 72.5\% en utilsant le même protocole que précédement.
 +reconnaissance de 72.5\% en utilisant le même protocole que précédemment.
 \nocite{*}
 \bibliographystyle{plain}