\documentclass[XUPS,XML,SOM,Unicode,francais,NoFloatCountersInSection,ThmDefs]{cedram}
\OneNumberAllTheorems
\setcounter{tocdepth}{2}
%\XUPScorrections
\usepackage{xups12-02}

\begin{document}
\frontmatter

\title[L'hypothèse de Riemann sur un corps fini]{La preuve par André Weil de~l'hypothèse de Riemann pour~une~courbe sur un corps fini}

\author[\initial{M.} \lastname{Hindry}]{\firstname{Marc} \lastname{Hindry}}
\address{Institut mathématique de Mathématiques de Jussieu,
Université Denis Diderot Paris~7,
Case Postale 7012,
2, place Jussieu,
75251 Paris Cedex 05}
\email{hindry@math.jussieu.fr}

\thanks{Journées X-UPS 2012. Henri Cartan \& André Weil, mathématiciens du \textsc{xx}\textsuperscript{e} siècle. Éditions de l'École polytechnique, 2012}

\begin{abstract}
André Weil a rédigé la preuve mentionnée dans le titre, en 1940, lorsqu'il était enfermé dans la prison de Rouen, attendant d'être jugé pour désertion. L'aspect dramatique des circonstances et les controverses avec Hasse autour de la preuve ne doivent pas cacher qu'il s'agit d'un des théorèmes majeurs du \textsc{xx}\textsuperscript{e} siècle, ayant ses origines dans l'étude de la fonction zêta de Riemann et les analogies entre arithmétique et géométrie (corps de nombres et corps de fonctions), ayant profondément modifié le développement notamment de la géométrie algébrique. Nous tentons d'expliquer l'énoncé, qui admet des applications très concrètes, la beauté du résultat, en abordant ses origines, sa descendance et bien sûr les grandes lignes de la démonstration.
\end{abstract}
\maketitle

\tableofcontents

\newpage
\mainmatter

La démonstration par André Weil, dans les années quarante, de l'hypothèse de Riemann pour une courbe sur un corps fini est un moment mathématique assez
extraordinaire pour de multiples raisons: le contexte dramatique durant lequel ce travail a été produit et \hbox{rédigé} par Weil, la polémique avec le mathématicien Helmut Hasse qui a suivi, l'histoire des développements qui l'ont précédé avec notamment les contributions de E.\,Artin, H.\,Hasse, F.\,K.\,Schmidt et bien sûr B.\,Riemann, et enfin les prodigieux développements qui l'ont suivi, d'une part dans le cadre des mathématiques appliquées (théorie des codes correcteurs linéaires) et d'autre part dans le c{\oe}ur des mathématiques pures avec les fameuses \og conjectures de Weil\fg , qui ont guidé et stimulé le développement spectaculaire de la géométrie algé\-bri\-que durant les décennies suivantes, culminant avec leur preuve par Grothendieck et Deligne.

\subsubsection*{Le contexte}
En 1940, nous sommes en pleine seconde guerre mondiale et André Weil, à la suite de péripéties qu'il narre dans ses \og souvenirs d'apprentissage\fg\cite{w5}, est enfermé pour insoumission dans la prison \og Bonne Nouvelle\fg à Rouen. Il y séjournera quelques mois, y travaille intensément ses mathématiques, correspond avec Henri Cartan \cite{au}, sa s{\oe}ur Simone Weil \cite{w1} et... démontre la fameuse \og\emph{hypothèse de Riemann pour une courbe sur un corps fini}\fg, travail qu'il résume dans une note \cite{w2} de trois pages aux Comptes rendus de l'Académie, présentée, \textit{via} Élie~\hbox{Cartan}, lors de la séance du 22 avril 1940. Le résumé glisse sous le tapis un énoncé (\og\emph{Voici un lemme important}\fg) dont il ne fournit pas la preuve. \hbox{Libéré} de prison et ayant réussi à rallier les États-Unis, \hbox{André Weil} publie une deuxième note \cite{w3} aux Proceedings of the National Academy of Sciences où il simplifie sa preuve... mais toujours en laissant un point capital sans élément de preuve (\og\emph{as in Severi}\fg). La note américaine se termine par l'annonce \og\emph{A detailed account of this theory} [...] \emph{and of the ``transcendental'' theory as outlined in my previous note is being prepared for publication.}\fg En fait Weil publiera
en 1946 \og \emph{\hbox{Foundations} of Algebraic Geometry}\fg et en 1948 deux livres sur les courbes algébriques et les variétés abéliennes qui complètent ce programme, ce qui est ainsi résumé par Jean-Pierre
Serre \og \emph{Après huit années, et plus de 500 pages, sa Note de 1940 est enfin justifiée} !\fg\cite{sew}.

\subsubsection*{La polémique}
Hasse, qui avait réussi quelques années auparavant à démontrer la dite hypothèse de Riemann \cite{h1,h2} pour les courbes de genre $1$, a été outré de l'attitude de Weil. Ce dernier a d'ailleurs explicitement décrit ses motivations et la rivalité avec Hasse dans une lettre à Henri Cartan, datée du 8 avril 1940 \cite{au} \og\emph{J'ai expédié la note sans avoir démontré le lemme fondamental; mais j'y vois assez clair sur ces questions à présent pour en prendre le risque. Jamais je n'ai rien écrit, et je n'ai presque jamais rien vu, qui atteigne un aussi haut degré de concentration que cette note. Hasse n'a plus qu'à se pendre, car j'y résous (sous réserve de mon lemme) \emph{tous} les principaux problèmes de la théorie: 1) hypothèse de Riemann pour les fonctions $\zeta$ de ces corps (démontrée par Hasse pour le genre~$1$) 2)~les séries $L$ d'Artin relatives aux caractères des extensions algébriques de ces corps sont des polynômes, dont je détermine le degré}\fg. Il s'en est suivi un échange indirect d'amabilités dont je citerai deux extraits:
\og\emph{Avez-vous une idée d'un ``profiteur de guerre spirituel''? il me semble que notre ``ami'' André Weil soit un tel . [...] C'est ce que j'appelle une manière typiquement juive!}\fg (Lettre de Hasse à Gaston Julia, 14 septembre 1941)
et, de nombreuses années plus tard, dans les commentaires de ses {\oe}uvres, Weil écrit \og\emph{Faut-il en conclure que l'esprit de ceux-ci [des algébristes allemands] avait été quelque peu grisé par les succès de leurs généraux?}\fg

\subsubsection*{La genèse}
Les analogies entre corps de nombres (le~corps $\Q$ et ses extensions finies) et les corps de fonctions sur un corps fini (le~corps~$\F_p(X)$ et ses extensions finies) ou encore entre arithmétique et géométrie ont exercé une fascination sur de nombreux mathématiciens, le premier étant peut-être Kronecker. Weil lui-même était presque obsédé par cette idée, lui adjoignant en plus un lien avec la topologie riemannienne, il parlait de \og texte trilingue\fg \cite{w1}. L'article de Riemann \cite{r} sur la répartition des nombres premiers est son unique texte traitant de théorie des nombres, il y développe les propriétés de la fonction zêta $\zeta(s)=\sum_{n\geq 1}n^{-s}$ et démontre le théorème des nombres premiers en admettant au passage plusieurs résultats dont ce qui est aujourd'hui appelé l'hypothèse de Riemann. Emil Artin a introduit l'analogue des fonctions zêta pour les corps de fonctions sur $\F_q$ et la théorie a été développée par l'école allemande, notamment Deuring, Hasse et Schmidt \cite{sc,h1,h2}, établissant la rationalité (analogue du prolongement analytique), l'équation fonctionnelle et, pour les courbes de genre $1$, l'hypothèse de Riemann. L'avancée capitale et par bien des aspects l'idée centrale, féconde et novatrice de Weil est de sortir le problème du cadre algébrique et de le placer dans un contexte géométrique.

\subsubsection*{Les développements ultérieurs}
En 1949 André Weil publie un article \cite{w4} sur le nombre de points d'une variété algébrique sur un corps fini. Cette article propose une série de conjectures qui généralisent aux variétés de dimensions quelconques les propriétés de la fonction zêta d'une courbe. Cet article visionnaire va, pendant trois décennies, catalyser et susciter la plupart des développements de la géométrie algébrique abstraite, développements pilotés par Grothendieck et complétés plus tard par Deligne: schémas, faisceaux, cycles algébriques et théorie de l'intersection, cohomologie étale, etc.

\smallskip

L'hypothèse de Riemann sur les corps finis s'avèrera également impor\-tante pour des questions de télécommunications et théorie de l'infor\-mation à travers les \og codes de Goppa\fg \cite{gop} où la borne dite de Hasse-Weil joue un rôle important. Il s'agit de construire expli\-ci\-tement des bons codes (linéaires) correcteurs d'erreurs; la décou\-verte de Goppa est que certains systèmes linéaires sur les courbes sur un corps fini fournissent de tels codes. Un des paramètres importants est le nombre de points rationnels de la courbe, qui doit être aussi grand que possible, c'est-à-dire en pratique approchant autant que possible la borne supérieure fournie par le théorème dit de Hasse-Weil !

\smallskip

Nous commençons bien sûr par expliquer dans le paragraphe suivant l'énoncé de l'hypothèse de Riemann et la définition de la fonction zêta d'une courbe, donnons ensuite des exemples avant de \hbox{décrire} brièvement les conjectures de Weil et allusivement quelques applications. Les trois paragraphes suivants présentent les \hbox{mathématiques} impliquées: d'abord le théorème de Riemann-Roch (hélas sans preuve) qui permet de montrer rationalité et équation fonctionnelle de la fonction zêta d'une courbe, puis la preuve de Weil de l'hypothèse de Riemann et enfin une preuve peut-être moins éclairante mais plus élémentaire découverte trente ans plus tard par Stepanov.

\smallskip

Nous avons repoussé en appendice quelques définitions, notions et exemples concernant corps finis, courbes algébriques et diviseurs sur celles-ci, en estimant que nombre des lecteurs seraient déjà familiers avec ces objets mais que quelques rappels pourrait être utiles à d'autres. Les notions de géométrie algébrique abordées ou évoquées peuvent toutes être étudiées par exemple dans \cite{har} et le monde plus élémentaire des courbes algébriques dans \cite{gold}. Enfin nous avons tenté d'émailler le texte d'exemples, l'hypothèse de Riemann sur les corps finis étant un énoncé très concret se prêtant bien aux illustrations et expérimentations élémentaires.

\section{Corps de fonctions, courbes algébriques et fonctions zêta}

La formulation la plus simple de l'hypothèse de Riemann pour les courbes sur un corps fini est la suivante:

\begin{theoreme}
Soit $f(x,y)$ un polynôme irréductible à coefficient entiers. Pour chaque nombre premier $p$, notons $N_p(f)$ le nombre de solutions des congruences
$f(x,y)\equiv 0\bmod p$. Il existe un entier $A$ ne dépendant que de $f$ tel que
\begin{equation*}
\left|N_p(f)-p\right|\leq A\,\sqrt{p}.
\end{equation*}
\end{theoreme}

Notons que cet énoncé implique en particulier que pour $p$ assez grand (ici $p>A^2$ suffit) on aura une solution $f(x,y)\equiv 0\bmod p$. Le véritable énoncé précis demande un peu plus de vocabulaire; on pourra trouver en appendice une description des notions assez intuitives de \og courbe algébrique\fg ainsi que celle de ses qualités éventuelles \og lisse\fg ou \og projective\fg et une brève présentation de la théorie des \og diviseurs\fg sur une courbe algébrique.

\begin{theoreme}[Hypothèse de Riemann pour les courbes sur les corps finis]\label{hrbis}
Soit $C$ une courbe algébrique lisse et projective, définie sur un corps fini $\F_q$. Il existe un entier $g\geq 0$ appelé le \emph{genre} de $C$ et des entiers algébriques $\alpha_1,\dots,\alpha_{2g}$ de module $|\alpha_i|=\sqrt{q}$ tels que\Addedok{, pour tout entier $m\geq1$,}
\begin{equation*}
\# C(\F_{q^m})=q^m+1-\left(\alpha^m_1+\dots+\alpha^m_{2g}\right).
\end{equation*}
En particulier, on a l'inégalité
\begin{equation*}
\left|\# C(\F_{q^m})-q^m-1\right| \leq 2gq^{m/2}.
\end{equation*}
\end{theoreme}

L'énoncé dit d'une certaine façon que le nombre de points rationnels d'une courbe algébrique sur $\F_q$ est proche du nombre de points de la droite projective sur $\F_q$, c'est-à-dire $q+1$.
Le lien avec l'énoncé précédent est le suivant: toute courbe algébrique, comme par exemple la courbe définie par $f(x,y)=0$, est comparable à une courbe lisse et projective et la différence entre leurs nombres de points rationnels est bornée par une constante ne dépendant que de la géométrie. Il nous reste à expliquer pourquoi cet énoncé s'appelle \og hypothèse de Riemann\fg.

\smallskip

La fonction zêta de Riemann est définie dans le demi-plan $\Re s>1$ par une série de Dirichlet ou un produit eulérien
$$\zeta(s):=\sum_{n=1}^{\infty}n^{-s}=\prod_p(1-p^{-s})^{-1}.$$
L'égalité entre la série et le produit (où $p$ parcourt l'ensemble des nombres premiers) est une version analytique de l'unicité de la décomposition en facteurs premiers.

Pour énoncer le théorème suivant on utilise la fonction $\Gamma(s)$ d'Euler, qui est définie pour $\Re(s)>0$ par l'intégrale
\[
\Gamma(s):=\int_0^{\infty}e^{-t}t^{s-1}dt
\]
et prolongée au plan complexe via l'identité
$\Gamma(s+1)=s\Gamma(s)$.

\begin{theoreme}[Riemann]
Les principales propriétés de la fonction~$\zeta(s)$ (dont la dernière est conjecturale) sont:

\begin{enumerate}
\item (Prolongement analytique) La fonction $\zeta(s)$ se prolonge en une fonction méromorphe sur le plan complexe ayant un unique pôle simple en $s=1$, de résidu égal à $1$.
\item (Équation fonctionnelle) Introduisons la fonction zêta \og complétée\fg: $\xi(s):=\pi^{-s/2}\Gamma(s/2)\zeta(s)$, elle vérifie l'équation fonctionnelle:
\begin{equation*}
\xi(1-s)=\xi(s).
\end{equation*}
\item (Hypothèse de Riemann) Les zéros de $\xi(s)$ sont situés sur la droite $\Re(s)=\sfrac{1}{2}$.
\end{enumerate}
\end{theoreme}

Notons que la fonction $\zeta(s)$ ne s'annule pas dans le demi-plan de convergence du produit eulérien $\Re s>1$ et, au vu de l'équation fonctionnelle et des pôles de la fonction $\Gamma(s)$, possède comme uniques zéros dans le demi-plan $\Re s<0$ des zéros simples en $-2n$ (pour $n\geq 1$ entier). Les zéros situés dans la bande critique $0\leq \Re s\leq 1$ sont les mêmes que ceux de $\xi(s)$ et sont situés symétriquement par rapport à la droite critique $\Re s=\sfrac{1}{2}$. Rappelons que l'hypothèse de Riemann est considérée comme l'un des problèmes ouverts majeurs en mathématiques. Le succès de la fonction zêta de Riemann, notamment dans l'étude de la répartition des nombres premiers (voir à ce sujet \cite{bost}) a stimulé les mathématiciens pour introduire d'autres fonctions zêta dans d'autres contextes.

\smallskip

L'analogue pour une courbe $C$ définie sur $\F_q$ s'écrit en introduisant l'ensemble des points \textit{fermés} $|C|$, c'est-à-dire les classes de conjugaison sous le groupe de Galois des points de $C(\bar{\F}_q)$. Pour un point fermé $x\in|C|$, son corps résiduel $\kappa(x)$ est le corps engendré par les coordonnées d'un de ses représentants et on note $N(x):=\#\kappa(x)$. On pose alors
\begin{equation*}
\zeta_C(s)=\prod_{x\in|C|}(1-N(x)^{-s})^{-1}.
\end{equation*}

On montre (c'est un calcul essentiellement formel donné ci-dessous) que
\begin{equation*}
\zeta_C(s)=Z(C,q^{-s}),
\end{equation*}
où la série formelle $Z(C,T)$ peut être décrite par
\begin{align*}
Z(C/\F_q,T)&=\prod_{D}(1-T^{\deg D})^{-1}\\
&=\exp\bigg(\sum_{m=1}^{\infty}\frac{\# C(\F_{q^m})}{m}T^m\bigg)=\sum_{n=0}^{\infty}A_nT^n,
\end{align*}
où $D$ parcourt l'ensemble des diviseurs effectifs irréductibles sur $\F_q$ et~$A_n$ désigne le nombres de diviseurs effectifs de degré $n$ définis sur~$\F_q$.

Pour vérifier ces formules, introduisons les notations suivantes: $N_m:=\# C(\F_{q^m})$ et $\Phi_m$ désigne le nombre de diviseurs définis sur $\F_q$, irréductibles de degré $m$. On a alors
$$Z(C,T)=\prod_{m=1}^{\infty}(1-T^m)^{-\Phi_m}.$$
En écrivant une partition de l'ensemble $C(\F_{q^m})$ suivant le degré du corps engendré sur $\F_q$ par un point et en remarquant que ce degré doit diviser $m$, on obtient la formule
\begin{equation*}
N_m=\sum_{n\,|\,m}n\Phi_n.
\end{equation*}
On en déduit la deuxième expression de $Z(C,T)$:
\begin{align*}
\log Z(C,T)&=\sum_{n=1}^{\infty}\Phi_n\bigg(\sum_{h=1}^{\infty}\frac{T^{nh}}{h}\bigg)\\
&=\sum_{m=1}^{\infty}\bigg(\sum_{n\,|\,m}n\Phi_n\bigg)\frac{T^m}{m}=\sum_{m=1}^{\infty}\frac{N_m}{m}T^m
\end{align*}
Ensuite, si l'on développe le produit on obtient la dernière formule:
\begin{align*}
\prod_{D}(1-T^{\deg D})^{-1}&=\prod_{D}\bigg(\sum_{m=0}^{\infty}T^{m\deg D}\bigg)\\
&=\sum_{n=0}^{\infty}\bigg(\sum_{m_1\deg D_1+\dots+m_r\deg D_r=n}1\bigg)T^n=\sum_{n=1}^{\infty}A_nT^n.
\end{align*}

\begin{exemples}
Dans le cas $C=\P^1$ on vérifie aisément que
\[
\#\P^1(\F_{q^m})=\frac{q^{2m}-1}{q^m-1}=q^m+1
\]
et donc:
$$Z(\P^1/\F_q,T)=\exp\bigg(\sum_{m=1}^{\infty}(q^m+1)\frac{T^m}{m}\bigg)=\frac{1}{(1-T)(1-qT)}.$$
On utilise pour cela la formule élémentaire
$$\exp\bigg(\sum_{m=1}^{\infty} \frac{T^m}{m} \bigg)=\frac{1}{1-T}.$$
Dans le cas d'une courbe elliptique (c'est-à-dire quand $g(C)=1$), Hasse a montré que la fonction zêta prend la forme
$$Z(C/\F_q,T)=\frac{1-aT+qT^2}{(1-T)(1-qT)},$$
où $a$ est un entier vérifiant $|a|\leq 2\sqrt{q}$. Plus précisément $1-aT+qT^2=(1-\alpha T)(1-\bar{\alpha}T)$ avec $|\alpha|=\sqrt{q}$. La contribution de Weil est la démonstration de l'analogue de ces énoncés pour une courbe de genre $g\geq 2$.

Observons que, si $g=1$, on a
\[
\# C(\F_q)\geq q+1-2\,\sqrt{q}=(\sqrt{q}-1)^2>0,
\]
donc une courbe de genre $0$ ou $1$ possède toujours un point $\F_q$\nobreakdash-ration\-nel.

Cependant l'existence d'un diviseur de degré $1$ n'implique pas l'existence d'un point rationnel de degré $1$ lorsque $g\geq 2$. L'inégalité de Weil
\[
\# C(\F_q)\geq q+1-2g\sqrt{q}
\]
garantit l'existence d'un point $\F_q$\nobreakdash-ration\-nel si $q$ est assez grand, par exemple si $q\geq 4g^2-1$. Donnons des exemples
de courbes de genre~$2$ ne possédant aucun point $\F_q$\nobreakdash-ration\-nel. Quand la caractéristique~$p$ n'est pas égale à~$2$, on peut choisir une courbe définie par l'équation affine $y^2=f(x)=f_6x^6+\dots+f_0$. La courbe possède deux points à l'infini; ils sont $\F_q$\nobreakdash-ration\-nels si et seulement si $f_6$ est un carré. Soit~$a$ un non carré et soit
\[
f(x)=a(x^6+\dots+xa_1)+a=ag(x)+a,
\]
où $g$ est tel que pour tout $x\in\F_q$ on ait $g(x)=0$ (loisible pour $q=3$ ou $5$). Alors la courbe $y^2=f(x)$ n'a aucun point rationnel.

Pour $q=7$, considérons\enlargethispage{-2\baselineskip}%
\[
y^2=3(1-(x^2-1)(x^2-2)(x^2-4))=f(x).
\]
Puisque $f(x)=3\notin\F_7^{*2}$ \Addedok{(ensemble des carrés dans le groupe multi\-plicatif du corps $\F_7$)} pour $x\neq0$ et $f(0)=6\notin\F_7^{*2}$, on voit que $C(\F_7)=\emptyset$.

On peut construire un exemple similaire pour $q=9$ en choisissant $f(x)$ unitaire de degré 6 tel que $f(x)\in\F_9^{*2}$ pour $x\in\F_9$, et on considère alors la courbe d'équation $ay^2=f(x)$ avec $a$ non carré. Choisissons $\alpha$ tel que $\alpha^2=-1\in\F_3$. On a alors $\F_9=\left\{ 0,\pm 1,\pm \alpha,\pm\alpha\pm 1 \right\}$ et $\F_9^{*2}=\left\{ \pm 1,\pm \alpha \right\}$, et si on choisit $f(x)=x^6-x^4+x^2+1$ on~a $f(\pm 1)=\nobreak-1$, $f(\pm\alpha)=1$ et $f(\pm\alpha\pm 1)=-1$, donc la courbe $y^2=(\alpha+1)f(x)$ n'a aucun point rationnel sur $\F_9$.

Dans le cas de caractéristique $2$, il faut procéder un peu différemment. Considérons la courbe affine $f_4(x,y)+f_3(x,y)+f_2(x,y)=0$ avec $f_i$ homogène de degré $i$; le point $P_0=(0,0) $ est singulier double ordinaire et les deux tangentes ne sont rationnelles que si $f_2(x,y)$ se factorise sur $\F_q$; les points à l'infini sont donnés par $Z=0$, $f_4(X,Y)=0$ avec $(X,Y)\neq (0,0)$). Si $P_0$ est le seul point singulier, alors $g=2$. Par exemple
$$X^4+YX^3+Y^4+Z(X^3+YX^2+Y^3)+Z^2(X^2+XY+Y^2)=0,$$
correspond à une courbe de genre $2$ avec $C(\F_2)=\emptyset$.
\end{exemples}

\begin{remarque}
Pour illustrer la différence entre l'existence d'un point $\F_q$\nobreakdash-ration\-nel, garantie seulement si $q$ est assez grand par rapport à~$g$, et l'existence d'un diviseur de degré $1$ défini sur $\F_q$, considérons la courbe de genre $2$ sur $\F_3$ d'équation affine $y^2=-(x^3-x)^2-1$. Cette courbe n'a aucun point rationnel sur $\F_3$; néanmoins, si $\alpha_1$, $\alpha_2$ désignent les racines de $y^2=-1$, le diviseur $D_1:=(0,\alpha_1)+(0,\alpha_2)$ est défini sur $\F_3$ tandis que, si $\beta_1$, $\beta_2$, $\beta_3$ désignent les racines de $x^3-x=-1$, le diviseur $D_2:=(\beta_1,1)+(\beta_2,1)+(\beta_3,1)$ est défini sur~$\F_3$. Ainsi $D:=D_2-D_1$ est un diviseur de degré $1$ défini sur $\F_3$.
\end{remarque}

On peut reformuler l'hypothèse de Riemann en terme de la fonction $Z(C/\F_q,T)$ ainsi:

\begin{theoreme}[Hypothèse de Riemann pour les courbes sur les corps finis]\label{hrter}\nopagebreak
Soit $C$ une courbe algébrique lisse et projective, définie sur un corps fini $\F_q$. Il existe un entier $g\geq 0$ appelé le \emph{genre} de $C$ et des entiers algébriques $\alpha_1,\dots,\alpha_{2g}$ de module $|\alpha_i|=\sqrt{q}$ tels que
\begin{equation*}
Z(C/\F_q,T)=\frac{(1-\alpha_1T)\dots(1-\alpha_{2g}T)}{(1-T)(1-qT)}.
\end{equation*}
De plus la fonction zêta vérifie l'équation fonctionnelle:
\begin{equation}\label{eqfz}
Z(C/\F_q,T)=q^{g-1}\,T^{2g-2}\,Z\Big(C/\F_q,\frac{1}{qT} \Big).
\end{equation}
\end{theoreme}

Si l'on revient à la définition initiale de la fonction $\zeta_C(s)$, on voit que l'énoncé donne un prolongement méromorphe au plan complexe (avec des pôles simples en $s=2i\pi/\log q$ et $s=1+2i\pi/\log q$, une équation fonctionnelle $\zeta_C(s)=q^{(2g-2)(s-1/2)}\zeta_C(1-s)$ et l'affirmation sur le module des nombres $\alpha_i$ équivaut à dire que $\zeta_C(s)=0$ implique $\Re s=1/2$, ce qui est bien l'analogue de l'hypothèse de Riemann.

\begin{remarque}
Si l'on sait déjà que $|\alpha_j|^2=\alpha_j\bar{\alpha}_j=q$, on peut en déduire que, si $\alpha$ est une racine réciproque du numérateur de la fonction zêta, alors $q/\alpha$ également. Si l'on ne connaît pas encore l'hypothèse de Riemann, l'équation fonctionnelle de la fonction zêta permet de retrouver que la transformation $\alpha\mto q/\alpha$ échange les racines réciproques.
\end{remarque}

\begin{remarque}
Soit $\alpha_1,\dots,\alpha_{2g}$ les entiers algébriques associés à la courbe $C$ par le théorème \ref{hrbis} ou \ref{hrter}; introduisons les polynômes symé\-triques $\sigma_i=\sigma_i(\alpha_1,\dots,\alpha_{2g})$ et les sommes $S_i=\alpha_1^i+\dots+\alpha_{2g}^i$. Posons en outre $N_i:=\# C(\F_q)$; la connaissance de $N_1,\dots, N_g$ équivaut à celle de $S_1,\dots, S_g$ et, par les formules de Newton, à celle de $\sigma_1,\dots,\sigma_g$ qui, par l'équation fonctionnelle, donne celle de $\sigma_1,\dots,\sigma_{2g}$. Ainsi pour calculer $Z(C/\F_q,T)$ on a seulement besoin de connaître $N_1,\dots, N_g$.
\end{remarque}

\section{Variantes et exemples}

Il est traditionnel d'appeler borne de Hasse-Weil l'inégalité:\marginparsok{Pourquoi utiliser $\lfloor\cdot\rfloor$ au lieu du classique $[{}\cdot\nobreak{}]$?}
\begin{equation}\label{hw}
\left|\# C(\F_q)-\# \P^1(\F_q)\right|\leq \left\lfloor2g\sqrt{q}\,\right\rfloor,
\end{equation}

On peut, dans certains cas, légèrement l'améliorer: tout d'abord le lemme ci-dessous montre qu'on peut écrire:
\begin{equation}\label{hws}
\left|\# C(\F_q)-\# \P^1(\F_q)\right|\leq g\left\lfloor 2\sqrt{q}\,\right\rfloor,
\end{equation}
Cette inégalité parfois appelée borne de Hasse-Weil-Serre \cite{se} améliore l'inégalité (\ref{hw}) lorsque $q$ n'est pas un carré.

\begin{lemme}\label{serretrick} Soit $S=\{\alpha_1,\dots,\alpha_s\}$ un ensemble d'entiers algébriques stable par action du groupe de Galois sur $\Q$ et tels que $\alpha_i$ vérifie $|\alpha_i|=p^{w/2}$ avec $w$ impair. Alors $s$ est pair et
$$\left|\alpha_1+\dots+\alpha_s\right|\leq \frac{s}{2}\left\lfloor 2p^{w/2}\right\rfloor.$$
\end{lemme}

\begin{proof}
Si $\alpha_i$ est réel alors $\alpha_i=\pm p^{w/2}$ et $-\alpha_i$ est conjugué avec $\alpha_i$ qui appartient donc à $S$, les autres éléments peuvent être groupés deux par deux avec leurs conjugués complexes, donc $s$ est pair, disons $s=2t$. Puisque $p^{w/2}$ et $-p^{w/2}$ ont une somme nulle, on peut supposer qu'aucun $\alpha_i$ n'est réel et écrire $S=T\cup\bar{T}$ avec $T=\{\alpha_1,\dots,\alpha_t\}$. Posons\marginparsok{Ici c'est $[{}\cdot{}]$ et pas $\lfloor\cdot\rfloor$; pourquoi?} $m:=[2p^{w/2}]$ et $x_i:=m+1+\alpha_i+\bar{\alpha}_i$, alors les $x_i$ sont des entiers algébriques réels positifs et forment un ensemble stable sous Galois donc le produit $x_1\cdots x_t$ est un entier positif donc $\geq 1$. En utilisant l'inégalité de la moyenne arithmétique-géométrique on obtient
\[
\frac{1}{t}\sum_{i=1}^tx_i\geq \sqrt[t]{x_1\dots x_t}\geq 1,
\]
et donc $tm+\sum_{i=1}^s\alpha_i\geq 0$. En remplaçant $\alpha_i$ par $-\alpha_i$ on obtient deux inégalités qui prouvent le lemme.
\end{proof}

Une autre technique est celle dite des \og formules explicites\fg. Écrivons
\[
L(C,T)=\prod_{j=1}^{g}(1-\sqrt{q}\,e^{i\theta_j}T)(1-\sqrt{q}\,e^{-i\theta_j}T).
\]
Pour un polynôme trigonométrique $f(\theta)=1+2\sum_{n\geq 1}c_n\cos(n\theta)$, posons $\psi_d(t)=\psi_{f,d}(t)=\sum_{n\geq 1}c_{dn}t^{dn}$.
À partir de
\begin{align*}
2\sum_{j=1}^g\cos(m\theta_j)=\sum_{j=1}^{2g}\alpha_j^mq^{-\sfrac{m}{2}}&=-N_mq^{-\sfrac{m}{2}}+q^{-\sfrac{m}{2}}+q^{\sfrac{m}{2}}\\[-3pt]
&=-\sum_{d\,|\,m}d\Phi_dq^{-\sfrac{m}{2}}+q^{-\sfrac{m}{2}}+q^{\sfrac{m}{2}},
\end{align*}
qu'on multiplie par $c_m$, on obtient en sommant la formule explicite suivante:
\begin{equation*}
\sum_{j=1}^gf(\theta_j)+\sum_{d\geq 1}d\,\Phi_d\,\psi_d(q^{-\sfrac{1}{2}})=g+\psi_1(q^{-\sfrac{1}{2}})+\psi_1(q^{\sfrac{1}{2}}).
\end{equation*}
Si on choisit $f$ de sorte que $c_n\geq 0$ et $f(\theta)\geq 0$, on peut minorer le membre de gauche par $N_1\psi_1(q^{-\sfrac{1}{2}})=\Phi_1\psi(q^{-\sfrac{1}{2}})$ et en tirer
\begin{equation*}
N_1\leq 1+\frac{g+\psi_1(q^{\sfrac{1}{2}})}{\psi_1(q^{-\sfrac{1}{2}})}.
\end{equation*}
Ainsi, par exemple en choisissant
\[
f(\theta)=1+\sqrt{2}\cos(\theta)+\frac{\cos(2\theta)}{2}=\frac{(1+\sqrt{2}\cos\theta)^2}{2},
\]
c'est-à-dire
\[
c_1=\frac{1}{\sqrt{2}},\quad c_2=\frac{1}{4}\quad\text{et}\quad
\psi_1(t)=\frac{t}{\sqrt{2}}+\frac{t^2}{4},
\]
on obtient, lorsque $g\leq\sfrac{q^{3/2}-q^{1/2}}{\sqrt{2}}$, l'inégalité
\begin{equation*}
N\leq q^2+1,
\end{equation*}
qui bien sûr n'améliore l'inégalité de Weil que si
\[
\frac{q^{3/2}-q^{1/2}}{2}<g\leq \frac{q^{3/2}-q^{1/2}}{\sqrt{2}},
\]
c'est-à-dire quand $g$ est grand devant $q$ mais pas trop.

\begin{exemple}
Pour $g=6$ et $q=5$,
\begin{itemize}
\item
l'inégalité de Weil donne $N_1\leq 5+1+\lfloor 12\sqrt{5}\,\rfloor=32$,
\item
l'inégalité de Weil améliorée donne $N_1\leq 5+1+6\lfloor 2\sqrt{5}\,\rfloor=30$
\item
et la formule explicite précédente donne $N_1\leq 5^2+1=26$.
\end{itemize}
\end{exemple}

\begin{exemple}
Supposons $p\neq3$ et $a_1a_2a_3\neq0$. Considérons la cubique plane $C$ sur $\F_p$ d'équation:
$$a_1X^3+a_2Y^3+a_3Z^3=0.$$
C'est une courbe elliptique\Addedok{: elle est de genre $1$} et, comme nous l'avons vu, elle possède nécessairement un point $\F_p$-rationnel. Lors\-que \hbox{$p\equiv 2\bmod 3$}, l'application $x\mto x^3$ est une bijection de $\F_p$ donc
$\# C(\F_p)=\# \P^1(\F_p)=p+1$ et l'on peut conclure
$$Z(C/\F_p,T)=\frac{1+pT^2}{(1-T)(1-pT)}.$$
Le cas $p\equiv 1\bmod 3$ est plus subtil mais peut être décrit explicitement ainsi (voir par exemple \cite{hi,gold}). Pour $\chi:\F_p^*\to\C^*$ un caractère de Dirichlet, on définit une \textit{somme de Gauss}
\[
G(\chi)=\sum_{u\in\F_p}\chi(u)\exp(2\pi iu/p)
\]
et une \textit{somme de Jacobi}
\[
J(\chi)=\sum_{u\in\F_p}\chi(u)\chi(1-u).
\]

\begin{proposition} Soit $\chi$ un caractère d'ordre $3$. La somme de Jacobi~$J(\chi)$ est un entier algébrique de module $\sqrt{p}$. On a
$$Z(C/\F_p,T)=\frac{1-aT+pT^2}{(1-T)(1-pT)}\,,$$
avec
$$a:=-\bar{\chi}(a_1a_2a_3)J(\chi)-\chi(a_1a_2a_3)J(\bar{\chi}).$$
\end{proposition}
Posons $D:=a_1a_2a_3$, pour $p=7$ on trouve
$$Z(C/\F_7,T)=\frac{1-aT+7T^2}{(1-T)(1-7T)}=\frac{(1-\alpha T)(1-\bar{\alpha}T)}{(1-T)(1-7T)},$$
avec
$$a:=\begin{cases}1 & \text{si } D= \pm 1\cr -4 & \text{si } D= \pm 3\cr 5 & \text{si } D= \pm 2\end{cases} \quad \text{et, respectivement,}\quad
\alpha= \begin{cases} \dfrac{1+i3\sqrt{3}}{2}\cr -2+i\sqrt{3}\cr \dfrac{5+i\sqrt{3}}{2}\cr\end{cases}$$
\end{exemple}

\begin{exemple}
Considérons la courbe d'équation affine $y^q+y=x^{q+1}$ sur $\F_q$ ou encore comme courbe plane projective
$$C:=\left\{(X,Y,Z)\in\P^2\mid ZY^q+Z^qY-X^{q+1}=0\right\}.$$
Le genre de $C$ est $g=\sfrac{q(q-1)}{2}$ et il y a un unique point à l'infini, de coordonnées homogènes $(0,1,0)$. Pour les points sur $\F_q$ on observe que $x^q=x$ et $y^q=y$, donc il y a $q$ points sur la courbe affine. Pour les points sur $\F_{q^2}$ notons que l'application trace de $\F_{q^2}$ vers~$\F_q$ est $\F_q$\nobreakdash-linéaire surjective et définie par $T(y)=y^q+y$, tandis que l'application norme de $\F_{q^2}^*$ vers $\F_q^*$ est un homomorphisme surjectif de groupes et définie par $N(y)=x^{q+1}$. L'ensemble des points de $C(\F_{q^2})$ est donné par le point à l'infini, les points $(0,y)$ tels que \hbox{$y^q+q=0$} (soit $q$ points) et enfin la réunion, pour $t\in\F_q^*$, des ensembles \hbox{$\{(x,y)\mid x^{q+1}=t=y^q+y\}$}, soit $(q-1)(q+1)q$ points, et on peut conclure:
$$N_1=q+1\quad{\rm et}\quad N_2=q^3+1.$$
Remarquons que la borne de Hasse-Weil s'écrit
$N_2\leq q^2+1+2gq=q^3+1$, donc la courbe est maximale sur $\F_{q^2}$.
\end{exemple}

\begin{exemple}
Considérons la quartique de Klein sur $\F_2$:
$$C:=\left\{(X,Y,Z)\in\P^2\mid ZY^3+Z^3X+X^{3}Y=0\right\}.$$
Le genre de $C$ est $g=3$. On voit aisément que
\[
C(\F_2)=\{(1,0,0),(0,1,0),(0,0,1)\}\,;
\]
considérant l'automorphisme $\sigma(X,Y,Z)=(Y,Z,X)$ d'ordre~$3$, on voit qu'il possède deux points fixes
$(j,j^2,1)$, où $j^2+j+1=0$, tous deux rationnels sur $\F_4$; on a donc $N_2\geq 5$ et $N_2\equiv 2\bmod 3$. Soit maintenant $\mu\in\F_8^*$ un générateur (une racine $7$-ième de l'unité),
l'automorphisme $\phi(X,Y,Z)=(X,\mu^3Y,\mu Z)$ est d'ordre 7 et possède comme points fixes les trois points de $C(\F_2)$ donc $N_3\equiv 3\bmod 7$. Ces remarques aident à déterminer:
$$N_1=3,\quad N_2=5 \quad{\rm et}\quad N_3=24$$
et, après calculs:
$$Z(C/\F_2,T)=\frac{1+5T^3+8T^6}{(1-T)(1-2T)}.$$
Remarquons que la borne de Hasse-Weil s'écrit
$N_3\leq 8+1+\lfloor 6\sqrt{8}\,\rfloor=25$, \Replacedok{tandis}{pendant} que la borne de Hasse-Weil-Serre s'écrit
$N_3\leq 8+1+3\lfloor 2\sqrt{8}\,\rfloor=24$, donc la courbe est maximale sur $\F_{8}$.
\end{exemple}

\section{Généralisations et applications}

Les conjectures de Weil \cite{w4} décrivent une vaste généralisation du théorème \ref{hrter} pour les variétés de dimension quelconque, mais toujours projective et lisse; leur démonstration, achevée dans les années soixante-dix a occupé pendant trente ans les géomètres. On pose ainsi pour une variété algébrique
définie sur $\F_q$:
$$Z(V/\F_q,T):=\exp\bigg(\sum_{m=1}^{\infty}\frac{\# V(\F_{q^m})}{m}T^m \bigg).$$

\begin{theoreme}[Conjectures de Weil, théorème de Grothendieck-Deligne]\label{conjweil}

Soit $V$ une variété algébrique projective et lisse de dimension $n$.
\begin{enumerate}
\item La série formelle $Z(V/\F_q,T)$ est une fraction rationnelle.
\item La fonction $Z(V/\F_q,T)$ vérifie l'équation fonctionnelle suivante où $\varepsilon=\varepsilon_V=\pm 1$ et $\chi=\chi_V$ est un entier:
$$Z\Big(V/\F_q,\frac{1}{q^nT} \Big)=\varepsilon\, q^{\sfrac{n\chi}{2}}\,T^{\chi}\,Z(V/\F_q,T)$$
\item (Hypothèse de Riemann) On peut écrire
$$Z(V/\F_q,T)=\frac{P_1(T)\cdots P_{2n-1}(T)}{P_0(T)\cdots P_{2n}(T)},$$
avec $P_0(T)=1-T$ et $P_{2n}(T)=1-q^nT$ et
$$P_i(T)=\prod_{j=1}^{b_i}(1-\alpha_{i,j}T)\quad {\rm et}\quad |\alpha_{i,j}|=q^{i/2}.$$
\item\label{betti} Les degrés $b_i$ des polynômes $P_i$ peuvent être calculés purement \og topologiquement\fg de même que $\chi=\sum_{i=0}^{2n}(-1)^ib_i$.
\end{enumerate}
\end{theoreme}

\begin{remarque} 
En utilisant l'égalité
\[
Z'(T)/Z(T)=\sum_{m\geq 1} \# V(\F_{q^m})T^{m-1},
\]
on peut traduire ces formules en une formule pour $\# V(\F_{q^m})$:
$$\# V(\F_{q^m})=\sum_{i=0}^{2n}\sum_{j=1}^{b_i}(-1)^i\alpha_{i,j}^m=q^{nm}+\sum_{i=0}^{2n-1}(-1)^i\sum_{j=1}^{b_i}\alpha_{i,j}^m.$$
On voit en particulier que pour $b_i$ fixés (ou bornés), la variété $V$ possède un point $\F_q$\nobreakdash-ration\-nel dès que $q$ est assez grand.
\end{remarque}

\begin{remarque}
Dans le cas $V=\P^n$ on voit que
\[
\# V(\F_{q^m})=q^{mn}+q^{m(n-1)}+\dots+q^m+1
\]
et
$$Z(\P^n/\F_q,T)=\frac{1}{(1-T)(1-qT)\dots(1-q^nT)}.$$
Ainsi on peut directement vérifier l'équation fonctionnelle avec $\varepsilon=(-1)^{n+1}$ et $\chi=n+1$.
Dans le cas d'une courbe de genre $g$, notons que $\varepsilon=+1$ et $\chi=2-2g$; on peut trouver d'autres exemples élémentaires dans \cite{hi}.
\end{remarque}

\begin{remarque}
La signification du dernier point du théorème \ref{conjweil} est une généralisation de la notion de genre (voir \cite{pop} pour un bel historique et un panorama de la notion de genre). Du point de vue de la topologie, une courbe lisse projective sur $\C$ est une surface (sic) de Riemann et son genre est le nombre de trous de la surface de Riemann. En dimension supérieure, on peut associer à une variété lisse projective $V$ de dimension $n$ sur $\C$, l'espace topologique $V(\C)$ et ses \og nombres de Betti\fg $B_i(V(\C))$, qui généralisent le genre, par exemple pour une courbe $B_1=2g$, ainsi que sa \og caractéristique d'Euler-Poincaré\fg $\chi(V(\C)):=\sum_{i=0}(-1)^iB_i(V(\C))$. Le point \ref{betti} du théorème \ref{conjweil} signifie que les $b_i$ obtenus en caractéristique $p$ sont égaux aux $B_i$ issus de la topologie. On est ainsi témoin d'une grandiose unification de l'arithmétique, de la géométrie et de la topologie, à laquelle Weil rêvait souvent. La topologie est en effet sous-jacente à la preuve des conjectures de Weil, via notamment la formule de Lefschetz comptant le nombre de points fixes d'une application
(ici le \og Frobenius\fg), la dualité de Poincaré (qui explique l'équation fonctionnelle), la formule de Künneth, etc.
\end{remarque}

L'hypothèse de Riemann originale est intimement liée à la distribution des nombres premiers et implique notamment des inégalités comme
$$\bigg|\sum_{p\leq x}\log p-x \bigg|\leq c\,\sqrt{x}\,(\log x)^2.$$
Une des applications les plus fréquentes à la théorie analytique des nombres de l'hypothèse de Riemann sur les corps finis est la majoration de sommes d'exponentielles de la forme\Addedok{, pour un polynôme~$F$ dans $\Z[X_1,\dots,X_n]$ ou $\F[X_1,\dots,X_n]$,}
\[
S:=\sum_{x\in\F_p^n}\exp\Big(\frac{2\pi iF(x)}{p} \Big).
\]
On peut majorer trivialement cette somme par $|S|\leq p^n$, mais le caractère oscillatoire des termes de la somme suggère que des majorations beaucoup plus précises doivent être possibles. L'exemple historiquement et théoriquement très important est celui de la somme de Gauss:
$$S(a):=\sum_{x\in\F_p}\exp \Big(\frac{2\pi iax^2}{p} \Big).$$
On montre en effet classiquement que pour $a\not\equiv 0\bmod p$ on a $|S(a)|=\nobreak\sqrt{p}$. L'hypothèse de Riemann pour les courbes permet de montrer par exemple que, pour $f(x)$ séparable de degré $d$, on a
$$\bigg|\sum_{x\in\F_p}\exp \Big(\frac{2\pi if(x)}{p}\Big) \bigg|\leq C_d\sqrt{p}.$$
L'étude des bornes pour les sommes d'exponentielles est encore aujourd'hui source de recherches très actives.

\smallskip
Les codes correcteurs (linéaires) ont été développés pour résoudre un problème très concret: lors de la transmission d'informations, de messages par téléphone, onde ou voie électronique, il peut arriver qu'une partie du message soit altéré (interférences, bruits, etc), on souhaite donc développer des techniques permettant de reconstituer autant que faire ce peut le message original. Les codes correcteurs liné\-aires sont parmi les plus utilisés et performants, ils sont par exemple utilisés dans la technique du disque compact. On écrit les messages avec un alphabet (en bijection avec) $\F_q$, c'est-à-dire des mots de disons $\F_q^k$; un \og code linéaire\fg est un sous-espace vectoriel $\mathcal{C}$ de $\F_q^n$ muni d'un isomorphisme $\lambda:\F_q^k\cong\mathcal{C}\subset\F_q^n$. Au lieu d'envoyer $x\in\F_q^k$, on envoie $\lambda(x)\in\F_q^n$. Si l'on reçoit un message $x'\notin\mathcal{C}$ on sait qu'il a été altéré et le procédé le plus simple pour le reconstituer est de remplacer $x'$ par le mot $x\in\mathcal{C}$ le plus proche. Pour donner un sens précis à cela on définit la \og distance de Hamming\fg et le \og poids\fg (\textit{weight} en anglais) d'un élément:
$$d(x,y):=\#\left\{i\in[1,n]\mid x_i\neq y_i\right\}\quad{\rm et}\quad w(x):=d(x,0).$$
La distance minimale d'un code est définie par
$$d(\mathcal{C}):=\min\left\{ d(x,y)\mid x\neq y\in\mathcal{C}\right\}=\min\left\{ w(x)\mid 0\neq x\in\mathcal{C}\right\}.$$
On voit facilement que si disons $d=d(\mathcal{C})$ est impair, il sera possible de repérer $d-1$ erreurs et d'en corriger $(d-1)/2$. Une première évaluation (naïve mais efficace) montre que les paramètres les plus importants d'un code sont $n,k,d$ et que la qualité d'un code peut s'apprécier en ce que le rapport $1<n/k$ ne soit pas trop grand et $d$ soit le plus grand possible.

\smallskip

Les codes de Goppa sont des codes linéaires liés aux courbes algébriques sur les corps finis; ils peuvent être décrits succinctement, selon \cite{gop,sti}, en anticipant un peu sur des définitions données dans le paragraphe suivant. On choisit $n$ points rationnels distincts $P_1,\dots, P_n$ dans $C(\F_q)$, on notera $D=P_1+\dots+P_n$ le diviseur somme de ces points; on choisit également $G$ un diviseur défini sur $\F_q$ de support disjoint de $D$, on considère l'espace vectoriel $L(D)$ des fonctions ayant au plus des pôles en $G$ et on pose
$$\mathcal{C}:=\left\{(x(P_1),\dots, x(P_n))\mid x\in L(G)\right\}.$$
On démontre alors que $k:=\dim\mathcal{C}=\dim L(G)-\dim L(G-D)$ et $d\geq n-\deg G$. Ce recours à la géométrie algébrique a permis de construire plusieurs des meilleures familles de codes connus. On notera que la taille du code, l'entier $n$, est bornée par le nombre de points dans $C(\F_q)$ donc par la borne de Hasse-Weil; cette observation a stimulé un grand nombre de travaux à la recherche de courbes maximales (c'est-à-dire ayant le plus grand nombre de points pour un genre donné).
C'est un bel exemple d'interaction fructueuse entre théorie et applications.

\section{Le théorème de Riemann-Roch pour les courbes}

Nous renvoyons à l'appendice pour les notions élémentaires sur les courbes et les corps finis.

Soit $C$ une courbe (lisse et projective) sur un corps $K$. À toute fonction rationnelle $f$ non nulle on peut associer son \textit{diviseur} qui est la somme formelle de ses zéros (comptés avec multiplicité positive) et pôles (comptés avec multiplicité négative). Si $D=\sum n_P[P]$ est un diviseur sur la courbe on définit l'ensemble
\begin{equation*}
L(D):=\{f\in K(C)\mid \divv(f)+D\geq 0\}\cup\{0\}.
\end{equation*}
En utilisant la relation sur l'ordre des zéros et pôles
\[
\ord_P(f_1+f_2)\geq\min\left(\ord_P f_1,\ord_P f_2\right),
\]
on voit que $L(D)$ est un espace vectoriel.
On notera $\ell(D)=\dim L(D)$. Par ailleurs comme $\divv(f_1f_2)=\divv(f_1)+\divv(f_2)$, on voit que, si~$D'=D+\divv(f)$, la multiplication par $f$ induit une bijection de $L(D')$ sur $L(D)$; en particulier
$\ell(D')=\ell(D)$.

La première forme du théorème de Riemann-Roch (celle démontrée par Riemann sur le corps des nombres complexes) s'énonce ainsi:

\begin{theoreme}[Riemann-Roch, forme \og faible\fg]\label{theorrf}
Soit $C$ une courbe lisse et projective. Il existe un entier positif $g$, appelé le \emph{genre} de la courbe et une constante $c_1$ tels que
\begin{enumerate}
\item pour tout diviseur $D$, on a
$$\ell(D)\geq \deg D-g+1;$$
\item de plus, si $\deg D\geq c_1$, on a l'égalité
$$\ell(D)=\deg D-g+1.$$
\end{enumerate}
\end{theoreme}

La forme complète du théorème de Riemann-Roch s'énonce ainsi

\begin{theoreme}[Riemann-Roch]\label{theorr}
Soit $C$ une courbe lisse et projective. Il existe un entier positif $g$, appelé le \emph{genre} de la courbe et un diviseur $K_C$
appelé le \emph{diviseur canonique} tels que pour tout diviseur $D$, on a
\begin{equation*}
\ell(D)-\ell(K_C-D)=\deg D-g+1.
\end{equation*}
\end{theoreme}

\begin{remarque}
En prenant $D=0$ dans l'énoncé, on voit que $\ell(K_C)=\nobreak g$; en prenant ensuite $D=K_C$, on voit que $\deg K_C=2g-2$. En particulier, comme $\ell(D)=0$ lorsque $\deg D<0$, on voit que, si $\deg D\geq 2g-1$, alors $\ell(K_c-D)=0$ et on conclut que la constante~$c_1$ dans le théorème \ref{theorrf} peut être prise égale à $2g-1$.
\end{remarque}

\begin{remarque}
On peut décrire la classe de diviseur $K_C$ comme la classe du diviseur d'une $1$-forme différentielle sur la courbe. Par exemple la forme différentielle $\omega=dx$ n'a aucun zéro ou pôle sur l'ouvert $\P^1\setminus\{\infty\}$ et quand on effectue le changement de variable $t=1/x$, on voit
$\omega=dx=-dt/t^2$ donc $\omega$ a un pôle d'ordre $2$ au point $\infty$ et on a donc
$$\divv(\omega)=-2[\infty].$$
On retrouve ainsi que le genre de $\P^1$ est zéro.

Si on considère la courbe elliptique d'équation affine $y^2=x^3+ax+b$ avec $\Delta=4a^3+27b^2\neq0$, on peut introduire la $1$-forme
\[
\omega=\frac{dx}{2y}=\frac{dy}{3x^2+a}
\]
qui n'a ni zéro ni pôle dans la partie affine; un calcul montre qu'elle n'a pas non plus de zéro ou pôle en le point à l'infini, autrement dit $\divv(\omega)=0$ et on retrouve que $g=1$.
\end{remarque}

\begin{exemple}
Nous n'allons pas donner la démonstration générale mais vérifier le théorème de Riemann-Roch sur un exemple. Considérons la courbe d'équation affine $y^2=h(x)$, où $h$ est un polynôme séparable de degré $2g+1$; elle possède un unique point à l'infini que nous notons~$\infty$. L'algèbre des fonctions ayant comme unique pôle le point~$\infty$ est l'algèbre des polynômes en $x$, $y$; on a $\divv(x)_{\infty}=2[\infty]$ et $\divv(y)_{\infty}=(2g+1)[\infty]$; on en déduit qu'une base de $L(m(\infty))$ est donnée par:
$$\{x^i\mid 0\leq i\leq m/2\}\cup\{yx^j\mid0\leq j\leq (m-2g-1)/2\}.$$
On vérifie directement que, lorsque $m\geq 2g-1$, on a $\ell(m(\infty))=m+1-g$. Par ailleurs la forme différentielle $dx/y$ n'a ni zéro ni pôle hors de $\infty$ et un calcul local montre qu'elle a un zéro d'ordre $2g-2$ en $\infty$ donc $K_C=(2g-2)[\infty]$ et on vérifie directement la formule de Riemann-Roch, c'est-à-dire que, pour $m\in[0,2g-2]$, on~a $\ell(m(\infty))-\ell((2g-2-m)\infty)=m-g+1$.
\end{exemple}

Le théorème de Riemann-Roch permet de démontrer que la fonction zêta est une fraction rationnelle (la forme faible suffit) et vérifie l'équation fonctionnelle annoncée (la forme complète étant utilisée).
On partira de l'expression
$$
Z(T)=Z(C/\F_q,T)=\sum_{n=0}^{\infty}A_nT^n
$$
avec $A_n:=\#\{D\geq 0,\;D/\F_q,\;\deg D=n\}$.
Notons
$h$ le nombre de classes de diviseurs de degré zéro\footnote{Le nombre de classes est un invariant très intéressant; il s'interprète comme le nombre de points rationnels de la \emph{jacobienne} de la courbe.} et récrivons la formule de Riemann-Roch pour une classe de diviseur $c$:
$$\ell(c)-\ell(K_C-c)=\deg(c)+1-g,$$
où $K_C$ désigne la classe canonique.

Supposons qu'il existe une classe de diviseurs $c_1$ de degré $1$ sur $C/\F_q$ (on peut montrer que ceci est toujours réalisé), alors l'ensemble des classes de diviseurs de degré $n$ est en bijection avec l'ensemble des classes de diviseurs de degré $0$ par l'application $c\mto c-nc_1$.
\begin{align*}
A_n=\sum_{\deg(c)=n}\frac{q^{\ell(c)}-1}{q-1}&=\frac{1}{q-1}\bigg\{\sum_{\deg(c)=n}q^{\ell(c)}-\sum_{\deg(c)=n}1 \bigg\}\\
&=
\frac{1}{q-1} \bigg\{\sum_{\deg(c)=n}q^{\ell(c)}-h \bigg\}.
\end{align*}
De plus, si $\deg(c)>2g-2$ on a
$$
\sum_{\deg(c)=n}q^{\ell(c)}=q^{n+1-g}h$$ et donc
\begin{multline*}
Z(T)=Z(C/\F_q,T)\\
=\frac{1}{q-1} \bigg\{\sum_{\deg(c)\leq 2g-2}q^{\ell(c)}T^{\deg(c)}+h\sum_{n=2g-1}^{\infty}q^{n+1-g}T^n-h\sum_{n=0}^{\infty}T^n \bigg\}.
\end{multline*}
Ainsi, si l'on pose
$$A(T):=\sum_{\deg(c)\leq 2g-2}q^{\ell(c)}T^{\deg(c)}\quad{\rm et}\quad B(T)=\frac{q^gT^{2g-1}}{1-qT}-\frac{1}{1-T}$$ on peut récrire
$$Z(T)=\frac{1}{q-1}\left\{A(T)+hB(T)\right\}.$$
Noter que $B(T)$ ne dépend que du genre. En particulier, on voit qu'il existe un polynôme $L(T)=L(C/\F_q,T)\in\Z[T]$ tel que
$$Z(T)=\frac{L(T)}{(1-T)(1-qT)}$$
avec $L(1)=h$ et $L(1/q)=hq^{-g+1}$.
Utilisons la symétrie $c\leftrightarrow K_C-c$ en notant $c':=K_C-c$ de sorte que
\begin{align*}
\deg(c)&=2g-2-\deg(c'),\\
\ell(c)&=\ell(c')+\deg(c)+1-g=\ell(c')-\deg(c')-1+g
\end{align*}
et remarquons que $c\mto c'$ est une bijection sur les classes qui satisfont~à $0\leq \deg(c)\leq 2g-2$; on obtient
\begin{equation}\label{eqfctA}
A(T)=q^{g-1}T^{2g-2}A(\sfrac{1}{qT}).
\end{equation}
Un calcul direct donne
\begin{equation}\label{eqfctB}
B(T)=q^{g-1}T^{2g-2}B(\sfrac{1}{qT}).
\end{equation}
En combinant les équations (\ref{eqfctA}) et (\ref{eqfctB}) on obtient l'équation fonctionnelle de $Z(T)$:
\begin{equation*}
Z(T)=q^{g-1}T^{2g-2}Z(\sfrac{1}{qT}).
\end{equation*}
On tire aisément de cette équation fonctionnelle que $\deg(L(T))=2g$ et on peut écrire:
\begin{equation*}
L(C/\F_q,T)=\prod_{j=1}^{2g}(1-\beta_jT).
\end{equation*}
avec la propriété que la transformation $\beta\mto q/\beta$ induit une bijection sur $\beta_1,\dots,\beta_{2g}$. On peut traduire cela en la formule:
\begin{equation*}
\# C(\F_{q^m})=q^m+1-\sum_{j=1}^{2g}\beta_j^m.
\end{equation*}

Ces résultats ont été prouvés par Artin et Schmidt. Il reste à prouver l'hypothèse de Riemann, c'est-à-dire que les $\beta_j$ sont tous de module $\sqrt{q}$, ce qui a été fait par Hasse lorsque $g=1$ puis par Weil quand $g\geq 2$. Remarquons qu'il suffit de prouver pour tout $j$ l'iné\-galité $|\beta_j|\leq\sqrt{q}$ car elle entraîne l'inégalité $|q/\beta_j|\leq \sqrt{q}$ et donc $|\beta_j|\geq\sqrt{q}$.

\section{La preuve originale de Weil}

\begin{enonce*}[remark]{Note historique}
Comme nous l'avons rappelé en introduction, la~preu\-ve de Weil (\cite{w2,w3}) a suscité des polémiques puisqu'elle repo\-sait sur un \og lemme-clef\fg que Weil n'avait pas, à ce moment-là, démontré; voir à ce propos la correspondance avec Henri Cartan \cite{au}. Les deux notes reposent sur un énoncé de positivité en géométrie algébrique sur un corps fini dont l'analogue était connu de Weil sur le corps des complexes, mais dont la démonstration était de nature \og transcendante\fg , utilisant analyse holomorphe et topologie et donc non applicable directement. Nous présentons en fait la preuve de la note de 1941, basée sur l'inégalité de Castelnuovo.
\end{enonce*}

La preuve de Weil requiert de travailler sur des variétés algé\-briques de dimension supérieure. La première version (la note de~1940) utilisait une variété de dimension $g$ appelée \textit{jacobienne} de la courbe, la~deuxième version (la note de 1941) requiert seulement de travailler sur la surface $C\times C$. On définit un \og diviseur\fg sur une surface comme une somme formelle à coefficients entiers de courbes; le diviseur d'une fonction est la somme de ses zéros (comptés positivement) et de ses pôles (comptés négativement); on dit que deux diviseurs sont linéairement équivalents si leur différence est le diviseur d'une fonction.

\smallskip

Dans le plan projectif deux droites distinctes se rencontrent toujours en un point. Cet énoncé élémentaire peut être largement généralisé, tout d'abord avec le résultat suivant.

\begin{theoreme}[Bézout]
Soit $C_1$ et $C_2$ deux courbes (non nécessairement irréductibles) dans $\P^2$ de degré $d_1$ et $d_2$, n'ayant aucune composante commune, alors $C_1\cap C_2$ est fini et le nombre de points de cette intersection, comptés avec multiplicité, est $d_1d_2$.
\end{theoreme}

On peut ainsi définir une \Replacedok{forme}{application} bilinéaire sur les paires de courbes de $\P^2$ qui à deux courbes $C_1$ et $C_2$ associe $C_1\cdot C_2:=d_1d_2$ et qui, quand les courbes se coupent proprement, compte le nombre de points dans l'intersection; notons que l'on doit donc définir $C\cdot C=(\deg C)^2$.

On peut généraliser ce procédé à toute surface $S$ (lisse, projective) et associer à toute paire de diviseurs (courbes) $D_1$, $D_2$ leur \og nombre d'intersection\fg $D_1\cdot D_2$. Ces nombres sont invariants par déformation des diviseurs et, en particulier par équivalence linéaire, c'est-à-dire que pour toute fonction $f$ et diviseur $D$ sur la surface $D\cdot\divv(f)=0$; si $D_1$ et $D_2$ se coupent proprement, ils sont égaux au nombre de points d'intersection. Plongeons la surface $S$ dans un espace projectif $\P^n$ et considérons l'intersection $D$ de $S$ avec un hyperplan de $\P^n$: il s'agit d'un diviseur qui a la particularité de rencontrer toutes les courbes tracées sur $S$; un tel diviseur est appelé une section hyperplane ou diviseur très ample, un diviseur ample est tel qu'un multiple positif est très ample.

\begin{lemme}\label{rrpos} Soit $H$ une section hyperplane sur une surface $S$. Lorsque~$D$ est un diviseur tel que $D\cdot H>0$ et $D^2>0$, alors un multiple de $D$ est linéairement équivalent à un diviseur positif.
\end{lemme}

La preuve repose sur un théorème de Riemann-Roch pour les surfaces.

\begin{lemme}[Inégalité de Hodge]\label{hodge}
Soit $H$ une section hyperplane et $D$ un diviseur sur une surface $S$. Supposons $D\cdot H=0$, alors on a
\begin{equation}\label{hineq}
D\cdot D=D^2\leq 0.
\end{equation}
\end{lemme}

\begin{proof} Supposons que $D^2\!>\!0$. Introduisons $H_m\!:=\!D\!+\!mH$, de sorte que, pour $m$ assez grand le diviseur $H_m$ est ample et l'on a $D\cdot H_m=D^2>0$ donc, d'après le lemme \ref{rrpos}, un multiple de $D$ est positif et en particulier $D\cdot H>0$, ce qui contredit l'hypothèse. \end{proof}

\begin{remarque*}
Si $D$ est un diviseur quelconque, posons
\[
D_1=(H^2)D-(D\cdot H) H.
\]
On a clairement $D_1\cdot H=0$ et donc $D_1^2\leq 0$, d'où l'on tire aisément l'inégalité en apparence plus générale
$$
(D^2)(H^2)\leq (D\cdot H)^2.
$$
\end{remarque*}

Voici maintenant l'inégalité-clef utilisée par Weil.

\begin{lemme}[Inégalité de Castelnuovo]\label{castelnuovo}
Soit $C$ une courbe lisse projective et $D$ un diviseur sur $C\times C$. Soit $P$ un point de $C$, notons $F_1:=C\times\{P\}$ et $F_2:=\{P\}\times C$. Notons $d_1:=D\cdot F_1$ et $d_2:=D\cdot F_2$. On a alors
\begin{equation}\label{castel}
D^2=D\cdot D\leq 2d_1d_2.
\end{equation}
\end{lemme}

\begin{proof} Ce lemme se déduit du lemme \ref{hodge}. Commençons par observer que $F_1\cdot F_2=1$ alors que $F_1\cdot F_1=F_2\cdot F_2=0$.
Dans le cas $S=C\times C$, on peut prendre $H=F_1+F_2$. Introduisons $D_1:=D-d_2F_1-d_1F_2$ alors on vérifie que
$$D_1\cdot H=(D-d_2F_1-d_1F_2)\cdot(F_1+F_2)=0.$$
On obtient donc
$$0\geq D_1^2=D^2-2d_2(D\cdot F_1)-2d_1(D\cdot F_2)+2d_1d_2(F_1\cdot F_2)=D^2-2d_1d_2.$$
C'est exactement l'inégalité de Castelnuovo.
\end{proof}

Le nombre de points rationnels sur $\F_q$ d'une courbe $C$ apparaît géométriquement comme le nombre de points fixes du Frobenius (voir le lemme \ref{frob} en appendice).

\begin{lemme}[Calcul de nombres d'intersection]
Soit $\Gamma$ le graphe du Frobenius $C\to C$ défini par \og $x\mto x^q$\fg, soit $\Delta$ la diagonale de $C\times C$ et soit $N:=\# C(\F_q)$ le nombre de points fixes du Frobenius et $g$ le genre de $C$. On a les formules suivantes
\begin{equation}\label{intersec}
\begin{gathered}
\Gamma\cdot \Delta=N,\quad \Delta^2=2-2g,\quad \Gamma^2=q(2-2g),\\
\Gamma\cdot F_1=q\quad{\rm et}\quad \Gamma\cdot F_2=1.
\end{gathered}
\end{equation}
\end{lemme}

\begin{proof} L'intersection du graphe $\Gamma$ avec $\Delta$ est égale au nombre de points fixes du morphisme Frobenius donc au nombre de points définis sur $\F_q$. Comme $\Gamma$ est un graphe, son nombre d'intersection avec $F_2$ est égal à $1$; enfin le Frobenius est de degré~$q$ (le~nombre d'antécédents d'un point est en général $q$) donc son nombre d'intersection avec $F_1$ est égal à $q$. Le calcul de l'auto-intersection de la diagonale est plus délicat, nous proposons de faire le calcul sur un exemple concret, la courbe hyperelliptique~$C$ d'équation affine $y^2=h(x)$, où $h$ est un polynôme séparable degré impair $2g+1$. L'entier $g$ est bien le genre et la courbe possède un unique point à l'infini noté $\infty$ et, si l'on pose
\[\textstyle
Q_1=\big(0,\sqrt{h(0)}\big),\quad Q_2=\big(0,-\sqrt{h(0)}\big)\quad\text{et}\quad P_j=(a_j,0)
\]
(où $a_j$ parcourt les zéros de $h$), on vérifie que
\[
\divv(x)=(Q_1)+(Q_2)-2(\infty)
\]
et surtout que, en posant $f(P,Q)=x(P)-x(Q)$, on a
\[
\divv(f)=\Delta+\Delta^--2(\infty)\times C -2C\times(\infty),
\]
où $\Delta^-$ est le graphe de l'involution $\iota(x,y)=(x,-y)$. On en tire
$$0=\Delta\cdot\Delta+\Delta^-\cdot\Delta-2\left((\infty)\times C\right)\cdot\Delta -2\left(C\times(\infty)\right)\cdot\Delta.$$
Le nombre d'intersection de $\Delta$ et $\Delta^-$ est égal au nombre de points fixes de $\iota$, c'est-à-dire $2g+2$ (les $2g+1$ points $P_j$ et le point $\infty$),d'où le calcul
$\Delta\cdot\Delta=2\cdot2+2\cdot2-(2g+2)=2-2g$. Enfin on peut écrire le graphe $\Gamma$ comme l'image réciproque de la diagonale par l'application $\Phi\times \id_C:C\times C\to C\times C$ et on en déduit que
\[
\Gamma\cdot\Gamma=\deg(\Phi\times \id_C)\,\Delta\cdot\Delta= q\,\Delta\cdot\Delta=q(2-2g).\qedhere
\]
\end{proof}

Appliquons ces formules au diviseur $D=r\Gamma+s\Delta$. On obtient:
$$d_1=D\cdot F_1=rq+s\quad{\rm et}\quad d_2=D\cdot F_2=r+s.$$
L'inégalité de Castelnuovo s'écrit donc
$$D\cdot D=D^2=r^2q(2-2g)+2rsN+s^2(2-2g)\leq 2(rq+s)(r+s),$$
d'où l'on tire
$$
gqr^2+(q+1-N)rs+gs^2\geq 0.
$$
Si l'on écrit que le discriminant de l'équation en $r,s$ doit être négatif on obtient l'inégalité voulue:
\begin{equation*}
\left|q+1-N\right|\leq 2g\sqrt{q}.
\end{equation*}

\section{Une autre preuve en restant dans le monde des courbes}

Vers la fin des années soixante, Stepanov \cite{ste} a introduit une méthode \og élémentaire\fg (c'est-à-dire n'utilisant que le théorème de Riemann-Roch sur la courbe) aboutissant à une preuve de l'hypo\-thèse de Riemann. La preuve a été simplifiée et complétée par \hbox{Bombieri} \cite{bomb} et nous allons présenter sa version. En préliminaire, remarquons que si $C$ est définie sur $\F_q$ avec des nombres $\beta_1,\dots,\beta_{2g}$ associés, la courbe $C'$ obtenue en étendant les scalaires à $\F_{q^r}$ est asso\-ciée à $\beta_j'=\beta_j^r$ et $|\beta_j'|=q^{r/2}$ équivaut à $|\beta_j|=\sqrt{q}$. Ainsi on peut sans dommage remplacer $\F_q$ par $\F_{q^r}$ et en particulier supposer que $q$ est grand.

\begin{proposition}\label{majorer}
Supposons que $q$ soit un carré et soit suffisamment grand, par exemple $q>(g+1)^4$, alors
$$\# C(\F_q)\leq q+1+(2g+1)\sqrt{q}.$$
\end{proposition}

\begin{proof}
Posons $N:=\# C(\F_q)$ et $q=q_0^2$. On peut supposer que l'on a un point $Q\in C(\F_q)$. L'idée est de construire une fonction ayant un unique pôle d'ordre au plus $H$ en $Q\in C(\F_q)$ et s'annulant à l'ordre disons $T$ en chaque point de $C(\F_q)\setminus \{x_0\}$; on aura alors $T(N-1)\leq H$ ou encore $N\leq 1+H/T$.

Choisissons deux paramètres $m,n\geq 1$, que l'on optimisera ultérieurement, et posons
$$T:=\left\{ i\in[0,m]\mid {\rm il \; existe}\; u_i\;{\rm avec}\; \divv (u_i)_{\infty}=iQ\right\}.$$
De plus, pour chaque $i\in T$ on choisit une fonction $u_i$.

\begin{lemme}
L'ensemble $\{u_i\mid i\in T\}$ forme une base de $L(mQ)$. En particulier $\# T=\ell(mQ)$.
\end{lemme}

Pour voir cela observons que $L((i-1)Q)\subset L(iQ)$ et que, ou bien on a égalité, ou bien il existe $u=u_i\in L(iQ)$ ayant un pôle d'ordre exactement $i$ en $Q$ et alors $L(iQ)=L((i-1)Q)\oplus\langle u_i\rangle$.

\smallskip

On introduit maintenant l'espace vectoriel
\begin{align*}
L&:=L(mQ)\cdot L(nQ)^{q_0}\\
&\phantom{:}=\bigg\{y=\sum_jx_jy_j^{q_0}\mid x_j\in L(mQ),\; y_j\in L(nQ)\bigg\}.
\end{align*}
\begin{lemme}
L'espace $L$ est un sous-espace vectoriel de $L((m\!+\!nq_0)Q)$. Si l'on suppose $m<q_0$, tout élément de $y\in L$ s'écrit de manière unique sous la forme
$$y=\sum_{i\in T}u_iz_i^{q_0}$$
avec $z_i\in L(nQ)$. En particulier
\begin{equation*}
\dim L=\# T\cdot \ell(nQ)=\ell(mQ)\cdot \ell(nQ).
\end{equation*}
\end{lemme}

\begin{proof}
La première partie est claire, de même que l'existence de l'écriture de $y$. Pour l'unicité, notons que,
si l'on avait \hbox{$0=\sum_{i\in T}u_iz_i^{q_0}$} avec au moins un des $z_i\neq0$, on en déduirait $\ord_{Q}(u_iz_i^{q_0})=-i+q_0\ord_{Q}(z_i)\equiv -i \bmod q_0$, mais
comme tous ces ordres sont distincts on obtient une contradiction. Le calcul de la dimension s'ensuit.
\end{proof}

Le lemme permet de définir l'application suivante:
\begin{align*}
\Phi: L &\to L((q_0m+n)Q)\\
\sum_{i\in T}u_iz_i^{q_0}&\mto \sum_{i\in T}u_i^{q_0}z_i.
\end{align*}

\begin{lemme} L'application $\Phi$ vérifie les propriétés suivantes:
\begin{enumerate}
\item L'application est additive et même semi-linéaire, c'est-à-dire:
$$\Phi(x+y)=\Phi(x)+\Phi(y)\quad{\rm et}\quad \Phi(\lambda^{q_0}x)=\lambda\Phi(x).$$
\item Posons $m=q_0-\varepsilon$ et $n=q_0+\gamma$ et supposons la condition numérique suivante réalisée:
\begin{equation}\label{ineqnum}
q_0>\frac{(\gamma +1-g)(g+\varepsilon)}{\gamma+1-2g}\,.
\end{equation}
Alors le noyau de $\Phi$ est non trivial.
\end{enumerate}
\end{lemme}

\begin{proof}
Le premier point est immédiat et pour prouver le second il suffit de savoir que $\dim L>\ell((q_0m+n)Q)$. Pour calculer ou estimer ces dimensions,
on a recours au théorème de Riemann-Roch qui indique dans ce contexte que
$$\dim L=\ell(mQ)\cdot \ell(nQ)\geq (m+1-g)(n+1-g)$$
et, comme $q_0m+n\geq 2g-1$:
$$\ell((q_0m+n)Q=mq_0+n+1-g.$$
L'inégalité $(m+1-g)(n+1-g)>q_0+n+1-g$ se traduit exactement (après calcul) en la condition (\ref{ineqnum}).
\end{proof}

Nous ferons les choix suivants: $\varepsilon=1$ et $\gamma=2g$ de sorte que l'inégalité (\ref{ineqnum}) se traduit par $q_0>(g+1)^2$.

\begin{lemme} Soit $x$ une fonction non nulle de $\Ker\Phi$, alors pour tout point $P\in C(\F_q)\setminus\{Q\}$ on a $x(P)=0$.
\end{lemme}

\begin{proof}
On exploite le fait que $q_0^2=q$ et donc si $a\in\F_q$ on aura $a^{q_0^2}=a$. On écrit la décomposition $x=\sum_{i\in T}u_iz_i^{q_0}$ et on calcule:
\begin{align*}
x(P)^{q_0}&=\bigg(\sum_{i\in T}u_i(P)z_i(P)^{q_0} \bigg)^{q_0}=\sum_{i\in T}u_i^{q_0}(P)z_i(P)\\
&= \bigg(\sum_{i\in T}u_i^{q_0}z_i \bigg)(P)=\left(\Phi(x)\right)(P)=0.\qedhere
\end{align*}
\end{proof}

On termine la démonstration en écrivant
$$\#\left(C(\F_q)\setminus\{Q\}\right)\leq \deg\divv(x)_0=\deg\divv(x)_{\infty}\leq m+nq_0$$
d'où l'on tire en tenant compte du choix des paramètres:
\[
\# C(\F_q)\leq q_0-\varepsilon +q_0(q_0+\gamma)+1=q+1+(2g+1)\sqrt{q}.\qedhere
\]
\end{proof}

Nous allons maintenant donner, pour une famille particulière de courbes, un argument permettant de déduire de la \textit{majoration} \ref{majorer} une minoration du nombre de points rationnels (le cas général suit la même idée mais est plus sophistiqué). Les courbes particulières sont les courbes de la forme $y^d=f(x)$ avec $f(x)$ séparable de degré~$e$ et~$d$ premier avec $pe$; on supposera également que les racines $d$-ièmes de l'unité sont dans $\F_q$. Il y a dans ce cas un unique point à l'infini que nous notons $Q_0$. Notons par ailleurs $a_1=1,a_2,\dots, a_d$ des représentants de $\F_q^*/\F_q^{*d}$ \Addedok{(le quotient du groupe multiplicatif $\F_q^*$ par le sous-groupe formé des éléments qui sont des puissances $d$-ièmes)} c'est-à-dire des éléments tels que
$\F_q^*=\cup_{i}a_i\F_q^{*d}$ (union disjointe). Pour $a\in\F_q^*$, on note $C_a$ la courbe affine
$$ay^d=f(x).$$
Ces courbes ont le même genre $g=(d-1)(e-1)/2$ que $C$, en fait $C_1=C_{a_1}=C\setminus\{Q_0\}$ et possède aussi un unique point l'infini qui est donc rationnel. On peut leur appliquer la majoration donnée par la proposition \ref{majorer}:
$$C_a(\F_q)\leq q+(2g+1)\sqrt{q}.$$

Notons $\mathcal{Z}_0:= \{x\in\F_q\mid f(x)=0\}$ et $\mathcal{Z}=\mathcal{Z}_0\times\{0\}$ et $r=\#\mathcal{Z}$; les courbes $C_a$ contiennent chacune l'ensemble $\mathcal{Z}$.
Si $x\in\F_q\setminus\mathcal{Z}_0$ on a $f(x)\in a_i\F_q^{*d}$ pour un seul des $a_i$ et l'équation $a_iy^d=f(x)$ possède~$d$ solutions en $y$. On en tire l'égalité
$$d(q-r)=\sum_{i=1}^d\#\left\{ C_{a_i}(\F_q)\setminus\mathcal{Z} \right\},$$
ou encore
$$\# C(\F_q)-1=\# C_1(\F_q)= dq-\sum_{i=2}^d\# C_{a_i}(\F_q).$$
En insérant la majoration de $\# C_a(\F_q)$ obtenue dans la proposition \ref{majorer}, on obtient la minoration
\begin{equation*}
\# C(\F_q)\geq q+1-(d-1)(2g+1)\sqrt{q}.
\end{equation*}

Ces arguments permettent ainsi de démontrer une inégalité du type
$$\left|\# C(\F_q^m)-q^m-1\right|\leq cq^{m/2}.$$
D'où l'on tire l'inégalité de Stepanov
$$\bigg|\sum_{j=1}^{2g}\beta_j^m \bigg|\leq cq^{m/2}.$$
La série entière $S(z)=\sum_{m=0}^{\infty}(\beta_1^m+\dots+\beta_{2g}^m)z^m$ est égale à la somme des $(1-\beta_jz)^{-1}$ et son rayon de convergence est $R=(\max|\beta_j|)^{-1}$. L'inégalité de Stepanov montre que le rayon de convergence est supérieur ou égal à $q^{-1/2}$; on en tire donc bien l'inégalité $\max_j|\beta_j|\leq \sqrt{q}$. Si l'on se souvient que la transformation $\beta\mto q/\beta$ laisse stable l'ensemble des $\beta_j$ on obtient bien l'égalité voulue: $|\beta_j|=\sqrt{q}$.

\section{Appendice: Corps finis et courbes algébriques}

\subsection{Corps finis} Le premier exemple de corps fini est bien sûr $\Z/p\Z$ muni de l'addition et multiplication, que l'on note $\F_p$. Un corps fini $K$ est nécessairement de caractéristique finie égale à un nombre premier $p$ (l'homomorphisme $\Z\to K$ donné par $m\mto m\cdot1_K$ ne peut être injectif) et contient donc $\F_p$; c'est donc un espace vectoriel de dimension finie, disons $n$, sur $\F_p$ et donc le cardinal de $K$ est $p^n$.

\begin{theoreme} Soit $K$ un corps fini de cardinal $q=p^n$.
Le groupe $K^*$ est cyclique de cardinal $q-1$. On dispose de la factorisation
$$X^q-X=\prod_{a\in K}(X-a).$$
L'application $\Phi:x\mto x^p$ est un automorphisme de $K$ dont les points fixes sont les éléments de $\F_p\subset K$.
\end{theoreme}

Cet énoncé permet aussi de construire un corps de cardinal $p^m$: il~suffit de construire un corps $K'$ extension de $\F_p$ tel que le polynôme $X^{p^m}-X\in\F_p[X]$ ait toutes ses racines dans $K'$; on définit alors $K$ comme l'ensemble de ces racines et on vérifie aisément que c'est un corps (si $x$ et $y$ sont des racines de $X^{p^m}-X=0$ alors $x\pm y$, $xy$, $ x^{-1}$ également). On arrive ainsi a l'énoncé fondamental.

\begin{theoreme} Soit $p$ un nombre premier et $m\geq 1$. Il existe un corps, unique à isomorphisme près, de cardinal $p^m$. On le note~$\F_{p^m}$. Si l'on plonge tous ces corps dans une clôture algébrique $\bar{\F}_p$ on peut identifier~$\F_{p^m}$ comme l'ensemble des points fixes de $\Phi^m$ (où $\Phi(x)=x^p$ désigne le Frobenius).
\end{theoreme}

Pour construire \og concrètement\fg un tel corps une solution est de trouver un polynôme de de degré $m$ et irréductible dans $\F_p[X]$; par exemple
\begin{align*}
\F_4&=\F_2[X]/(X^2+X+1)\F_2[X], \\
\F_8&=\F_2[X]/(X^3+X+1)\F_2[X], \\
\F_9&=\F_3[X]/(X^2+ 1)\F_3[X].
\end{align*}

\subsection{Courbes algébriques et diviseurs}
Une courbe affine est un sous-ensemble algébrique, c'est-à-dire l'ensemble des zéros communs de polynômes, qui de plus est de dimension $1$, par exemple
\[
C:=\{(x,y)\in\A^2\mid f(x,y)=0\}.
\]
\Addedok{Si $f$ est à coefficients dans $\F_q$, on dit que la courbe $C$ est définie sur~$\F_q$, ce qu'on indique par $C/\F_q$, et $C(\F_q)$ désigne l'ensemble des couples $(x,y)\in\F_q^2$ solutions de $f(x,y)=0$: ce sont les \emph{points rationnels de~$C/\F_q$}. Pour toute extension $\F$ de $\F_q$ ($\F_{q^m}$ ou $\ov\F_q$ par exemple), $C(\F)$ désigne l'ensemble des solutions de $f(x,y)=0$ dans $\F^2$.}

On est souvent amené à considérer les courbes projectives: les sous-ensembles algébriques de dimension $1$ d'un espace projectif, c'est-à-dire l'ensemble des zéros communs de polynômes homogènes.
Par exemple si on pose
\[
F(X,Y,Z)=Z^{\deg(f)}f(XZ^{-1},YZ^{-1})
\]
alors
\[
\bar{C}:=\{(X,Y,Z)\in\P^2\mid F(X,Y,Z)=0\}
\]
est une courbe projective qui est la fermeture de la courbe affine $C$ précédente (ce procédé est l'analogue algébrique de la compactification topologique).
Un \textit{diviseur} sur une courbe est une somme formelle de points à coefficients entiers $D=\sum_{P\in C}n_PP$, son degré est l'entier $\deg D=\sum_{P\in C}n_P$. Si $f$ est une fonction rationnelle sur la courbe, on définit son diviseur $\divv(f)$ comme la somme de ses zéros moins la somme de ses pôles (comptés avec multiplicités), ce que l'on peut noter $\divv(f)=\sum_P\ord_P(f)[P]$. Si $C$ est projective, on a toujours $\deg\divv(f)=0$.

Ces notions sont définies sur la clôture algébrique disons de $\F_q$, mais on peut parler de courbes, diviseurs \textit{définis} sur $\F_q$: ce sont les objets définis à l'aide de polynômes à coefficients dans $\F_q$ ou encore invariants sous le groupe de Galois de $\bar{\F}_q$ sur $\F_q$.

\smallskip

Sur une courbe affine $f(x,y)=0$ un point \textit{singulier} est un point $P=(x_0,y_0)$ tel que
\[
f(x_0,y_0)=\frac{\partial f}{\partial x}(x_0,y_0)=\frac{\partial f}{\partial y}(x_0,y_0)=0
\]
(intuitivement c'est un point où il n'y a pas de tangente bien définie). On dit qu'une courbe est \textit{lisse} si elle ne possède aucun point singulier. On peut montrer que toute courbe est birationnelle à une unique courbe lisse projective.

\smallskip

Il est facile d'expliciter sur l'exemple de la droite projective le diviseur d'une fonction. Le corps des fonctions est le corps des fonctions rationnelles en $x$ et on peut écrire
$$f=a\prod_{i=1}^r(x-a_i)^{m_i},$$
avec des $a_i$ distincts et $m_i\in\Z$. Le support de $\divv(f)$ contient naturellement les points $P_i=(a_i,1)$ et (éventuellement) le point à l'infini
$\infty=(1,0)\in\P^1$ dont la multiplicité est $ -\deg f=-\sum_im_i$ en effet si on pose $t=1/x$ alors $t$ est un paramètre local en $\infty$ et
$$f=a\prod_{i=1}^r(t^{-1}-a_i)^{m_i}=at^{-\deg f} \prod_{i=1}^r(1-a_it)^{m_i}.$$
On vérifie donc bien l'égalité
$$\deg \divv(f)=\deg\bigg(\sum_{i=1}^rm_i[P_i]-\deg(f)[\infty]\bigg)= \sum_{i}m_i-\deg f=0.$$
On peut aussi explicitement calculer l'espace
$$L(m[\infty]):=\{f\in K(x)\mid \divv(f)+m[\infty]\geq 0\}.$$
Lorsque $m\geq 0$, il s'agit des polynômes de degré $\leq m$, on retrouve ainsi $\ell(m[\infty])=m+1$ et donc $g=0$ dans le théorème de Riemann-Roch. Plus généralement
$\ell(D)=0$ si $\deg(D)<0$ et comme on peut toujours écrire
\begin{align*}
D=\sum_im_i[P_i]&= \sum_im_i[P_i]- \Big(\sum_im_i\Big)[\infty] +\Big(\sum_im_i\Big)[\infty]\\
&=\divv(f)+\deg(D)[\infty],
\end{align*}
un diviseur $D$ est équivalent à $\deg D[\infty]$ et donc
$$\ell(D)=\deg D+1,\quad \text{si }\deg D\geq 0.$$

\smallskip

Le \textit{genre} d'une courbe algébrique est son invariant le plus important, la première définition vient de la topologie: si $C$ est une \og courbe\fg algébrique définie sur le corps des complexes et si la courbe est lisse, l'ensemble de ses points complexes forme (sic) une \og surface de Riemann\fg et si la courbe est projective, la surface de Riemann asso\-ciée est compacte. La topologie nous apprend qu'une surface compacte a la forme d'un \og tore à $g$ trous\fg, l'invariant $g$ est bien le \og genre\fg (voir \cite{pop}). Le théorème de Riemann-Roch permet de donner une définition purement algébrique du genre.

Par exemple, le genre d'une courbe plane lisse de degré $d$ est
\[
g=\frac{(d-1)(d-2)}{2}\,;
\]
si l'on considère une courbe plane projective quelconque, l'ensemble~$S$ de ses points singuliers est fini et on peut attacher à chaque point $P\in S$ une mesure de sa singularité $\delta(P)\geq 1$ telles que
$$g=\frac{(d-1)(d-2)}{2}-\sum_{P\in S}\delta(P).$$
Par exemple
le genre d'une courbe $y^d=f(x)$ avec $f$ séparable de degré $e$ et $\mathrm{pgcd}(d,pe)=1$ est $g=\sfrac{(d-1)(e-1)}{2}$. Ainsi pour une courbe
d'équation affine $y^2=f(x)$ avec $p\neq 2$ et $f$ un polynôme séparable de degré impair $d$, on trouve $g=\sfrac{(d-1)}{2}$. L'équation homogène est
$Z^{d-2}Y^2=Z^df(X/Z)$ et il y a un seul point à l'infini $\infty=(0,1,0)$. Pour $d=3$ le point à l'infini est lisse et le genre égal à~$1$; pour $d>3$, le point $\infty$ est singulier et $\delta(\infty)=\sfrac{(d-1)(d-3)}{2}$.

\subsection{Le Frobenius}
Le \og Frobenius\fg $x\mto x^q$ peut être étendu en un morphisme $\Phi:\P^n\to\P^n$, encore appelé Frobenius, défini par $\Phi(x_0,\dots,x_n):=(x_0^q,\dots,x_n^q)$. Le calcul simple suivant est essentiel dans la preuve du lemme ci-dessous. Si $F=\sum_ia_ix^i\in\F_q[X_0,\dots,X_n]$ est un polynôme à coefficients dans $\F_q$ alors
\begin{align*}F(x_0,\dots,x_n)^q:=\Big(\sum_ia_ix^i\Big)^q&=\sum_ia_i^qx^{iq}\\
&=\sum_ia_ix^{iq}=F(x_0^q,\dots,x_n^q).\end{align*}
\begin{lemme}\label{frob} Soit $V$ une sous-variété de $\P^n$ définie sur $\F_q$. Alors $\Phi$ induit un endomorphisme de $V$, noté $\Phi_V:V\to V$. De plus, l'ensemble des points $\F_q$\nobreakdash-ration\-nels est l'ensemble des points fixes du \hbox{Frobenius}~$\Phi_V$, c'est-à-dire
\begin{equation*}
V(\F_q)=\left\{x\in V(\bar{F}_q)\mid\Phi_V(x)=x\right\}.
\end{equation*}
\end{lemme}

En effet si $F_1(x)=\dots=F_t(x)=0$ est un ensemble d'équations à coefficients dans $\F_q$ définissant $V$, on a, pour tout $P=(x_0,\dots,x_n)\in\nobreak V(\bar{F}_q)$, l'égalité
$F_i(\Phi(P))=F_i(x_0,\dots,x_n)^q=0$ donc $\Phi(P)\in V$. Pour la deuxième affirmation, on peut choisir une coordonnée égale à $1$ et l'assertion découle de la propriété des corps finis rappelée: $x^q=x$ équivaut à $x\in\F_q$. Si $P\in V$, on a donc $\Phi(P)=P$ si et seulement si $P\in V(\F_q)$ ou plus généralement $\Phi^m(P)=P$ si et seulement si $P\in V(\F_{q^m})$.

\backmatter
\bibliographystyle{jepalpha+eid}
\bibliography{xups12-02}
\end{document}