\documentclass[XUPS,XML,SOM,Unicode,francais, NoFloatCountersInSection]{cedram}
\graphicspath{{xups23-03_figures}}
\setcounter{tocdepth}{2}
\tochyphenpenalty0

%\XUPScorrections

\def\bq{\def\baselinestretch{.95}\normalfont\begin{quotation}\!\!\smaller \itshape}
\def\eq{\normalsize\end{quotation}\def\baselinestretch{1.1}\normalfont\par\smallskip}

\usepackage{stmaryrd, mathtools}
\mathtoolsset{showonlyrefs}
\usepackage{graphicx}

\theoremstyle{plain}
\newtheorem{thm}{Théorème}[section]
\newtheorem{cor}[thm]{Corollaire}
\newtheorem{pro}[thm]{Proposition}
\newtheorem{lem}[thm]{Lemme}

\theoremstyle{definition}
\newtheorem{defi}[thm]{Définition}
\newtheorem{que}{Question}[section]
\newtheorem{exemple}[thm]{Exemple}
\newtheorem{rem}[thm]{Remarque}
\newtheorem{exo}[thm]{Exercice}

\newcommand\C{\mathbf{C}}
\newcommand\R{\mathbf{R}}
\newcommand\Q{\mathbf{Q}}
\newcommand\Z{\mathbf{Z}}
\newcommand\N{\mathbf{N}}
\newcommand\bfF{{\mathbf{F}}}
\newcommand\bfK{\mathbf{K}}
\newcommand\bfL{\mathbf{L}}

\let\AV R

\newcommand\Mat{{\mathrm{Mat}}}
\newcommand\Pas{{\mathrm{Pas}}}
\newcommand\Orb{{\mathrm{Orb}}}

\newcommand\bfe{{\boldsymbol{e}}}
\newcommand\bfv{{\boldsymbol{v}}}
\newcommand\bfk{\boldsymbol{k}}
\newcommand\bfu{\boldsymbol{u}}
\newcommand\vx{{\boldsymbol{x}}}
\newcommand\vt{{\boldsymbol{t}}}
\newcommand\vs{{\boldsymbol{s}}}

\newcommand\val{\mathrm{v}}

\DeclarePairedDelimiter\floor{\lfloor}{\rfloor}
\DeclarePairedDelimiter\av{\vert}{\vert}
\DeclarePairedDelimiter\norm{\Vert}{\Vert}
\DeclarePairedDelimiter\card{{\mathrm{card}}(}{)}
\DeclarePairedDelimiter\set{{\{}}{{\}}}
\newcommand\tq{{\; ; \;} }

\DeclareMathOperator\GL{{\mathsf{GL}}}
\DeclareMathOperator\U{{\mathsf{U}}}
\DeclareMathOperator\End{{\mathsf{End}}}
\DeclareMathOperator\Bij{{\mathsf{Bij}}}
\DeclareMathOperator\Id{{\mathsf{Id}}}
\DeclareMathOperator\Diff{{\mathsf{Diff}}}
\DeclareMathOperator\Aut{{\mathsf{Aut}}}
\DeclareMathOperator\ii{{\mathsf{i}}}

\DeclareMathOperator\Ker{Ker}
\DeclareMathOperator\Frac{{\mathrm{Frac}}}
\DeclareMathOperator\dist{dist}

\newcommand\bbA{{\mathbb{A}}}\let\A\bbA


\begin{document}
\frontmatter

\title[Skolem-Mahler-Lech]
{Le théorème de Skolem, Mahler et~Lech}
\author[\initial{S.} \lastname{Cantat}]{\firstname{Serge} \lastname{Cantat}}
\address{Univ Rennes, CNRS, IRMAR - UMR 6625, F-35000 Rennes, France}
\email{serge.cantat@univ-rennes1.fr}
\urladdr{https://perso.univ-rennes1.fr/serge.cantat/}

\thanks{Journées X-UPS 2023. Promenades dans le monde non archimédien. Éditions de l'École polytechnique, 2023. Recherche soutenue par l’Union Européenne (ERC GOAT 101053021)}

\begin{abstract}
Ces notes constituent une version étendue et complétée du cours délivré à l'École polytechnique les 20 et 21 avril 2023,
le cours étant principalement tourné vers la démonstration du théorème de Skolem, Mahler et Lech, y compris dans un cadre non linéaire obtenu par Jason Bell.
\end{abstract}
\maketitle
\vspace*{-1\baselineskip}\enlargethispage{\baselineskip}
{\let\\ \relax\tableofcontents}
\mainmatter

\section*{Introduction: les temps de passage}

Soit $X$ un ensemble. Les permutations de $X$ forment un groupe pour la composition; nous le noterons $\Bij(X)$. Si $f\in\Bij(X)$ les puissances
$f^n$ sont donc obtenues par composition; ainsi, $f^0=\Id_X$ est l'identité, $f^{-1}$ est l'inverse de $f$, et $f^{n+1}=f\circ f^n$ pour tout $n\in \Z$.

Soit $z$ un élément de $X$. L'{\emph{orbite}} de $z$ sous l'action de $f$ est la suite $z_n=f^n(z)$, avec $n\in \Z$; l'orbite est donc ici considérée comme une suite paramétrée par un temps discret $n\in \Z$. L'ensemble $\Orb_f(z):=\{f^n(z)\tq n\in \Z\}$ sera aussi appelé orbite de $z$ pour $f$.
L'orbite de $z$ est {\emph{périodique}} s'il existe un entier $q\geq 1$ tel que $f^{n+q}(z)=f^n(z)$ pour tout $n\in \Z$; on dit alors que $q$ est une période de $z$.
De manière équivalente, l'orbite de $z$ est périodique si $\Orb_f(z)$ est un ensemble fini. Si $k$ désigne le cardinal de $\Orb_f(z)$, $k$ est la plus petite période de $z$; on dit alors que $k$ est la période de $z$.

Si $W$ est un sous-ensemble de $X$, l'ensemble des {\emph{temps de passage}} de $z$ dans $W$ est, par définition, l'ensemble des entiers
\begin{equation}
\Pas_f(z;W)=\set{n\in \Z\tq f^n(z)\in W };
\end{equation}
l'ensemble des temps de passage positifs est
\[
\Pas_f^+(z;W)=\set{n\in \N\tq f^n(z)\in W }.
\]

Les temps de passage peuvent former un sous-ensemble quelconque de $\Z$. En effet, soit $T$ un tel sous-ensemble. Choisissons $X=\Z$,
$f\colon X\to X$ la translation $s\mapsto s+1$ et $W=T$. Alors $\Pas_f(0;W)=T$.

Lorsque $X$ est un espace vectoriel complexe, $f\colon X\to X$ est une transformation linéaire, et $W$ est un sous-espace vectoriel, le théorème de Skolem, Mahler et Lech stipule que $\Pas_f(z;W)$ est une union \hbox{finie} de progressions arithmétiques (voir le paragraphe~\ref{par:transformations_algébriques} ci-dessous). Le~but principal de ce texte est de décrire comment l'analyse $p$-adique permet de montrer un tel énoncé, y compris dans le cadre plus général, non linéaire, où $f$ est une transformation polynomiale de l'espace affi\-ne qui est inversible et dont l'inverse est aussi polynomiale. Aupa\-ra\-vant, un peu en guise d'échauffement, un peu pour introduire d'autres méthodes issues de la théorie ergodique, nous analyserons une situation plus générale qui apparaît fréquemment en sciences physiques.

\section{Théorèmes de récurrence}\label{par:recurrence}

\bq
Ce paragraphe présente le cas, maintenant classique, où $f$ préserve une mesure de probabilité et $A$ est un ensemble de mesure strictement positive: nous verrons que l'ensemble $\Pas_f(z;A)\subset \Z$ a une densité strictement positive, ceci pour presque tout point $z$.
\eq

\subsection{Le théorème de récurrence de Poincaré} Supposons que~$X$ est muni d'une tribu $\mathcal{T}$ et d'une mesure de probabilité $\mu$, et que $f\colon X\to X$ est une application mesurable qui préserve $\mu$. Ceci signifie que \begin{equation}
\mu(f^{-1}(A))=\mu(A)
\end{equation}
pour tout $A\in \mathcal{T}$ (il n'est pas nécessaire de supposer $f$ inversible pour l'instant).

\begin{exemple} Soit $X\subset \R^2$ le carré $[-1/2,1/2]^2$, muni de la tribu des ensembles boréliens et de la mesure de Lebesgue. Soit $\bfv\colon \R^2\to \R^2$ un champ de vecteurs de classe $C^\infty$ qui est nul en dehors de~$X$.
En résolvant l'équation différentielle
\begin{equation}
\gamma^{\,}{'}(t)=\bfv(\gamma(t)),
\end{equation} avec la condition initiale $\gamma(0)=z\in X$, on obtient une courbe $\gamma_z\colon\R\to \R^2$ tracée dans $X$. Fixons $t\in \R$, et notons $\Phi_t(z)$ l'application qui, à $z\in X$, associe $\gamma_z(t)$; ceci définit un homéomorphisme $\Phi_t\colon X\to X$ (de classe $C^\infty$). Si $\bfv$ est à divergence nulle, ces homéomorphismes préservent tous la mesure de Lebesgue. Pour construire des exemples, il suffit donc de construire des champs de vecteurs à divergence nulle. Dans le disque de centre $(0,0)$ et de rayon $r<1/2$, on peut prendre $\bfv(x,y)=h(x^2+y^2)(y,-x)$, où $s\in \R\mapsto h(s)\in \R$ est de classe $C^\infty$ et est nulle si $\av{s} \geq r$; en changeant la fonction~$h$, le~centre du disque, et son rayon, on construit ainsi de nombreux homéomorphismes du carré préservant l'aire, que l'on peut ensuite composer entre eux pour construire de nouveaux exemples d'homéomorphismes du carré préservant la mesure de Lebesgue.\end{exemple}

Soit $A$ un élément de $\mathcal{T}$. Nous dirons que $B$ est de {\emph{mesure totale}} dans $A$ si $B\in \mathcal{T}$, $B\subset A$ et $\mu(B)=\mu(A)$.

\begin{thm}[de récurrence de Poincaré] Soit $(X,\mathcal{T})$ un ensemble mesurable, muni d'une mesure de probabilité $\mu$. Soit $f\colon X\to X$ une application mesurable préservant $\mu$. Si $A\in \mathcal{T}$, il existe un sous-ensemble $A_\infty$ de mesure totale dans $A$ tel que
pour tout $z\in A_\infty$, l'ensemble $\Pas_f^+(z,A_\infty)$ est infini.
\end{thm}

Montrons tout d'abord que l'orbite positive de presque tout $z\in A$ revient au moins une fois visiter $A$.
Pour cela, considérons l'ensemble $B\in \mathcal{T}$ défini par
\begin{equation}
B=\set{z\in A\tq f^n(z)\notin A, \, \forall n\geq 1}\, ;
\end{equation}
il s'agit de montrer que $\mu(B)=0$. Par définition, $f^{-j}(B)\cap B=\emptyset$ pour tout $j\geq 1$, donc $f^{-m}(B)\cap f^{-n}(B)=\emptyset$ pour tous $m\neq n\geq 0$; autrement dit, les $f^{-n}(B)$ sont deux à deux disjoints. La mesure de $\bigcup_{n\geq 0} f^{-n}(B)$ est donc égale à la somme des $\mu(f^{-n}(B))$, si bien que $\sum_{n\geq 1} \mu(f^{-n}(B))\leq \mu(X)=1$. Mais $\mu(f^{-n}(B))=\mu(B)$ pour tout $n$ car $f$ préserve $\mu$, donc $\mu(B)=0$.

Reprenons cet argument en fixant un entier $N\geq 1$ et en notant~$B_N$ l'ensemble défini par
\begin{equation}
B_N=\set{z\in A\tq f^n(z)\notin A, \, \forall n\geq N};
\end{equation}
le cas $N=1$ correspond à l'ensemble $B$ étudié ci-dessus. Alors
\[
f^{-Nj}(B_N)\cap B_N=\emptyset
\]
pour tout $j\geq 1$, donc $f^{-Nm}(B_N)\cap f^{-Nn}(B_N)=\emptyset$ pour tous $m\neq n\geq 0$. On en déduit comme précédemment que l'ensemble $A_N$ des points de $A$ dont l'orbite revient dans $A$ après $N$ itérations est de mesure totale. L'intersection $A_\infty$ des $A_N$ pour $N\geq 1$ est exactement l'ensemble des $z\in A$ dont l'orbite passe une infinité de fois dans $A$.
Et $\mu(A_\infty)=\mu(A)$ parce que $\mu(A\setminus A_N)=0$ pour tout~$N$.

Si $z\in A_\infty$ et $f^s(z)\in A$ alors $f^s(z)$ appartient en fait à $A_\infty$, car l'orbite de $z$ doit passer une infinité de fois dans $A$ après l'instant $s$. Les retours successifs de $f^n(z)$ dans $A$ s'effectue donc en fait dans~$A_\infty$, et le théorème est établi.

Pour $z\in A_\infty$, nous noterons $r_A(z)$, le plus petit entier $r \geq 1$ tel que $f^r(z)\in A$; c'est le premier {\emph{temps de retour}} de $z$ dans $A$.
On vérifie que l'ensemble
\begin{equation}
A_\infty(s)=\set{z\in A_\infty\tq r_A(z)=s}
\end{equation}
appartient à $\mathcal{T}$ et que les $A_\infty(s)$ forment une partition de $A_\infty$.

\subsection{Espérance du temps de retour, densité des temps de passage} Nous dirons que $B\subset X$ est {\emph{$f$-invariant}} si $f^{-1}(B)=B$, et que $\mu$ est {\emph{ergodique}} pour l'action de $f$ si tout
sous-ensemble invariant $B\in \mathcal{T}$ est de mesure nulle ou totale, \ie $\mu(B)=0$ ou $1$ (voir~\cite{CoudeneBook, FurstenbergBook} pour des exemples de transformations et mesures ergodiques).

\begin{thm}[de Rokhlin sur la moyenne des temps de retour]\label{thm:rokhlin} Soit $(X,\mathcal{T})$ un ensemble mesurable muni d'une mesure de probabilité $\mu$. Soit $f\colon X\to X$ une bijection bimesurable préservant $\mu$, pour laquelle $\mu$ est ergodique. Si $A\in \mathcal{T}$ et $\mu(A)>0$, la moyenne des temps de retour $r_A(z)$, pour $z\in A$, est l'inverse de la mesure de $A$:
\[
\frac{1}{\mu(A)}\int_A r_A(z)d\mu(z)=\frac{1}{\mu(A)}.
\]
\end{thm}

Pour obtenir cette formule, conservons les notations employées au paragraphe précédent.
Pour $0\leq n \leq s-1$, les éléments de $f^n(A_\infty(s))$ sont exactement les $z$ tels que $f^{-n}(z)$ est dans~$A_\infty$, $f^{s-n}(z)$ est dans~$A_\infty$, et aucun des $f^{k}(z)$ n'est dans~$A_\infty$ pour $-n< k < s-n$. Ces ensembles sont donc disjoints:
\begin{equation}
f^{n}(A_\infty(s))\cap f^{m}(A_\infty(r))=\emptyset
\end{equation}
si $0\leq n\leq s-1$, $0\leq m\leq r-1$, et $(n,s)\neq (m,r)$. Les $f^n(A_\infty(s))$, avec $s\geq 1$ et $0\leq n \leq s-1$, forment donc une partition de $A':=\bigcup_{n\geq 0} f^n(A_\infty)$. Par construction, $f(A')\subset A'$; puisque $f$ est inversible et préserve $\mu$, nous en déduisons que $f(A')=A'$ à un ensemble de mesure nulle près; par ergodicité, nous obtenons $A'=X$, à un ensemble de mesure nulle près. Donc
\begin{equation}
\begin{aligned}
1=\mu(A')&=\sum_{0\leq n<s} \mu(f^n(A_\infty(s)))\\
&= \sum_{s} s \mu(A_\infty(s)) = \int_A r_A(z)d\mu(z),
\end{aligned}
\end{equation}
ce qu'il fallait démontrer.

Considérons l'application $f_A\colon A_\infty\to A_\infty$ définie par les premiers retours: si $z\in A_\infty$, alors $f_A(z)=f^{r_A(z)}(z)$; de manière équivalente,
\begin{equation}
f_A(z)=f^s(z) \quad \text{si} \quad z\in A_\infty(s).
\end{equation}
En utilisant comme ci-dessus la partition de $A_\infty$ en les $A_\infty(s)$, on vérifie facilement que $f_A$ préserve la mesure de probabilité
\begin{equation}
\mu_A=\frac{1}{\mu(A_\infty)}\,\mu_{\vert A_\infty}
\end{equation}
et que $\mu_A$ est ergodique pour l'action de $f_A$ (car $\mu$ est supposée ergodique).

Les passages successifs de l'orbite de $z$ dans $A$ correspondent aux points suivants: d'abord $f_A(z)$ à l'instant $r_1(z)=r_A(z)$,
puis $f_A^2(z)$ à l'instant $r_1(z)+r_2(z)$ avec $r_2(z)=r_A(f_A(z))$, puis $f_A^3(z)$ à l'instant $r_1(z)+r_2(z)+r_3(z)$ avec $r_3(z)=r_A(f_A^2(z))$, etc.
Ainsi, le $n$-ème temps de passage dans $A$ est
\begin{equation}
r_A(z;n)=\sum_{j=0}^{n-1} r_A(f_A^j(z)).
\end{equation}
Le théorème ergodique de Birkhoff\footnote{La démonstration du théorème de Birkhoff est nettement plus ardue que celle des théorèmes de Poincaré et Rokhlin; voir~\cite{CoudeneBook}.} montre que
\begin{equation}
\lim_{n\to +\infty}\frac{1}{n}r_A(z;n)=\int_A r_A(z)d\mu_A(z)
\end{equation}
pour presque tout $z$ (c'est-à-dire pour $z$ dans un sous-ensemble $A_\infty$ de mesure $1$ pour $\mu_A$). Avec le théorème de Rokhlin,
nous obtenons l'énoncé suivant: {\emph{pour presque tout $z\in A$, le $n$-ème temps de passage de l'orbite de $z$ dans $A$ est de l'ordre de $n/\mu(A)$;
le nombre d'instants $n\leq N$ pour lesquels $f^n(z)\in A$ est donc comparable à $N\mu(A)$ lorsque~$N$ est grand}}.

Dans $\Pas^+_f(z;A)$, on peut alors trouver des progressions arithmétiques de longueur arbitraire : voir~\cite{FurstenbergBook} et~\cite{FurstenbergBAMS} pour l'interaction entre théorie ergodique, temps de passage, et étude des sous-ensembles $T\subset\N$ de densité positive.

\begin{exemple}[{\cite[\S3]{FurstenbergBAMS}}]
Soit $q$ un réel $>4$. Soit
\begin{equation}
T=\set{r_1 < r_2 < \cdots < r_n < \ldots}
\end{equation}
une suite d'entiers $\geq 1$ telle que $r_{n+1}\geq q r_n$.
Considérons le cercle $X=\R/\Z$, l'intervalle $I:=[1/3; 2/3] \subset \R/\Z$ et les sous-ensembles~$\Lambda_n$ de $\R/\Z$ définis par
\begin{equation}
\Lambda_n=\set{t\in \R/\Z\tq r_nt\in I}.
\end{equation}
La longueur de $I$ est $1/3$, donc $\Lambda_n$ est constitué de $r_n$ intervalles fermés de longueur $(3r_n)^{-1}$ qui sont répétés périodiquement avec pério\-de $r_n^{-1}$; par exemple, si $r_n$ était égal à $5$, on aurait les $5$ intervalles $J_1=[1/15; 2/15]$, $J_2=J_1+1/5$, $\ldots$, jusqu'à $J_5=J_1+4/5=[13/15; 14/15]$.

Comme $r_{n+1}> 4 r_n$, chacun des intervalles constituant $\Lambda_n$ contient au moins un des intervalles constituant $\Lambda_{n+1}$ donc l'intersection $\Lambda$ des compacts $\Lambda_n$ n'est pas vide. Soit $\lambda$ un élément de $\Lambda$ et $f\colon X\to X$ la translation
$f(t)=t+\lambda$; elle préserve la mesure de Lebesgue $\mu=dt$. Soit $A\subset X$ un intervalle de longueur $<1/6$. Alors $f^{r}(A)=A+r\lambda$, donc si $t\in A$ et $f^{r}(t)\in A$, alors
$t+r\lambda$ et $t$ sont à distance $< 1/6$; comme $r_n\lambda\in [1/3, 2/3]$, ceci montre que $f^{r_n}(A)\cap A$ est vide pour tout $n$.

Ainsi, l'ensemble lacunaire $T$ est disjoint de $\Pas_f(t;A)$ pour tout $t\in A$.
Par contre, si l'on considère un sous-ensemble
\[
S=\set{s_1< s_2 < \cdots < s_n < \cdots}
\]
de $\N$ et l'ensemble $D=\set{s_j-s_i\tq s_i < s_j \in S}$, alors pour toute transformation $f\colon X\to X$ comme dans le théorème~\ref{thm:rokhlin} et toute partie $A\subset X$ de mesure positive, il existe un entier $d\in D$ et une partie $A'\subset A$ de mesure positive telle que $f^d(A')\subset A$. Ainsi, $D$~contient toujours des temps de retour de $A$ dans $A$.
\end{exemple}

\section{Transformations algébriques et arithméticité des temps de passage}\label{par:transformations_algébriques}

\bq
Nous énonçons maintenant le théorème de Skolem, \hbox{Mahler} et Lech, ainsi que la version non linéaire -- mais polynomiale -- obtenue par Bell (voir~\cite{Skolem1934, Mahler1956, Lech1953} et~\cite{Bell2006, Bell-Ghioca-Tucker2010}).
\eq

\begin{thm}[de Skolem, Mahler, et Lech] Soit $V$ un espace vectoriel complexe de dimension finie. Soit $f\colon V\to V$ une application linéaire inversible. Si $z\in V$ et si $W$ est un sous-espace de $V$, l'ensemble des temps de passage $\Pas_f(z;W)$ est une union finie de progressions arithmétiques.
\end{thm}

Ceci signifie qu'il existe un ensemble fini de couples $(a_i, r_i)\in \Z\times \Z$, $i\in I$, tels que
\begin{equation}
\Pas_f(z;W)=\bigcup_{i\in I} \set{a_i+nr_i\tq n\in \Z}.
\end{equation}
Chaque $\set{a_i+nr_i\tq n\in \Z}$ est une progression arithmétique, dont la raison $r_i$ peut-être nulle; l'ensemble $\Pas_f(z;W)$ est infini si et seulement si $r_i\neq 0$ pour au moins un $i$.

Un énoncé analogue vaut encore sans supposer $f$ inversible si l'on restreint l'étude aux temps de passage positifs; dans ce cas, les progressions arithmétiques sont de la forme $\set{a_i+nr_i\tq n\in \N}$, avec les~$a_i$ et~$r_i$ dans $\N$. En effet, le sous-espace
\begin{equation}
V'=\bigcap_{n\geq 0}f^n(V)=\bigcap_{n=0}^{\dim(V)} f^n(V)
\end{equation} est un sous-espace strict de $V$, $f(V')=V'$ et $f_{\vert V'}\colon V'\to V'$ est inversible.
De plus $f^{n}(z)\in V'$ pour tout $n\geq \dim(V)$, donc le théorème de Skolem, Mahler et Lech peut être appliqué à $f_{\vert V'}$, $W\cap V'$ et $f^{\dim(V)}(z)$ pour conclure que $\Pas_f^+(z; W)$ est une union finie de progressions arithmétiques.

\begin{cor} Si $(u(n))_{n\geq 0}$ est une suite de nombres complexes définie par une relation de récurrence linéaire
\[
u(n+m)=\alpha_0 u(n)+\alpha_1u(n+1)+\cdots+\alpha_{m-1}u(n+m-1)
\]
et des conditions initiales $u(0)=z_0,\dots,u(m-1)=z_{m-1}$, alors $\set{n\in \N\tq u_n=0}$
est une union finie de progressions arithmétiques.
\end{cor}

\begin{proof} Notons $V$ l'espace $\C^m$, $(\vx_1, \ldots, \vx_m)$ les coordonnées et $z=(z_0, \ldots, z_{m-1})$.
Les vecteurs
\[
\bfu(n)=(u(n), u(n+1), \ldots, u(n+m-1))
\]
vérifient la relation de récurrence $\bfu(n+1)=M\bfu(n)$, où $M$ est la matrice compagnon
dont les $m-1$ premières lignes sont $(0,1,0, \ldots, 0)$, $(0,0,1,0\ldots, 0)$, $\ldots$, et $(0,0, \ldots, 0, 1)$ et la dernière ligne est
$(\alpha_0, \alpha_1, \ldots, \alpha_{m-1})$. Ainsi, en notant $W$ l'hyperplan d'équation $\vx_1=0$, $\set{n\tq u(n)=0}$ coïncide avec $\Pas_M(z;W)$.
\end{proof}

Un inconvénient du théorème de Skolem, Mahler et Lech est l'absence d'effectivité du résultat. Le {\emph{problème de Skolem}} est le suivant: \emph{existe-t-il un algorithme qui, étant donnée une suite $(u_n)$ défi\-nie par une relation de récurrence linéaire à coefficients entiers et une condition initiale, détermine si, oui ou non, $u_n$ s'annule pour au moins un $n\in \N$?} À l'heure actuelle, ce problème est encore ouvert (voir~\cite{Tao, BellSurvey}).

Pour décrire le théorème de Jason Bell, quelques notions de géométrie algébrique sont nécessaires.

Soit $\bfK$ un corps.
Soit $\A^m$ l'espace affine de dimension $m$ sur $\bfK$, muni d'un jeu de coordonnées affines $(\vx_1, \ldots, \vx_m)$ fixé une fois pour toutes.
Si $f_1$, $f_2,\dots,f_m$ sont des polynômes à coefficients dans $\bfK$ en les variables $(\vx_1, \ldots, \vx_m)$,
l'application $f\colon \A^m\to \A^m$ définie par
\begin{equation}
f(\vx_1, \ldots, \vx_m)=(f_1(\vx_1, \ldots, \vx_m), \ldots, f_m(\vx_1, \ldots, \vx_m))
\end{equation}
est, par définition, un endomorphisme (polynomial) de l'espace affine. Si les coefficients des $f_i$ sont dans un sous-anneau $R$ de $\bfK$, on dit que~$f$ est un {\emph{endomorphisme}} défini sur $R$; on note alors $f\colon \A^m_R\to \A^m_R$, ou $f\in \End(\A^m_R)$. La composition $f\circ g$ de deux éléments de $\End(\A^m_R)$ est encore un élément de $\End(\A^m_R)$. Les éléments inversibles de $\End(\A^m_R)$ pour cette loi de composition sont, par définition, les {\emph{automorphismes}} de $\A^m_R$; ils forment un groupe, noté $\Aut(\A^m_R)$.

Nous noterons $\A^m(R)\simeq R^m$ l'ensemble des points de l'espace à coordonnées dans $R$. Le groupe $\Aut(\A^m_R)$ agit par permutations sur l'ensemble $\A^m(R)$; on obtient ainsi un homomorphisme de groupes $\Aut(\A^m_R)\to \Bij(R^m)$.

\begin{exemple} Lorsque $m=1$, les endomorphismes de $\A^1_\R$ sont exactement les polynômes univariés à coefficients dans $R$. Les automorphismes sont des polynômes de degré $1$, car la relation $f\circ g(\vx)=\vx$ entraîne $\deg(f)\deg(g)=1$. Un polynôme $f(\vx)=a\vx+b$ de degré $1$ est un élément de $\Aut(\A^1_R)$ si, et seulement si $a$ est inversible dans~$R$; par exemple, $f(\vx)=2\vx+3$ est un élément de $\Aut(\A^1_\Q)$ mais pas de $\Aut(\A^1_\Z)$.
\end{exemple}

\begin{exemple}\label{eg:automorphismes_m=2} Si $m=2$ et $P\in R[\vx_1]$, l'application $(\vx_1,\vx_2)\mapsto (\vx_1, \vx_2+P(\vx_1))$ est un automorphisme de $\A^m_R$. Ainsi, les degrés des formules définissant les automorphismes de $\A^m_R$ sont quelconques. \end{exemple}

Un sous-ensemble $W$ de $\A^m(\bfK)$ est dit {\emph{algébrique}} s'il existe des polynômes $P_i\in \bfK[\vx_1, \ldots, \vx_m]$ tels que
\[
W=\set{(z_1,\ldots, z_m)\in \bfK^m\tq P_i(z_1, \ldots, z_m)=0\; \forall i}
\]
(l'anneau $\bfK[\vx_1, \ldots, \vx_m]$ étant noethérien, on peut toujours supposer que $W$ est défini par un nombre fini d'équations, voir~\cite{LangAlgebra}).

\begin{thm}[de Bell sur l'arithméticité des temps de passage]\label{thm:Bell} Soit $f$ un automorphisme de l'espace affine complexe~$\A^m_\C$. Soit $W$ un sous-ensemble algébrique de $\A^m$.
Soit $z$ un point de $\A^m(\C)$. Alors l'ensemble des temps de passage $\Pas_f(z;W)$ est une union finie de progressions arithmétiques.
\end{thm}

Cet énoncé contient celui de Skolem, Mahler et Lech en prenant pour $f$ un automorphisme linéaire et pour $W$ un sous-espace vectoriel.

\begin{exemple} Soit $P(\vx_2,\vx_3)$ un polynôme de deux variables à coefficients complexes. Soit $(u(n))_{n\geq 0}$ la suite définie par les conditions initiales $u(0)=x_0$, $u(1)=y_0$, $u(2)=z_0$ et la relation de récurrence
\begin{equation}
u(n+3)=u(n)+P(u({n+1}),u({n+2})).
\end{equation} Cette relation peut être écrite sous la forme
\begin{equation}
(u(n+1),u(n+2),u(n+3))=f(u(n),u(n+1),u(n+2))
\end{equation}
où $f(\vx_1,\vx_2,\vx_3)=(\vx_2,\vx_3, \vx_1+P(\vx_2,\vx_3))$.
Avec $W$ l'hyperplan d'équation $\vx_1=0$, le théorème de Bell montre que les indices $n$ pour lesquels $u(n)=0$ forment une union finie de progressions arithmétiques (qui dépend de $P$ et de $(x_0,y_0,z_0)$).
\end{exemple}

\begin{exemple}\label{eg:henon} Étant donnés deux nombres complexes $a$ et $b$, avec $b\neq 0$, considérons l'application
\begin{equation}
h_{a,b}(\vx_1,\vx_2)=(\vx_2+1-a\vx_1^2, b\vx_1).
\end{equation}

\noindent\begin{minipage}{0.53\textwidth}
\includegraphics[scale=0.7]{HenonMR3.png}
\end{minipage}\begin{minipage}{0.47\textwidth}\smaller\def\baselinestretch{.95}\normalfont
Cette transformation du plan est la composée de
\[(\vx_1,\vx_2)\mapsto (\vx_1, \vx_2+1-a\vx_1^2),\] qui d'après l'exemple~\ref{eg:automorphismes_m=2} est un automorphisme, et de $(\vx_1,\vx_2)\mapsto (\vx_2, b\vx_1)$, qui est un automorphi\-sme linéaire; c'est donc bien un automorphisme du plan. Son inverse est
\[(\vx_1,\vx_2)\mapsto (\vx_2/b, \vx_1-1+a\vx_2^2/b^2).\]

La figure ci-contre \cite{M-R89} montre les vingt mille premiers points de l'orbite de $z_0=(0,0)$ sous l'action de $h_{a,b}$, lorsque $a=0.2$ et $b=0.9991$.
\end{minipage}

\medskip
On peut démontrer que le degré des formules définissant $h_{a,b}^n$ est égal à $2^n$ et qu'il existe une infinité dénombrable de points $z\in \A^2(\C)$ qui ont une orbite périodique sous l'action de~$h_{a,b}$. Lorsque $a\in \R$ et $b=\pm 1$, $h_{a,b}$ préserve la mesure de Lebesgue, si bien que les techniques de la section~\ref{par:recurrence} peuvent être appliquées à $h_{a,b}$.

Si l'on applique le théorème de Bell à $h_{a,b}$, on obtient le résultat suivant: {\emph{soit $z$ un point du plan, et $W$ une courbe plane définie par une équation polynomiale; alors $\Orb_{h_{a,b}}(z)\cap W$ est fini.}} (Voir l'exemple~\ref{eg:suite-henon}). \end{exemple}

\section{Fonctions analytiques}\label{par:fonctions_analytiques}
\bq
La démonstration du théorème de Bell emploie des outils élémentaires d'analyse $p$-adique: le but de cette partie est d'introduire les notions principales qui seront utilisées par la suite. Le lecteur pourra consulter les textes d'Antoine Chambert-Loir et de Jérôme Poineau dans ce volume pour des compléments à cette partie.
\eq

\subsection{Algèbre de Tate}
Notons $\bfK$ le corps $\Q_p$, $\vert\cdot\vert$ la valeur absolue $\vert\cdot\vert_p$, et $R\subset \bfK$ l'anneau $\Z_p$.
Soit $m$ un entier $\geq 1$. L'espace affine $\bbA^m_\bfK$ est muni de ses coordonnées $(\vx_1, \ldots, \vx_m)$ et de la norme du supremum
\begin{equation}
\Vert(u_1, \ldots, u_m)\Vert_{\sup}=\max\{\vert u_i\vert\; ; \; 1\leq i \leq m\}.
\end{equation}
Les points à coordonnées dans $\AV$ forment le polydisque unité
\begin{equation}
\bbA^m(\AV)=\AV^m=\{ u\; ; \; \Vert u\Vert_{\sup}\leq 1\}.
\end{equation}

Soit $f$ un élément de $\bfK[\vx_1, \ldots, \vx_m]$. En utilisant les notations $\vx=(\vx_1, \ldots, \vx_m)$ et $\vx^I=\vx_1^{i_1}\cdots \vx_m^{i_m}$ pour tout multi-indice $I=(i_1, \ldots, i_m)\in \N^m$, on peut écrire $f$ de manière unique sous la forme
$f(\vx)=\sum_I a_I \vx^I$. La {\emph{norme de Gauss}} est alors définie par
\begin{equation}
\Vert f\Vert = \max_{I} \vert a_I\vert;
\end{equation}
c'est la norme du supremum dans la base des monômes $(\vx^I)$.
L'{\emph{algèbre de Tate}} $\bfK\langle \vx_1, \ldots, \vx_m\rangle$ est la complétion de l'algèbre des polynômes pour cette norme.

Si une suite $(f_n)$ de polynômes converge dans cette complétion, les coefficients $(a_{I,n})$ convergent individuellement vers une valeur limite $a_I\in \bfK$, car $\bfK$ est complet. Ainsi,
\begin{itemize}
\item les éléments de $\bfK\langle \vx_1, \ldots, \vx_m\rangle$ peuvent être représentés de manière unique comme des séries formelles $f\in \bfK\llbracket \vx_1, \ldots, \vx_m\rrbracket$, $f(\vx)=\sum_Ia_I \vx^I$;
\item les coefficients $a_I$ d'un élément de $\bfK\langle \vx_1, \ldots, \vx_m\rangle$ tendent vers $0$ dans~$\bfK$ lorsque la longueur $\vert I\vert := i_1+\cdots i_m$ tend vers $+\infty$ (car pour un polynôme les coefficients sont nuls si $\vert I\vert$ est suffisamment grand);
\item par complétion, la norme de Gauss s'étend à $\bfK\langle \vx_1, \ldots, \vx_m\rangle$, avec la même formule $\Vert f\Vert= \max_I\vert a_I\vert$.
\end{itemize}
Réciproquement, toute série $f(\vx)=\sum_I a_I \vx^I$ vérifiant $\lim_{\vert I\vert}\av*{a_I}=0$ est la limite des polynômes obtenus à partir de $f$ par troncature.

Notons
\begin{align}
\AV\langle \vx_1, \ldots, \vx_m\rangle &= \{ f\in \bfK\langle \vx_1, \ldots, \vx_m\rangle\; ;\; \Vert f \Vert \leq 1\} \\
&= \bigl\{\textstyle\sum_I a_I \vx^I\; ;\; \vert a_I\vert \leq 1, \; \forall I\in \N^m\bigr\} \\
&= \bigl\{\textstyle\sum_I a_I \vx^I\; ;\; a_I\in \AV, \; \forall I\in \N^m\bigr\}.
\end{align}

\begin{lem}
Une série formelle $\sum_I a_I \vx^I\in \bfK\llbracket \vx_1, \ldots, \vx_m\rrbracket$ est un élément de $\bfK\langle \vx_1, \ldots, \vx_m\rangle$ si, et seulement si $\vert a_I\vert$ tend vers $0$ lorsque $\vert I \vert$ tend vers $+\infty$, si, et seulement si la
série $\sum_I a_I z^I$ converge dans $\bfK$ pour tout $z\in \AV^m$. \end{lem}

Il suffit en effet d'observer que la série converge pour $z=(1,1,\ldots,1)$ si, et seulement si $\vert a_I\vert$ tend vers $0$ lorsque $I$ tend vers l'infini dans $\N^m$ et, dans ce cas, elle converge sur tout $\AV^m$. Voir~\cite{ACL} pour des compléments.

\begin{rem}\label{rem:Gauss_cas_ultramétrique_complet} Nous aurions pu introduire les mêmes définitions pour tout corps $\bfK$ ultramétrique complet. Notons \hbox{$\AV=\set{z\in \bfK\tq \av{z}\leq 1}$} l'anneau de valuation, $\AV^\circ=\set{z\in R\tq \av{z}<1}$ l'idéal maximal de~$R$, et $\bfk=\AV/\AV^\circ$ le corps résiduel. Si $\bfK$ est une extension de $\Q_p$ complète {\emph{dont le corps résiduel $\bfk$ est infini}} et si $f\in \bfK\langle \vx_1, \ldots, \vx_m\rangle$, alors $\Vert f\Vert = \max_{z\in \AV^m} \vert f(z)\vert$. En effet, considérons le polynôme $F(\vx)$ obtenu en ne gardant de $f$ que les monômes $a_I \vx^I$ pour lesquels $\vert a_I\vert = \Vert f\Vert$, puis écrivons $F(\vx)=a F_0(\vx)$ où $a\in \bfK$ vérifie $\vert a \vert = \Vert f\Vert$ et $F_0(\vx)\in \AV[\vx_1, \ldots, \vx_m]$. Si $f=0$, il n'y a rien à démontrer. Sinon $F_0(\vx)$ est un polynôme non nul dont tous les coefficients sont dans $\AV\setminus \AV^\circ$. Modulo~$\AV^\circ$, $F_0$ devient un polynôme non nul à coefficients dans $\bfk$; comme $\bfk$ est infini, il existe un $m$-uplet $u\in \AV^m$ tel que $F_0(u)\neq 0\bmod(\AV^\circ)$. Alors $\vert F_0(u)\vert =1$ et l'inégalité ultramétrique donne $f(u)=\Vert f\Vert$.

Lorsque $\bfK=\Q_p$, le corps résiduel $\bfF_p$ est fini; cet argument ne peut donc pas être appliqué; l'exemple suivant illustre ce fait.
\end{rem}

\begin{exemple}\label{eg:coefficients_binomiaux} Pour $k=0$, posons $B_0=1$.
Pour $k$ entier $\geq 1$, notons $B_k\in \bfK[\vx]$ le polynôme binomial défini par
\begin{equation}
B_k(\vx)= \binom{\vx }{ k} = \frac{\vx (\vx-1)\cdots (\vx-k+1)}{k !}.
\end{equation}
Ses coefficients sont rationnels et vérifient:
\begin{equation}
\quad \max_i \vert a_i\vert = \Bigl\vert \frac{1}{k !}\Bigr\vert.
\end{equation}
La valuation $p$-adique de $k!$ étant
\begin{equation}
\val_p(k !)= \floor{k/p}+\floor{k/p^2}+\cdots + \floor{k/p^n}+\cdots,
\end{equation}
nous obtenons
\begin{equation}\label{eq:estimation_valuation_de_k!}
\floor*{\frac{k}{p}} \leq \val_p(k !)\leq \frac{k}{p-1}
\end{equation}
et $\av*{\sfrac{1}{k !}}\geq p^{\floor{\sfrac{k}{p}}}$. Par ailleurs, si $z\!\in\! \N$, $B_k(z)\!\in\! \N$, donc $\av*{B_k(z)}\!\leq\! 1$; par passage à la limite,
\begin{equation}
\av*{B_k(z)}\leq 1
\end{equation}
pour tout $z\in \Z_p$. La norme de Gauss de $B_k$ est donc supérieure à $p^{\floor{\sfrac{k}{p}}}$ tandis que $\av{B_k}$ est majorée par $1$ sur le disque unité de $\Q_p$.
\end{exemple}

\begin{lem} La norme de Gauss s'étend à la $\bfK$-algèbre $\bfK\langle \vx_1, \ldots, \vx_m\rangle$ en une norme multiplicative
et ultramétrique: $\forall f, g\in \bfK\langle \vx_1, \ldots, \vx_m\rangle$, \[\Vert fg\Vert = \Vert f\Vert \Vert g\Vert\quad \text{et} \quad \Vert f+g\Vert\leq \max\{ \Vert f\Vert, \Vert g\Vert\}.\]
\end{lem}

\begin{proof}[Démonstration]
Si $f=\sum_I a_I \vx^I$ et $g=\sum_I b_I \vx^I$, et si $I$ et $J$ sont les plus petits multi-indices (pour l'ordre lexicographique) tels que $\vert a_I\vert=\Vert f\Vert$ et $\vert b_J\vert=\Vert g\Vert$, alors le coefficient $c_{I+J}$ du produit $f(\vx)g(\vx)$ vérifie $\vert c_{I+J}\vert = \Vert f\Vert \Vert g\Vert$.
\end{proof}

\subsection{Le principe des zéros isolés} L'énoncé suivant fournit une version effective du théorème des zéros isolés.

\begin{thm}[des zéros isolés de Strassman] Soit $f(\vx)=\sum_{k\geq 0}a_k\vx^k$ un élément de $\bfK\langle\vx\rangle\setminus\{0\}$.
Soit $N_f$ le plus grand indice $N$ pour lequel $\av{a_N}=\norm{f}$. Alors $f$ s'annule au plus $N_f$-fois dans le disque fermé $\AV$, les racines étant comptées avec multiplicité.
\end{thm}

Ce théorème est démontré dans~\cite{ACL} en utilisant la théorie du poly\-gone de Newton. Voici une version condensée de la démonstration, par récurrence sur~$N_f$.

Supposons d'abord $N_f=0$, ce qui signifie que $\av{a_k}<\av{a_0}=\norm{f}$ pour tout indice $k\geq 1$; l'inégalité ultramétrique montre alors que~$f$ ne s'annule pas dans~$R$. Supposons maintenant le résultat montré pour $N_f=N$ et établissons le pour $N_f=N+1$. Si $f$ a au moins une racine $z\in R$; alors
\begin{align}
f(\vx) &= f(\vx)-f(z) \\
&= \sum_{k\geq 0} a_k(\vx^k-z^k) \\
&= (\vx-z) \sum_{k\geq 1} a_k (\vx^{k-1}+z\vx^{k-2}+\cdots + z^{k-2}\vx+z^{k-1}).
\end{align}
Ainsi, $f(\vx) =(\vx-z)g(\vx)$ où la série $g(\vx)=\sum_{j\geq 0} b_j \vx^j$ est définie par
\begin{equation}
\sum_{j\geq 0} b_j \vx^j= \sum_{k\geq 1} a_k (\vx^{k-1}+z\vx^{k-2}+\cdots + z^{k-2}\vx+z^{k-1}).
\end{equation}
Le coefficient $b_j$ est une combinaison linéaire à coefficients entiers des $a_nz^m$ pour $n\geq j+1$ et $m\leq n-1$; puisque $\av{a_n}$ tend vers $0$ quand~$n$ tend vers l'infini, l'inégalité ultramétrique montre que $b_j$ est bien défini; de plus, $\av{b_j} < \norm{f}$ pour $j\geq N_f$; ainsi, $N_g<N_f$. L'hypothèse de récurrence montre donc que $g$ a au plus $N_f-1$ racines dans $R$; ainsi, $f$ s'annule au plus $N_f$ fois dans $R$.

L'entier $N_{f-a}$ est majoré par $N_{f-f(0)}$, ceci quelque soit $a$ dans $\bfK$. Le théorème de Strassman admet donc le corollaire suivant.

\begin{cor}\label{cor:corollaire_du_thm_de_strassman} Soit $f(\vx)=\sum_{k\geq 0}a_k\vx^k$ un élément non constant de $\bfK\langle\vx\rangle$.
Il existe un entier $N$ tel que $f(\vx)=a$ possède au plus $N$ solutions dans $\AV$, ceci quelque soit $a$ dans $\bfK$.
\end{cor}

\section{La méthode des différences divisées et le théorème\\ de Mahler}
\bq
Cette section est un intermède. Elle est inutile pour la suite, mais la preuve du théorème de Bell et Poonen présentée dans la section suivante repose, dans un cadre plus difficile, sur des idées comparables.
\eq

\subsection{Différences divisées de Newton} Soit $f$ un polynôme univarié de degré $d$ à coefficients dans un corps $\bfK$ de caractéristique nulle. Si l'on connaît les $d+1$ valeurs
\begin{equation}
f(0), \, f(1), \, \ldots, \, f(d-1), \, f(d)
\end{equation}
on connaît $f$, car l'espace des polynômes de degré $d$ est de dimension $d+1$. La méthode des différences divisées de Newton fournit un algorithme correspondant à cette affirmation.

Notons $\Delta$ l'opérateur de différence\footnote{Ici, l'incrément entre $\vx$ et $\vx+1$ est égal à $1$. Il n'y a donc pas de division (ou plutôt, on divise par $1$) dans notre \og méthode des différences divisées\fg .}, qui à $f(\vx)$ associe
\[
\Delta f(\vx)=f(\vx+1)-f(\vx).
\]
Les polynômes binomiaux $(B_m)_{m\geq 0}$ (voir l'exemple~\ref{eg:coefficients_binomiaux}) forment une base de l'espace vectoriel $\bfK[\vx]$ vérifiant $\Delta B_k=B_{k-1}$. Si le degré de~$f$ est égal à $d$, on peut donc écrire
\begin{equation}
f(\vx)=\sum_{k=0}^d A_k B_k(\vx)=\sum_{k=0}^d A_k \binom{\vx }{ k}
\end{equation}
avec des $A_k\in \bfK$. Remarquons que $f(0)=A_0$ car tous les $B_k$ de degré $\geq 1$ s'annulent à l'origine; ensuite, $\Delta f(0)=A_1$ car $\Delta f = \sum_{k=1}^d A_k B_{k-1}$, et ainsi de suite: $\Delta^nf(0)=A_n$ pour tout $n\geq 0$. Nous avons donc établi le théorème suivant.

\begin{thm}\label{thm:Newton}
Soit $\bfK$ un corps de caractéristique nulle. Tout polynôme $f(\vx)$ à coefficients dans $\bfK$ est une combinaison linéaire $f(\vx)=\sum_{k\geq 0} A_k B_k(\vx)$ des polynômes binomiaux. Cette écriture est unique: les $A_k$ sont donnés par
\[
A_k=\Delta^k f(0) = \sum_{j=0}^k (-1)^j \binom{k }{ j} f(k-j).
\]
\end{thm}
Supposons, par exemple, que $f$ est de degré $3$ et que ses premières valeurs sont $f(0)=2$, $f(1)=6$, $f(2)=-1$, $f(3)=5$.
En écrivant les premières valeurs de $\Delta^kf$ sur la ligne numéro $k$, avec $0\leq k\leq 3$, nous obtenons le tableau suivant
\begin{align*}
&2, \quad \quad\quad\quad 6, \quad\quad -1, \quad\quad 5, \quad\quad \ldots \\
&4, \quad\quad\quad -7, \quad\quad\quad 6, \quad\quad \ldots \\
&-11, \quad\quad 13, \quad\quad\; \ldots \\
&24, \quad\quad\quad \ldots
\end{align*}
Par exemple, les premières valeurs de $\Delta f$ sont $4=f(1)-f(0)$, $-7=f(2)-f(1)$, $6=f(3)-f(2)$. La colonne de gauche, lue de haut en bas, fournit les $A_k=(\Delta^kf)(0)$. Ainsi, $f$ étant de degré $3$, nous obtenons
\begin{equation}
f(\vx)= 2 + 4 B_1(\vx) -11 B_2(\vx) + 24 B_3(\vx).
\end{equation}
On pourra consulter~\cite{DemaillyAnaNum} pour l'intérêt de cet algorithme de Newton en analyse numérique (voir aussi~\cite{DunhamBook} pour quelques points historiques).

\subsection{Le théorème de Mahler} Un théorème de Fritz Carlson montre comment étendre le théorème~\ref{thm:Newton} du cas des fonctions polynomiales à celui des fonctions analytiques d'une variable complexe. On cherche alors à écrire la fonction analytique $f$ comme une série infinie de fonctions $f(\vx)=\sum_{k\geq 0} A_k B_k(\vx)$, les coefficients $A_k$ étant donnés par la méthode des différences divisées; il y a existence et unicité d'une telle écriture si la fonction $z\in \C\mapsto \av{f(z)}$ ne croît pas trop vite\footnote{Plus précisément, si $\av{f(z)}\leq C \exp(\alpha\av{z})$ et $\av{f(\ii y)}\leq C \exp(\beta\av{y})$ pour des constantes $C>0$, $\alpha >0$ et $0<\beta < \pi$.}.

Le théorème de Mahler, lui, étend le procédé de Newton à n'importe quelle fonction continue $f\colon \Z_p\to \Q_p$. Avant de l'énoncer, considérons les séries de fonctions $\sum_{k\geq 0} a_k B_k(\vx)$ pour des coefficients $a_k\in \Q_p$. {\textit{Une
telle série converge uniformément sur $\Z_p$ si, et seulement si $\av{a_k}_p$ tend vers $0$ lorsque $k$ tend vers $+\infty$}}. En effet, comme remarqué à l'exemple~\ref{eg:coefficients_binomiaux}, $\av{B_k}_p$ est majorée par $1$ sur $\Z_p$, donc si $(a_k)$ tend vers $0$, la série converge. Réciproquement, si la série converge uniformément, les fonctions $x\mapsto \av{a_kB_k(x)}_p$ doivent tendre uniformément vers $0$ sur $\Z_p$ lorsque $k$ tend vers $+\infty$, donc $\av{a_k}_p=\av{a_kB_k(k)}_p$ tend vers $0$.

\begin{thm}[Mahler, 1956] Soit $f\colon \Z_p\to \Q_p$ une fonction continue. Soit $(A_k)_{k\geq 0}$ la suite de nombres $p$-adiques définies par
\[
A_k=\Delta^k f(0) = \sum_{j=0}^k (-1)^j \binom{k }{ j} f(m-j).
\]
Alors $A_k$ tend vers $0$ lorsque $k$ tend vers $+\infty$ et $f(\vx)\!=\!\sum_{k=0}^{+\infty} A_kB_k(\vx)$.
\end{thm}

Nous ne démontrerons pas ce théorème (voir pour cela~\cite{RobertBook}).

\begin{rem}
Disons qu'une suite $u\colon \N\to \Q_p$ est uniformément continue si elle l'est comme application de $\N\subset \Z_p$ dans $\Q_p$: $\forall s > 0$, $\exists r>0$,pour tous $n, m \in \N$,
\begin{equation}
\text{si}\; p^r \;\text{divise}\; (n-m),\;\text{alors}\; \vert u(n)-u(m)\vert_p \leq p^{-s}.
\end{equation} Une telle suite étant donnée, il existe une unique fonction continue $f\colon \Z_p\to \Q_p$
vérifiant $f(n)=u(n)$ pour tout $n\in \N$. Le théorème de Mahler montre que cette fonction est donnée par la série $f(\vx)=\sum_{k\geq 0} A_k B_k(\vx)$ avec $A_k=\sum_{j=0}^k (-1)^j \binom{k}{j} u(k-j)$.
\end{rem}

\section{Difféomorphismes et flots analytiques du polydisque}
\bq
Nous introduisons ici le groupe des difféomorphismes analytiques de $\A^m(\Z_p)$ et la notion de flot analytique $p$-adique. Nous démontrons le théorème de Bell et Poonen, qui sera l'ingrédient clé pour démontrer le théorème~\ref{thm:Bell}.
\eq

Comme au paragraphe~\ref{par:fonctions_analytiques}, $\bfK$ désigne le corps $\Q_p$, $\av{\cdot}$ la valeur absolue $p$-adique, et $\AV$ l'anneau $\Z_p$.

\subsection{Endomorphismes et difféomorphismes} Appelons {\emph{endo\-morphisme analytique}} de $\AV^m$ (ou de $\bbA^m(\AV)$) toute application $f\colon \AV^m\to \AV^m$ qui est analytique au sens de Tate, c'est-à-dire qu'il existe des éléments $f_i(\vx)$ de $\AV\langle \vx_1, \ldots, \vx_m\rangle$ tels que
\begin{equation}
f(\vx)=(f_1(\vx), \ldots, f_m(\vx)).
\end{equation}
Nous noterons $\End\langle \AV^m\rangle$ l'ensemble de ces endomorphismes analytiques. C'est un $\AV$-module qui est stable par composition: si~$f$~et~$g$ appar\-tiennent à $\End\langle \AV^m\rangle$, alors $g\circ f$ appartient à $\End\langle \AV^m\rangle$. Les éléments inversibles de ce monoïde forment un groupe, le groupe $\Diff\langle \AV^m\rangle$ des {\emph{difféomorphismes analytiques}}; l'élément neutre est l'application identité $\Id_m(\vx_1,\ldots,\vx_m)=(\vx_1,\ldots,\vx_m)$.

\begin{lem}
Soit $g$ un élément de $\bfK\langle \vx_1, \ldots, \vx_m\rangle$. Alors $g\colon \AV^m\to \bfK$ est $\norm{g}$-lipschitzienne:
$ \av{g(x)-g(y)}\leq \norm{g} \av{x-y} $
pour toute paire $(x,y)\in \AV^m\times\AV^m$.
\end{lem}

\begin{proof}[Démonstration] Si $i\in \N^*$ et $(x,y)\in \bfK^2$ alors
\begin{align}
\av{x^i-y^i} &\leq \av*{(x-y)(x^{i-1}+x^{i-2}y+\cdots +xy^{i-2}+y^{i-1})} \\
&\leq \av*{x-y} \max\{\av{x}; \av{y}\}^{i-1},
\end{align}
ce qui montre que $x\mapsto x^i$ est $1$-lipschitzienne sur $\AV$. Si $i$ et $j$ sont des entiers positifs, et $x$, $y$, $z$, $w$ sont dans $\AV$, on obtient donc
\begin{align}
\av{x^iz^j-y^iw^j} &\leq \av*{x^i z^j - y^iz^j +y^iz^j -y^iw^j} \\
&\leq \max\{ \av{z}^j \av{x-y}, \av{y}^i \av{z-w}\} \\
&\leq \max\{ \av{x-y}, \av{z-w}\}.
\end{align}
Plus généralement, tout monôme $\vx^I$ est $1$-lipschitzien sur $\AV^m$. L'inégalité ultramétrique montre alors le résultat pour tout élément $g$ de $\AV\langle \vx_1, \ldots, \vx_m\rangle$. \end{proof}

Ce lemme implique directement le théorème suivant.

\begin{thm}
Le monoïde $\End\langle \AV^m\rangle$ et le groupe $\Diff\langle \AV^m\rangle$ agissent respectivement par transformations $1$-lipschit\-ziennes et par isométries sur $\AV^m$ pour la distance induite par $\norm{\cdot}_{\sup}$.
\end{thm}

\subsection{Morphismes de réduction}\label{par:réduction}
Les boules fermées de $\AV^m$ de rayon $\av{p}^{-s}$ sont en bijection avec les éléments de $(\AV/p^s\AV))^m =(\Z/p^s\Z)^m$ (voir~\cite{ACL}).
Si $f$ est un élément de $\Diff\langle \AV^m\rangle$, alors $f$ agit par permutation sur cet ensemble fini de boules. Voici comment décrire cette action.
En réduisant les coefficients de $f(\vx)$ modulo $p^s\AV$ on obtient une application polynomiale $\overline{f}\colon \bbA^m\to \bbA^m$ définie sur l'anneau $\Z/p^s\Z$; c'est un automorphisme polynomial de $\bbA^m_{\Z/p^s\Z}$ dont l'inverse est donné par la réduction $\overline{f^{-1}}$ de $f^{-1}$. Ceci définit un homomorphisme
\begin{equation}
\Diff\langle \AV^m\rangle\to \Aut(\bbA^m_{\Z/p^s\Z}).
\end{equation}
L'action de $\Aut(\bbA^m_{\Z/p^s\Z})$ sur les points de $\bbA^m$ à coordonnées dans $\Z/p^s\Z$ détermine un second homomorphisme
\begin{equation}
\Aut(\bbA^m_{\Z/p^s\Z})\to \Bij(\bbA^m({\Z/p^s\Z})).
\end{equation}
Par composition, nous obtenons pour chaque $s\geq 1$ un homomorphisme
\begin{equation}
\Theta_s\colon \Diff\langle \AV^m\rangle\to \Bij(\bbA^m(\Z/p^s\Z)).
\end{equation}
Alors l'action de $f\in \Diff\langle \AV^m\rangle$ sur l'ensemble des boules de $\AV^m$ de rayon $\av{p}^{s}$ coïncide avec celle
de $\Theta_s(f)$ sur $\bbA^m(\Z/p^s\Z)$. Le noyau de~$\Theta_s$ fixe chacune de ces boules; l'intersection des $\Ker(\Theta_s)$ pour $s\geq 1$ est donc réduite à~$\{\Id_m\}$. Comme $\bbA^m(\Z/p^s\Z)$ est fini, de cardinal~$p^{sm}$, nous obtenons le lemme suivant.

\begin{lem}\label{lem:diff_tate_est_residuellement_fini} Le noyau de $\Theta_s$ est d'indice fini dans $\Diff\langle \AV^m\rangle$; l'intersection de ces noyaux est réduit à $\{\Id_m\}$.
\end{lem}

\subsection{Difféomorphismes proches de l'identité} Soit $c$ un réel positif. Si $f$ appartient à $\End\langle \AV^m\rangle$, nous écrirons
\begin{equation}
f=0\mod(p^c)
\end{equation}
si, et seulement si $\norm{f}\leq \av{p}^{c}$; nous écrirons $f=g\bmod(p^c)$ si \hbox{$f-g=0\bmod(p^c)$}. Par exemple, l'application d'une variable définie par $f(\vx)=p^2+ 3\vx + 18\vx^2+ p\vx^3$ vérifie $f(\vx)= 3\vx + 18\vx^2\bmod(p)$; si $p=3$, $f(\vx)=0\bmod(p)$, et $f(\vx)=p\vx+p\vx^3\bmod(p^2)$.

\begin{lem}\label{lem:inegalites_par_composition_dans_end} Soient $g$ et $h$ des éléments de $\End\langle \AV^m\rangle$ et $f$ un élément de $\Diff\langle\AV^m\rangle$. Alors
\begin{enumerate}
\item\label{lem:inegalites_par_composition_dans_end1} $\norm{g\circ h}\leq \norm{g} \norm{h}$ et $\norm{g\circ f}= \norm{g}$;
\item\label{lem:inegalites_par_composition_dans_end2} $\norm{g\circ(\Id_m+h)-g}\leq \Vert h\Vert$;
\item\label{lem:inegalites_par_composition_dans_end3} $\norm{f^{-1}-\Id_m}= \norm{f-\Id_m}$.
\end{enumerate}
\end{lem}

\begin{proof}[Démonstration] Les coefficients des formules définissant $g\circ h$ sont des sommes de produits d'éléments $a_I$ et $b_J$ de $\AV$ dont les valeurs absolues sont respectivement majorées par $\norm{g}$ et $\norm{h}$. Dans chaque produit apparaît au moins un coefficient vérifiant $\av*{a_I}\leq \norm{g}$ et un coefficient vérifiant $\av*{b_J}\leq \norm{h}$. Comme $\norm{g}\leq 1$ et $\norm{h}\leq 1$, nous obtenons $\norm{g\circ h}\leq \norm{g} \norm{h}$.
L'égalité $\norm{g\circ f}= \norm{g}$ s'en déduit en utilisant que $\norm{f}=\norm{f^{-1}}=1$.

Pour montrer \eqref{lem:inegalites_par_composition_dans_end2}, il suffit de traiter le cas où $g$ est une fonction monomiale $g(\vx)=\vx^I$; le cas général s'en déduit en écrivant chaque composante de $g$ comme une composition linéaire de tels monômes et en utilisant l'inégalité ultramétrique. Or, pour $g(\vx)=\vx^I$,
\begin{equation}
g\circ (\Id_m+h) - g = A_1(h) + A_2(h) + \cdots A_{\av{I}}(h)
\end{equation}
où chaque $A_j$ est un polynôme homogène de degré $j$ en $(\vx_1, \ldots, \vx_m)$ à coefficients dans $\AV$. Comme $\norm{h}\leq 1$, on a $\norm{A_j(h)}\leq \norm{h}$ et $\norm{g\circ (\Id_m+h) - g} \leq \norm{h}$.

L'assertion \eqref{lem:inegalites_par_composition_dans_end3} se déduit de la première en posant $g=f^{-1}-\Id_m$.
\end{proof}

\begin{pro}
Soit $c$ un réel $\geq1$. Le sous-groupe de $\Diff\langle\AV^m\rangle$ formé des éléments $f$ tels que $f=\Id_m\bmod(p^c)$ est distingué. Si $f$ est un tel élément, et si $p^N$ divise $n$, alors $f^n=\Id_m \bmod(p^{c+N})$. En particulier, si $f=\Id_m\bmod(p)$ alors $f^{p^N}=\Id_m\bmod(p^N)$.
\end{pro}

\begin{proof}[Démonstration] La première affirmation résulte du lemme~\ref{lem:inegalites_par_composition_dans_end} ci-dessus. Pour la deuxième, écrivons $f(\vx)=\vx + s h(\vx)$ où $s\in \AV$ vérifie
$\av{s}\leq \av{p}^{c}$ et $h\in \End\langle\AV^m\rangle$. L'assertion \eqref{lem:inegalites_par_composition_dans_end2} du lemme~\ref{lem:inegalites_par_composition_dans_end} montre que
\begin{equation}
f^2(\vx)= \vx + sh(\vx) + s h(\vx+s h(\vx)) = \vx + 2sh(\vx) + s^2 h_2(\vx)
\end{equation}
pour un élément $h_2$ de $ \End\langle\AV^m\rangle$. Après $k$ itérations, $f^k=\Id_m + ksh + s^2 h_k$ pour un $h_k\in \End\langle\AV^m\rangle$. En prenant $k=p$, on obtient l'égalité \hbox{$f^p= \Id_m\bmod(p^{c+1})$}; l'égalité $f^{p^N}= \Id_m\bmod(p^{c+N})$
s'en déduit par récurrence\end{proof}

\subsection{Flots analytiques} Soit $t\mapsto \Phi_t$ un homomorphisme du groupe additif $(\AV,+)$ vers le groupe $\Diff\langle \AV^m\rangle$: \begin{equation}
\Phi_{t+s}=\Phi_t\circ\Phi_s
\end{equation}
pour tous $t$, $s$ dans $\AV$. On dispose
alors d'une action de $\AV$ sur $\AV^m$, définie par $(t,x)\mapsto \Phi_t(x)$; une telle action est appelée un {\emph{flot}} (paramétré par $\AV$, sur le polydisque $\AV^m$). Si l'application $\AV\times \AV^m\to \AV^m$ définie par cette action est une application analytique au sens de Tate, c'est-à-dire que les $m$ coordonnées de $
(\vt,\vx)\mapsto \Phi_\vt(\vx)$ sont des éléments de $\AV\langle \vt, \vx_1, \ldots, \vx_m\rangle$, nous dirons que $\Phi$ détermine un {\emph{flot analytique}}.
Nous identifierons $\Phi$ à l'action correspondante, $\Phi$ pouvant donc être considéré comme un homomorphisme ou comme un flot. L'orbite du flot passant par $x$ en $t=0$ est la courbe $t\in \AV\mapsto \Phi_t(x)\in \AV^m$.

À un tel flot $\Phi$ est associé un champ de vecteurs $X_\Phi \colon \AV^m\to \AV^m$, défini par
\begin{equation}
X_\Phi(x)=\Bigl(\frac{\partial \Phi_t(x)}{\partial t}\Bigr)_{t=0}.
\end{equation}
Les orbites du flot correspondent alors aux courbes intégrales du champ $X_\Phi$, mais ici ces ``courbes'' sont paramétrées par l'ensemble de Cantor $\AV=\Z_p$.

\subsection{Le théorème de Bell et Poonen}\label{par:theoreme_de_bell_poonen_preuve} Voici son énoncé (voir~\cite{Bell2006, Poonen2014}).

\begin{thm}\label{thm:bell_poonen_flot}
Soit $f$ un élément de $\End\langle \AV^m\rangle$ vérifiant l'égalité $f=\Id_m \bmod(p^c)$ avec $c>\spfrac{1}{p-1}$.
Il existe alors un flot analytique $\Phi\colon \AV\times\nobreak \AV^m\to \AV^m$, $(\vt,\vx)\mapsto \Phi_\vt(\vx)$ tel que
\begin{enumerate}
\item $\Phi_n(\vx)=f^n(\vx)$ pour tout $n\in \N$;
\item $\norm{\Phi_t-\Phi_s}\leq p^{(\spfrac{1}{p-1})-c} \av{t-s}$, pour tous $t$, $s\in \AV$.
\end{enumerate}
En particulier, $f\in \Diff\langle \AV^m\rangle$ et $f^{-1}=\Phi_{-1}$.
\end{thm}

Pour $p\geq 3$, on peut prendre $c=1$, pour $p=2$ on peut prendre $c=2$. Si $p\geq 3$ et $f=\Id_m\bmod(p)$, ou si $p=2$ et $f=\Id_m\bmod(p^2)$, l'action de $\Z$ définie par $(n,x)\mapsto f^n(x)$ peut donc être étendue en une action analytique du groupe $(\AV,+)$ sur $\AV^m$.

\begin{proof}[Démonstration] Considérons, pour $x\in \AV^m$ fixé, la suite $u(n)=f^n(x)$. Nous cherchons une fonction $t\mapsto \Phi_t(x)$ qui interpole $(u(n))$, c'est-à-dire que $\Phi_n(x)=u(n)$ pour $n\in \N$. Pour cela, nous appliquerons la méthode de Mahler et Newton; comme $u(n+1)-u(n)=f^{n+1}(x)-f^n(x)=f^n(f(x))-f^n(x)$, nous som\-mes conduits à introduire l'opérateur
$\Delta_f$ défini par
\begin{equation}
\Delta_fh(\vx)=h\circ f(\vx) - h(\vx),
\end{equation}
$h$ pouvant être un élément de $\bfK\langle \vx_1, \ldots, \vx_m\rangle$ ou de $\End\langle \AV^m\rangle$. Du~lem\-me~\ref{lem:inegalites_par_composition_dans_end}, on déduit
\begin{equation}
\Delta_fh(\vx)=h(\vx) \mod(p^c)
\end{equation}
pour tout $h\!\in\! \End\langle \AV^m\rangle$. Ainsi, $\norm{\Delta_f^kh}\!\leq\! \av{p}^{kc}$ pour tout $h\!\in\! \End\langle\AV^m\rangle$.
En particulier,
\begin{equation}
\norm{\Delta_f^k(\Id_m)}\leq \av{p}^{kc}.
\end{equation}
D'après l'équation~\eqref{eq:estimation_valuation_de_k!} fournie dans l’exemple \ref{eg:coefficients_binomiaux}, $
\val_p(k !)\!\leq\! \spfrac{k}{p-1}$. L'hypothèse $c\!>\!\spfrac{1}{p-1}$ permet ainsi d'affirmer que la série
\begin{align}
\Phi_\vt(\vx) &:= \sum_{k\geq 0} B_k(\vt) \Delta_f^k(\Id_m)(\vx) \\
&\hphantom{:}=\sum_{k\geq 0}\frac{\vt(\vt-1)\cdots (\vt-k+1)}{k !}\Delta_f^k(\Id_m)(\vx)
\end{align}
détermine bien un élément de $(\AV\langle\vt, \vx_1, \ldots,\vx_m\rangle)^{m}$.

Si $n$ est un entier $\geq 1$, les coefficients binomiaux $B_k(n)$ sont nuls dès que $k\geq n+1$, donc
\begin{align}
\Phi_n(\vx) &= \sum_{k= 0}^n \binom{n}{k} \Delta_f^k(\Id_m)(\vx) \\
&=(\Id+\Delta_f)^n(\Id_m)(\vx) \\
&= f^n(\vx)
\end{align}
car l'opérateur $\Id+\Delta_f$ est l'opérateur de composition par $f$. Ceci établit l'égalité $\Phi_n(\vx)=f^n(\vx)$ pour tout $n\geq 1$.
En particulier, $\Phi_{n+m}=f^{n+m}=\Phi_{n}\circ \Phi_m$ pour toute paire d'entiers positifs.
Par le \hbox{théorème} des zéros isolés, nous déduisons que $\Phi_{t+s}(u)=\Phi_t(\Phi_s(u))$ pour tout $u\in \AV^m$ et toute paire $(s,t)\in \AV^2$. Donc $\Phi_{\vt+\vs}(\vx)=\Phi_\vt\circ\nobreak \Phi_\vs(\vx)$ comme éléments de $\Diff\langle\AV^m\rangle$. Autrement dit, $\Phi$ est un flot analytique qui interpole la dynamique de $f$.

Il reste à estimer la norme de Gauss $\norm{\Phi_t-\Phi_s}$. Posons $P_k(\vt)=\vt(\vt-1)\cdots (\vt-k+1)$; c'est un polynôme à coefficients dans $\Z$. Alors
\begin{align}
\norm{ \Phi_t(\vx) - \Phi_s(\vx) } &\leq \max_{k\geq 0}\{ \av{P_k(t)-P_k(s)} \cdot \norm{ \frac{1}{k !} \Delta_f^k(\Id_m) } \} \\
&\leq \av{t-s} \cdot \av{p}^{c-\spfrac{1}{p-1}}.
\end{align}

Enfin, l'égalité $\Phi_{-1}\circ \Phi_1=\Phi_0=\Id_m$ montre que $f=\Phi_1$ est inversible.
\end{proof}

\begin{exemple}
Supposons $p=2$ et $m=1$, et considérons l'homothétie $f(\vx)=-\vx$. Alors $f=\Id_1$ modulo $p$. Pourtant, il n'existe pas de flot analytique $\Phi_\vt$ pour lequel
$\Phi_1=f$ (voir le lemme~\ref{lem:point_periodique_fixe_pour_les_flots} ci-dessous); il faut donc bien supposer $c>1$ dans ce cas.
\end{exemple}

\begin{exemple} Le théorème de Bell et Poonen peut être étendu aux corps complets $(\bfK, \av{\cdot})$ contenant $\Q_p$.
Supposons que $\bfK$ contient une racine de l'unité d'ordre $p$, notée $\xi$. On montre alors que $\av{\xi-1}=p^{-\spfrac{1}{p-1}}$. L'homothétie $f(\vx)=\xi \vx$
vérifie donc l'égalité \hbox{$f=\Id_1\bmod(p^c)$} avec $c=\spfrac{1}{p-1}$. Le lemme~\ref{lem:point_periodique_fixe_pour_les_flots} montre donc à nouveau que $f$ ne peut coïncider avec le temps $1$ d'un flot analytique. La borne $c>\spfrac{1}{p-1}$ du théorème de Bell et Poonen est donc optimale.\end{exemple}

\subsection{Le sous-groupe \texorpdfstring{$\mathsf{D}$}{D}} Notons $o=(0, \ldots, 0)$ l'origine de $\bbA^m_\bfK$.
Considérons le sous-groupe ${\mathsf{D}}_o$ de $\Diff\langle \AV^m\rangle$ constitué des éléments $f\in \Diff\langle \AV^m\rangle$ fixant $o$ modulo $p$;
le noyau de $\Theta_1$ est contenu dans~${\mathsf{D}}_o$ (voir le paragraphe~\ref{par:réduction}).
L'application qui à $f\in {\mathsf{D}}_o$ associe
la différentielle $(D\overline{f})_o$ détermine un homomorphisme de ${\mathsf{D}}_o$ vers $\GL_m(\Z/p\Z)$.

Supposons maintenant que
\[
f(o)=o\mod(p^2)\quand (D\overline{f})_o=\Id_m\mod(p),
\]
et écrivons
\begin{equation}
f(\vx)=A_0+A_1(\vx)+\cdots + A_j(\vx)+\cdots
\end{equation}
chaque $A_j(\vx)$ étant une application polynomiale homogène de degré~$j$ à coefficients dans $\AV$. Par hypothèse,
\[
A_0=o \mod(p^2)\quand A_1=\Id_m\mod(p).
\]
Maintenant, conjuguons $f$ par l'homothétie de rapport $p$:
\begin{equation}
p^{-1}f(p \vx)=\frac{A_0}{p}+A_1(\vx)+p A_2(\vx) +\cdots + p^{(j-1)}A_j(\vx)+\cdots
\end{equation}
Si $p\geq 3$ alors $\spfrac{1}{p-1}\leq \sfrac{1}{2}$ et $p^{-1}f(p \vx)$ satisfait aux hypothèses du théorème de Bell et Poonen (pour $p=2$, on remplacera $p$ par $p^2$ dans toutes les congruences imposées ci-dessus).

L'ensemble $\bbA^m(\Z/p^2\Z)$ et le groupe $\GL_m(\AV/(p))$ sont finis. On~obtient donc les deux premières propriétés de l'énoncé suivant.

\begin{thm}\label{thm:sous-groupe_D_de_diff_analytique}
Soit ${\mathsf{D}}$ le sous-groupe de $\Diff\langle\AV^m\rangle$ défini par
\[
f(o)=o\mod(p^2) \quand (Df)_o=\Id_m\mod(p)
\]
(\resp $f(o)=o\bmod(p^4) {\text{ et }} (Df)_o=\Id_m\bmod(p^2)$ lorsque $p=2$). Alors
\begin{enumerate}
\item ${\mathsf{D}}$ est d'indice fini dans $\Diff\langle\AV^m\rangle$;
\item pour tout $f\in {\mathsf{D}}$, il existe un flot analytique $\Phi\colon \AV\to \Diff\langle \AV^m\rangle$
vérifiant $\Phi_1(\vx)=p^{-1}f(p\vx)$;
\item ${\mathsf{D}}$ est sans torsion.
\end{enumerate}
\end{thm}

\noindent
La dernière assertion découle du lemme suivant, appliqué à $p^{-1}f(p\vx)$.

\begin{lem}\label{lem:point_periodique_fixe_pour_les_flots} Soit $f$ un élément de $\Diff\langle \AV^m\rangle$ pour lequel il existe un flot analytique $\Phi \colon \AV\to \Diff\langle \AV^m\rangle$ tel que $f=\Phi_1$.
\begin{enumerate}
\item\label{lem:point_periodique_fixe_pour_les_flots1} Si $z\in \AV^m$ est un point périodique de $f$, c'est un point fixe;
\item\label{lem:point_periodique_fixe_pour_les_flots2} Si $f$ est d'ordre fini, alors $f=\Id_m$.
\end{enumerate}
\end{lem}

\begin{proof} Soit $k$ la période de $z$.
Alors
$\Phi_{kn}(z)=f^{kn}(z)=z$ pour tout $n\in \Z$ et, par le théorème des zéros isolés, $\Phi_t(z)=z$ pour tout $t\in R$. Ainsi,
$f(z)=\Phi_1(z)=z$. Ceci montre \eqref{lem:point_periodique_fixe_pour_les_flots1}, et \eqref{lem:point_periodique_fixe_pour_les_flots2} en résulte. \end{proof}

\section{Plongements de Lech}
\bq
Le théorème de Bell concerne les transformations polynomiales à coefficients complexes, tandis que le théorème de Bell et Poonen concerne les corps $p$-adiques. Cette partie présente un lemme qui permettra de passer du complexe au $p$-adique
\eq

Rappelons qu'un corps $\bfK$ est une {\emph{extension de type fini}} de $\Q$ s'il contient $\Q$ et est engendré, en tant qu'extension de $\Q$, par un nombre fini d'éléments
$\alpha_1,\dots,\alpha_k$; tout élément de $\bfK$ peut alors être écrit comme un quotient\vspace*{-3pt}\enlargethispage{.5\baselineskip}
\begin{equation}
\frac{P(\alpha_1, \ldots, \alpha_k)}{Q(\alpha_1, \ldots, \alpha_k)}
\end{equation} où $P$ et $Q$ sont des éléments de $\Z[\vx_1, \ldots, \vx_k]$ et $Q(\alpha_1, \ldots, \alpha_k)\neq 0$.

Un {\emph{plongement}} $\iota$ d'un corps $\bfK$ dans un corps $\bfL$ est un homomorphisme de corps injectif; cette propriété est automatique si l'on prend soin d'imposer que $\iota(1)=1$ ou, ce qui revient au même, que $\iota$ n'est pas identiquement nul.

\begin{lem}[de plongement de Lech]\label{thm:plongement_de_Lech} Soient $\bfK$ une extension de type fini du corps $\Q$ et $S$ une partie finie de $\bfK$.
Il existe un nombre premier~$p$ et un plongement $\iota$ de $\bfK$ dans $\Q_p$ tel que $\av{\iota(s)}_p=1$
pour tout $s\in S\setminus\{0\}$. L'ensemble des $p$ qui conviennent a une densité strictement positive parmi les
nombres premiers.
\end{lem}

La dernière assertion signifie qu'il existe une constante $\alpha >0$ telle que, parmi les $n$ premiers nombres premiers,
au moins $\alpha n$ nombres premiers convien\-nent, du moins lorsque $n$ est suffisamment grand.
Ce~lemme nécessite de faire appel au théorème de Chebotarev (voir~\cite{Lech1953,LSChebotarev}), ce qui dépasse le cadre de ce livre.
La preuve que nous présenterons fournit seulement une infinité de nombres premiers $p$ convenables,
ce qui sera suffisant pour toutes nos utilisations du lemme de Lech. Cette démonstration emploie quelques ingrédients de théorie algébrique des nombres, et est donc reportée au \S~\ref{par:preuve_lech}. Ici, nous nous contenterons de deux cas particuliers qui illustrent bien le cas général.

Soit $\bfK$ un corps de caractéristique nulle. Rappelons que $\xi\in \bfK$ est algébrique (sur $\Q$), s'il existe un polynôme $P\in \Q[\vt]\setminus\set{0}$ tel que $P(\xi)=0$. Les éléments algébriques de $\bfK$ forment un ensemble dénombrable car $\Q[\vt]$ est dénombrable et chaque $P\in \Q[\vt]$ a au plus $\deg(P)$ racines dans $\bfK$. Un élément de $\bfK$ est transcendant s'il n'est pas algébrique (par exemple $\pi=3,141592...$ est transcendant).

\subsubsection*{Extensions transcendantes} Supposons que $\bfK=\Q(\omega)$, où $\omega$ est transcendant, et que $S=\{\omega\}$.

Soit $p$ un nombre premier. Comme $\Z_p$ n'est pas dénombrable\footnote{$\Z_p$ est homéomorphe à un ensemble de Cantor, ses éléments correspondant aux séries $\sum a_n p^n$ avec $a_n\in\set{0, 1, \ldots, p-1}$} il existe des éléments transcendants dans $\Z_p$. Soit $\beta$ un tel élément; le nombre $\alpha=1+p\beta$ est transcendant et $\av{\alpha}_p=1$.

Il existe alors un unique homomorphisme de corps $\iota\colon \Q(\omega)\to \Q_p$ tel que $\iota(\omega)=\alpha$: à la fraction $P(\omega)/Q(\omega)$, $\iota$ associe le nombre $p$\nobreakdash-adique $P(\alpha)/Q(\alpha)$. Cet homomorphisme convient car $\av{\alpha}_p=1$.

\subsubsection*{Extensions algébriques} Supposons maintenant que $\bfK$ est le corps $\Q(\xi)$, où $\xi\neq 0$ est algébrique, et que $S=\set{\xi}$.

Soit $P(\vt)\in \Q[\vt]$ le polynôme minimal de $\xi$: c'est le polynôme unitaire de degré minimal tel que $P(\xi)=0$; il est irréductible, donc à racines simples. Alors $\bfK$ s'identifie au quotient $\Q[\vt]/(P)$ de $\Q[\vt]$
par l'idéal engendré par $P$.
Multiplions $P$ par un entier $\neq 0$ pour obtenir un polynôme $Q(\vt)$ dont les coefficients sont entiers et globalement premiers entre eux.
Notons $D$ le discriminant de $Q$; c'est un nombre entier non nul car les racines de $P$ sont simples.

\begin{lem}\label{lem:comptage_pour_obtenir_des_racines}
Soit $F(\vt)\in \Z[\vt]$ un polynôme à coefficients entiers de degré $d\geq 1$. Il existe une infinité de premiers $p$ tels
que $F$ ait une racine modulo $p$.
\end{lem}

\begin{proof}[Démonstration]
Dans le cas contraire, il existe un entier $k$ et des nombres premiers $p_1,\dots,p_k$ tels que
$F(n)$ soit de la forme\vspace*{-3pt}\enlargethispage{.5\baselineskip}
\begin{equation}
F(n)=(\pm 1) \prod_{j=1}^k p_j^{\alpha_j(n)}
\end{equation}
pour tout $n\in \Z$.
L'ensemble $F(\Z)\cap [-M,M]$ contient donc au plus\vspace*{-3pt}
\begin{equation}
2(\log(M)/\log(2))^k
\end{equation}
éléments.
Par ailleurs, $\vert F(n) \vert$ est de l'ordre de $n^d$ lorsque $n$ tend vers $+\infty$.
Donc le cardinal de $F(\Z)\cap [-M,M]$ est de l'ordre de $M^{1/d}$ lorsque $M$ est grand.
C'est une contradiction.
\end{proof}

En appliquant ce lemme au polynôme $Q$, on trouve un nombre premier $p>\max(D, \av{Q(0)})$ et une racine $\alpha_0$ de $Q$ modulo $p$.
Cette racine est simple, car $D\neq 0\bmod(p)$; elle est non nulle car $Q(0)\neq 0\bmod(p)$.
Le lemme de Hensel fournit une racine $\alpha\in \Z_p$ de $Q$ dont la réduction modulo $p$ coïncide avec $\alpha_0$ (voir~\cite{ACL}). Il existe alors un unique homomorphisme $\iota\colon \bfK\to \Q_p$
qui envoie $\xi$ sur $\alpha$, et cet homomorphisme convient car $\av{\alpha}_p=1$ (en effet, $\alpha_0\neq 0\bmod(p)$).

\section{Trois applications du théorème de Bell et Poonen}
\bq
Nous présentons enfin quelques applications de la méthode $p$-adique basée sur le théorème de Bell et Poonen. L'arithméticité des temps de passage est présentée au paragraphe~\ref{par:preuve_bell}.
\eq

\subsection{Le théorème de Bass et Lubotzky} Un groupe $\Gamma$ est
\begin{itemize}
\item {\emph{de type fini}} s'il est engendré par une partie finie $S\subset \Gamma$ (on peut alors supposer $S$ symétrique, c'est-à-dire que $g\in S$ si, et seulement si $g^{-1}\in S$).
\item {\emph{résiduellement fini}} si, pour tout $\gamma\in \Gamma\setminus\{1_\Gamma\}$, il existe
un groupe fini $F$ et un homomorphisme $\alpha\colon \Gamma\to F$ tel que $\alpha(\gamma)\neq 1_F$.
\item {\emph{virtuellement sans torsion}} s'il existe un sous-groupe d'indice fini $\Gamma_0\subset \Gamma$
qui est sans torsion (\ie tout $\gamma\in \Gamma_0\setminus\{1_\Gamma\}$ engendre un sous-groupe cyclique infini).
\end{itemize}

Anatolii V. Malcev et Atle Selberg ont montré que tout groupe linéaire de type fini est résiduellement fini et virtuellement sans torsion.

\begin{thm}[de Bass et Lubotzky] Soit $\bfK$ un corps de caractéristique nulle. Soit $m$ un entier $\geq 1$.
Si $\Gamma$ est un sous-groupe de type fini de $\Aut(\bbA^m_\bfK)$, alors $\Gamma$ est résiduellement fini et virtuellement sans torsion.
\end{thm}

\begin{proof}
Puisque $\Gamma$ est
de type fini, nous pouvons fixer une partie finie et symétrique $S=\{g_1, \ldots, g_s\}\subset \Gamma$ engendrant $\Gamma$,
puis remplacer $\bfK$ par l'extension $\bfK_0$ de $\Q$ engendrée par l'ensemble $C_S$ des coefficients des formules polynomiales définissant les $g_i$. Le lemme~\ref{thm:plongement_de_Lech} fournit un nombre premier $p\geq 3$ et un plongement $\iota \colon \bfK_0\to \Q_p$ telle que $\iota(C_S)\subset \Z_p$.
Le groupe $\Gamma$ peut donc être plongé dans le groupe $\Aut(\bbA^m_{\Z_p})$;
ce faisant, $\Gamma$ devient un sous-groupe de $\Diff\langle \Z_p^m\rangle$.
D'après le lemme~\ref{lem:diff_tate_est_residuellement_fini}, $\Diff\langle \Z_p^m\rangle$ est résiduellement fini; donc $\Gamma$ aussi. Et si~$\Gamma_0$ désigne l'intersection de $\Gamma$ avec le sous-groupe ${\mathsf{D}}$ de $\Diff\langle \Z_p^m\rangle$ qui est fourni par le théorème~\ref{thm:sous-groupe_D_de_diff_analytique}, alors $\Gamma_0$ est sans torsion. Donc $\Gamma$ est virtuellement sans torsion.
\end{proof}

\begin{rem}
Cette démonstration d'Hyman Bass et Alexander Lubotzky reprend celle
de Malcev et Selberg et remonte à Minkowski, qui a montré que le sous-groupe de $\GL_m(\Z)$ formé des matrices
qui sont égales à l'identité modulo $3$ est sans torsion. Nous renvoyons à~\cite{Bass-Lubotzky} pour des énoncés plus généraux.
\end{rem}

\subsection{Arithméticité des temps de passage}\label{par:preuve_bell} Démontrons le théorème de Bell, énoncé au paragraphe~\ref{par:transformations_algébriques}, théorème~\ref{thm:Bell}.

Fixons un système fini de $r$ équations $P_i(\vx)=0$ définissant $W$. Notons $A$ l'anneau de type fini engendré par les coordonnées de $z$, les coefficients des formules définissant $f$ et $f^{-1}$, et les coefficients des $P_i(\vx)$.
Le lemme~\ref{thm:plongement_de_Lech} fournit un nombre premier $p\geq 3$ et un plongement $\iota\colon \Frac(A)\to \Q_p$ tel que $\iota(A)\subset \Z_p$.
En appliquant $\iota$ aux coordonnées de $z$, aux coefficients des formules qui définissent $f$ et $f^{-1}$, et aux coefficients des polynômes $P_i$, nous sommes ramenés au cas où les données du problème sont définies sur $\Z_p$. Nous supposerons donc désormais que $f$ est un élément de $\Aut(\bbA^m_{\Z_p})$, que $z$ appartient à $\bbA^m(\Z_p)$ et que $W$ est un sous-ensemble algébrique défini par des équations $P_i(\vx)=0$ à coefficients dans~$\Z_p$.

Notons maintenant $\ell$ l'indice du sous-groupe ${\mathsf{D}}$ de $\Diff\langle\Z_p^m\rangle$ qui est défini par le théorème~\ref{thm:sous-groupe_D_de_diff_analytique} (cet indice ne dépend que de $p$ et $m$). Pour $0\leq j\leq \ell-1$,
notons $W_j$ le sous-ensemble algébrique $f^{-j}(W)\subset \bbA^m_{\Q_p}$; il est défini par les équations $P_{i,j}:=P_i\circ f^j\in \Z_p[\vx]$, pour $1\leq i \leq r$.

Conjuguons $f$ par la translation de vecteur $z$ afin de ramener $z$ en l'origine~$o$; ce faisant, $f$ est remplacé par $g(\vx)=f(z+\vx)-z$.

L'automorphisme $h:=g^\ell$ appartient au groupe ${\mathsf{D}}$. Il existe donc un flot analytique $\Phi_\vt$ tel que
$p^{-1} h(p\vx)=\Phi_1(\vx)$. Et $p^{-1} h(p\vx)$ est obtenu en conjuguant $f^\ell$ par la transformation affine $\vx\mapsto p\vx+z$.
Soit $V_j$ l'image réciproque de $W_j$ par cette transformation affine; les polynômes $Q_{i,j}(\vx)=P_{i,j}(p\vx+z)$ forment un système d'équations définissant $V_j$. Alors\vspace*{-3pt}\enlargethispage{\baselineskip}
\begin{equation}
\Pas_h(o;V_j)=\{n\in \Z\; ; \; Q_{i,j}(\Phi_n(o))=0 \quad \forall 1\leq i\leq r\}
\end{equation}
Comme les fonctions $\vt\mapsto Q_{i,j}(\Phi_{\vt}(o))$ sont analytiques, le principe des zéros isolés montre que cet ensemble est soit fini,
soit égal à $\Z$. Dans le second cas, l'orbite de $o$ par $h$ est entièrement contenue dans $V_j$.
Puisque $h$ est conjuguée à $f^\ell$, nous venons de montrer le théorème pour $f^\ell$ à la place de $f$ et pour chaque $W_j$ à la place de $W$. Mais, en répartissant les entiers $n\in \Z$ suivant leur congruence modulo $\ell$,\vspace*{-3pt}
\begin{align}
\Pas_f(z; W)&=\bigcup_{j=0}^{\ell-1} \{ n=k\ell + j\; ; \; f^{\ell k}(z)\in f^{-j}(W)\}\\
&=\bigcup_{j=0}^{\ell-1} \left(j+ \ell \, \Pas_{f^\ell}(z;f^{-j}(W))\right).
\end{align}
Donc $\Pas_f(z; W)$ est bien une union finie de progressions arithmétiques.

\begin{rem} La démonstration montre que les raisons $r_i$ divisent l'entier~$\ell$; elles sont donc majorées par $\ell$, et l'on peut toujours choisir $\ell\leq p^{3m}$ (voir la démonstration du théorème~\ref{thm:périodes} ci-dessous).
\end{rem}

\Subsection{Uniformité}

\begin{thm} Soit $f\colon \bbA^m_\bfK\to \bbA^m_\bfK$ un automorphisme, où $\bfK$ est un corps de caractéristique nulle.
Soit $Q\colon \bbA^m_\bfK\to \bbA^k_\bfK$ une application polynomiale. Soit $z$ un élément de $\bbA^m(\bfK)$. Si $\Pas_f(z; Q^{-1}(a))$ est fini pour tout $a\in \bbA^m(\bfK)$, il existe un entier $N$ tel que\vspace*{-3pt}
\[
\card{\Pas_f(z; Q^{-1}(a))} \leq N
\]
pour tout $a\in \bbA^k(\bfK)$.
\end{thm}

Par exemple, si $Q(\vx_1, \ldots, \vx_m)=(\vx_1, \ldots, \vx_{m-1})$, ce théorème \hbox{fournit} une bor\-ne uniforme pour le nombre de passages de l'\hbox{orbite} de $z$ dans une droite verticale (\ie de vecteur directeur $\bfe_m=(0, \ldots, 0,1)$), sauf si l'orbite de $z$ passe périodiquement dans l'une de ces droites.

\begin{proof}
Nous pouvons supposer que toutes les données sont définies sur $\Z_p$; en particulier $f\in \Diff\langle \Z_p^m\rangle$ et $Q\in (\Z_p[\vx])^k$. Si $f$ est dans le groupe ${\mathsf{D}}$, $p^{-1}f(p \vx)$ est égal à $\Phi_1(\vx)$ pour un flot analytique $\Phi_t$.
Par hypothèse, le nombre de solutions de $Q(\Phi_t(z))=a$ est fini, ceci quelque soit $a\in \bbA^l(\bfK)$. Il s'agit d'un système de $k$ équations analytiques en la variable $t$, que l'on peut écrire sous la forme $\sum_{n} b_{i,n} t^n=a_i$ où les $b_{i,n}$ sont dans $\Z_p$ et tendent vers $0$ lorsque~$n$ tend vers $+\infty$ et les $a_i$ sont les coordonnées de $a$ (l'indice~$i$ varie entre~$1$ et~$k$). Le théorème de Strassman et son corollaire~\ref{cor:corollaire_du_thm_de_strassman} permettent alors de majorer le nombre de solutions indépendamment de~$a$.\enlargethispage{\baselineskip}

Si $f$ n'appartient pas à ${\mathsf{D}}$, un itéré $f^\ell$ est dans ${\mathsf{D}}$, et il suffit d'appliquer l'argument précédent aux fonctions $Q\circ f^j$ pour $0\leq j\leq \ell$.
\end{proof}

\Subsection{Orbites des automorphismes: transitivité} \label{par:transitivité}

\begin{thm}\label{thm:transitivite_des_automorphismes} Il existe un automorphisme $f$ de $\bbA^m_\Z$ agissant transitivement sur $\bbA^m(\Z)$ si, et seulement si $m=1$; dans ce cas $f(\vx)=\vx+1$ ou $\vx-1$.
\end{thm}

\begin{proof} Supposons $m=1$. Les translations $\vx\mapsto \vx+ 1$ et $\vx\mapsto\vx-1$ agissent transitivement sur $\Z$. Un élément $f$ de $\Aut(\bbA^1_\Z)$ est une transformation affine $f(\vx)=a\vx+b$ avec $a, b\in \Z$ dont l'inverse est aussi à coefficients dans $\Z$; autrement dit, $a=\pm 1$. Si $a=-1$ alors $f$ est d'ordre $2$. Si $a=1$, $f(\vx)=\vx+b$. Pour que $f$ agisse transitivement, il faut donc que $f(\vx)=\vx+1$ ou $\vx-1$.

Supposons maintenant que $m\geq 2$ et que $f\in \Aut(\bbA^m_\Z)$ agit transitivement sur $\bbA^m(\Z)$. Soit $L$ la droite définie par $\vx_i=0$ pour $i\leq m-1$. L'orbite de $o$ visite $L$ une infinité de fois. Par le théorème d'arithméticité des temps de passage, il existe $a\geq 0$ et $r\geq 1$ tels que $f^{rn}(f^a(o))\in L$ pour tout $n\in \Z$. Alors $L=f^r(L)$, car deux
courbes irréductibles s'intersectant en un nombre infini de points sont égales\footnote{Voici un argument direct:
$f^r(L)$ est définie par les équations $\vx_i\circ f^{-r}=0$ pour $i\leq m-1$; en restriction
à $L$, $\vx_i\circ f^{-r}$ devient une fonction polynomiale d'une seule variable s'annulant sur l'ensemble infini $\{f^{rn+a}(o)\; ; \; n\in \Z\}$, c'est donc la fonction nulle et $L\subset f^r(L)$; symétriquement, $f^r(L)\subset L$.}.

On en déduit que l'orbite de $L$ sous l'action de $f$ est contenue dans l'ensemble fini de courbes $\{f^j(L)\; ;\; 0\leq j\leq r-1\}$. Et l'orbite de $o$ est entièrement contenue dans l'union de ces courbes. En particulier, l'orbite de $o$ est contenue dans le sous-ensemble algébrique défini par l'équation polynomiale $\prod_{j=0}^{r-1}\vx_1\circ f^j =0$. Puisque le
polynôme $\prod_{j=0}^{r-1}\vx_1\circ f^j $ n'est pas identiquement nul, il existe un point à coordonnées entières en lequel il ne s'annule pas, l'orbite de $o$ ne peut pas passer par un tel point, une contradiction.
\end{proof}

L'argument utilisé pour cette démonstration fournit aussi la propriété suivante:

\begin{thm} Soit $\bfK$ un corps de caractéristique $0$. Soient $f\colon \bbA^m_\bfK\to \bbA^m_\bfK$ un automorphisme et $z$ un élément de $\bbA^m(\bfK)$. Si l'orbite de $(f^n(z))_{n\in \Z}$ intersecte un sous-ensemble algébrique strict de $\bbA^m_\bfK$ en une infinité d'instants, cette orbite ne peut pas être Zariski dense: il existe un polynôme $Q\in \bfK[\vx_1, \ldots, \vx_m]$ non identiquement nul tel que $Q(f^n(z))=0$ pour tout $n\in \Z$.
\end{thm}

Ce phénomène peut déjà être observé dans le cas linéaire. Supposons en effet que $V$ est un espace vectoriel complexe de dimension finie, et que $f\in \GL(V)$. Soient $W\subset V$ un sous-espace, $z$ un point de~$V$ et $a$ et $r$ des entiers $\geq 1$ tels que $f^n(z)\in W$ dès que $n=a+rk$, $k\in \Z$. Changeons $z$ en $w=f^a(z)$ et $f$ en $g=f^k$. Alors $g^n(w)\in W$ pour tout $n\in \Z$. Notons $W'$ le sous-espace vectoriel de $W$ engendré par les $g^n(w)$. Il est $g$-invariant, donc périodique sous l'action de $f$, et $\Orb_f(z)$ est contenue dans l'union finie de sous-espaces $\bigcup_{n=0}^{k-1}f^n(W')$.

Le théorème d'arithméticité des temps de passage doit donc avant tout être considéré comme un théorème de finitude: {\emph{si l'orbite de $z$ est Zariski dense, c'est-à-dire qu'elle n'est pas confinée dans un sous-ensemble algébrique strict, elle intersecte tout sous-ensemble algébrique strict de $\A^m_\bfK$ en un nombre fini de points}}.

\begin{exemple}\label{eg:suite-henon} Si l'on considère l'un quelconque des automorphismes de Hénon $h_{a,b}$ décrits dans l'exemple~\ref{eg:henon}, on peut montrer que $h_{a,b}$ ne préserve aucune courbe algébrique $W\subset \C^2$. L'énoncé de finitude des temps de passage formulé à la fin de la section~\ref{par:transformations_algébriques} résulte alors de l'argument que nous venons de décrire.\end{exemple}

\subsection{Orbites des automorphismes: périodes} Dans le théorème suivant, le cas $A=\Z$, $\bfK=\Q$ est déjà intéressant.

\begin{thm}\label{thm:périodes} Soient $\bfK$ un corps de caractéristique nulle et $A\subset \bfK$ un sous-anneau de type fini.
Pour tout entier $m\geq 1$ il existe un entier $q_A(m)$ vérifiant la propriété suivante. Pour tout $f\in \Aut(\bbA^m_A)$ et tout $z\in \bbA^m(A)$, ou bien $\Orb_f(z)$ est infini, ou bien $\card{\Orb_f(z)} \leq q_A(m)$.
\end{thm}

\begin{lem}\label{lem:ordre_des_elements_de_GLmFini}
Soit $\bfF_q$ un corps fini à $q$ éléments. Soit $m$ un entier $\geq 1$. Si $B$ est un élément de $\GL_m(\bfF_q)$, alors $B^s=\Id$ pour un $s\leq q^m-1$, et ceci est optimal.
\end{lem}
\begin{proof} Le théorème de Cayley-Hamilton fournit une relation de dépendance linéaire à coefficients dans $\bfF_q$ entre les $m+1$ matrices $\Id,B,\dots,B^m$. La sous-algèbre de $\Mat_m(\bfF_q)$ engendrée par $B$ est donc un $\bfF_q$-espace vectoriel de dimension $\leq m$. Elle contient donc au plus $q^{m}-1$ éléments non nuls et il existe $0\leq k < \ell \leq q^m$ tels que $B^k=B^\ell$; en particulier, $B^{s}=\Id$ avec $s=\ell-k\leq q^m-1$.

Pour montrer que cette estimation est optimale, considérons une extension de $\bfF_q$ de degré $m$; une telle extension existe, est isomorphe à $\bfF_{q^m}$ et est un $\bfF_q$-espace vectoriel de dimension~$m$ (voir~\cite{LangAlgebra}). Le~groupe $\bfF_{q^m}^\times$ est cyclique, d'ordre $q^m-1$; soit $\xi$ un générateur de ce groupe. Alors $x\mapsto \xi x$ est une transformation $\bfF_q$-linéaire de $ \bfF_{q^m}$ d'ordre égal à $q^m-1$.
\end{proof}

\begin{proof}[Démonstration du théorème~\ref{thm:périodes}] Soit $S\subset A\setminus\set{0}$ une partie finie telle que $A=\Z[S]$. Par le théorème de Lech, il existe un nombre premier $p\geq 3$
et un plongement $\iota\colon \Frac(A)\to \Q_p$ tel que $\iota(A)$ soit contenu dans $\Z_p$. Notons $p_A$ le plus petit nombre premier vérifiant cette propriété. Nous allons voir que l'entier
\begin{equation}
q_A(m):=p_A^{3m}
\end{equation}
convient; pour $A=\Z$, on pourra donc choisir $q_\Z(m)=27^m$.

Supposons donc l'orbite de $z$ finie. Conjuguons $f$ par la translation de vecteur $z$: nous obtenons un élément $g$ de $\Aut(\A^m_A)$ et il s'agit de majorer la période de l'origine $o$ sous l'action de~$g$. En utilisant le plongement $\iota\colon \Frac(A)\to \Q_{p_A}$, nous pouvons supposer que $g$, $g^{-1}$ et~$z$ sont à coefficients dans $\Z_{p_A}$.

L'ensemble $\A^m(\Z_{p_A}/(p_A^2\Z_{p_A}))$ est fini, de cardinal $p_A^{2m}$. Il existe donc un entier $k\leq p_A^{2m}$ tel que $g^{k}(o)=o\bmod(p_A^2)$. Soit $B$ la différentielle de $g$ en $o$ modulo $p_A$. Le lemme~\ref{lem:ordre_des_elements_de_GLmFini} montre que l'ordre de $B$ dans $\GL_m(\bfF_{p_A})$ est majoré par $p_A^m$. On trouve ainsi un entier $\ell\leq p_A^{3m}$ tel que
\begin{align}
g^\ell (o)&=o\mod(p_A^2)\\
Dg^\ell_o&=\Id\mod(p_A).
\end{align}
Nous pouvons donc appliquer le théorème de Bell et Poonen: en restriction à $\A^m(\Z_{p_A})$, l'automorphisme polynomial $h(\vx)=p_A^{-1}g^\ell(p_A \vx)$ coïncide avec le temps $1$ d'un flot analytique $\Phi\colon \Z_{p_A}\to \Diff\langle\Z_{p_A}^m\rangle$. Le lemme~\ref{lem:point_periodique_fixe_pour_les_flots} montre alors que $h$ fixe $o$, car l'orbite de $o$ est finie. La période
de $z$ sous l'action de $f$ est donc majorée par $\ell$, donc par $q_A(m)$. \end{proof}

\appendix
\refstepcounter{section}\label{appA}
\begin{center}
{\bfseries\appendixname\ \protect\ref{appA}. Caractéristique positive\\ et ensembles analytiques}
\addcontentsline{toc}{section}{\protect\appendixname\ \protect\ref{appA}. Caractéristique positive et ensembles analytiques}
\end{center}
\bq
Le théorème de Skolem, Mahler et Lech ne peut être étendu au cas où le corps des nombres complexes est remplacé par un corps de caractéristique positive, ni à celui où l'ensemble~$W$ est analytique, même si la transformation $f$ est linéaire.
Ce paragraphe présente quelques exemples illustrant ces remarques.
\eq

\subsection{Caractéristique positive} Le théorème de Skolem, Mahler et Lech reste valable si l'on remplace le corps des nombres complexes par un corps $\bfK$ de caractéristique nulle. En effet, dans une base de l'espace vectoriel $V$, les coefficients de la matrice de $f$, les coordonnées de $z$, et~les coefficients d'un système fini d'équations linéaires définissant~$W$ engendrent un sous-corps de $\bfK$ qui est une extension de $\Q$ de type fini; mais une telle extension peut être plongée dans $\C$. La même remarque s'applique au théorème d'arithméticité de Bell.

Intéressons-nous maintenant au cas où le corps est de caractéristique positive.
Soit $p$ un nombre premier et $\bfK$ le corps $\bfF_p(\vt)$. Soit $V=\bfK^3$ et $f\colon V\to V$ la transformation
linéaire diagonale définie par $f(x,y,z)=((1+\vt)x, \vt y, z)$. Soient $z=(1,1,1)\in V$ et $W=\set{(x,y,z)\in V\tq x=y+z}$. L'orbite de $z$ sous l'action de $f$ est
\begin{equation}
f^n(z)= ((1+\vt)^n, \vt^n, 1)
\end{equation}
et $f^n(z)\in W$ si et seulement si
\begin{equation}
(1+\vt)^n=1+\vt^n.
\end{equation}
En caractéristique $p$, $(a+b)^p=a^p+b^p$ car les coefficients binomiaux $\binom{p}{j}$ sont divisibles par $p$ pour tout $1\leq j \leq p-1$; donc $(a+b)^n=a^n+b^n$ dès que $n$ est une puissance de $p$. En particulier, $\Pas^+_f(z;W)$ contient $\set{p^k\tq k\in \N^*}$. Réciproquement, $\vt$ étant une indéterminée, l'identité $(1+\vt)^n=1+\vt^n$ signifie que chaque coefficient binomial $\binom{n}{j}$ avec $1\leq j \leq n-1$ est divisible par $p$. On en déduit facilement que $n$ est une puissance de $p$; en effet, le premier coefficient fournit $n=0\bmod(p)$, donc $n=p\ell$ pour un $\ell \geq 1$, puis le coefficient numéro~$p$ fournit
\begin{equation}
\frac{\ell (p\ell-1)\cdots (p\ell-p+1)}{(p-1)\cdots 2\cdot 1}=0\mod(p)
\end{equation}
ce qui entraîne que $\ell$ est aussi divisible par $p$, etc. Finalement,
\begin{equation}
\Pas^+_f(z;W)=\set{p^k\tq k\in \N^*}.
\end{equation}
Harm Derksen, dans~\cite{Derksen2007}, donne d'autres exemples pathologiques (par exemple $\set{p^k\tq k\in \N^*}\cup\set{p^\ell+p^{m}; \ell, m\in \N^*}$), et caractérise les ensembles $\Pas^+_f(z;W)$ qui peuvent apparaître dans le théorème de Skolem, Mahler et Lech en caractéristique $p>0$. Sa démonstration est effective, au sens où elle répond positivement au problème de Skolem en caractéristique positive (voir l'énoncé du problème dans la section~\ref{par:transformations_algébriques}).

\subsection{Ensembles analytiques} Soit $M$ le tore $\R^2\!/\Z^2$. Soit~\hbox{$s{:}\,\R\!\to\!\R$} une fonction $1$-périodique, c'est-à-dire que $s(t+1)=s(t)$. Alors $s$ peut être considérée comme une fonction de $\R/\Z$ vers $\R$; en prenant ses valeurs modulo $1$, on obtient une fonction $\overline{s}\colon \R/\Z\to \R/\Z$; le graphe $G(s)$ de $\overline{s}$ est alors une courbe tracée dans $M$. Si $s$ est de classe $C^k$ (\resp est analytique), $G(s)$ est également de classe $C^k$ (\resp analytique).

\begin{thm}\label{thm:passages_analytiques} Soit $z_n=(x_n,y_n)$ une suite de points du tore $\R^2/\Z^2$. Supposons que les $x_n$ sont deux à deux distincts et que $(z_n)$ est dense dans le tore. Il existe une fonction $s\colon \R\to \R$ qui est analytique et $1$-périodique, et une suite croissante d'entiers $k_i\geq 1$ telles que
\begin{enumerate}
\item $\{n\tq z_n\in G(s)\}=\{k_i\tq i\geq 1\}$;
\item $k_{i+1}-k_i>k_i$ pour tout $i\geq 1$.
\end{enumerate}
\end{thm}

\subsubsection{Application} Considérons une matrice diagonale $A\in \GL_2(\C)$ dont les deux valeurs propres
$\alpha$ et $\beta$ sont de module $1$; écrivons
\begin{equation}
\alpha=\exp(2\ii \pi a), \quad \beta=\exp(2\ii \pi a).
\end{equation}
Nous supposerons que $1$, $a$ et $b$ sont $\Q$-linéairement indépendants (en~particulier, $a$ et $b$ sont irrationnels).

Définissons $\varphi\colon M\to \C^2$ par $\varphi(x,y)= (e^{2\ii \pi x}, e^{2\ii \pi y})$; alors
\begin{equation}
\varphi(M)=\set{(u,v)\in \C^2\tq \av{u}=\av{v}=1}
\end{equation}
et $A$ préserve $\varphi(M)$; plus précisément,
\begin{equation}
A\varphi(x,y) =(e^{2\ii \pi (x+a)}, e^{2\ii \pi (y+b)}) = \varphi(x+a,y+b) .
\end{equation}
Puisque $1$, $a$ et $b$ sont $\Q$-linéairement indépendants,
\begin{itemize}
\item l'ensemble $\set{(x+na,y+nb)\tq n\in \Z}$ est dense dans $M$, ceci quelque soit la condition initiale $(x,y)$;
\item modulo $1$, les $x_n=x+na$ sont deux à deux distincts.
\end{itemize}
En appliquant le théorème précédent, nous obtenons:

\begin{cor} Il existe un élément $A$ de $\U_2(\C)$, un point $z_0\in \C^2$, et~une courbe analytique réelle $C\subset \C^2$ telle que l'ensemble des temps de passage $\Pas_A(z_0;C)$ soit infini mais ne contienne aucune progression arithmétique de longueur $\geq 3$.
\end{cor}

En effet, considérons une suite $(k_i)$ vérifiant la seconde assertion du théorème~\ref{thm:passages_analytiques}. Si $(k_i)$ contenait une progression arithmétique $a$, $a+r$, $a+2r$, on pourrait écrire $a=k_\ell$, $a+r=k_m$, $a+2r=k_n$ avec $\ell< m < n$. On aurait alors $k_n-k_m> k_m$, soit $r>a+r$, ce qui est impossible car $a=k_\ell\geq 0$.

\subsubsection{Démonstration du théorème~\ref{thm:passages_analytiques}} Nous allons construire simultanément la fonction $s$ et la suite $(k_i)$.
Nous chercherons $s$ sous la forme d'une série trigonométrique
\begin{equation}
s(t)=a_0+\sum_{n\geq 1}^\infty a_n\cos(2\pi nt) + b_n \sin(2\pi nt),
\end{equation}
à coefficients $a_n$ et $b_n$ réels. Si $a_n^2+b_n^2$ tend exponentiellement vite vers $0$, la fonction $s$ est analytique.

\subsubsection*{Remarque préliminaire} L'espace $V_d$ des fonctions trigonométriques
\begin{equation}
P(t)=a_0+ \sum_{n\geq 1}^{ d} a_n\cos(2\pi nt) + b_n \sin(2\pi nt)
\end{equation} est de dimension $2d+1$. Nous le munirons de la norme définie par
\begin{equation}
\norm{P}^2=a_0^2+\sum_{n=1}^d a_n^2+b_n^2.
\end{equation}
Soit $F$ une partie finie de $\R/\Z$ de cardinal $k< \dim(V_d)$. Soient $\delta$ et $\eta$ des réels $>0$. Il existe alors $\epsilon >0$, qui dépend de $d$, $F$, $\eta$ et $\delta$, vérifiant la propriété suivante: si $x\in \R/\Z$ et $\dist(x,F)\geq \delta$, alors il existe $P\in V_d$ tel que
\begin{itemize}
\item[(a)] $P(F)=\{ 0\}$;
\item[(b)] $P(x)=\epsilon$;
\item[(c)] $\norm{P}\leq \eta$.
\end{itemize}
La contrainte (a) définit en effet un sous-espace $W_F$ de dimension $\geq 1$ dans $V_d$. Si $x\in \R/\Z$, l'évaluation en $x$ détermine une forme linéaire
${\textup{év}}_x\colon W_F\to \R$; cette forme s'annule si, et seulement si $x\in F$; et lorsque $\dist(x,F)\geq \delta$, la norme de ${\textup{év}}_x$ est uniformément minorée. La remarque en découle.

\subsubsection*{Construction}
Choisissons un entier $k_1\geq 1$. Posons
\[
F_0=\{x_n\tq n < k_1\}.
\]
Il existe un polynôme trigonométrique $P_1\in V_{k_1}$, tel que $P_1(F_0)=\{0\}$ et $P_1(x_{k_1})\neq 0$. Si l'on définit $s_1=P_1$, alors l'ensemble des temps des passage $n\leq k_1$ de la suite $(z_n)$ sur la courbe $G(s_1)$ coïncide avec~$\{k_1\}$.

Supposons maintenant $s_i$ définie en sorte que l'ensemble des temps de passage $\{n\tq n\leq k_i \; {\text{et}} \; z_n\in G(s_i)\}$ coïncide avec $\{k_j\tq j\leq i\}$. Considérons l'ensemble $F_i=\{x_n\tq n\leq k_i\}$; il comporte $k_i$ éléments distincts. Soit $\delta_i>0$ suffisamment petit pour qu'il existe un intervalle~$I$ de longueur $>0$ dans $\{ x\in \R/Z\tq \dist(x,F_i)\geq \delta_i\}$. Soit $\eta_i$ un réel $>0$ que l'on choisira ultérieurement. Soit $\epsilon_i$ un réel $>0$ pour lequel la remarque préliminaire soit valable pour $k_i$, $F_i$, $\delta_i$, $\eta_i$. Par densité de la suite $(z_n)$,
nous pouvons trouver un entier $k_{i+1}$ tel que $k_{i+1}>2k_i$ et
\begin{align}
x_{k_{i+1}} \in I \\
\av{s_i(x_{k_{i+1}})-y_{k_{i+1}}} &<\epsilon_i.
\end{align}
Ainsi, le point $z_{k_i+1}$ est à distance $<\epsilon_i$ du graphe $G(s_i)$ et sa première coordonnée est à distance $\geq \delta_i$ de $F_i$.
Il existe alors un polynôme trigonométrique $P_{i+1}\in V_{k_i+1}$ tel que $P_{i+1}(F_i)=\{0\}$, $P_{i+1}(x_{k_{i+1}})=s_i(x_{k_{i+1}})-y_{k_{i+1}}$ et $\norm{P_{i+1}}\leq \eta_i$. Posons $s_{i+1}^0(t)=s_i(t)-P_{i+1}(t)$. Les entiers $n\leq k_i$ tels que $z_n\in G(s_{i+1}^0)$ sont encore les $k_j$ pour $j\leq i$; par ailleurs, $z_{k_{i+1}}$ est aussi situé sur $G(s_{i+1}^0)$. Nous allons modifier $s_{i+1}^0$ pour assurer qu'aucun des $z_n$ ne soit sur le graphe
lorsque $k_i<n<k_{i+1}$. Pour cela, on choisit $Q_{i+1} \in V_{k_{i+1}}$ tel que
\begin{itemize}
\item $Q_{i+1}(F_i\cup \{x_{k_{i+1}}\})=\{0\}$;
\item si $k_i< n <k_{i+1}$, alors $Q_{i+1}(x_n)=0$ si, et seulement si $z_n\notin G(s_{i+1}^0)$.
\end{itemize}
Un tel choix est possible car les $x_n$ sont distincts; en multipliant $Q_{i+1}$ par une constante non nulle, nous imposerons aussi $\norm{Q_{i+1}}\leq \eta_{i}$. Posons
\begin{equation}
s_{i+1}=s_{i+1}^0+Q_{i+1}=s_i+P_{i+1}+Q_{i+1}
\end{equation}
et $P_{i+1}+Q_{i+1}\in V_{k_{i+1}}$ vérifie $\norm{P_{i+1}+Q_{i+1}}\leq 2\eta_i$. Alors
\begin{equation}
\{ n\leq k_{i+1}\tq z_n\in G(s_i)\}=\{k_j\tq j\leq i+1\}.
\end{equation}

Si les $\eta_i$ tendent suffisamment vite vers $0$, la suite de fonctions trigonométriques $(s_i)_{i\geq 1}$ converge vers une fonction analytique $1$\nobreakdash-pé\-rio\-dique vérifiant $\{n\tq z_n\in G(s)\}=\{k_i\tq i\geq 1\}$, ce qu'il fallait démon\-trer.

\refstepcounter{section}\label{par:preuve_lech}
\begin{center}
{\bfseries\appendixname\ \protect\ref{par:preuve_lech}. Démonstration\\ du lemme de plongement de Lech}
\addcontentsline{toc}{section}{\protect\appendixname\ \protect\ref{par:preuve_lech}. Démonstration du lemme de plongement de Lech}
\end{center}

Écrivons $\bfK$ comme une extension algébrique d'une extension transcendante pure $\bfL$ de $\Q$ (voir~\cite{LangAlgebra}). En notant $\ell$
le degré de transcendance de $\bfL$ sur $\Q$, nous pouvons fixer un isomorphisme $\bfL\simeq \Q(t_1, \ldots t_\ell)$ où les $t_i$
sont des indéterminées. Le théorème de l'élément primitif (voir~\cite{LangAlgebra}) montre qu'il
existe $\alpha\in \bfK$ tel que $\bfK=\bfL[\alpha]$. Soit $P_\alpha(\vx)\in \bfL[\vx]$ le polynôme minimal (unitaire) de $\alpha$ sur~$\bfL$ ; quitte à multiplier $P_\alpha$
par un élément non nul de $\Z[t_1, \ldots, t_\ell]$, nous pouvons supposer que $P_\alpha$ appartient à l'anneau $\Z[t_1, \ldots, t_\ell][\vx]$ (ce faisant, $P_\alpha$ n'est plus unitaire).
Soit $D$ le discriminant de $P_\alpha$ par rapport à la variable $\vx$: c'est un élément de $\Z[t_1, \ldots, t_d]$.

Pour chaque élément $s$ de $S\setminus\{0\}$, il existe un polynôme $G_s\in \bfL[\vx]$ tel que $s=G_s(\alpha)$. Nous fixerons
$G_s$, ainsi qu'un polynôme $B_s\in \Z[t_1, \ldots, t_l]$ tel que $B_s\times G_s$ soit un élément de $\Z[t_1, \ldots, t_\ell][\vx]$. Le
résultant de $P_\alpha(\vx)$ et de $(B_sG_s)(\vx)$ sera noté $R_s$: c'est un élément de $\Z[t_1, \ldots, t_\ell]$.

Choisissons des entiers $(a_1, \ldots, a_\ell)$ tels que:
\begin{itemize}
\item $D(a_1, \ldots, a_\ell)$ n'est pas nul ;

\item $P_\alpha(a_1, \ldots, a_\ell)(\vx)$ n'est pas un polynôme constant (de la varia\-ble~$\vx$) ;

\item pour tout $s\in S$, $B_s(a_1, \ldots, a_\ell)$ et $R_s(a_1, \ldots, a_\ell)$ ne sont pas nuls.
\end{itemize}
Soit ${\mathcal{B}}$ l'ensemble des premiers $p$ tels que (a) ces trois propriétés restent valables modulo
$p$ et (b) le polynôme $P_\alpha( a_1, \ldots, a_\ell)(\vx)$ a une racine modulo~$p$. Le lemme~\ref{lem:comptage_pour_obtenir_des_racines} montre
que ${\mathcal{B}}$ est infini.

Fixons alors un $p$ dans ${\mathcal{B}}$. Comme $\Z_p$ n'est pas dénombrable,
nous pouvons trouver $\ell$ nombres $\tau_i\in \Z_p$ tels que $\Q(\tau_1, \ldots, \tau_\ell)$ soit
une extension transcendante pure de $\Q$. Le polynôme
\[
P_\alpha( a_1+p\tau_1, \ldots, a_\ell+p\tau_\ell)(\vx)
\]
a une racine modulo $p$;
comme $D(a_1, \ldots, a_\ell)$ n'est pas nul modulo $p$, le lemme de Hensel assure l'existence d'une racine ${\hat{\alpha}}\in \Z_p$ de
$P_\alpha( a_1+p\tau_1, \ldots, a_\ell+p\tau_\ell)(\vx)$. Il existe donc un unique homomorphisme $\iota:\bfK\to \Q_p$ tel que $\iota(t_i)=a_i+p \tau_i$
et $\iota(\alpha)={\hat{\alpha}}$.

Soit $s$ un élément de $S\setminus \{0\}$. Le choix de $p$ montre que
\[
\iota(B_s(a_1+p\tau_1, \ldots, a_\ell+p\tau_\ell))
\]
est dans
$\Z_p$ et n'est pas nul modulo $p$; sa valeur absolue est donc égale à~$1$. Cet argument s'applique aussi à
\begin{equation}
B_s(a_1+p\tau_1, \ldots, a_\ell+p\tau_\ell) G_s(a_1+p\tau_1, \ldots, a_\ell+p\tau_\ell)(\hat\alpha)
\end{equation}
car $R_s(a_1+p\tau_1, \ldots, a_\ell+p\tau_\ell)$ n'est pas nul modulo $p$. Ainsi, $\av{\iota(s)}_p=1$, ce qui conclut la démonstration.

\backmatter
\bibliographystyle{jepplain+eid}
\bibliography{xups23-03}
\end{document}