La présentation, la lisibilité, l'orthographe, la qualité de la rédaction, la clarté et la précision des raisonnements entreront pour une part importante dans l'appréciation des copies.
Les candidats sont invités à encadrer dans la mesure du possible les résultats de leurs calculs.
Ils ne doivent faire usage d'aucun document ; l'utilisation de toute calculatrice et de tout matériel électronique est interdite. Seule l'utilisation d'une règle graduée est autorisée.
Si au cours de l'épreuve un candidat repère ce qui lui semble être une erreur d'énoncé, il le signalera sur sa copie et poursuivra sa composition en expliquant les raisons des initiatives qu'il sera amené à prendre.
Tout au long du sujet désigne un entier naturel supérieur ou égal à 2 .
Notations :
Pour , on note la valeur absolue de .
Pour tout vecteur , on note
et .
On notera la matrice identitée de .
Pour , on note la matrice transposée de .
Résultat admis :
Pour , on a .
Définitions :
Une matrice est dite positive si tous ses coefficients sont des nombres réels positifs ou nuls; elle est dite strictement positive si tous ses coefficients sont des nombres réels strictement positifs.
Un vecteur colonne est dit de probabilité si est positif et si .
Une matrice est dite stochastique si elle est positive et si pour tout .
Un vecteur est dit invariant par si .
Soit . La suite de matrice est convergente vers la matrice si pour tout converge vers .
Préliminaires
Soit tel que
P1. Montrer que, pour tout réel, .
P2. Etude du cas . On supposera donc, dans cette question P2 uniquement, .
P2.a Montrer que
P2.b Montrer à l'aide de (E), que si pour tel que , alors et ont même signe.
P2.c Conclure que ou .
P3. Montrer que ou dans le cas général où est un entier quelconque vérifiant .
Partie I Google et PageRank
En 1998, Sergey Brin et Larry Page, co-fondateurs de Google, ont introduit la notion de PageRank. Le PageRank est un indice mesurant la notoriété de chacune des pages Web référencées dans Google. Bien que les outils de calcul de cet indice soient maintenus secrets, le principe mathématique sur lequel repose ce calcul est public et peut-être résumé comme suit.
On numérote de 1 à les pages Web référencées dans Google (on pense que est un bon ordre de grandeur). On dira qu'une page pointe vers une autre page s'il existe un lien dans la page permettant de rejoindre la page en cliquant dessus.
Pour tout , on note le nombre de pages vers lesquelles la è page pointe. Lorsque pour chaque couple de pages posons si et . Lorsque , posons soit si pointe vers soit sinon. Si , on définit la matrice de Google par
Pour tout , le PageRank d'une page est un nombre réel positif ou nul noté . Les sont par ailleurs définis par le système d'équations
A la question "que mesure exactement pour une page donnée ce fameux PageRank ?", leurs concepteurs assurent qu'il s'agit de la "chance" qu'un surfeur se retrouve sur la page en question. Le but de ce sujet est de lever un coin du voile entourant le mystère du PageRank en justifiant d'une part de l'existence et de l'unicité de la solution du système ( S ) et en fournissant d'autre part une interprétation probabiliste de ce système permettant de donner un sens mathématique aux affirmations de Brin et Page.
A. Etude de la matrice G de Google
On démontre dans cette section quelques propriétés simples de la matrice de Google.
I.A. 1 Montrer que est une matrice strictement positive.
I.A. 2 Soit tel que , montrer que .
I.A. 3 Soit tel que . En écrivant que
montrer que .
I.A. 4 Que peut-on en déduire pour ?
I.A. 5 Montrer que le vecteur défini en (S), en admettant qu'il existe, est invariant par .
B. Modèle du surfeur sur le Web
Dans toute cette partie ( ) désigne un espace probabilisé et toutes les variables aléatoires utilisées sont toutes définies sur cet espace. On rappelle que l'on numérote de 1 à les pages Web référencées dans Google. On considère un internaute surfant sur le Web en utilisant Google, on
note la première page visitée et la page sur laquelle il se retrouve au bout de opérations (soit de clic sur un lien dans une page soit d'abandon au profit d'une autre adresse). Pour tout , est à valeurs dans et on admettra que la suite de variables aléatoires vérifie pour tout entier et tout
où est la matrice de Google. On considère un entier naturel strictement positif.
I.B. 1 On note le vecteur de dont pour tout , la è composante est définie par . Vérifier que est bien un vecteur de probabilité.
I.B. 2 Exprimer pour tout à l'aide de et .
I.B. 3 En déduire que .
I.B. 4 Montrer que pour tout entier naturel .
Partie II Matrices stochastiques
Le but de cette deuxième partie est de prouver l'existence et l'unicité d'un vecteur de probabilité invariant pour une matrice stochastique strictement positive.
A. Etude d'un exemple
On considère une matrice stochastique et strictement positive. peut se mettre sous la forme
avec et .
II.A. 1 Déterminer l'ensemble des vecteurs vérifiant .
II.A. 2 Montrer qu'il existe un unique vecteur de probabilité invariant par et le calculer.
II.A. 3 Prouver que pour tout entier
II.A. 4 En déduire que converge lorsque tend vers l'infini vers une matrice dont les deux vecteurs colonnes sont égaux à .
On cherchera à généraliser ce résultat dans la partie III.
B. Existence d'un vecteur de probabilité invariant
Dans cette section II.B, est une matrice stochastique.
II.B. 1 On note le vecteur élément de dont toutes les composantes valent 1 . Calculer .
II.B. 2 Montrer que si est inversible, alors est aussi inversible.
II.B. 3 Déduire des deux questions précédentes que 1 est valeur propre de .
Soit une valeur propre réelle de telle que et un vecteur propre de associé à la valeur propre .
II.B. 4 Prouver que le vecteur est positif.
II.B. 5 Montrer que le vecteur est invariant par .
Indication : on pourra sommer les composantes du vecteur .
II.B. 6 Prouver l'existence d'au moins un vecteur de probabilité invariant par .
C. Unicité d'un vecteur de probabilité invariant
Dans cette section II.C, est une matrice stochastique strictement positive. On sait d'après II.B. 6 qu'il existe au moins un vecteur de probabilité invariant par noté
Cette section II.C permettra de démontrer l'unicité d'un tel vecteur.
II.C. 1 Prouver que si est un vecteur positif invariant par , alors soit soit est strictement positif.
II.C. 2 Justifier que est strictement positif.
On considère à présent un autre vecteur de probabilité noté
invariant par . Puis, on définit
II.C. 3 Montrer que est invariant par .
II.C. 4 Montrer que est positif mais pas strictement positif.
II.C. 5 En déduire que .
II.C. 6 En conclure que .
On reprend jusqu'à la fin de cette partie les notations de la partie I sur Google et la notion de PageRank.
II.C. 7 Montrer que le système ( S ) définissant le PageRank admet bien une et une seule solution.
II.C. 8 Démontrer que pour tout .
II.C. 9 Le rôle du paramètre est essentiel pour assurer l'unicité de la solution du système (S). Que se passerait-il pour et disons pour simplifier à l'extrême? (Songer qu'il peut exister des pages Web qui ne pointent vers aucune autre!).
Partie III Validation du PageRank
Dans toute cette partie III, on considère matrice stochastique strictement positive. On notera l'unique vecteur de probabilité invariant par .
A. Valeurs propres de
Il s'agit dans cette section III.A de localiser les valeurs propres de .
III.A. 1 Vérifier que pour tout vecteur on a
avec de plus lorsque est positif.
III.A. 2 En déduire que pour toute valeur propre réelle de , on a .
Soient une valeur propre réelle de telle que , et un vecteur propre de associé à tel que . On sait grâce au II.B. 5 que .
III.A. 3 Etablir l'identité
où est la è composante de pour .
III.A. 4 En déduire en utilisant P 3 que est colinéaire à puis que .
B. Convergence
On fera dans cette section III.B l'hypothèse supplémentaire que est diagonalisable.
Le but de ce qui suit est d'établir que la suite converge, lorsque tend vers l'infini, vers la matrice dont les vecteurs colonnes sont tous égaux à .
III.B. 1 Montrer qu'il existe une matrice diagonale et une matrice inversible , telles que pour tout .
III.B. 2 Prouver que parmi les coefficients diagonaux de un et un seul est égal à 1 alors que tous les autres sont de valeur absolue strictement inférieure à 1 .
III.B. 3 En déduire que la suite converge vers une matrice .
III.B. 4 Prouver que pour tout est stochastique puis que est stochastique.
III.B. 5 Démontrer que .
III.B. 6 En déduire que chacun des vecteurs colonnes de est invariant par .
III.B. 7 Conclure.
On admettra pour la partie III.C que converge lorsque tend vers l'infini vers la matrice dont les vecteurs colonnes sont tous égaux à sous les seules hypothèses stochastique et strictement positive.
C. Application au modèle du surfeur
On reprend pour la fin du sujet les notations du PageRank de Google décrit dans l'introduction de la partie I et du modèle du surfeur décrit dans la partie I.B. On considère la variable aléatoire à valeurs dans dont la loi est définie par
III.C. 1 Montrer que converge en loi vers lorsque tend vers l'infini.
III.C. 2 En quoi ce résultat donne-t-il du sens à l'assertion un peu vague: "le PageRank d'une page donnée représente la chance qu'un internaute se retrouve sur la page en question lorsqu'il surfe"?