vendredi 25 septembre 2015

Bereshit, ou les passionnantes aventures du plan projectif arguésien

Je vais essayer de publier peu à peu, par touches successives, mes idées sur la géométrie projective (sur sa présentation pour être exact). Ce ne sera pas un exposé systématique, au début en tout cas ; il s'agit plutôt, pour le moment, de vous faire saisir la nature de l'intérêt que je porte à cette discipline. C'est donc un work in progress. Je suis prêt à enrichir mon approche de vos réflexions si vous désirez m'en faire part.
Jusqu'à présent, je me suis surtout intéressé à la gp comme un moyen de fonder la géométrie "classique", affine, euclidienne et non-euclidienne. Dans la présentation "moderne" de la géométrie affine et euclidienne, à l'université, on fait généralement dériver ces géométries de l'étude des espaces vectoriels. Un espace affin ou euclidien est donc essentiellement un espace vectoriel muni de certaines structures supplémentaires, et un espace projectif peut être vu de la même façon (avec d'autres structures bien entendu). Mais l'on peut également faire dériver ces différents types d'espaces d'un espace projectif, défini axiomatiquement. Contrairement à ce que pensent beaucoup de gens, il n'est pas du tout nécessaire de partir d'un espace vectoriel pour définir un espace projectif. On peut très bien faire le contraire, cela ne pose aucun problème logique ou autre. Et l'on peut "construire" les différents types d'espaces géométriques les plus couramment utilisés à l'université à partir d'un espace projectif, que l'on définit au moyen des axiomes appropriés. Il n'est même pas nécessaire d'avoir un corps de départ. Si notre géométrie est une géométrie sur un corps (celui des réels par exemple), on peut construire ce corps à partir des axiomes de l'espace projectif arguésien plus quelques conditions supplémentaires (continuité...). L'intérêt, théorique et "esthétique" de cette approche, est de construire toutes les structures de la géométrie à partir d'axiomes très simples et purement géométriques, c'est-à-dire impliquant des êtres nommés "points" et "droites" (en fait juste les points suffisent, on peut formuler les axiomes de la gp sans faire référence aux droites, plans etc. mais laissons cela pour le moment) et des relations bien définies entre ces êtres. Ainsi, les points et les relations élémentaires entre les points deviennent l'ingrédient de base de la géométrie, et non les nombres comme dans l'approche algébrique. Les structures algébriques apparaîtront comme une conséquence du fonctionnement des structures géométriques que nous aurons définies, non comme leur cause. Quoique en fait, très vite nous nous retrouverons en train d'étudier les propriétés de groupes de transformations agissant sur une structure élémentaire, et c'est cela qui nous permettra d'ériger des structures plus complexes ; donc les groupes, structures algébriques, seront au coeur de notre approche, mais d'abord comme groupes de transformations, les nombres apparaîtront après. La principale justification de cette approche est qu'elle est possible, très cohérente mathématiquement, et dans les sciences, tout ce qui est possible doit se réaliser un jour ou l'autre. Il y a aussi une motivation d'ordre "esthétique" ; partir de relations très simples entre "points", "droites", "plans", relations purement spatiales, et construire pas à pas des structures géométrico-algébriques complexes est assez fascinant ; les démonstrations que cette technique met en oeuvre sont d'un style particulier, elles seront assez élégantes souvent. Si l'on est sensible à la beauté, à l'élégance en mathématiques, on aimera sans doute cette façon de procéder. Mais bien sûr l'élégance est une notion très subjective, alors que les mathématiques demandent surtout de l'objectivité. C'est donc assez paradoxal d'en appeler à quelque chose d'aussi subjectif pour apprécier une démarche mathématique. Mais je suis de ceux qui pensent encore que l'utilité n'est pas le seul critère dans les sciences ni leur seule justification, et que la beauté y est aussi pour quelque chose dans l'attrait qu'elles exercent sur nous. Je ne crois pas qu'Euler, Gauss ou Poincaré n'aient jamais eu en vue que l'utilité, Platon et Pythagore considéraient les mathématiques comme une voie d'accès à la sagesse - à cause de l'harmonie qu'elles dégagent - et c'est ce que je pense aussi. En apprenant à construire des structures complexes à partir de relations simples, je pense qu'on travaille à l'harmonie de son esprit. C'est dans cet esprit-là que je travaille. Pour comprendre ce que j'essaie de faire, il vaut donc mieux que l'idée d'une "belle" démonstration ait un sens pour vous, sinon tant pis, nous risquons de mal nous comprendre.

Fondements

Nous allons nous concentrer ici sur l'espace à deux dimensions, le plan. L'espace euclidien bidimensionnel, le plan euclidien, est une structure mathématique d'une certaine complexité, dans laquelle il est possible d'énoncer et de démontrer un grand nombre de théorèmes qui n'ont rien de trivial. Il peut paraître assez fascinant, c'est mon point de vue, de constater que cette structure très riche peut être dérivée d'une structure un peu moins "différenciée", celle du plan projectif, que l'on peut définir à partir de quelques axiomes remarquablement simples :

0. Le plan projectif est un ensemble dont les éléments sont appelés "points" ; il est muni d'une famille de sous-ensemble appelés "droites", tels que :

1. Toute droite comporte au moins trois points
2. Il existe trois points non compris dans une même droite
3. Deux points appartiennent à une et une seule droite
4. Deux droites ont un et un seul point en commun

Le premier "axiome" n'est pas vraiment un axiome mais plutôt une définition, c'est pourquoi nous l'avons numéroté 0 ; les vrais axiomes sont les propositions 1 à 4 qui déterminent les rapports entre points et droites caractérisant la structure projective. Introduisons aussi un peu de terminologie : on dira que trois points sont "alignés" s'ils appartiennent à une même droite, qu'une droite "passe par" un point, que deux droites "se rencontrent" en un point. Trois droites sont "convergentes" ou "concourantes" si elles passent par un même point. Dans la suite, nous noterons les points par des lettres majuscules et les droites par des lettres minuscules, le plus souvent. De plus, nous noterons AB la droite passant par les points A et B, et a.b le point d'intersection des droites a et b.
Pour être tout à fait rigoureux, l'axiome 3 devrait plutôt être formulé : étant donnés deux points X, Y, il existe une et une seule droite d telle que X et Y soient éléments de d (ou compris dans d). Et même, il serait mieux de formuler cela en langage mathématique, en utilisant le moins de mots possibles. Mais dans l'approche qui est la mienne, je considère qu'une expression comme "toute droite comporte", "deux points appartiennent à", est suffisamment claire. Ce faisant, je suppose que le lecteur est capable de la retraduire correctement en langage mathématique pur ; c'est un pari un peu osé si l'on veut, mais cela permet des énoncés beaucoup moins lourds. Il faut parfois savoir vivre dangereusement...

On remarquera la symétrie des axiomes 3 et 4, dits axiomes d'incidence, les plus importants : de fait, il n'y a que des droites sécantes dans le plan projectif, sa structure est donc plus homogène que celle du plan affin ou euclidien, d'où son intérêt ; en outre, points et droites jouent un rôle symétrique, et comme on peut montrer que par tout point passent au moins trois droites et qu'il existe trois droites non concourantes, les notions d'alignement et de convergence sont également symétriques. Dès lors, si l'on intervertit "points" et "droites", on obtient une structure possédant les mêmes propriétés que le plan projectif : c'est le plan projectif dual, dont les points sont les droites du premier plan que j'appellerai plan "direct", et vice-versa. Ces deux plans ont les mêmes propriétés, et chaque théorème vrai dans l'un reste vrai dans l'autre ; de sorte qu'à tout théorème impliquant des points et des droites, correspond un théorème "dual", obtenu en intervertissant points et droite, alignement et convergence, etc. C'est le fameux principe de dualité projective. En dimension finie, la dualité est au coeur de la géométrie projective ; elle peut notamment servir de point de départ à l'étude des coniques. (Tout ceci se transpose aisément en dimensions 3, 4, etc. En revanche, dans les espaces projectifs de dimension infinie, qui existent, la question de la dualité semble plus délicate.)

Les axiomes 1 à 4 définissent une certaine structure : tout ensemble d'objets qui vérifie ces propositions est un plan projectif, par définition. Il existe donc une infinité de plans projectifs possédant, en plus de cette structure commune, des propriétés très différentes, dues à des axiomes supplémentaires. Il existe des plans projectifs avec une infinité de points, et d'autres qui n'ont qu'un nombre fini de points et de droites, on les appelle des plans projectifs finis. Les 4 premiers axiomes permettent entre autres de démontrer que tout plan projectif comprend au moins sept points, mais pas forcément plus. Le plus petit plan projectif comprend donc exactement sept points (et sept droites, car il y a toujours autant de droites que de points dans un plan projectif) : c'est le plan projectif à sept points et sept droites ou "plan de Fano". On peut le représenter comme suit :

Les ronds noirs représentent les points, et les lignes, les droites. Les sept droites sont les trois côtés et les trois hauteurs du triangle, plus le cercle central qui doit être considéré comme une droite. On peut en effet vérifier que les points et "droites" ainsi définis vérifient les axiomes, et il n'en faut pas plus. Du moment que deux ensemble d'objets vérifient les axiomes d'incidence, on peut les appeler "points" et "droites" et considérer qu'on a un plan projectif. C'est ainsi que fonctionnent les mathématiques. Il faut noter de plus que sur le schéma ci-dessus, les "droites" sont seulement les sept ensemble de trois points réunis par des lignes ; chaque droite comporte exactement trois points, pas un de plus.
Dans le même genre, on a le plan projectif à 13 points (et 13 droites), qui peut être représenté ainsi :



Les plans projectifs finis ont des applications en analyse combinatoire et dans les domaines connexes comme la cryptographie. Dans la suite, cependant, nous nous intéresserons surtout aux plans projectifs infinis (avec une infinité de points ; toutefois, noter qu'ils sont tous de dimension 2, par définition), qui permettent plus de développements géométriques.

Projectivités et perspectivités
 
Avec ces 4 axiomes de base, très simples comme on le voit, on ne peut pas démontrer énormément de théorèmes. Mais ce qui est intéressant surtout, c'est de considérer les transformations qui laissent invariante cette structure. On appelle projectivité une transformation, c'est-à-dire une application injective du plan projectif dans lui-même, qui conserve les propriétés d'alignement des points, c'est-à-dire qui transforme trois points alignés en trois points alignés et trois points non alignés en trois points non alignés. Injective signifie évidemment qu'elle transforme deux points distincts en deux points distincts. On exigera aussi, au choix, qu'une telle transformation soit surjective - donc bijective, elle admet une inverse - ou qu'elle ne fixe pas plus de trois points ou alors tous les points (identité), c'est-à-dire que la seule projectivité qui fixe quatre points est l'identité, par hypothèse. Bon, en fait, je peux montrer que dans le cadre du plan arguésien, ces deux exigences reviennent au même, mais pas qu'une transformation injective qui conserve l'alignement est forcément bijective, bien que ce soit mon intuition. Dans les traités que j'ai lus (Wylie, Veblen and Young, Von Staudt, Godeaux et Rozet...), les projectivités (souvent appelées "homographies", moi j'utilise la terminologie de F. Buekenhout, un grand mathématicien belge qui fut mon professeur de gp), on postule toujours la bijectivité, la question n'est donc pas abordée. J'espère arriver à déterminer si c'est un overstatement comme je le subodore ou non, mais laissons cela pour le moment.
Au passage, vous noterez cependant que cette question n'est pas triviale, et qu'elle ne se pose que dans l'approche géométrique qui est la mienne. Dans l'approche généralement enseignée, algébrique, on définit le plan projectif à partir de l'espace vectoriel 3D, et les projectivités sont juste les applications linéaires. On ne se pose pas ce genre de question, non par sottise mais parce qu'on n'est pas vraiment intéressé par ce genre de problème qui à la limite relève plus de la logique mathématique que de la géométrie. Pourtant cette question n'est pas sans intérêt. Là, vous voyez, j'essaie de vous expliquer pourquoi j'aime bien cette manière de procéder.

Bon. On a donc défini les projectivités comme les transformations qui conservent la structure projective définie par les axiomes ci-dessus. On démontre facilement que les projectivités transforment les droites en droites, et trois droites convergentes en trois droites convergentes : comme elles conservent l'alignement, elles conservent la convergence ; de même, toute transformation injective qui conserve la convergence des droites est une projectivité. Alignement des points et convergence des droites sont deux propriétés symétriques, "duales". Ensuite, un type important de projectivités est celles que l'on appelle "perspectivités", qui fixent tous les points d'une droite, appelée l'axe.
D'où notre premier théorème important : toute perspectivité fixe également les droites passant par un point, appelé le centre. Elle les fixe globalement, c'est-à-dire qu'une droite passant par ce point sera transformée globalement en elle-même, mais ses points peuvent bouger (à part le centre), tout en restant sur cette droite. Toute projectivité qui a un axe possède également un centre, et vice-versa. Le centre peut éventuellement appartenir à l'axe même ; j'appelle ce type de perspectivité "transvection", sinon je parlerai de "perspectivité générale". Le centre est alors distinct de l'axe.
 
En supposant qu'il existe une perspectivité, il est clair qu'elle est entièrement déterminée par son centre O, son axe a et un couple de points A, A' tels que A' soit l'image de A. La figure ci-dessous montre comment construire l'image d'un point B quelconque : B' appartient forcément à la droite OB. Le point C appartient à l'axe, il est donc fixe ; comme les perspectivités conservent l'alignement, B' appartient aussi à la droite A'C, donc B' = OB.A'C. Mais cela ne prouve pas qu'il existe des perspectivités ! Ce sera l'objet du « théorème » de Desargues (grand mathématicien français du XVIIIe siècle, un des esprits les plus originaux de tous les temps ; il a créé un langage mathématique nouveau à lui tout seul !).


Les perspectivités jouent un rôle très important en géométrie. Elles permettent de formuler le dernier axiome, qui n'est autre qu'une version minimale du théorème de Desargues, qui implique la version complète et l'existence de perspectivités. En effet, il a été formulé à l'origine comme un théorème de la géométrie affine, mais en géométrie projective, c'est plutôt un axiome, qui permet d'algébriser le plan projectif, en tout cas d'y introduire des coordonnées homogènes.

Théorème de Desargues

Il existe différentes manières de le formuler. La plus simple est de postuler l'existence d'un ensemble minimal de perspectivités :

5. Si O, X, Y sont trois points alignés et d une droite, il existe une perspectivité de centre O, d'axe d, appliquant X sur Y

Cette formulation est trop forte, c'est un overstatement (je dis deux fois la même chose mais j'aime bien ce mot, désolé). En fait, il suffit de postuler que cette proposition est vraie pour une droite d et un point O fixés, on peut alors démontrer qu'elle est vraie quels que soient O et d ; on peut même fixer deux points X1, X2 et formuler l'axiome pour tout point Y aligné avec O et X1 ou avec O et X2, plus une partie pour les transvections d'axe d ; à partir de là, on peut démontrer l'axiome 5. ou le théorème de Desargues. C'est la formulation "minimale". Mais cela ne change rien pour la suite du développement ; l'important est de postuler l'existence des perspectivités.

On peut aussi commencer par définir les perspectivités "conjuguées" : deux perspectivités sont conjuguées si le centre de l'une est sur l'axe de l'autre, et vice-versa (on parle ici de perspectivités générales, non de transvections). Le théorème de Desargues pourra alors se formuler très simplement :

5bis. Deux perspectivités conjuguées commutent toujours

c'est-à-dire que l'ordre dans lequel on les effectue ne change pas le résultat. On peut visualiser cette proposition grâce à la figure suivante :



Si les lignes rouges convergent, les lignes bleues aussi et vice-versa. Cette formulation n'est pas vraiment classique, mais l'équivalence est facile à montrer. De plus, si l'on veut travailler dans un corps commutatif comme celui des réels, on peut remplacer cet axiome par un plus fort, qui équivaut au "théorème de Pappus" dont la formulation classique est la suivante :

Soient trois points A, B, C alignés et trois autres points alignés (sur une autre droite) A', B', C' ; posons : P = AB'.A'B, Q = AC'.A'C, R = BC'.B'C. Les points P, Q, R sont alignés.

Mais on vérifie facilement que cette proposition se traduit en termes de perspectivités de la manière suivante :

6. Deux perspectivités de même centre et de même axe commutent toujours

en comparant cette formulation à la version 5bis du théorème de Desargues, la symétrie apparaît  évidente : il s'agit toujours d'une question de commutativité entre perspectivités d'un certain type.
Le théorème de Pappus implique celui de Desargues, mais non vice-versa. On peut montrer, (voir plus bas), que le théorème de Desargues (axiome 5. ou 5bis.) implique que l'ensemble des perspectivités de centre et d'axe donnés forme un corps ; le théorème de Pappus (axiome 6) implique que ce corps est commutatif. En faisant les hypothèses adéquates sur l'infini (le corps ne comporte pas un élément idempotent à part le neutre) et la continuité, le corps comprendra au moins celui des rationnels et des réels. Le fait que les perspectivités d'axe et centre donnés forment un corps permet d'introduire dans le plan des coordonnées homogènes, c'est-à-dire de "repérer" la position de chaque point par un triplet de nombres (d'éléments du corps), définis à une constante multiplicative près. C'est-à-dire que les triplets (X, Y, Z) et (2X, 2Y, 2Z) = 2(X, Y, Z), par exemple, représentent le même point. On peut donc identifier l'ensemble des points du plan à l'ensemble de ces triplets "homogènes". Le plan devient un être algébrique ; mais c'est le résultat d'un processus d'élaboration géométrique, non un postulat de départ. C'est l'étude de ce processus qui, jusqu'à présent, a surtout retenu mon attention. (Ce n'est pas la seule approche possible de la gp, mais j'estime cette approche féconde, en tout cas si on aime que les mathématiques soient l'occasion de voir le monde autrement, d'ouvrir son esprit. Petite parenthèse subjective.)
C'est dans le théorème de Desargues que réside la clef du passage de la géométrie à l'algèbre, de l'algébrisation de la géométrie. C'est pourquoi, personnellement, je regarde le théorème de Desargues comme le théorème géométrique le plus important au monde. Opinion personnelle, mais j'adore ce théorème. Et surtout les nombreuses variantes auxquelles il se prête, tenez en voici une autre :

étant donnés deux pentagones ABCDE et A'B'C'D'E' tels que chaque sommet du premier appartient à un côté (différent) du second, et que quatre des sommets du second appartienne à un côté (différent) du premier, le cinquième sommet appartient au cinquième côté.

Visualisons cela :
Cela nous fait déjà quatre façons assez différentes de formuler ce théorème : en termes d'existence de perspectivités, de perspectivités harmoniques qui commutent, d'existence du birapport, ou de pentagones mutuellement inscrits. Il en existe encore bien d'autres. Celle-ci par exemple : toute projection centrale peut être prolongée en une perspectivité (ou plus rigoureusement, étant donnée une projection centrale de centre O d'une droite d sur une droite d', il existe une perspectivité de centre O telle que l'image de d soit d'). L'équivalence avec le théorème de Desargues se voit sur la figure suivante :
Cette formulation n'est pas gratuite ; en effet, le théorème de Pappus peut alors se formuler en termes de projections centrales également : toute composée de projections centrales est entièrement déterminée par son action sur trois points. Outre que cela fait apparaître une nouvelle symétrie entre les deux théorèmes, on a ainsi décomposé le théorème de Pappus : les deux propositions ensemble impliquent ce théorème, mais aucune séparément ne l'implique ; la première proposition équivaut au théorème de Desargues, et si on y ajoute la seconde on obtient celui de Pappus. Mais la seconde proposition seule n'implique pas Pappus parce que rien ne dit qu'une composée de projections centrales se prolonge en une projectivité ; pour cela, il est nécessaire de postuler que toute projection centrale se prolonge en une perspectivité, et c'est précisément le théorème de Desargues. La richesse de ce théorème n'arrête pas de me fasciner.
Signalons au passage qu'à ma connaissance, aucun traité de gp ne mentionne cette décomposition du théorème de Pappus, et c'est dommage. J'estime en effet que, puisque ces deux théorèmes sont en quelque sorte complémentaires, mais que l'un implique strictement l'autre, ce dernier, Pappus, est en quelque sorte "trop riche" ; il est intéressant de savoir ce qu'il faut ajouter à Desargues pour avoir Pappus, et je ne connais aucun auteur à part moi qui ait songé à faire cette analyse (ce qui ne veut pas dire qu'il n'en existe pas, ne me faites pas dire ce que je n'ai pas dit ; j'ai beaucoup cherché mais je ne prétends pas encore avoir tout lu). C'est encore une justification de mon approche.

Entre autres conséquences du théorème de Desargues, toute projectivité peut se décomposer en un produit de trois perspectivités (au plus) ; cette décomposition n'est pas unique, et toute projectivité est entièrement déterminée par son action sur quatre points en position générale : étant donnés quatre points trois à trois non alignés, il existe une et une seule projectivité qui les applique sur quatre autres points en position générale.

Construction du corps

La conséquence importante du théorème de Desargues est la possibilité de construire un corps qui "sous-tend" le plan, et d'attribuer aux points (et aux droites) des coordonnées dans ce corps, donc de traduire les problèmes géométriques en équations algébriques.
Rappelons qu'un corps est un ensemble E muni de deux lois de composition, que l'on note généralement (mais pas obligatoirement) + et . ou "somme" et "produit" ; les éléments de E sont un groupe pour chacune de ces deux lois, et le produit est distributif par rapport à la somme. Un "groupe", cela signifie que chaque loi est associative, autrement dit si x, y, z sont des éléments de E on doit avoir

(x + y) + z = x + (y + z) et (x.y).z = x.(y.z)

de plus, chaque loi possède un élément neutre, c'est-à-dire qu'il existe un élément e et un élément e' tels que pour tout x :

x + e = e + x = x  et  x.e' = e'.x = x

souvent, l'élément neutre de la somme est noté 0 et celui du produit est noté 1, on a alors

x + 0 = 0 + x = x et x.1 = 1.x = x

Chaque loi est "inversible", c'est-à-dire que pour tout x, il existe un élément (-x) tel que

x + (-x) = 0

et un élément x^-1 tel que

x.x^-1 = 1

(sauf éventuellement 0, l'élément neutre de la somme, qui n'a pas toujours d'inverse pour le produit).

Enfin, les deux lois sont distributives l'une par rapport à l'autre, c'est-à-dire que l'on a

x.(y + z) = x.y + x.z et (y + z).x = y.x + z.x

Si l'on a tout cela, on a un corps. Noter que dans un corps, la première loi (+) est toujours commutative (c'est-à-dire que x + y = y + x), mais pas forcément la deuxième (on n'a pas forcément x.y = y.x dans tous les cas).
Si la deuxième loi commute, on a un corps commutatif. Sinon on parle de corps gauche, ou simplement non commutatif.
L'exemple de corps le plus connu est celui des nombres réels, R, c'est-à-dire tous les nombres qui peuvent s'écrire sous la forme d'un nombre entier suivi d'une virgule et d'une suite infinie de décimales, éventuellement nulles à partir d'un certain rang (dans ce cas on a un nombre rationnel), ou périodiques (nombre rationnel aussi), ou alors totalement quelconques. Les deux lois sont l'addition et la multiplication "ordinaires", c'est-à-dire bêtement ceux que l'on voit à l'école primaire, et qui se déduisent en fait de l'addition et de la multiplication des nombres entiers. Les éléments neutres sont le 0 et le 1 bien connus.
Quelques autres exemples de corps :

- le corps des nombres rationnels, Q ; c'est la restriction des réels aux nombres qui peuvent s'écrire comme une fraction d'entiers ;
- le corps des nombres réels algébriques : tous les nombres réels qui sont solution d'une équation algébrique de type polynôme à coefficients rationnels, par exemple la racine carrée de 2 ;
- le corps des nombres complexes, extension des réels ;
- le corps des quaternions, extension des complexes ;
- les corps d'entiers modulo n, qui sont des corps finis à n éléments (avec n entier premier) ; la somme et le produit s'obtiennent en prenant le reste de la division par n. Par exemple, le corps des entiers modulo 2 est le corps à deux éléments, {0, 1}. Un corps de ce type est caractérisé par ses tables d'addition et de multiplication, par exemple dans le cas de {0, 1} :

0 + 0 = 0, 0 + 1 = 1            0.0 = 0, 0.1 = 0
1 + 0 = 1, 1 + 1 = 0            1.0 = 0, 1.1 = 1

Tous ces corps sont commutatifs, sauf celui des quaternions. Un corps commutatif n'est pas forcément fini (cf. celui des réels), mais tout corps fini est commutatif. Chaque corps peut donner naissance à une géométrie projective particulière : par exemple, le corps des entiers modulo 2 donne naissance au plan de Fano, celui des entiers modulo 3 au plan à 13 points, etc. Mais à l'inverse, on peut imposer des conditions (géométriques) à un plan projectif pour qu'il vérifie les propriétés d'un plan sur un corps donné.
Voyons maintenant, de façon simplifiée, comment le théorème de Desargues donne naissance à un corps.

Pour cela, on fixe d'abord une droite d et un point O extérieur à d ; nous allons nous intéresser à l'ensemble des perspectivités d'axe d, et à deux de ses sous-ensembles, l'ensemble des transvections d'axe d (perspectivités d'axe d ayant leur centre aussi sur d) et l'ensemble des perspectivités d'axe d et de centre O. On sait qu'elles existent grâce au théorème de Desargues.
Notons dorénavant

G_d l'ensemble des perspectivités d'axe d,
T_d l'ensemble des transvections d'axe d ou d-transvections,
O_d l'ensemble des perspectivités d'axe d et de centre O

On montre d'abord que chacun de ces ensembles est un groupe pour la loi de composition "naturelle" qui consiste à "enchaîner" une perspectivité après l'autre, c'est-à-dire que si h et k sont deux perspectivités, leur composée est tout simplement hk : "sur un point P quelconque, j'effectue d'abord k et puis h". On vérifie aisément que cette loi de composition est associative, qu'elle possède un élément neutre, la perspectivité identique (qui fixe tout point), et un inverse : si une perspectivité h envoie P sur P', son inverse envoie P' sur P, et la composée des deux est l'identité. De plus, les trois ensembles ci-dessus sont stable par composition : la composée de deux d-transvections est une d-transvection, etc. Ce sont donc des groupes : G_d est un groupe, T_d et O_d en sont deux sous-groupes. Toute l'astuce, maintenant, est de doter O_d d'une deuxième loi de composition, qui en fera un corps ; pour cela nous allons nous servir de T_d.
Tout d'abord, à partir de maintenant, nous notons additivement (+) la composée de transvections : c'est-à-dire que si t et t' sont deux transvections d'axe d, on notera leur composée t + t' au lieu de t'. Simple convention d'écriture, qui se révélera utile pour la suite. De même, la perspectivité identique, en tant qu'élément neutre de T_d, sera notée 0 : c'est la "transvection nulle".
Ensuite, nous allons faire "agir" O_d sur T_d de la façon suivante : si t est une d-transvection, h un élément de O_d et h^-1 son inverse, on définit la transformée de t par h, h*t, comme suit :

h*t = hth^-1

On montre que h*t est encore une d-transvection. En termes de théorie des groupes, cela veut dire que T_d, dans G_d, est un "sous-groupe distingué" (stable par l'action d'un autre sous-groupe).

On montre ensuite que la transformée est distributive par rapport à la composition de d-transvections : quelles que soient t, t' dans T_d et h dans O_d on a

h*(t + t') = h*t + h*t'

Ceci va nous permettre de définir une addition dans O_d. En effet, si h et k sont des éléments de O_d, on montre qu'il existe un seul élément q de O_d tel que

q*t = h*t + k*t

et cet élément ne dépend pas du choix de t ; on peut donc le noter h + k, et par définition h + k = q. C'est leur action sur les transvection qui définit l'addition des perspectivités de O_d.
Tout ceci peut se démontrer à l'aide de constructions géométriques déduites des axiomes d'incidence et du théorème de Desargues.
On montre encore que, dans O_d, le produit (qui reste la composée ordinaire)  est distributif par rapport à la somme : quels que soient h, k et q dans O_d, t dans T_d, on a

h(k + q)*t = (hk + hq)*t, donc h(k + q) = hk + hq.

On a maintenant presque un corps (en fait on a un anneau), mais il y a juste un os : l'addition jusqu'ici n'a ni élément neutre ni (a fortiori) opposé (inverse). Nous allons donc devoir trouver un élément neutre pour l'addition dans O_d. Pour cela, nous introduisons ce que j'appelle une "pseudo-perspectivité", c'est-à-dire une application de T_d dans T_d, notée 0*, qui applique toute d-transvection sur la d-transvection nulle :

0*t = 0 (élément neutre de la loi + dans T_d)

par définition, quelle que soit t. Cet élément 0* n'existe pas en tant que perspectivité du plan projectif, mais son action sur T_d est bien définie. On montre de plus qu'on peut étendre à cet élément la loi additive dans O_d, c'est-à-dire que h + 0* est définie, par l'équation

(h + 0*)*t = h*t + 0*t = h*t + 0 = h*t

et par conséquent on peut écrire h + 0* = 0* + h = h, donc 0* joue bien le rôle d'élément neutre.
Pour l'opposé, enfin, on commence par montrer que l'on peut construire une (vraie !) perspectivité j possédant la propriété d'être auto-inverse (involutive ou idempotente), c'est-à-dire que jj = 1. Cette perspectivité joue le rôle de l'élément -1 dans le corps que nous sommes en train de construire, c'est-à-dire qu'on montre qu'elle possède la propriété que pour toute perspectivité h de O_d et pour toute transvection t :

(h + jh)*t = 0*t = 0

et par conséquent h + jh = 0*.

La multiplication par j transforme une perspectivité h en une perspectivité (-h) = jh qui est son opposée pour l'addition. C'est comme la multiplication par -1 dans le corps des réels.
Maintenant, la loi + dans O_d possède un élément neutre et chaque élément a son opposé, donc O_d, complété par 0*, est un corps.
En outre, l'action de ce corps sur T_d fait de celui-ci un espace vectoriel sur O_d.

Mais le travail n'est pas terminé, car le corps ainsi construit dépend du choix de la droite d et du point O. Mais on peut montrer qu'en fait, tous les corps ainsi construits, par différents choix de O et de d, sont isomorphes, c'est-à-dire qu'on peut les identifier et les considérer comme différentes "copies" d'un seul et même corps qui sous-tend le plan.
Ce corps n'est pas forcément commutatif, mais on a vu qu'il l'est si l'on postule le théorème de Pappus, qui équivaut simplement à dire que les éléments de O_d commutent.

Avoir un corps n'est toutefois pas suffisant pour spécifier complètement notre géométrie, car il existe une infinité de corps. On devra donc imposer des hypothèses supplémentaires permettant de préciser la nature du corps, c'est-à-dire d'identifier O_d à un corps connu.
Par exemple, si l'on postule que le plan contient exactement 7 points (plan de Fano, voir supra), alors on voit facilement que les seules perspectivités non triviales (non identiques) sont les transvections, donc O_d se réduit aux éléments 0 et 1 : c'est le corps à deux éléments, qui est unique (à un isomorphisme près). On en déduit que le plan de Fano est le plan sur le corps des entiers modulo 2. Par un raisonnement identique, on montre que si le plan comprend 13 points, le corps est celui des entiers modulo 3 ({0, 1, 2}), etc.
Si l'on veut avoir une infinité de points, on devra postuler qu'il existe une perspectivité qui ne divise pas 0*, c'est-à-dire que l'on peut l'ajouter indéfiniment à elle-même sans obtenir l'élément neutre. Par itération de la somme, on voit alors que le corps contient au moins l'ensemble des entiers naturels, et leurs inverses, par conséquent, il est au moins isomorphe au corps des rationnels. C'est la "plus petite" géométrie arguésienne à une infinité de points, le plan projectif sur le corps des nombres rationnels.
Si l'on postule de plus la continuité, c'est-à-dire que toute suite infinie de points admet une sous-suite convergente (dans le plan !), ou qu'elle possède au moins un point d'accumulation (grosso modo, un point du plan au voisinage duquel la suite devient infiniment dense), on pourra alors montrer que le corps contient au moins les nombres réels. On pourra donc se restreindre aux nombres réels, et identifier O_d à R de manière à avoir un plan projectif réel (sur le corps des réels). Et ainsi de suite ; par des conditions appropriées, on peut identifier les corps de perspectivités à n'importe quel corps a priori connu.

Birapport

Maintenant que l'on a construit le corps, on va pouvoir introduire des coordonnées ; mais pour cela, il est commode d'introduire d'abord le birapport de quatre points ou droites.
Définissons d'abord le rapport d'une perspectivité : l'axe et le centre étant fixés, on peut associer à chaque perspectivité un nombre réel (ou un élément du corps quel qu'il soit, mais nous supposons maintenant que nous travaillons sur R) que nous nommerons rapport de cette perspectivité, de telle sorte qu'au produit ou à la somme de deux perspectivités corresponde le produit ou la somme de leurs rapports. De plus, à l'inverse ou à l'opposée d'une perspectivité correspond l'inverse ou l'opposé du rapport ; à la perspectivité identique, élément neutre du produit, correspond le nombre 1 ; à la perspectivité auto-inverse j correspond le rapport -1.
Si A, B, C, D sont quatre points alignés, on définit un nombre noté (A B C D) qui est leur birapport : c'est le rapport d'une perspectivité de centre B, dont l'axe passe par A et qui envoie C sur D. Ce nombre ne dépend pas de la position de l'axe (du moment qu'il passe par A). Il possède les propriété suivantes :

1. Il se conserve par projectivité et par projection centrale
2. Si r est un réel et A, B, C trois points distincts alignés, il existe un et un seul point D tel que (A B C D) = r
3. Si E est un cinquième point aligné avec A, B, C, D, on a (A B C E) = (A B C D)(A B D E)
4. (A B C D) + (A C B D) = 1
5. (A B D C) = 1/(A B C D)
6. (D C B A) = (A B C D)

Remarque à propos du point 1 : une projection centrale est une application du plan (ou d'une droite) sur une droite a, qui, à un point P, associe le point P' = OP.a où O est un point fixé, non compris dans a.
Les points 2 à 5 reviennent tout simplement à dire que le rapport d'une perspectivité (d'où l'on déduit le birapport) est un isomorphisme de corps, entre O_d et, dans ce cas-ci, les réels (mais ça marche bien sûr avec n'importe quel corps).
Ces relations permettent de montrer que l'on a également

(A B C D)(B E C D) = (A E C D)
(B A C D) = 1/(A B C D)
(A A C D) = (A B C C) = 1

Si (A B C D) = -1, les points C, D sont dits harmoniquement conjugués par rapport aux points A, B et vice-versa. On dit aussi que les quatre points forment une division harmonique ; cette notion joue un rôle important en gp.
Du fait de la conservation par projection centrale, quatre droites concourantes déterminent sur n'importe quelle droite qui les coupe toutes quatre points ayant toujours le même birapport, de sorte que l'on peut parler du birapport de quatre droites concourantes. Un théorème important dit que

étant donnés quatre points alignés A, B, C, D et trois autres points B', C', D' alignés avec A, si (A B C D) = (A B' C' D'), les droites BB', CC' et DD' sont nécessairement concourantes. La proposition duale et non moins importante est : étant donnés deux faisceaux de quatre droite concourantes a, b, c, d et a, b', c', d' (la droite a commune aux deux faisceaux), si (a b c d) = (a b' c' d'), les points b.b', c.c' et d.d' sont alignés.

Ce théorème fournit, dans beaucoup de démonstrations, un critère essentiel de convergence de droites ou d'alignement de points.
Le birapport est une propriété intrinsèque de quatre points alignés, invariant par toute projectivité ; c'est l'invariant projectif par excellence, une structure fondamentale du plan arguésien. En fait, on peut montrer que si l'on postule l'existence d'un nombre possédant les propriétés 1 à 6 ci-dessus, il en résulte les théorèmes de Desargues et Pappus (si le corps est commutatif) avec toutes leurs conséquences. L'existence du birapport est un équivalent du théorème de Pappus (ou de Desargues, si l'on remplace le corps des réels par un corps quelconque, non nécessairement commutatif). Propriété facile à vérifier mais qui n'est généralement pas mentionnée dans les traités de gp ; voici donc une justification possible de notre approche : elle permet de voir facilement que l'on peut introduire axiomatiquement le birapport et en déduire le théorème de Pappus, plutôt que l'inverse. C'est une possibilité réelle et intéressante - du moins si l'on aime la symétrie - que ne révèle pas forcément l'approche "classique".
Dans les traités de gp, en général, on introduit d'abord les coordonnées homogènes, et on définit ensuite le birapport ; nous verrons en effet que l'on peut définir le birapport en fonction des coordonnées. Mais de notre point de vue, l'approche inverse est plus féconde : maintenant que nous avons défini le birapport - soit axiomatiquement, comme ci-dessus, soit à partir du rapport d'une perspectivité - nous allons nous en servir pour introduire des coordonnées.
Bon, d'accord, c'est pas une grande découverte, mais enfin, soulignons que nous sommes les seuls à notre connaissance à procéder ainsi, à définir les coordonnées à partir du birapport et non l'inverse ; c'est pourtant très logique, je ne comprends pas très bien que cette approche n'ait pas plus de succès, mais il y a parfois des choses mystérieuses dans le monde, c'est comme ça. En procédant ainsi, on va de la géométrie vers l'algèbre ; cela montre bien qu'on peut tout à fait prendre les relations entre points comme fondement de la géométrie ; on construit ensuite pas à pas les structures compliquées de la géométrie algébrique à partir des propriétés des projectivités, transformations qui conservent la structure d'incidence. Toute la géométrie se construit ainsi à partir en somme de ces deux relations simplissimes et parfaitement symétrique : deux points déterminent une droite, deux droites déterminent un point. Esthétiquement, je trouve cela fascinant, mais il est important de saisir le rôle du birapport là-dedans ; l'inversion du rapport habituel entre birapport et coordonnées est une des clefs de notre construction.

Coordonnées projectives

Bon, j'arrête de philosopher et je reviens aux choses sérieuses. On a le birapport maintenant ; pour introduire les coordonnées, on procède de la façon suivante : on prend quatre points O, I, J, K en position générale, c'est-à-dire trois à trois non alignés. Ce seront nos points de base, qui définissent un repère projectif ou une base projective, j'utilise les deux expressions pour désigner le dispositif qui permet de repérer les points et les droites par des coordonnées sur le corps grâce au birapport, comme indiqué ci-dessous.
Appelons I' et I'' les projections de I depuis K sur OJ et depuis J sur OK. Soit maintenant un point P quelconque, non situé sur JK. Appelons de même P' et P'' ses projections depuis K  sur OJ et depuis J sur OK. Nous allons à présent attribuer au point P un triplet (X, Y, Z) de nombres réels, homogène, c'est-à-dire défini à une constante près, tels que :

X/Z = (J O I' P'), Y/Z = (K O I'' P'').

Il est donc clair que le rapport X/Z est le rapport de la perspectivité de centre O, d'axe JK, qui envoie I' sur P', et Y/Z le rapport de la perspectivité de centre O, d'axe JK, qui envoie I'' sur P''. Si maintenant P appartient à JK, en étant distinct de J et K, on définit I''' projection de I sur JK depuis O ; on attribue encore à P un triplet (X, Y, Z), avec Z = 0 et

X/Y = (J K I''' P)

c'est le rapport de la perspectivité de centre J, d'axe OK, appliquant I''' sur P. Le fait que Z = 0 indique que P appartient à JK. Les points J et K quant à eux auront pour coordonnées respectives (1, 0, 0) et (0, 1, 0) à une constante près. Pour que les choses soient bien claires, précisons que cette expression "à une constante près" qui caractérise les coordonnées homogènes signifie que deux triplets (X, Y, Z) et (aX, aY, aZ), où a est un nombre quelconque (non nul !), désignent toujours le même point (vu que seuls les rapports X/Z, Y/Z etc. ont une signification géométrique réelle). Les points O et I ont pour coordonnées (0, 0, 1) et (1, 1, 1). On comprend la raison des trois nombres : deux suffiraient pour repérer tous les points extérieurs à la droite JK ; il en faut un de plus pour repérer les points de cette droite. Toutefois, c'est toujours le rapport de deux coordonnées qui a un sens géométrique, lié au birapport et aux perspectivités.
Connaissant les coordonnées d'un point, on peut le construire par le procédé inverse : on détermine d'abord ses projections P' et P'', grâce à l'axiome 2 du birapport, et ensuite on prend l'intersection des droites KP' et JP''. Il est important de noter que seul le triplet (0, 0, 0) ne désigne aucun point ; il est exclu dans ce système de coordonnées. On peut à présent identifier le plan projectif à l'ensemble des triplets homogènes, et transformer les problèmes géométriques en problèmes algébriques. Tel est la conséquence ultime et fondamentale des théorèmes de Desargues-Pappus.
Voici, concrètement, à quoi ressemble un repère projectif :


Il est utile d'avoir cette figure en tête, car souvent les coordonnées homogènes sont présentées comme un simple procédé algébrique, abstrait, alors que sur ce schéma, on voit qu'elles possèdent une signification géométrique précise.
Dans ce repère, le point de base I est appelé "point unité" pour la raison suivante : vu que les points O, J, K ont pour coordonnées (0, 0, 1), (1, 0, 0) et (0, 1, 0) à une constante près (qui n'est pas forcément la même pour les trois points !), un point P de coordonnées (x, y, z) peut s'écrire comme une somme pondérée des points de base :

P = xJ + yK + zO

mais sous la condition que J + K + O = I, de sorte que la constante dans l'expression "à une constante près" soit fixée. Le point I sert donc, d'un point de vue algébrique, à uniformiser les constantes, ce qui permet d'interpréter les coordonnées d'une autre manière, comme les coefficients d'une somme pondérée.
Mais allons de l'avant. Maintenant que nous disposons de coordonnées homogènes, nous allons pouvoir faire un tas de choses passionnantes. Pour commencer, déterminer une expression algébrique du birapport.
Si A, B, C, D sont quatre points alignés de coordonnées respectives (X1, Y1, Z1), ..., (X4, Y4, Z4), leur birapport (A B C D) pourra s'écrire

(X3/Z3 - X1/Z1)(X4/Z4 - X2/Z2) / (X3/Z3 - X2/Z2)(X4/Z4 - X1/Z1)

ou encore

(détCA / détCB)(détDB / détDA),

où j'appelle détCA le déterminant de la matrice 2 fois 2 formée par les vecteurs (X3, Z3) et (X1, Z1), etc.
Vu l'invariance par projection centrale du birapport, la valeur de cette expression ne change pas si l'on remplace X ou Z par Y ; on peut donc calculer le birapport en utilisant, pour chaque point, deux des trois coordonnées, au choix ; à condition bien sûr qu'il n'y en ait pas une qui soit nulle pour tous les points. Si par exemple ils appartiennent à la droite JK de sorte que Z = 0 pour les quatre points, on devra obligatoirement utiliser les coordonnées X et Y. Cela tient au fait que dans ce cas, deux des trois projections envoient les quatre points sur un seul, et la conservation du birapport ne s'applique plus dans ce cas. Nous pouvons maintenant calculer facilement le birapport grâce aux coordonnées, et il est facile également de voir que ces expressions algébriques vérifient les relations

(A B C D)(A B D E) = (A B C E),

etc.

J'espère au moins vous avoir convaincu que la manière la plus élégante de procéder est d'introduire les coordonnées à partir du birapport et non l'inverse, comme cela se fait généralement... Ici nous sommes en train de construire toute la structure de la géométrie plane classique, projective, affine, vectorielle, euclidienne, non-euclidienne, avec comme seuls ingrédients de base les axiomes d'incidence du plan projectif. Tout dérive de là, et des propriétés des transformations et de leurs invariants. On ne fait pas plus synthétique. Mais bon, arrêtons de nouveau de philosopher, on n'est pas ici pour ça (quoique...).

Maintenant qu'on a les coordonnées et l'expression du birapport, on peut chercher une expression algébrique pour les droites, les projections centrales, les projectivités, etc. Un raisonnement pas trop compliqué mais dont je vous passe les détails ici permet d'arriver à la conclusion que, dans le repère projectif que nous avons défini, les droites s'écrivent sous la forme d'équations linéaires homogènes. C'est-à-dire qu'une droite d est constituée par l'ensemble des points (X, Y, Z) satisfaisant une équation de la forme

AX + BY + CZ = 0

où A, B, C sont des nombres réels définis à une constante près (la démonstration est basée sur la conservation du birapport ; quatre points sont alignés si leurs projections sur deux axes distincts ont le même birapport : on fixe donc trois points de la droite, et on exprime le fait qu'un quatrième point fait partie de la droite si les projections des quatre points sur deux des axes ont le même birapport ; après ce n'est qu'une question de manipulations algébriques). Le triplet homogène (A, B, C) correspond aux coordonnées de la droite d dans la base duale, c'est-à-dire la base de l'espace projectif dual formée par les droites o = JK, j = OK, k = OJ, i = LM où L et M sont les points tels que (J O I' L) = (K O I'' M) = -1 (conjugués harmoniques de I', I'' par rapport à (O, J) et (O, K)). Rappelons que les droites du plan direct sont des points du plan dual ; d'un repère projectif dans le plan direct, on peut donc déduire un repère dans le plan dual, et les coefficients de l'équation qui définit une droite dans le premier deviennent les coordonnées d'un point dans le second, et vice-versa. Les coordonnées d'un point P dans le plan direct s'interprètent comme les coefficients d'une équation linéaire homogène qui définit une droite dans le plan dual, et cette "droite" n'est autre que le faisceau des droites passant par le point P dans le plan direct ; chacune de ces droites doit en effet satisfaire une équation homogène qui s'annule en P. Les coordonnées dans le plan direct sont classiquement appelées "ponctuelles", et celles dans le plan dual, "coordonnées tangentielles".
Pour que trois points P(X, Y, Z), Q(X', Y', Z'), R(X'', Y'', Z'') soient alignés, il faut qu'il existe des coefficients A, B, C tels que le système

AX + BY + CZ = 0
AX' + BY' + CZ' = 0
AX'' + BY'' + CZ'' = 0

admette une solution ; ce n'est possible que si la matrice ayant pour colonnes les coordonnées des trois points soit de déterminant nul, autrement dit, ses colonnes - donc les coordonnées des points - sont linéairement dépendantes. On peut donc trouver des nombres l, m tels que les coordonnées de R par exemple s'écrivent comme combinaison de celles de P et Q :

X'' = lX + mX'
Y'' = lY + mY'
Z'' = lZ + mZ''

ce sont les équations paramétriques de la droite passant par P(X, Y, Z) et Q(X', Y', Z'). On écrira symboliquement : R = lP + mQ. 
On voit aussi maintenant que la droite PP' joignant deux points P(X, Y, Z) et P'(X', Y', Z') aura pour coordonnées

(YZ' - Y'Z, X'Z - XZ', XY' - X'Y)

et le point d.d', intersection des droites d(A, B, C) et d'(A', B', C') aura pour coordonnées

(BC' - B'C, A'C - AC', AB' - A'B)

ces formules permettent de calculer très facilement l'intersection de deux droites ou l'équation de la droite joignant deux points.

Petite parenthèse : revenons au plan de Fano, notre bon vieux plan sur le corps à deux éléments. Si nous prenons comme points de base les trois sommets du grand triangle et le point central comme point unité, nous pouvons attribuer aux sept points les coordonnées suivantes :


Et l'on constate que chaque droite vérifie des équations paramétriques de la forme

X = aX1 + bX2
Y = aY1 + bY2
Z = aZ1 + bZ2

où tous les nombres X1, X2, Y1, Y2 etc. et les coefficients variables a et b prennent uniquement les valeurs 0 et 1 et la somme est définie modulo 2. Bien entendu, a et b ne peuvent être simultanément nuls.

Attaquons-nous maintenant à l'expression algébrique des projectivités en coordonnées homogènes. Une projectivité sera représentée par une transformation linéaire des coordonnées, c'est-à-dire qu'un point P(X, Y, Z) et son image P'(X', Y', Z') seront reliés par des équations de la forme

X' = aX + bY + cZ
Y' = dX + eY + fZ
Z' = gX + hY + iZ

où a, b, c, d, e, f, g, h, i sont des nombres réels, définis à une constante près, que l'on peut disposer selon une matrice qui sera non dégénérée (de déterminant non nul) du moment que la transformation est bijective ; les projectivités correspondent donc exactement, dans le plan arguésien, aux applications linéaires de matrice régulière (non dégénérée). Les colonnes de cette matrice correspondent aux coordonnées des images des points de base J, K, O, les constantes étant fixées de telle sorte que leur somme corresponde aux coordonnées de l'image du point unité I. La démonstration n'est pas très compliquée, elle utilise encore la conservation du birapport.
On montre aussi que les perspectivités prennent une forme particulièrement simple dans un repère où le centre (s'il n'appartient pas à l'axe) est le point O et les points J et K appartiennent à l'axe. Dans ce cas, une perspectivité générale prend la forme d'une matrice diagonale avec une diagonale de la forme (a, a, 1) (à une constante près), c'est-à-dire une matrice diagonale avec deux valeurs propres. Les transvections quant à elles peuvent s'écrire sous la forme d'une matrice triangulaire supérieure avec une diagonale constante et seulement un 1 dans la dernière colonne, tous ses autres éléments étant nuls.
Les matrices dégénérées correspondent à des transformations projectives non injectives, comme les projections centrales, qui correspondent à des matrices de rang 2. Les matrices de rang 1 correspondent à des transformations que j'appelle "contractions", qu'aucun auteur ne mentionne à ma connaissance, mais qui n'en sont pas moins la réciproque "duale" d'une projection ; une projection centrale, en effet, applique toutes les droites du plan sur une droite donnée, à l'exception de celles passant par un point donné (le centre), qui seul n'a pas d'image (son image algébrique est le triplet (0, 0, 0), qui désigne en fait tout le plan). Inversement, une contraction applique tous les points du plan sur un point donné, à l'exception de ceux d'une droite donnée, qui seule n'a pas d'image.
Ainsi, la transformation de matrice

aX bX cX
aY bY cY
aZ bZ  cZ

qui est de rang 1 - toutes ses lignes sont proportionnelles - applique tout point sur le point (X, Y, Z), sauf ceux de la droite (a, b, c) qui ont pour image (0, 0, 0), c'est-à-dire tout le plan. Ceci est anecdotique mais amusant, n'est-ce pas ?

Il est aussi intéressant d'étudier l'effet d'un changement de repère. Si l'on choisit quatre nouveaux points de base O', I', J', K', dont les coordonnées dans le repère OIJK sont connues, comment s'écriront les coordonnées d'un point P(X, Y, Z) dans le repère O'I'J'K' ? On peut montrer, évidemment, qu'elles se transforment de façon linéaire, au moyen d'une matrice de changement de base dont les colonnes correspondent, à une constante près, aux coordonnées des anciens points dans la nouvelle base. Elle est l'inverse de la matrice qui a pour colonnes les coordonnées des nouveaux points dans l'ancienne base. Cela fonctionne comme pour un changement de base dans un espace vectoriel, mais la démonstration est plus compliquée, il faut faire preuve de subtilité. En effet, on ne peut pas se contenter d'écrire

P = X'J' + Y'K' + Z'O'

et d'identifier les coefficients, comme dans le cas vectoriel, parce qu'on ne peut pas, a priori, additionner les points comme on additionne des vecteurs (plus exactement, l'associativité de l'addition est justement ce qu'il faut démontrer !). Il faut commencer par écrire les équations des droites J'P, K'P, etc. et calculer les coordonnées des projections de P depuis K' sur O'J' et depuis J' sur O'K' dans l'ancien repère, et en déduire des birapports, qui nous donneront les coordonnées du même point dans le nouveau repère, en fonction des ses coordonnées dans l'ancien et de celles des nouveaux points de base. C'est un travail plus délicat que dans le cas d'un espace vectoriel, mais la patience est récompensée, et au final on constate qu'un changement de base projective correspond à une transformation linéaire des coordonnées, avec pour coefficients les coordonnées des points de base. Mais on y sera parvenu par un raisonnement géométrique, faisant intervenir des équations de droites et des projections (et des birapports !), non par un simple calcul algébrique.
 Il est vrai que je n'ai lu qu'une dizaine de traités de gp, et ce ne sont peut-être pas les plus profonds, mais je ne connais pas un auteur à part moi qui ait songé à dériver géométriquement ces formules de changement de base projective... Je ne voudrais pas paraître casse-pieds, mais je trouve ça dommage, c'est important ; évidemment, c'est tellement plus simple avec les espaces vectoriels ! Oui, mais nous voulons, nous, étudier les propriétés du plan projectif à partir d'axiomes projectifs, sans passer par les e.v. La possibilité existe, donc il faut bien que quelqu'un le fasse. Et puis c'est tellement plus élégant... Or, dans une approche axiomatique de la gp, on ne peut pas démontrer le changement de base comme dans un e.v., il est quasi obligatoire de procéder comme indiqué ci-dessus (on pourrait certes aussi raisonner en considérant qu'un changement de base est grosso modo analogue à une projectivité, et utiliser les formules déjà connues pour les projectivités, mais je trouve cela un peu moins rigoureux). Si vous connaissez quelqu'un qui l'a fait, indiquez-le moi, merci. Sinon, c'est que je suis seul à m'intéresser de façon cohérente et complète à l'axiomatique du plan projectif, mais j'ai quand même du mal à le croire.

Coniques et polarités

L'étude des coniques (et quadriques en dimension > 2) est une des grandes motivations du développement de la gp. D'habitude, on introduit les coniques comme lieux de points dont les coordonnées satisfont une équation homogène quadratique (de degré 2). Mais pour nous, fidèles à notre approche axiomatique, les coniques sont avant tout des êtres géométriques, et nous allons les définir par leurs propriétés géométriques, avant de dériver leur expression algébrique. L'expérience à montré que l'étude des coniques et quadriques se simplifiait beaucoup par celle des polarités qu'elles induisent. D'où l'idée qui a germé dans l'esprit de certains (Coxeter) de définir les coniques à partir des polarités, et c'est la posture que nous allons adopter.
Une polarité est un isomorphisme du plan projectif sur son plan dual, c'est-à-dire une application qui à tout point fait correspondre une droite, sa polaire, de telle sorte que :

1. à deux points distincts correspondent deux droites distinctes
2. à trois points alignés correspondent trois droites concourantes (conservation de l'incidence)
3. à trois points non alignés correspondent trois droites non concourantes

Cette correspondance est biunivoque, donc à toute droite correspond pareillement un point, son pôle. Une polarité intervertit donc points et droites, en préservant les relations d'incidence. Il est facile de voir que si le point P appartient à la droite d, le pôle de D appartiendra à la polaire de P (conséquence du point 2).
Il peut se faire qu'un point appartienne à sa propre polaire ; dans ce cas, ce point et cette droite seront dits auto-conjugués. Une polarité comporte-t-elle des points/droites auto-conjugués ? Là est la question. Si oui, le lieu des points auto-conjugués est appelé une conique, et les droites auto-conjuguées sont appelées tangentes. L'étude des coniques revient donc à celle des polarités qui admettent des points auto-conjugués.
On peut montrer, à partir de cette définition, par un procédé analogue à celui que l'on utilise pour les projectivités, que les coordonnées d'un point et celle de sa polaire sont reliées par des équations linéaires homogènes : si p(A, B, C) est la polaire de P(X, Y, Z), on aura

A = aX + bY + cZ
B = dX + eY + fZ
C = gX + hY + iZ

où a, b, ... , i sont des coefficients réels formant une matrice régulière, définie à une constante près.
Une polarité est en fait une projectivité d'un plan projectif dans un autre, qui est justement son dual ; nous n'avons pas parlé jusqu'ici de projectivités entre deux plans distincts, mais algébriquement cela ne fait pas une grande différence.
Pour trouver le lieu des points auto-conjugués - l'équation de la conique - il suffit d'exprimer que le point P appartient à sa polaire, autrement dit d'écrire

AX + BY + CZ = 0

avec A, B, C exprimés d'après les équations ci-dessus ; ensuite on simplifie et on obtient un polynôme homogène de degré 2 en les trois variables X, Y, Z dont les racines ont pour lieu la conique. En abrégé, on peut écrire

(P)'(M)(P) = 0

où je note (P) la matrice-colonne formée par les coordonnées du point P, (P)' sa transposée et (M) la matrice des coefficients a, b, ... , i. (C'est pas terrible comme écriture, mais je maîtrise mal le html, sorry).
La matrice M n'est pas univoquement déterminée, et on montre qu'on peut toujours lui donner une forme symétrique, de sorte que sur les neuf coefficients qui définissent une polarité, six seulement sont indépendants. On travaillera donc toujours avec des matrices symétriques.
On montre, à partir de ces définitions, que toute droite rencontre une conique en 0, 1 ou 2 points. Si elle la rencontre en 1 point c'est une tangente ; en deux points, c'est une sécante. Ces dernières propriétés peuvent fournir une autre définition des coniques.
Si c est une conique, P un point, on parlera de "la polaire de P par rapport à c" pour désigner son image par la polarité "induite par c", c'est-à-dire dont c est le lieu des points auto-conjugués.
Deux droites seront dites "conjuguées" par rapport à une conique si le pôle de l'une appartient à l'autre et vice-versa. Deux points seront dits conjugués si la polaire de l'un passe par l'autre et vice-versa.
Une conique possède un intérieur et un extérieur. Un point P est extérieur si sa polaire rencontre la conique en deux points, appelons-les Q et R. Dans ce cas, les propriétés des pôles et polaires impliquent que les droites PQ et PR sont tangentes à la conique (puisque par définition, un point de la conique appartient à sa propre polaire qui est la tangente en ce point). Il s'ensuit qu'un point extérieur est un point par lequel passent deux tangentes à la conique. Inversement, un point intérieur est un point par lequel ne passe aucune tangente, ou dont la polaire ne rencontre pas la conique. Dans le cas particulier du plan projectif réel, un point intérieur est aussi un point tel que toute droite passant par ce point est une sécante (rencontre la conique en deux points), et un point extérieur, un point par lequel passe au moins une droite qui ne rencontre pas la conique ; mais cette propriété n'est pas vraie sur un corps quelconque, tandis que la première définition des points intérieurs et extérieurs - en fonction des polaires - a toujours un sens.
Les propriétés des pôles et polaires ont un lien avec le birapport. Soient une conique c, un point P, et une droite d passant par P. Si d rencontre c en deux points A et B, et la polaire de P en un point P', alors

(A B P P') = -1

les points P, P' sont conjugués harmoniques par rapport aux points A, B. Si une conique est donnée, cette propriété peut servir à construire la polaire d'un point.

Notons que, par un changement de repère approprié, on peut toujours faire en sorte que l'équation d'une conique c donnée prenne la forme extrêmement simple

X^2 + Y^2 - Z^2 = 0

En effet, il suffit de prendre pour point origine O un point quelconque intérieur à la conique, et pour droite JK sa polaire. On choisit les points J et K de telle sorte que OJ soit la polaire de K et OK la polaire de J. Le quatrième point I sera choisi de telle sorte que ses projections I', I'' sur les axes OJ et OK soient justement les intersections de la conique avec ces droites. Dans ce repère, le point O par exemple a pour coordonnées (0, 0, 1) ; ce sont aussi les coordonnées de la droite JK (sa polaire) dans la base duale, ou les coefficients de son équation dans la base OIJK. Dès lors, on en déduit que la dernière colonne de la matrice de c doit être proportionnelle à (0, 0, 1), c'est-à-dire de la forme (0, 0, a). De même, le point J a pour coordonnées (1, 0, 0) et sa polaire OK aussi, donc la deuxième colonne doit être proportionnelle à (1, 0, 0). En appliquant le même raisonnement au point K on voit que la première colonne doit être proportionnelle à (0, 1, 0). Enfin, puisque les points I' et I'', qui ont pour coordonnées (1, 0, 1) et (0, 1, 1) font partie de la conique, on voit que les coefficients de proportionnalité doivent être égaux en valeur absolue, les deux premiers étant positifs et le troisième négatif, ou l'inverse. Autrement dit, la matrice est, à une constante près, diagonale, avec pour diagonale (1, 1, -1), ce qui donne l'équation ci-dessus. Il y a toujours moyen de déterminer des points O, I, J, K vérifiant ces propriétés ; en les prenant comme nouveaux points de base, on peut ainsi calculer une matrice de changement de coordonnées qui ramène l'équation de c à cette forme standard.
D'autre part, si l'on choisit des points de base tels que O soit extérieur à c, JK sa polaire, avec OJ tangente à c en J et OK tangente à c en K, et I un point quelconque de la conique, on voit par un raisonnement analogue que son équation prendra une autre forme très simple :

XY - (1/2)Z^2 = 0

En prenant toujours pour O un point extérieur, J et K deux points de sa polaire, mais cette fois tels que OK soit polaire de J, etc. on obtiendra la forme

X^2 - Y^2 - Z^2 = 0.

Nous verrons dans un autre article, consacré à la construction du plan affin, que si JK est prise à chaque fois comme "droite à l'infini", la première de ces trois équations correspond à une conique sans point à l'infini, c'est-à-dire une ellipse, tandis que les deux dernières correspondent à une conique avec deux points à l'infini, c'est-à-dire une hyperbole ; la deuxième équation sera celle d'une hyperbole dans un repère ayant pour axes ses asymptotes, la troisième, celle de la même hyperbole ayant pour axes deux droites conjuguées passant par le centre.

Les propriétés projectives des coniques sont fortement reliées également à celles des transformations de la droite projective (ou des faisceaux de droite).
On appelle projectivité d'une droite d sur elle-même, ou sur une autre droite d', une application bijective des points de d sur ceux de d' ou sur eux-mêmes qui conserve le birapport. Une projectivité auto-inverse est appelée involution. On montre que toute projectivité d'une droite sur elle-même possède 0, 1 ou 2 points fixes (on l'appelle aussi perspectivité si elle possède au moins un point fixe) ; dans le cas d'une involution, c'est toujours 0 ou 2 : dans le premier cas elle est dite elliptique, dans le second, hyperbolique. Une involution à un seul point fixe est impossible.
On peut montrer que toute projectivité se décompose en un produit de deux perspectivités ou de deux involutions.
On parle de même de projectivités et d'involutions d'un faisceau de droites sur lui-même ou sur un autre, en se souvenant qu'un faisceau de droites par un point est une droite du plan dual.
Ceci étant, un premier résultat important de l'étude des coniques est le théorème de Steiner, qui dit que si P, Q sont deux points fixes d'une conique c, et R un point variable sur c, alors les faisceaux formés par les droites PR et QR sont reliés par une projectivité. Cette propriété peut servir de définition des coniques, c'est ce que font certains auteurs. Cela revient à dire que, si A, B, C, D sont quatre points fixes d'une conique c, et P un point variable de c, le birapport du faisceau PA, PB, PC, PD ne dépend pas de la position de P (rappelons qu'une projectivité entre faisceaux est une bijection qui conserve le birapport, d'où la dernière propriété). On peut donc aussi parler de façon cohérente du birapport de quatre points appartenant à une même conique.
De façon duale, si p et q sont deux tangentes fixes à une conique c et r une tangente variable, ses intersections avec p et q respectivement sont reliées par une projectivité (de p sur q). On peut donc aussi parler de façon cohérente du birapport de quatre tangentes à une conique, du reste c'est naturel puisque l'ensemble des tangentes à une conique c forme une conique dans le plan dual, la conique tangentielle. Sa matrice est juste l'inverse de celle de la conique ponctuelle.
On appelle triangle auto-polaire, dans une polarité donnée, un ensemble de trois points P, Q, R tels que la polaire de chacun d'eux soit la droite qui joint les deux autres. Un autre résultat fondamental de l'étude des coniques est le théorème de Chasles, grand mathématicien français, qui affirme que si l'on connaît un triangle auto-polaire ABC, plus un point P et sa polaire p, on peut construire n'importe quel point de la conique, et la polaire de n'importe quel point du plan.
En combinant les théorèmes de Chasles et de Steiner, on obtient presque tous les résultats importants ; par exemple, par cinq points en position générale passe une et une seule conique, et si l'on connaît cinq points d'une conique, on peut construire - rien qu'en reliant des points ou en prenant des intersections de droites - n'importe quel point, n'importe quelle tangente et n'importe quelle polaire. Une conique - et sa polarité induite - est donc entièrement déterminée par la donnée de cinq points - ou de cinq tangentes, de façon duale.
De même, il existe une et une seule conique passant par trois points non alignés donnés et tangente en deux d'entre eux à deux droites données ; et l'on peut construire tous les points, tangentes et polaires en connaissant ces cinq éléments.

Montrons concrètement la construction d'un point quelconque connaissant cinq points d'une conique :


Connaissant les points A, B, C, P, Q par exemple, on construit d'abord le point R comme sur la figure ; un triangle variable - en rouge - dont les côtés passent par P, Q, R et dont deux des sommets appartiennent à AC et BC détermine par son troisième sommet un point de la conique.
En dualisant cette construction, on obtient une méthode simple pour construire la conique tangentielle. On en déduit une démonstration du théorème de Brianchon et de son dual, le célèbre théorème de Pascal : dans un hexagone inscrit à une conique, si les diagonales sont concourantes, les côtés opposés se rencontrent en trois points alignés, et vice-versa. En fait, le théorème de Pascal n'est qu'une simple conséquence du moins célèbre mais bien plus fondamental théorème de Steiner.
En caricaturant un peu, on pourrait dire que ces quatre théorèmes : Desargues, Pappus, Chasles, Steiner, résument toute la gp réelle plane (en y ajoutant que les projections centrales conservent le birapport, source de bien des démonstrations, mais c'est une conséquence du théorème de Desargues, si l'on considère que la source du birapport est le rapport d'une perspectivité).

On donne aussi le nom de conique dégénérée aux figures suivantes : un couple de droites, une droite, un point. Cela permet de généraliser la construction ci-dessus au cas où trois des cinq points (ou plus) sont alignés. De plus, quand on considère le plan comme sous-espace d'un espace projectif de dimension 3, on constate que les quatre types de coniques : coniques ovales, couples de droites, droites, points, correspondent à toutes les intersections possibles d'un cône avec un plan ; ceci reste vrai en géométrie affine, où les coniques ovales se distinguent en ellipses, paraboles et hyperboles : les six types de coniques ainsi obtenues correspondent à toutes les possibilités d'intersection d'un cône (quelconque) avec un plan, et ajoutons que cela reste même vrai en géométrie euclidienne, si l'on considère les cercles comme un type à part ; d'où le nom de coniques donné historiquement à ces figures !

Beaucoup de propriété des coniques sont liées aussi à la notion d'involution induite. Rappelons que deux points sont conjugués par rapport à une conique si la polaire de l'un passe par l'autre, ce qui implique que vice-versa. Maintenant, étant donnés une conique c, une droite d, un point P de d, il existe sur d un point P' conjugué de P par rapport à c, c'est l'intersection de d avec la polaire de P. L'application de d dans d qui à tout point P associe son conjugué P' est une involution, l'involution induite par c sur la droite d. On a une notion analogue (duale) pour les faisceaux, l'involution induite par une conique c sur un point P (plus exactement, sur le faisceau des droites par P). Comme toute involution, cette involution induite est elliptique ou  hyperbolique (à moins que d soit une tangente ou P un point de c, dans ce cas elle est dégénérée, on ne s'en occupe pas). Dans le cas d'une droite d, si l'involution induite est elliptique, cela veut dire que d ne rencontre c en aucun point ; si elle est hyperbolique, c'est une sécante. Dans le cas d'un point P, si l'involution est hyperbolique, c'est qu'il y a deux tangentes qui passent par P, donc P est un point extérieur à c. Si elle est elliptique, il ne passe aucune tangente par P donc c'est un point intérieur.
On montre enfin qu'il existe une seule conique tangente à deux droites données et déterminant sur deux autres droites données deux involution données.

Aucun commentaire:

Enregistrer un commentaire