Ok

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies. Ces derniers assurent le bon fonctionnement de nos services. En savoir plus.

19/11/2010

Szolem Mandelbrojt

Szolem Mandelbrojt

Szolem Mandelbrojt, né à Varsovie le 20 janvier 1899 et mort à Paris le 23 septembre 1983 est un mathématicien français d'origine polonaise. Il est membre fondateur du groupeBourbaki.

Il est titulaire de la chaire de mathématique et mécanique au Collège de France de 1938 à 1972. Il est élu membre de l'Académie des sciences en 1972.

Szolem Mandelbrojt est l'oncle de Benoît Mandelbrot.

Biographie [modifier]

Dernier né d’une famille nombreuse, ses frères et sœurs, notamment Calel, de quinze ans son aîné, jouent un rôle important dans son éducation. Sa sœur Fanny ainsi que Calel accompagné de sa femme Bertha et de ses deux fils Benoît, futur inventeur des fractales, et Léon le rejoindront en France peu avant la guerre.

À Varsovie il s’initie aux mathématiques par la lecture de René BaireÉmile BorelGeorg Cantor et surtout Jacques Hadamard, puis il passe l’année scolaire 1919 à Kharkov où il est l’auditeur unique des cours de Serge Bernstein.

Arrivé en France en 1920, il partage un deux pièces avec Georges Politzer, fréquente les philosophes Jean WahlNorbert Guterman, les poètes Pierre MorhangeMax Jacob, mais avant tout il suit les cours de Picard, de Lebesgue, et surtout les séminaires et leçons au Collège de France de Jacques Hadamard. Il se lance alors seul dans la théorie du prolongement analytique des séries de Taylor et soutient, encouragé par Paul Montel, sa thèse en 1923.

Il est naturalisé Français en 1926.

Il succède au Collège de France à Jacques Hadamard en 1938, après avoir été chargé de cours à l’Université de Lille puis professeur à l’Université de Clermont-Ferrand.

Membre fondateur du groupe Bourbaki, il s’en écarte pendant la guerre pour continuer à se consacrer à l’analyse mathématique (voir « souvenirs à bâtons rompus… »).

Mobilisé en septembre 1939, il décline le classement en « affectation spéciale », qui lui est proposé en tant que professeur au Collège de France, et sert dans une unité combattante.

Immédiatement après l’armistice du 22 juin 1940, il est invité à enseigner au Rice Institute à Houston. Il obtient de Vichy un visa de sortie grâce à son service dans une unité combattante et il se rend à Houston avec sa femme Gladys et leur fils Jacques.

Après avoir offert ses services dès 1942 aux Forces françaises libres, il est révoqué du Collège de France en 1942. En 1944-45, il est membre de la mission scientifique française auprès des Forces Françaises Libres à Londres créée par Louis Rapkine.

Réintégré à la Libération, il reprend son enseignement au Collège de France en 1945.

Officier de la Légion d’Honneur, il a obtenu de nombreux prix et distinctions.

Il a formé de nombreux mathématiciens, notamment à Clermont-Ferrand le polonais Gorny, puis à Paris les Français Jean-Pierre KahanePaul Malliavin, les Israéliens Shmuel Agmon etYitzhak Katznelson, l’Indien U.N.Singh

Anecdote : en 1947 Szolem Mandelbrojt organise un congrès d'analyse harmonique à Nancy, et invite Norbert Wiener C'est à la suite de ce congrès qu'est apparu le néologismeCybernétique

On pourra avoir une introduction à son œuvre mathématique qui comprend environ 200 articles et plusieurs livres, dans Szolem Mandelbrojt, SELECTA, Gauthier-Villars, 1981.

Il a exposé ses idées générales et ses sentiments sur les mathématiques et la création mathématique dans une conférence au Collège Philosophique « Pourquoi je fais des mathématiques » Revue de métaphysique et de morale, 57, no 4, pages 422-429 (octobre-décembre 1952).

On pourra également consulter pour sa biographie, ses idées et une description, entre autres, de la vie mathématique d’avant guerre… « Souvenirs à bâtons rompus de Szolem Mandelbrojt recueillis en 1970 et préparés par Benoît Mandelbrot », Cahier du séminaire d’histoire des mathématiques, 6 (1985), pages 1-40.

Liens externes [modifier]

 

22:42 Publié dans Szolem Mandelbrojt | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Numdam

NUMDAM Source : http://www.numdam.org/numdam-bin/feuilleter?j=SB

Séminaire Bourbaki

1948-2002
tome 1 (1948-1951) Restricted access tome 23 (1980-1981)
tome 2 (1951-1954) Restricted access tome 24 (1981-1982)
tome 3 (1954-1956) Restricted access tome 25 (1982-1983)
tome 4 (1956-1958) Restricted access tome 26 (1983-1984)
tome 5 (1958-1960) Restricted access tome 27 (1984-1985)
tome 6 (1960-1961) Restricted access tome 28 (1985-1986)
tome 7 (1961-1962) Restricted access tome 29 (1986-1987)
tome 8 (1962-1964) Restricted access tome 30 (1987-1988)
tome 9 (1964-1966) Restricted access tome 31 (1988-1989)
tome 10 (1966-1968) Restricted access tome 32 (1989-1990)
tome 11 (1968-1969) tome 33 (1990-1991)
tome 12 (1969-1970) tome 34 (1991-1992)
tome 13 (1970-1971) tome 35 (1992-1993)
tome 14 (1971-1972) tome 36 (1993-1994)
tome 15 (1972-1973) tome 37 (1994-1995)
tome 16 (1973-1974) tome 38 (1995-1996)
tome 17 (1974-1975) tome 39 (1996-1997)
tome 18 (1975-1976) tome 40 (1997-1998)
tome 19 (1976-1977) tome 41 (1998-1999)
tome 20 (1977-1978) tome 42 (1999-2000)
tome 21 (1978-1979) tome 43 (2000-2001)
tome 22 (1979-1980) tome 44 (2001-2002)

22:40 Publié dans Numdam | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Association des collaborateurs de Nicolas Bourbaki


  
 

L'Association des Collaborateurs de Nicolas Bourbaki a été créée en 1935.

Ses membres fondateurs sont : Henri Cartan, Claude Chevalley, Jean Coulomb, Jean Delsarte, Jean Dieudonné, Charles Ehresmann, René de Possel, Szolem Mandelbrojt, André Weil. 

Ses activités principales sont :


  1. La rédaction des Éléments de Mathématique 

  2.  
  3. L'organisation d'un Séminaire : 
Programme (pdf) et résumés (pdf) des exposés du séminaire du 13 novembre 2010
 
Textes des exposés de la session de juin 2009
Programme des séminaires précédents depuis novembre 1996 
 
Date des prochains séminaires
 
Éditeurs du Séminaire depuis sa création. 
 
Ici le fichier de style bourbaki.cls, recommandé pour la saisie des exposés du séminaire.
 
- Ici la documentation de ce style: bourdoc.texbourdoc.dvibourdoc.ps.

Un séminaire de Physique, le Séminaire Poincaré, a été créé en 2001 sur le modèle du Séminaire Bourbaki

Source : http://www.bourbaki.ens.fr/

Nicolas Bourbaki

Nicolas Bourbaki

Page d'aide sur l'homonymie Pour les articles homonymes, voir Bourbaki.

Nicolas Bourbaki est un mathématicien imaginaire, sous le nom duquel un groupe de mathématiciens francophones, formé en 1935 à Besse-et-Saint-Anastaise (Besse-en-Chandesse à l'époque) en Auvergne sous l'impulsion d'André Weil, a commencé à écrire et éditer des textes mathématiques à la fin des années 1930. L'objectif premier était la rédaction d'un traité d'analyse. Le groupe s'est constitué en association, l'Association des amis de Nicolas Bourbaki, le 30 août 1952. Sa composition a évolué avec un renouvellement constant de générations.

Sous le nom Nicolas Bourbaki fut publiée une présentation cohérente des mathématiques, appuyée sur la notion de structure, dans une série d'ouvrages sous le titre Éléments de mathématique. Cette œuvre est à ce jour inachevée. Elle a eu une influence sur l'enseignement des mathématiques et sur l'évolution des mathématiques du xxe siècle. Toutefois, elle connaît de nombreuses critiques : incompatibilité[réf. nécessaire] entre le formalisme retenu et la théorie des catégoriesstyle trop rigoureux[réf. nécessaire], manque d'exemples, incompréhension des étudiants, etc.

L'activité du groupe cependant a dépassé la rédaction d'ouvrages, par exemple avec l'organisation des séminaires Bourbaki.

Sommaire

 [masquer]

Explications sur la biographie imaginaire [modifier]

Bourbaki [modifier]

Le nom de famille Bourbaki était le nom emprunté par Raoul Husson en 1923 lors d'un canular, alors qu'il était élève en troisième année de l'École normale supérieure. Il s'était donné l'apparence d'un mathématicien barbu du nom du professeur Holmgren pour donner une fausse conférence, volontairement incompréhensible et avec des raisonnements subtilement faux1. L'objectif aurait été la démonstration d'un prétendu « théorème de Bourbaki ». Cette histoire amusa tellement le groupe, que le nom « Bourbaki » fut choisi.

Le choix de ce nom par Husson connaît trois explications possibles :

  • Bourbaki vient du général Charles Bourbaki sous lequel avaient servi des élèves normaliens durant la guerre de 1870. Ce nom lui aurait été emprunté, par souvenir ;
  • Bourbaki est le nom d'un furet curieux et intelligent dans un roman d'Octave MirbeauLe Journal d'une femme de chambre (1900). Cette seconde explication a été proposée par le mathématicien Sterling K. Berberian en 1980, mais n'a été confirmée par les propos d'aucun membre du groupe ;
  • Pour une autre hypothèse, voir : François Laubie, « A Mathematician called Bourbaki », The Mathematical Intelligencerno 29, 2007, p. 7-8.

Le nom Bourbaki a été arrêté en juillet 1935 lors du congrès fondateur de Besse-en-Chandesse.

Extrait d'une lettre2 de Jean Dieudonné à la rédaction du Cahiers du séminaire d'histoire des mathématiques :

« [Le nom de Bourbaki] est effectivement une idée de Weil. À Aligarh, il s'était lié avec un mathématicien hindou D. Kosambi, lequel avait une querelle avec un de ses collègues dont, je ne sais pas le nom. Weil lui suggéra pour faire « perdre la face » à son adversaire de publier un article où il ferait référence à un mémoire imaginaire que l'autre évidemment ne connaîtrait pas et en serait humilié. L'article est effectivement paru sous le titre : On a generalization of the second theorem of Bourbaki, Bull. Acad. Sci. Allahabad, vol. 1., 1931-1932, p. 145-147. [...] Ce dernier a été dûment analysé dans Jahrbuchtome. 58, 1932, p. 734, par Schouten3. Il est dit en effet qu'un mathématicien russe du nom de D. Bourbaki aurait publié un théorème sur les dérivées covariantes que Kosambi généralise dans l'article ; Kosambi disait dans l'article que le mémoire lui aurait été signalé par A. Weil, mais Schouten a cru que c'était une erreur de nom et a dit dans son compte-rendu que c'était H. Weyl qui aurait signalé le mémoire russe à Kosambi, et il ajoute qu'il ne sait pas dans quel périodique a paru le mémoire. »

Prénom [modifier]

Le prénom Nicolas a été choisi par Éveline de Possel4 à la fin de 19355, afin que puisse être communiquée une fausse note biographique à l'académie des sciences.

Toutefois, la mention N. Bourbaki, dans les premiers écrits publiés sous ce nom, ne renvoie pas à l'initiale de Nicolas. N était écrit tant que le nom du professeur était inconnu6.

Depuis les débuts, les Éléments de mathématique sont publiés sous le nom de N. Bourbaki. Le seul ouvrage publié sous le nom de Nicolas Bourbaki se trouve être les Éléments d'histoire des mathématiques. On remarquera que si le mathématicien N. Bourbaki parle de « mathématique », l'historien Nicolas Bourbaki parle des mathématiques.

Poldévie [modifier]

Article détaillé : Poldévie.

En 1935, dans une lettre à Élie Cartan, Weil introduit N. Bourbaki comme un professeur de Poldévie, pays imaginaire d'Europe centrale. D'après Maurice Mashaal, ce risque pris fut une nécessité pour pouvoir publier des travaux sous ce pseudonyme. Une prétendue nation poldève avait déjà été évoquée en 1929 par le journaliste d'Action française Alain Mellet pour mystifier les députés républicains de gauche7.

Le nom Poldévie est resté. Il est notamment mentionné comme le lieu de travail de Nicolas Bourbaki dans la Notice sur la vie et l'œuvre de Nicolas Bourbaki.

Histoire de Bourbaki [modifier]

Origines [modifier]

Théorie des ensembles, premier tome des Éléments de mathématique, 1970, chez Herman.

Le groupe Bourbaki s'est constitué dans un contexte où une génération de mathématiciens potentiels avait été décimée par la Première Guerre mondiale. Les jeunes normaliens qui constituèrent le groupe se trouvaient donc sans prédécesseurs immédiats au sein de l'Université, sauf Gaston Julia, et avaient pour interlocuteurs des chercheurs du xixe siècle (Élie CartanHenri LebesgueJacques Hadamard8, Picard, Goursat). La critique de Bourbaki portait sur :

  • l'émiettement des mathématiques en spécialités étanches ;
  • la pré-éminence d'une analyse foisonnante mais manquant de rigueur ;
  • l'ignorance (explicable en partie par le contexte politique) de branches actives à l'étranger, particulièrement l'algèbre développée en Allemagne.

À l'origine, au début de leurs prises de fonction à l'université de Strasbourg, Henri Cartan et André Weil se retrouvent à devoir enseigner l'intégration et le calcul différentiel. Ils sont alors peu satisfaits des traités disponibles, en particulier du Traité d'analyse d'Édouard Goursatqu'ils utilisent pour leur cours.

Leur vient alors l'idée de réunir des amis, également anciens camarades de l'École normale supérieure de la rue d'Ulm (sauf Szolem Mandelbrojt), avec la volonté de rédiger un tel traité les satisfaisant. Le groupe d'amis, les membres fondateurs de ce qui deviendra Bourbaki, est à cette époque composé d'André Weil9 et Jean Delsarte (promotion 1922), d'Henri CartanJean Coulomb et René de Possel (promotion 1923), Jean Dieudonné et Charles Ehresmann (promotion 1924), Claude Chevalley (promotion 1926) et Szolem Mandelbrojt.

Parmi les règles qui organisent ce groupe secret de mathématiciens, il est décidé qu'à l'âge de 50 ans, tout membre de Bourbaki devra céder sa place aux jeunes générations. Pour l'anecdote, André Weil, à l'occasion de la fête d'anniversaire des 50 ans de Dieudonné, fit lire au groupe Bourbaki une lettre où il annonçait son retrait du groupe, car il avait lui-même dépassé l'âge limite. Cet éclat (chose à laquelle on peut s'attendre de la part de Weil) eut son effet mais les cinquantenaires traînèrent un peu les pieds pour partir.

La première réunion de travail a lieu dans un café du quartier latin10 en décembre 1934. En juillet de l'année suivante, le groupe se retrouve pour la première fois à Besse-en-Chandesse. Ils pensent alors que trois ans seront suffisants pour mener l'entreprise à son terme. En fait, le premier chapitre nécessitera quatre ans de travail et, très rapidement, c'est un traité sur la mathématique qui devient le projet du groupe : les Éléments de mathématique, œuvre collective publiée sous le pseudonyme de N. Bourbaki. L'ampleur de la tâche fait qu'elle se poursuit encore...

L'âge d'or de Bourbaki [modifier]

Le premier volume des Éléments de mathématique à être publié, en 1939, fut le Fascicule de résultats de la Théorie des ensembles. La publication des volumes suivants ne respecta pas l'ordre du traité (Théorie des ensembles, Algèbre, Topologie générale, ...).

Même si Nicolas Bourbaki n'est pas mort aujourd'hui, on considère que l'influence de Bourbaki a été la plus importante dans les années 1960-70. À cette époque, son importance était telle que les choix réalisés par Bourbaki ont influencé toute la recherche française en mathématiques, et peut-être même l'enseignement à travers la réforme Lichnerowicz[réf. nécessaire].

Nicolas Bourbaki totalise 5 médailles Fields (la plus importante récompense en mathématiques) à travers Laurent Schwartz (1950), Jean-Pierre Serre (1954), Alexandre Grothendieck(1966), Alain Connes (1982) et Jean-Christophe Yoccoz (1994).

La mort de Bourbaki [modifier]

Dans la lignée dadaïste de sa naissance, le faire-part de décès suivant fut publié pour annoncer la « mort » de Nicolas Bourbaki :

« Les familles CantorHilbertNoether ; les familles CartanChevalleyDieudonnéWeil ; les familles BruhatDixmierSamuelSchwartz ; les familles Cartier,GrothendieckMalgrangeSerre ; les familles DemazureDouadyGiraudVerdier ; les familles filtrantes à droite et les épimorphismes strictes, mesdemoiselles Adèle et Idèle ;

ont la douleur de vous faire part du décès de M. Nicolas Bourbaki, leur père, frère, fils, petit-fils arrière-petit-fils et petit-cousin respectivement pieusement décédé le11 novembre 1968, jour anniversaire de la victoire, en son domicile de Nancago. La crémation aura lieu le samedi 23 novembre 1968 à 15 heures au cimetière des fonctions aléatoires, métro Markov et Gödel.
On se réunira devant le bar « aux produits directs », carrefour des résolutions projectives, anciennement place Koszul.

Selon les vœux du défunt, une messe sera célébrée en l'église Notre-Dame des problèmes universels, par son éminence le Cardinal Aleph 1 en présence des représentants de toutes les classes d'équivalence et des corps algébriquement clos constitués. Une minute de silence sera observée par les élèves des Écoles normales supérieures et des classes de Chern.

Car Dieu est le compactifié d'Alexandroff de l'universGrothendieck IV, 22. »

Héritage et influence [modifier]

En mathématique [modifier]

Ce que les mathématiques doivent à Bourbaki est essentiellement :

On est redevable à Bourbaki d'un travail de clarification des concepts, de précision dans la formulation, d'une recherche — parfois aride — de structure, de classification systématique et exhaustive des mathématiques.

Dans d'autres disciplines [modifier]

En littérature, l'Oulipo copie indéniablement la « méthode » Bourbaki de travail collectif et de mise en évidence systémique des structures profondes de la création littéraire. À noter qu'un membre important de l'Oulipo, Jacques Roubaud est un mathématicien qui a été très marqué par Bourbaki. C'est par exemple lui qui a écrit l'avis de décès de Bourbaki, sous forme de canular.

Le structuralisme lacanien ou celui de Lévi-Strauss en ethnologie, à la même époque, dénote d'une quête de structures fondamentales dont on peut débattre s'il s'agit de l'influence de Bourbaki ou d'un certain « air du temps »15.

Le philosophe des sciences Jules Vuillemin fut influencé par Bourbaki (La philosophie de l'algèbre).

Note critique

Il est inutile d'imaginer un groupe qui ait influencé les autres groupes. André Weil (1906) est sensiblement de la même génération qu'André Breton (1896), Jacques Lacan (1900), ouClaude Lévi-Strauss (1908). Tous ces groupes avaient atteint leur apogée en 1964.

Une rencontre s'est opérée géographiquement au mois de janvier 1964 lorsque le directeur de l'École normale, Robert Flacelière a mis à la disposition de Jacques Lacan une salle dans les locaux de son école. (Séminaire Livre XI, Les Quatre concepts fondamentaux de la psychanalyse).

D'un côté Jacques Lacan souhaitait la venue des mathématiciens pour formuler les structures algébriques et topologiques qu'il considérait à l'œuvre dans la psychanalyse ; de l'autre lesmathématiciens voyaient là, peut-être avec un certain amusement, une application concrète des mathématiques fondamentales.

C'est sensiblement à cette époque que le groupe Bourbaki fit paraître la Théorie des ensembles dont Lacan fit un très grand usage.

Ce qui distinguerait le groupe des mathématiciens des autres groupes, ce serait son côté fermé et réservé aux mathématiciens de haut niveau de l'École normale supérieure, alors que le structuralisme prétendrait intéresser tous les praticiens des sciences humaines : littérature, politique, psychanalyse, ethnologie, linguistique.

Il y a bien sûr un point commun, qui est le retour aux sources, la recherche des fondements et la rupture épistémologique.

Mais les deux groupes sont néanmoins restés sur leur quant-à-soi.

Mathématiciens ayant appartenu à Bourbaki [modifier]

Membres fondateurs [modifier]

Membres non-fondateurs [modifier]

Membres actuels [modifier]

Les noms des membres actuels de Bourbaki sont tenus secrets.

Références [modifier]

Notes [modifier]

  1.  Maurice Mashaal, p. 25.
  2.  [pdf] Jean Dieudonné, « Lettre à la rédaction », dans Cahiers du séminaire d'histoire des mathématiquestome 7, 1986, p. 221-222. [archive]
  3.  Jahrbuchtome. 58, 1932, p. 734. [archive]
  4.  Éveline de Possel se remarie peu après avec André Weil.
  5.  André Weil, Souvenirs d'apprentissage, Birkhaüser, 1991, p. 106.
  6.  Maurice Mashaal, p. 29.
  7.  Dans un article au ton canularesque, Michèle Audin soutient que dès 1910 des normaliens montèrent une mystification qui roulait sur une prétendue nation poldève. ([pdf] Michèle Audin, « La vérité sur la Poldévie » [archive], 2009, en ligne sur le site de l'université de Strasbourg). Elle donne pour référence André WeilSouvenirs d’apprentissage, Vita Mathematica, vol. 6, Birkhäuser, Basel, 1991, p. 106 sq (passage commençant par : « Vers 1910, à ce que dit l’histoire, des normaliens ramassèrent dans les cafés de Montparnasse des individus d’origine variée dont ils firent, moyennant quelques apéritifs, des représentants de la nation poldève. »). Elle cite aussi L. Beaulieu (« Jeux d’esprit et jeux de mémoire chez N. Bourbaki, in La Mise en mémoire de la science », in Pour une ethnographie historique des rites commémoratifs, P. Abir-Am (dir.), Éditions des Archives contemporaines, Paris, 1998, p. 75–123), qui attribue l'invention de la Poldévie à Alain Mellet et ajoute dans une note de bas de page « que, d’après Weil, il y aurait eu quelque chose en 1910 ». Elle indique au sujet d'André Weil (§ 3. Documents, p. 9) : « Ajoutons qu’André Weil est entré à l’ens en 1922 ; nul doute que la relation d’événements qui se sont produits douze ans auparavant ait pu se perpétuer jusqu’à lui. »
  8.  Le séminaire d'Hadamard au Collège de France était alors le seul en France où les jeunes mathématiciens pouvaient entendre et faire des exposés sur les mathématiques « vivantes ».
  9.  Il est le frère de la philosophe Simone Weil.
  10.  « Le Petit Cluny », boulevard Saint-Michel.
  11.  Les deux auteurs en revendiquent la paternité.
  12.  Algèbre, chapitre IX : Formes sesquilinéaires et formes quadratiques, 1959.
  13.  Groupes et algèbre de Lie, chapitres 4, 5 et 6, 1968
  14.  Ces notes ont été rassemblés en un volume intitulé Éléments d'histoire des mathématiques et signé Nicolas Bourbaki.
  15.  Aubin 1997

Bibliographie [modifier]

  • Frédéric PatrasLa Pensée mathématique contemporaine, coll. « Science, histoire et société », P.U.F., 2001 ; 2e éd. 2002.
  • Michèle Chouchan, Nicolas Bourbaki Faits et légendes, Édition du choix, 1995 (ISBN 2-909028-18-6).
  • Maurice Mashaal, Bourbaki, une société secrète de mathématiciens, Pour la science, 2002 (ISBN 2-84245-046-9).
  • (en) David Aubin, « The Withering Immortality of Nicolas Bourbaki: A Cultural Connector at the Confluence of Mathematics », Science in Contextno 10, 1997, p. 297-342, [pdf].
  • (en) François Laubie, « A Mathematician called Bourbaki », The Mathematical Intelligencerno 29, 2007, p. 7-8.
  • Amir D. Aczel, Nicolas Bourbaki, Histoire d'un génie des mathématiques qui n'a jamais existé, édition JC Lattès, 2009.
  • Michèle AudinLa Vérité sur la Poldévie, 2009 .

Liens [modifier]

Liens internes [modifier]

Liens externes [modifier]

22:35 Publié dans Nicolas Bourbaki | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Augustin-Louis Cauchy - Œuvres complètes, série 1, tome 1

Portrait de l'auteur

Augustin-Louis Cauchy - Œuvres complètes, série 1, tome 1



Avertissement p.v-vii
Texte intégral PDF (Gallica)

Avertissement p.4-4
Texte intégral PDF (Gallica)

Théorie de la propagation des ondes à la surface d'un fluide pesant d'une profondeur indéfinie p.5-318
Mémoires présentés par divers savants à l'Académie royale des sciences de l'Institut de France et imprimés par son ordre. Sciences mathématiques et physiques. Tome I, imprimé par autorisation du Roi à l'Imprimerie royale; 1827
Table des matières | Texte intégral PDF (Gallica)

Mémoire sur les intégrales définies p.319-506
Table des matières | Texte intégral PDF (Gallica)

Augustin Louis Cauchy

Augustin Louis Cauchy

Page d'aide sur l'homonymie Pour les articles homonymes, voir Cauchy.

Augustin Louis Cauchy
Augustin Louis Cauchy
Cauchy vers 1840. Lithographie de Zéphirin Belliard d'après une peinture de Jean Roller.
Naissance 21 août 1789
Paris (France)
Décès 23 mai 1857 (à 67 ans)
Sceaux (Hauts-de-Seine) (France)
Nationalité France Français
Champs Mathématicien
Institution École polytechnique
Diplômé École polytechniqueÉcole nationale des ponts et chaussées
Célèbre pour Séries (critère de Cauchy), analyse complexe, Algèbre (théorème de Cauchy)
Distinctions Académie des sciences
Son nom est sur la Liste des soixante-douze noms de savants inscrits sur la tour Eiffel

Augustin Louis, baron Cauchy, né à Paris le 21 août 1789 et mort à Sceaux (Hauts-de-Seine) le 23 mai 1857, est unmathématicien français, membre de l’Académie des sciences et professeur à l’École polytechnique. Catholique fervent, il est le fondateur de nombreuses œuvres charitables, dont l’Œuvre des Écoles d’Orient. Royaliste légitimiste, il s’exila volontairement lors de l'avènement de Louis-Philippe, après les Trois Glorieuses. Sa position politique et religieuse lui valut nombre d’oppositions.

Il fut l'un des mathématiciens les plus prolifiques, quoique devancé par Leonhard Euler, avec près de 800 parutions et sept ouvrages ; sa recherche couvre l’ensemble des domaines mathématiques de l’époque. On lui doit notamment en analyse l’introduction des fonctions holomorphes et des critères de convergence des séries et des séries entières. Ses travaux sur lespermutations furent précurseurs de la théorie des groupes. En optique, on lui doit des travaux sur la propagation des ondes électromagnétiques.

Son œuvre a fortement influencé le développement des mathématiques au xixe siècle. La négligence dont fit preuve Cauchy envers les travaux d'Évariste Galois et de Niels Abel, perdant leurs manuscrits, a cependant entaché son prestige.

Sommaire

 [masquer]

Biographie [modifier]

Augustin Louis, baron Cauchy
Pierre-Simon de Laplace

Né le 21 août 1789 à Paris, Augustin Louis Cauchy est le fils aîné de Louis François Cauchy(1760-1848) et de Marie-Madeleine Desestre (1767- 1839)1. Son père fut premier commis du Lieutenant général de police de Paris Louis Thiroux de Crosne en 1789 ; suite à l’exécution de ce dernier en avril 1794, Louis François se retira à Arcueil pour fuir la dénonciation et la Terreur. Sa famille subit néanmoins la loi du maximum et connut la famine. Il retourna occuper des postes administratifs divers en juillet2 et fut nommé secrétaire général du Sénat conservateur le1er janvier 1800. Il obtint un appartement de fonction au palais du Luxembourg sous l'Empire. Il fut proche du ministre de l’Intérieur et mathématicien Pierre-Simon de Laplace (1749-1827) et du sénateur et mathématicien Joseph-Louis Lagrange (1736-1813).

Augustin Louis reçoit une première éducation chrétienne de son père ; il apprend le latin, la littérature et la science. Il fréquente ensuite l’École centrale du Panthéon et se voit décerner en1803 et en 1804 divers prix dans les épreuves littéraires du Concours général3. Il fréquente le lycée Napoléon et a notamment pour professeur Jacques Binet. À 16 ans, en 1805, il est reçu deuxième au concours l'École polytechnique, pour lequel il est interrogé par Jean-Baptiste Biot. Des amis de la famille, Berthollet, Lagrange, et Laplace, l'ont soutenu durant ses études secondaires.

Sous le Premier Empire [modifier]

Il est reçu premier au corps prestigieux de l'École nationale des ponts et chaussées en 1807. Devenu aspirant ingénieur, il est appelé à participer à la construction du canal de l'Ourcq puis du pont de Saint-Cloud. L’ingénierie apparaissait alors comme le domaine naturel d’application des mathématiques. Le 18 janvier 1810, il est nommé pour s’occuper du chantier du port de Cherbourg, qui devait devenir une position militaire stratégique du Premier Empire. Cauchy quitte ce poste en mars. Pendant son séjour à Cherbourg, il commence ses premiers travaux en mathématiques durant son temps libre, indépendamment des institutions académiques. Après qu’un premier écrit est égaré par Gaspard de Prony(1755-1839)4, il publie, encouragé par Lagrange, ses deux premiers mémoires, portant sur les polyèdres, en février 1811 et en janvier 1812. Il donne aussi des heures officieuses d’enseignement pour préparer des étudiants aux examens d’entrée, et se passionne pour l’histoire naturelle5.

Siméon Denis Poisson

Durant une grave maladie (dont les causes peuvent être attribuées à un surmenage6 ou aux séquelles de la famine qu’il connut durant son enfance), il retourne en automne 1812 à Paris, et prend quelques mois de congés. Après qu'un poste de professeur-adjoint lui est refusé, il est appelé par son ancien professeur Pierre-Simon Girard à participer de nouveau en mars 1813 au chantier de l'Ourcq. À cette époque, sous l’influence de Lagrange et de Laplace, il exprime le souhait d’abandonner ses travaux d’ingénieur pour se consacrer aux mathématiques7. Deux demandes auprès de l'Académie des sciences, appelée alors l'Institut, furent appuyées par Laplace et Siméon Denis Poisson(1741-1840), en mai 1813 et en novembre 1814 après la mort de Lagrange et de Lévêque, mais furent toutes deux rejetées8. Cauchy reçoit temporairement un poste à la Société philomathique en décembre 1814. En 1816, il remporte le prix des mathématiques pour des travaux sur la propagation des ondes.

Membre de la La Congrégation depuis ses études à Polytechnique9, Cauchy peut bénéficier de l'importance que prend ce mouvement dès le début de la Seconde Restauration. Il devient professeur assistant à l’École polytechnique en novembre 1815, puis professeur d'analyse et de mécanique en décembre. Suite à une ordonnance du 21 mars 1816 rétablissant les Académies, il intègre l'académie des sciences sous nomination royale, parallèlement au renvoi d'importants mathématiciens connus pour leurs positions républicaines et libérales, Lazare Carnot(1753-1823) et Gaspard Monge (1746-1818)10. Cauchy est durement accusé par ses pairs : « Il accepta sans hésiter, non par intérêt, jamais il ne fut sensible à un motif pareil, mais par conviction11. »

En 1818, il épouse Aloïse de Bure12, avec laquelle il aura deux filles, Alicia (1819) et Mathilde (1823).

Il donne chaque année à l'École polytechnique un cours d'analyse jusqu'en 1830. Ses collègues, François Arago (1786-1853) et Alexis Thérèse Petit 1791-1820) contestent l'insuffisance supposée de ses cours d'analyse, tandis certains élèves en critiquent la surcharge horaire13. Invité à les rédiger, il publie divers traités durant cette période : une première partie des notes de cours sous le titre Analyse algébrique en 1821 ; puis les notes complètes sous le titre Leçons sur le calcul différentiel en 1829, sans tenir compte des exigences de ses collègues et du ministère.

Exil [modifier]

À l'issue des Trois glorieuses (juillet 1830), son cléricalisme revendiqué et sa position antilibérale le contraignent à l'exil. En effet, royaliste dévoué à Charles X, il refuse de prêter serment au nouveau roi Louis-Philippe comme l'exige la loi du 30 août 1830. En conséquence, il perd son poste à l’École polytechnique en novembre. À cause de son attachement à la dynastie des Bourbons et par réaction au soutien des étudiants de l’École polytechnique à la Révolution, Cauchy s'exile volontairement à Fribourg en Suisse en septembre 1830, sa femme et ses enfants restant à Paris14. Il tente vainement d'y fonder une Académie où les savants émigrés pourraient enseigner15. Sur invitation du roi de PiémontCharles-Albert, il occupe la chaire nouvellement créée de physique sublime à l'université de Turin en janvier 1832. Il effectue un voyage à Rome et est reçu par le pape Grégoire XVI. Après l’enlèvement de son frère cadet Amédée Cauchy à 26 ans, Augustin fait deux voyages consécutifs à Paris.

Refusant de rentrer en France malgré les demandes réitérées de sa famille, il accepte l’invitation du roi en exil Charles X de devenir le précepteur du duc de Bordeaux Henri d'Artois(1820-1883). Il est choisi pour ses connaissances scientifiques et son attachement à la religion. Il s’installe en 1833 à Prague, bientôt rejoint par sa femme en 1834. Devenu membre de l’Académie de Prague, il séjourne en 1835 à Toeplitz, puis en 1836 à Budweitz, Kirchberg, et Gloritz. En remerciement pour son dévouement, Charles X le crée baron en 1839.

Retour en France [modifier]

Il regagne Paris fin 1838, souhaitant rester politiquement neutre, et reprend sa place à l'Académie. Toutefois, il ne récupère pas son poste d’enseignant à l’École polytechnique. Alors qu'il avait peu publié durant son séjour en Allemagne, il publie près d’un article par semaine de 1839 à février 1848, excepté en 1844. En novembre 1839, il est élu pour succéder àGaspard de Prony au Bureau des longitudes. Mais, parce qu'il refuse de prêter serment, sa nomination est officiellement rejetée par le gouvernement en 1843. Il rend l’affaire publique en décembre. La même année, il est candidat à la chaire de mathématiques du Collège de France, laissée vacante après la mort de Lacroix (1765-1843), qu'il se voit refuser au profit ducomte Libri.

L’insurrection en février 1848 conduit à la suppression temporaire du serment politique. Après la fuite du comte Libri pour poursuites judiciaires pour vols et vente illégale de livres, Cauchy postule à nouveau à la chaire de mathématiques du Collège de France, mais se retire au profit de Joseph Liouville (1809-1882), finalement élu en janvier 1851. En 1849, Cauchy devient, à la suite d'Urbain Le Verrier (1811-1877), titulaire de la chaire d'astronomie mathématique à la Faculté des sciences de ParisVictor Puiseux, un de ses amis et élèves, lui succèdera à sa mort. Il prend aussi une chaire à la Sorbonne.

Cauchy refuse de prêter serment à Napoléon III (1808-1873), en 1852. Il n'en est cependant pas moins maintenu dans ses fonctions, grâce à l'intervention d’Hippolyte Fortoul (1811-1856)16.

En 1857, Cauchy est impliqué dans des querelles à propos de la mécanique. Le 23 mai vers 4 h du matin heure locale, il meurt d'un rhume dans la maison familiale de sa femme à Sceaux. Il est enterré au cimetière de Sceaux17. Son dernier vœu fut que son œuvre fasse l'objet d'une publication intégrale18.

Position [modifier]

Engagement religieux [modifier]

Franz Joseph Gall

Catholique convaincu, proche des Jésuites, Augustin Cauchy s’engagea dans une confrérie, la Congrégation, lors de ses études. Il fut critiqué dès son séjour à Cherbourg pour son usage de prier matin et soir : « On dit que ma dévotion me fera tourner la tête19. » De retour à Paris, il utilisa à plusieurs reprises sa position à l’Académie pour promouvoir sa pensée. Il défendait notamment ouvertement le créationnisme. En1824, il condamna les recherches en neurologie de Franz Joseph Gall (1758-1828). Sa prise de position, considérée comme non scientifique, fut fortement condamnée dans la presse écrite par Stendhal (1783-1842) dans deux articles successifs.

Il éprouvait une antipathie pour les idées libérales issues du xviiie siècle et s’engagea pour la liberté d’enseignement en défendant les écolesjésuites dès son retour en France en 1838. Supprimées en 1772 et rétablies sous la Restauration, elles furent remises en cause sous la Monarchie de Juillet. Engagé aux côtés de Xavier de Ravignan, prêtre de Notre-Dame, Cauchy fit appel à l’Institut : « Catholique, je ne peux rester indifférent aux intérêts de la religion ; géomètre, je ne peux rester indifférent aux intérêts de la Science. […] Vous ne considérez pas comme des ennemis de la civilisation, ceux-là même qui ont éclairé et civilisé tant de peuples divers20. » Pierre-Antoine Berryer (1790-1868),Charles de Montalembert (1810-1870) et de Vatisménil le soutinrent dans sa démarche. Il est probable que les raisons pour lesquelles il ne put entrer au Collège de France en 1843 soient son engagement aux côtés des jésuites et la forte opposition du comte Libri21. Seuls certains établissements des jésuites furent finalement fermés en 1845. L’affaire prit fin en 1848 : la Deuxième République assura l’indépendance de l’enseignement.

Cauchy fonda diverses œuvres catholiques :

  • Il apporta un soutien actif dès 1838 à la Société de Saint-Vincent-de-Paul, œuvre catholique fondée en 1833 pour apporter une aide aux démunis.
  • Il fonda en 1842 l’Institut catholique, ou Centre du Luxembourg, dont il présida la section scientifique.
  • Il proposa en 1843 un opuscule sur la prévention des crimes envoyé à Alexis de Tocqueville (1805-1859).
  • Sur une demande signée par l’Institut fut fondée en 1846 l’œuvre d’Irlande visant à combattre la famine en Irlande.
  • En 1854, il fonda l’œuvre pour l’observation du dimanche, demandant la fermeture des commerces le dimanche.
  • En 1855, Cauchy est l’un des fondateurs de l’œuvre des Écoles d’Orient, dont l’objectif est de consolider l’émancipation par l’éducation, dont Lenormant et Cauchy devinrent les vice-présidents et dont le premier président fut le contre-amiral Mathieu, collègue de Cauchy au Bureau des longitudes.

Engagement politique [modifier]

Cauchy est un monarchiste antilibéral. Il utilisa sa position à l'Académie pour promouvoir la pensée royaliste22, et s’exila volontairement en 1830 pour s’opposer au nouveau régime. Il considérait la dynastie des Bourbons comme « les soutiens de la religion et de la civilisation chrétienne, les défenseurs des idées et des principes auxquels il avait voué de bonne heure son âme et son cœur23. »

Son engagement politique lui valut de fortes oppositions au sein de l'Institut, puis de l'Académie, venant notamment de Poinsot ou d'Arago. Cependant, Arago apporta son soutien en1839 à Cauchy pour sa candidature au Bureau des longitudes24. Il connut aussi des oppositions avec les ministères, par son refus réitéré de prêter un serment de fidélité à chaque nouveau régime.

Position scientifique [modifier]

Le génie de Cauchy fut reconnu dès son plus jeune âge. Dès 1801, Lagrange eut ce commentaire : « Vous voyez ce petit homme, eh bien ! Il nous remplacera tous tant que nous sommes de géomètres25. » La prédominance de Cauchy en sciences s’explique par la multitude de ses domaines d’études : ses travaux « embrassent à peu près toutes les branches des sciences mathématiques, depuis la théorie des nombres et la géométrie pure jusqu’à l’astronomie et l’optique26. »

Bien que ses talents de mathématicien aient été applaudis, les faveurs dont il bénéficia durant la Seconde Restauration ne furent pas appréciées. Critiquant ouvertement Laplace et Poisson, il connut rapidement des conflits avec ses anciens appuis à qui il devait ses premières publications. Ses rapports avec Poisson se dégradèrent avec le temps et une rivalité entre eux s’installa. Ses votes à l’Académie étaient considérés comme orientés. Malgré l’influence de Cauchy sur les nouvelles générations, ses dernières années furent obscurcies par une querelle de priorité en mécanique, où il refusa de reconnaître son erreur.

En tant que membre de l’Académie, Cauchy devait lire et corriger les articles envoyés. Il commit une négligence envers les travaux de Niels Henrik Abel (1802-1829) et d'Évariste Galois(1811-1832). Son avis sur le mémoire d'Abel tarda et le rapport fourni en juin 1829 fut finalement défavorable ; les recherches de Galois lui avaient été soumises en mai et n'eurent aucune réponse. Une telle attitude lui a été violemment reprochée. Dans sa biographie, Valson donne une explication : « On doit l’excuser de n’avoir pas toujours eu le temps de s’occuper des publications d’autrui, quand il n’a pas trouvé dans le cours de sa propre vie le loisir nécessaire pour relier et classer ses travaux personnels27. »

Travaux [modifier]

L’ensemble des travaux de Cauchy furent publiés de 1882 à 1974 chez Gauthier-Villars, dans les Œuvres complètes en 27 tomes qui rassemblent environ 800 articles couvrant l’analyse, l’algèbre, la mécanique et les probabilités28. Lors de la préparation de ses cours et conférences, Cauchy réfléchit sur les fondements de l’analyse et introduisit des définitions rigoureuses de notions seulement intuitivement utilisées avant lui29. Une partie importante de ses travaux concerne l’introduction des fonctions holomorphes et les séries convergentes30.

Analyse [modifier]

Avant les travaux de Cauchy en analyse, les séries et séries de fonctions étaient couramment utilisées dans les calculs, sans le développement d'un formalisme précis et cela conduisait à des erreurs fréquentes, car les mathématiciens ne se posaient pas de question sur l'éventuelle divergence des séries utilisées, comme l'a remarqué Cauchy. Dans son Cours d’Analyse, il définit rigoureusement la convergence des séries et étudie en particulier les séries à termes positifs : les sommes partielles convergent si et seulement si elles sont bornées. Il donne des résultats de comparaison de séries. Il déduit de la convergence des séries trigonométriques un critère de convergence qui porte aujourd’hui son nom, le critère de Cauchy : si la limite supérieure de la suite an | 1 / n est strictement inférieure à 1, la série de terme général an converge. Intéressé par les séries entières (appelées alors séries de puissances), il met en évidence l'existence d'un rayon de convergence (qu’il appelle cercle de convergence), et en donne une méthode de calcul, conséquence de son critère de convergence. Il démontre que sous certaines hypothèses, le produit des sommes de deux séries convergentes peut s’obtenir comme la somme d’une série, appelée par la suite produit de Cauchy. Il en donne une version pour les séries entières.

Une fonction régulière était à tort considérée comme la somme de sa série de Maclaurin : autrement dit, on pensait à tort qu'une fonction indéfiniment dérivable était déterminée par la suite de ses dérivées successives en un point. En 1822, Cauchy relève deux problèmes : d’une part, le rayon de convergence de cette série entière peut être nul, et d’autre part, sur l’intersection des domaines de définition, la fonction et la somme de sa série de Maclaurin ne sont pas nécessairement égales. Cependant des solutions d’équations différentielles linéaires avaient été exprimées sous forme de séries entières sans aucune justification. Après avoir exhibé des exemples de fonctions plates, Cauchy s’intéresse de près audéveloppement de Taylor, et évalue le reste sous forme de la détermination principale. Il donne ainsi des conditions suffisantes pour obtenir des réponses positives aux questions soulevées.

Toujours dans son Cours d’Analyse, il énonce et démontre le théorème des valeurs intermédiaires31, démonstration déjà finalisée par Bolzano en 1817 à partir du critère de Cauchy pour la convergence des suites32. Chez Cauchy, la notion première est celle de quantité variable. C'est à partir de cette notion que sont définies les notions de limite et d'infiniment petit. Ensuite Cauchy définit la continuité à l'aide des infiniment petits : d'un accroissement infiniment petit de x résulte un accroissement infiniment petit de y. Il précise les notions de limite ; et formalise en termes de limites la continuité et la dérivabilité. Il est arrêté dans ses travaux par une nuance qu'il ne perçoit pas : la différence entre convergence simple et convergence uniforme33. Pourtant, la convergence simple (convergence d'une suite de fonctions en chaque point d'évaluation) n'est pas une condition suffisante pour préserver la continuité par passage à la limite. Il est le premier à donner une définition sérieuse de l’intégration. Il définit l’intégrale d’une fonction d’une variable réelle sur un intervalle comme une limite d’une suite de sommes de Riemann prises sur une suite croissante de subdivisions de l’intervalle considéré. Sa définition permet d'obtenir une théorie de l’intégration pour les fonctions continues. Dans son Analyse algébrique, il définit les logarithmes et les exponentielles comme uniques fonctions continues vérifiant respectivement les équations fonctionnelles f(x + y) = f(x)f(y)et f(xy) = f(x) + f(y). Bien qu'il se soit efforcé de donner des bases rigoureuses à l'analyse, il ne s'est pas interrogé sur l’existence du corps des nombres réels, établie plus tard parGeorg Cantor.

Dans son cours de Polytechnique, Leçon de calcul différentiel et intégral, il apporte clarté et rigueur aux résolutions des équations différentielles linéaire d'ordre un 34 et s'intéressa aux équations au dérivées partielles (théorème de Cauchy-Lipschitz).

Analyse complexe [modifier]

On doit à Cauchy l'introduction des fondements de l'analyse complexe. Sous l’influence de Laplace, il présente dans le mémoire Sur les intégrales définies (1814) la première écriture des équations de Cauchy-Riemann comme condition d'analyticité pour une fonction d'une variable complexe. Dans cet article, il s’intéresse à l’intégration d’une fonction analytique d’une variable complexe sur le contour d’un rectangle, donne la définition de résidu, et fournit un premier calcul de résidu. Dans Sur les intégrales définies prises entre des limites imaginaires(1825), il donne la première définition d'intégrale curviligne, démontre l'invariance par homotopie (formulée en termes d'analyse), et énonce précisément le théorème des résidus pour les fonctions analytiques comme outil pour le calcul d'intégrales.

En 1831, Cauchy propose une expression du nombre de racines complexes d’un polynôme dans une région du plan complexe. Si F et P sont des polynômes, il démontre :

int_{partial U}F(z).frac{P'(z)}{P(z)}dz= sum F(z_i),

où l'intégrale est prise sur le contour du domaine U, et où la somme porte sur les racines de P appartenant au domaine U.

Durant son séjour à Turin, il déduit de la formule de Cauchy précédemment énoncée une expression des coefficients de la série de Taylor d'une fonction analytique d'une variable complexe comme intégrales. Il en déduit les inégalités dites de Cauchy et des résultats sur la convergence des fonctions analytiques d’une variable complexe. Ses travaux seront publiés en 1838 et poursuivis par Laurent, qui fournit comme généralisation des séries entières les séries de Laurent.

Vers 1845, Cauchy s'inspire des travaux des mathématiciens allemands sur les nombres imaginaires, et en particulier l'écriture trigonométrique. Il repousse dans un premier temps cet aspect géométrique pour ensuite l'utiliser dans ses propres travaux. Il définit la notion de dérivée d'une fonction d'une variable complexe ; il établit ensuite l'équivalence entre dérivabilité et analyticité, fondant ainsi la définition des fonctions holomorphes. Tous ses résultats précédents sur le sujet concernent les fonctions holomorphes ; la formule de Cauchy devint un outil central dans l’étude des fonctions holomorphes, et il étudie alors à nouveau les équations de Cauchy-Riemann.

Algèbre [modifier]

Lagrange avait démontré que la résolution d’une équation algébrique générale de degré n passe par l’introduction d’une équation intermédiaire : sa résolvante dont le degré est le nombre de fonctions à n variables obtenues par permutation des variables dans l’expression d’une fonction polynomiale. Ce nombre est un diviseur de n! : ce résultat est aujourd’hui vu comme une conséquence de l’actuel théorème de Lagrange. En 1813, Cauchy améliore cette estimation et démontre que ce nombre est supérieur au plus petit diviseur premier de n. Son résultat fut généralisé ensuite en l’actuel théorème de Cauchy.

Il fut le premier à réaliser une étude des permutations comme des objets (appelés alors substitutions). Il introduit les écritures encore utilisées aujourd’hui pour noter les permutations ; il définit le produit, l’ordre, et établit l’existence et l’unicité de la décomposition des permutations en produit de cycles (substitutions circulaires) à supports disjoints. Les travaux de Cauchy et de Lagrange sur le sujet sont considérés comme précurseurs de la théorie des groupes. Cependant, Cauchy ne connaissait pas la théorie des groupes et donna sans le savoir une première étude du groupe symétrique.

En algèbre linéaire, il écrivit un traité sur le déterminant35 contenant l'essentiel des propriétés de cette application. Il étudia la diagonalisation des endomorphismes symétriques réels et qu'il démontra en dimension deux et trois36 et dans le cas où le polynôme caractéristique ne possède aucune racine multiple37. Enfin, il formalisa la notion de polynôme caractéristique38.

Géométrie [modifier]

Le dodécaèdre, un polyèdre régulier convexe

En 1811, il s’intéresse dans son premier mémoire à l’égalité de polyèdres convexes dont les faces sont égales. Il propose une démonstration du théorème de Descartes-Euler, concernant les nombres de sommets, de faces et d'arêtes d'un polyèdre convexe. Sa preuve consiste à projeter le polyèdre en un graphe planaire suivant ce qui est aujourd’hui appelé une projection stéréographique. Cependant, Cauchy commit une erreur, en ne faisant pas d’hypothèse claire sur les polyèdres étudiés.

Dans son second mémoire en 1812, il donna des formules pour calculer les angles diédraux.

Mécanique et optique [modifier]

En mécanique, Cauchy proposa pour décrire la matière d’opposer à la continuité de la matière un système de points matériels dont les mouvements sont continus. Selon Cauchy, les forces entre ces particules doivent devenir négligeables sur les distances estimables. Cauchy énonça des lois sur les variations de tension, de condensation et de dilatation. Il fit une étude sur l’élasticité des corps.

S’intéressant à la variation des molécules d’éther, Cauchy établit les équations de propagation de la lumière en 1829. Il établit les modes depolarisation des ondes planes, mises en évidence par des travaux antérieurs de Fresnel. S’intéressant aux conditions limites au niveau d’une interface, Cauchy démontra les lois de la réflexion et de la réfraction de la lumière. Il retrouva les résultats de Brewster sur la variation de l’angle de polarisation lors d’une réflexion ou d’une réfraction. Enfin, il démontra l’existence d’ondes évanescentes, vérifiée expérimentalement par Jasmin.

Sous l’influence de Coriolis, Cauchy étudia la dispersion de la lumière. Ses travaux sur les ombres rejetèrent une des objections à la théorie ondulatoire de la lumière. Il mit en évidence le phénomène de diffraction.

En astronomie, sa recherche sur les séries lui permit de réviser la théorie des perturbations mise en place par Lagrange, Laplace, et Poisson pour étudier la stabilité du système solaire. Cauchy s’intéressa de plus près aux calculs astronomiques à partir de son élection au Bureau des Longitudes en 1839. En 1842, il proposa des méthodes de calculs de primitives d’expressions rationnelles en cosinus et sinus ; ces méthodes furent motivées par le développement de la fonction perturbative. En 1845, le mémoire de Le Verrier sur la planète Pallasest vérifié en quelques heures par Cauchy.

Probabilités [modifier]

Les travaux de Cauchy sur le principe du minimax permirent de développer la théorie de la décision statistique. En 1853, il étudia, via leurs fonctions caractéristiques, une famille de distributions paires répondant à un problème variationnel39, parmi lesquelles figurent la loi normale et la loi de Cauchy, découverte par Poisson. Faisant usage des fonctions caractéristiques, il publia une démonstration du théorème central limite.

Principales publications [modifier]

  • Cours d'analyse (1821)
  • Leçons sur les applications du calcul infinitésimal à la géométrie (1826)
  • Exercices de mathématiques (1827)
  • Œuvres complètes (28 volumes, 1882-1974)
Mémoires
  • Théorie des ondes
  • Mémoires sur la polarisation de la lumière
  • Théorie des nombres

Hommages [modifier]

Notes et références [modifier]

  1.  Valson, Tome I, pp. 3-5.
  2.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , p. 14-15.
  3.  Valson, Tome I, pp. 19-20.
  4.  Valson, Tome I, p. 43.
  5.  Valson, Tome I, pp. 27-31.
  6.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , p. 33.
  7.  Valson, Tome I, p. 42.
  8.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , pp. 47-53.
  9.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , pp. 59-62
  10.  Jacques Bouveresse, Jean Itard, Émile Sallé, Histoire des mathématiques [détail des éditions] , p 164, biographie de Cauchy
  11.  Lettre de Biot à de Falloux. Le Correspondant, 1857.
  12.  Valson, Tome I, pp. 67-69
  13.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , p. 78.
  14.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , p. 124.
  15.  (en) Bruno Belhoste, Augustin-Louis Cauchy: A Biography [détail des éditions] , p. 149-150.
  16.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , pp. 207-208.
  17.  Valson, Tome I, p. 267.
  18.  Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions] , p. 213.
  19.  Lettre de Cauchy à sa mère, rapportée dans Valson, Tome I, p. 38.
  20.  Valson, Tome I, pp. 108-121.
  21.  (en) Bruno Belhoste, Augustin-Louis Cauchy: A Biography [détail des éditions] , pp. 184-187.
  22.  Bruno Belhoste, p. 114.
  23.  Valson, Tome I, p. 71.
  24.  Bruno Belhoste, p. 157.
  25.  Valson, Tome I, p. 20.
  26.  Valson, Tome II, Introduction.
  27.  Valson, Tome I, p. 251.
  28.  (en) Bruno Belhoste, Augustin-Louis Cauchy: A Biography [détail des éditions] , chaps. 6, 7 et 12.
  29.  Jean Dieudonné (dir.), Abrégé d'histoire des mathématiques 1700-1900 [détail des éditions] , vol. 1, pp. 341-344
  30.  Jean Dieudonné (dir.), Abrégé d'histoire des mathématiques 1700-1900 [détail des éditions] , vol. 1, pp. 141-149.
  31.  Nicolas BourbakiÉléments d'histoire des mathématiques [détail des éditions], p. 193.
  32.  M. Guillemot, Bolzano et la démonstration du théorème des valeurs intermédiaires, in La démonstration mathématique dans l'histoire, Irem de Lyon, ISBN 2906943207 p 106
  33.  Nicolas BourbakiÉléments d'histoire des mathématiques [détail des éditions], p. 257.
  34.  Nicolas BourbakiÉléments d'histoire des mathématiques [détail des éditions], p. 81.
  35.  Cauchy Mémoire sur les fonctions qui ne peuvent obtenir que deux valeurs égales et des signes contraires par suite des transpositions opérées entre les variables qu'elles renferment adressé en1812 et publié dans le Journal de l'Ecole Polytechnique, XVIIe Cahier, Tome X, Paris 1815 lire sur Gallica [archive]
  36.  Augustin Louis Cauchy, Mémoire sur l’équation qui a pour racines les moments d’inertie principaux d’un corps solide et sur diverses équations du même genre Mémoires de l'Académie des sciences, t. IX, p. 111; présenté en 1826 et publié en 1830
  37.  Augustin Louis Cauchy L’équation qui a pour racines les moments d’inertie principaux d’un corps solide, et sur diverses équations du même genre Mem. Acad. des Sci. Paris 1830
  38.  Augustin Louis Cauchy Méthode générale propre à fournir les équations de condition relatives aux limites des corps dans les problèmes de physique mathématique Comptes rendus Acad. Sci. 8 Paris pp 79-81 1940 lu en 1939
  39.  Sur les résultats moyens d’observations de même nature, et sur les résultats les plus probables, 1853.

Bibliographie [modifier]

  • Claude-Alphonse Valson, La vie et les travaux du Baron Cauchy, Paris, Gauthier-Villars, 1868
  • Bruno Belhoste, Cauchy, un mathématicien légitimiste au XIXe siècle [détail des éditions]

 

Liens internes [modifier]

Liens externes [modifier]

Commons-logo.svg

Wikimedia Commons propose des documents multimédia libres sur Cauchy.

22:31 Publié dans Augustin Louis Cauchy | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Espaces préhilbertiens complexes

Espaces préhilbertiens complexes

Définition Une application d'un $ mathbb{C}$-espace vectoriel $ E$ dans un $ mathbb{C}$-espace vectoriel $ F$ est dite semi-linéaire si 
$ bullet $ $ forall (x,y)in E^2 f(x+y)=f(x)+f(y)$ 
$ bullet $ $ forall (x,{lambda})in Etimes mathbb{C} f({lambda}.x)=overline {lambda}f(x)$

Une application semi-linéaire est un semi-isomorphisme si et seulement si elle est semi-linéaire et bijective.

Une forme semi-linéaire est une application semi-linéaire d'un $ mathbb{C}$-espace vectoriel dans $ mathbb{C}$.

Etant donnés $ E$ et $ F$ des $ mathbb{C}$-espace vectoriel une application $ phi$ de $ E times F$ est dite forme sesquilinéaire sur $ E times F$ si 
$ bullet $$ forall x$ l'application $ ymapsto phi(x,y)$ est une forme linéaire sur $ F$ 
$ bullet $$ forall y$ l'application $ xmapsto phi(x,y)$ est une forme semi-linéaire sur $ E$

Une forme sesquilinéaire sur $ Etimes E$ est dite hermitienne lorsque en outre $ forall (x,y) in E^2 phi(x,y)=overline {phi(y,x)}$.

Une forme sesquilinéaire hermitienne $ phi$ sur $ E^2$ est dite produit scalaire hermitien sur $ E$ si $ forall x in Esetminus{0}  phi(x,x) in mathbb{R}^+_*$. On note généralement alors$ <xvert y>=phi(x,y)$

Etant donné un produit scalaire hermitien $ <.vert.>$, on définit une norme hermitienne; il s'agit de l'application $ x mapsto {parallel}x {parallel}= sqrt{<xvert x>}$. On verra plus loin qu'il s'agit d'une norme.

On appelle espace préhilbertien complexe un $ mathbb{C}$-espace vectoriel muni d'un produit scalaire hermitien. Un sous-espace vectoriel $ F$ d'un espace préhilbertien complexe $ E$ muni d'un produit scalaire hermitien, muni de la restriction du produit scalaire hermitien à $ F$, est appelée sous-espace préhilbertien de $ E$ (c'est un espace préhilbertien).

Attention! On n'a à aucun moment imposé que la dimension soit finie. 

Attention! La notation $ <xvert y>$ peut être remplacée par $ (xvert y)$$ <x,y>$$ (x,y)$, ou même $ x.y$

Remarquons que le fait que pour une forme sesquilinéaire hermitienne $ phi$ on ait $ forall x  phi(x,x) in mathbb{R}$ découle du fait que $ phi$ est hermitienne; il suffit de vérifier que$ phi(x,x)>0$.

Attention! Une forme linéaire n'est pas nécéssairement une forme semi-linéaire

Attention! Une forme semi-linéaire n'est pas nécéssairement une forme linéaire

Une forme sesquilinéaire est donc semi-linéaire par rapport à la première variable et linéaire par rapport à la seconde. 

Exemples: Sur $ mathbb{C}^n$ le produit scalaire hermitien canonique est défini par $ <xvert y>=sum_{i=1..n} overline {x_i}.y_i$

Les inégalités de Schwartz et de Minkowski montrées dans la partie[*] sont valables ici aussi; mais la démonstration, basée sur la bilinéarité et utilisant les formes quadratiques, n'est plus valable. 

Lemme [Egalité utile]

 

$displaystyle {parallel}x+y {parallel}^2={parallel}x {parallel}^2+{parallel}y{parallel}^2+2.Re(<xvert y>)$

 

avec $ Re(u)$ la partie réelle de $ u$.

Démonstration: Evidente, en utilisant $ <xvert y>=overline {<yvert x>}$.$ sqcap$$ sqcup$ 

Théorème [Inégalité de Cauchy-Schwartz] Dans un espace préhilbertien complexe

 

$displaystyle forall (x,y) in E^2 vert<xvert y>vert leq {parallel}x {parallel}. {parallel}y {parallel}$

 

Il y a égalité si et seulement si la famille est liée

Démonstration: Soit $ theta$ l'argument de $ <xvert y>$, alors pour tout $ t$ réel, au vu du lemme [*]:

 

$displaystyle {parallel}t.e^{itheta}.x+y {parallel}^2 =t^2.{parallel}x {parallel}^2 + {parallel}y {parallel}^2 + 2.t.vert<yvert x>vert$

 

On en déduit donc que le discriminant de $ tmapsto t^2.{parallel}x {parallel}^2 + {parallel}y {parallel}^2 + 2.t.vert<yvert x>vert$ est négatif ou nul, ce qui donne l'inégalité annoncée. Le cas d'égalité est le cas où le discriminant est nul.$ sqcap$$ sqcup$ 

Corollaire [Inégalité de Minkowski] Dans un espace préhilbertien complexe

 

$displaystyle forall (x,y) in E^2 {parallel}x+y {parallel}leq {parallel}x {parallel}+ {parallel}y {parallel}$

 

Il y a égalité si $ y={lambda}.x$ ou $ x={lambda}.y$ avec $ {lambda}>0$

Démonstration: Par le lemme [*], on a

 

$displaystyle {parallel}x+y {parallel}^2={parallel}x {parallel}^2+{parallel}y{parallel}^2+2.Re(<xvert y>)$

 

 

$displaystyle leq {parallel}x {parallel}^2 + {parallel}y {parallel}^2 + 2.vert<xvert y>vert$

 

(par Cauchy-Schwartz ci-dessus)

 

$displaystyle =({parallel}x {parallel}+ {parallel}y {parallel})^2$

 

D'où le résultat. Le cas d'égalité se montre facilement... $ sqcap$$ sqcup$ 

Proposition Dans le cas euclidien, retrouver le produit scalaire à partir de la norme était facile; dans le cas hermitien c'est un peu plus compliqué:

 

$displaystyle <xvert y>=frac14 ({parallel}x+y {parallel}^2 - {parallel}x -... ...allel}^2 -i {parallel}x + i.y {parallel}^2 + i.{parallel}x-i.y{parallel}^2)$

 

 

$displaystyle =frac14(sum_{n=0}^3 e^{-2.i.pi.n/4}{parallel}x+e^{2.i.pi.n/4}.y {parallel})$

 


Attention! La dernière ligne est un bon moyen mnémotechnique, mais il faut bien penser que l'on a un signe moins dans le coefficient de l'exponentiel en dehors de $ {parallel}.{parallel}$ et un signe plus à l'intérieur. 

 


next up previous index 
suivant: Espaces préhilbertiens monter: Espaces préhilbertiens et espaces précédent: Espaces préhilbertiens réels   Index
C_Antonini,J_F_Quint,P_Borgnat,J_Bérard,E_Lebeau,E_Souche,A_Chateau,O_Teytaud

Source : http://www.les-mathematiques.net/b/c/i/node3.php3

22:29 Publié dans Espaces préhilbertiens complexes | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Inégalité de Cauchy-Schwarz

Inégalité de Cauchy-Schwarz

Page d'aide sur l'homonymie Pour les articles homonymes, voir Cauchy et Schwarz.

En mathématiques, l'inégalité de Cauchy-Schwarz, aussi appelée inégalité de Schwarz1, ou encore inégalité de Cauchy-Bunyakovski-Schwarz2, se rencontre dans de nombreux domaines tels que l'algèbre linéaire, l'analyse avec les séries et en intégration.

Cette inégalité s'applique dans le cas d'un espace vectoriel sur le corps des nombres réels ou complexes muni d'un produit scalaire. Dans le cas complexe, le produit scalaire désigne une forme hermitienne définie positive. Son contexte général est donc celui d'un espace préhilbertien.

Cette inégalité possède de nombreuses applications, comme le fait d'établir l'inégalité triangulaire montrant que la racine carrée de la forme quadratique associée au produit scalaire est une norme, ou encore que le produit scalaire est continu. Elle fournit des justifications ou des éclairages dans des théories où le contexte préhilbertien n'est pas central.

Elle doit son nom à Hermann Amandus Schwarz3 et à Augustin Louis Cauchy4.

Sommaire

 [masquer]

Énoncé [modifier]

Le théorème s'énonce couramment de la façon suivante :

Théorème 1 — Soit (E,langle cdot,cdotrangle) un espace préhilbertien réel ou complexe. Alors, pour tous vecteurs x et y de E,

 |langle x,yrangle|leqslant |x| |y|.

De plus, les deux membres sont égaux si et seulement si x et y sont linéairement dépendants.

Démonstrations [modifier]

Les démonstrations présentées ici sont valables aussi bien dans le cadre d'un espace préhilbertien complexe que réel, sauf bien sûr la dernière.

Lorsque y=0, l'énoncé est clairement vrai, par conséquent on supposera y non nul.

En outre, pour la première démonstration, qui est la plus connue, on suppose que le nombre langle x,yrangle est réel. On obtient la généralisation du cas étudié par multiplication du vecteur x(ou y) par un nombre complexe convenable de module égal à 1. Ceci étant langle x,yrangle devient réel sans changer de module; |,x,| et |,y,| ne varient pas non plus5.

Inégalité [modifier]

Posons, pour tout réel t,

P(t)=|,x+ty,|^2=|,x,|^2+2tlangle x,yrangle+ t^2|,y,|^2.

Par construction, cette expression polynomiale du second degré est positive ou nulle pour tout réel t. On en déduit que son discriminant est négatif ou nul :

 4 langle x,yrangle^2 - 4 |,x,|^2|,y,|^2le 0,

d'où l'inégalité annoncée.

Une variante plus directe est de poser

t_0=-langle x,yrangle/|,y,|^2

et d'utiliser que

0le P(t_0)=|,x,|^2-langle x,yrangle^2/|,y,|^2.

(Ce t0 n'est autre que la valeur en laquelle P atteint son minimum, mais cette propriété n'est pas utilisée.)

Cas d'égalité [modifier]

Si (x,y) est lié alors xy pour un certain scalaire λ et l'on en déduit immédiatement :

|langle x,yrangle|=|lambda| |,y,|^2=|,x,| |,y,|.

Réciproquement, si |<x,y>|=||x|| ||y|| alors le discriminant ci-dessus est nul donc P admet une racine réelle (double) t, et pour ce t on a

|,x+ty,|^2=P(t)=0,

donc x=-ty, si bien que (x,y) est lié.

Ou plus directement (avec le t0 de la variante ci-dessus) : l'hypothèse équivaut à P(t0)=0 donc à x=-t0y.

Variante géométrique [modifier]

Une variante6 utilise l'identité du théorème de Pythagore.

Un calcul direct permet de voir que les vecteurs langle x,y rangle y/|y|^2 et x-langle x,yrangle y/|y|^2 sont orthogonaux. Alors, par le théorème de Pythagore on a :

|x|^2 = left|langle x,yrangle y/|y|^2right|^2 + left|x-langle x,yrangle y/|y|^2right|^2,

et donc

|x|^2 geq |langle x,yrangle |^2/|y|^2

qui donne l'inégalité souhaitée.

Cette démonstration consiste en fait6 à calculer la norme du projeté orthogonal du vecteur x sur la droite vectorielle engendrée par y. L'égalité correspond donc au cas où x et y sont linéairement dépendants.

Le cas particulier Rn [modifier]

Dans l'espace euclidien mathbb{R}^n muni du produit scalaire usuel langle x,yrangle=sum_{i=1}^nx_iy_i, où x=(x_1,dots,x_n)inmathbb{R}^n et y=(y_1,dots,y_n)inmathbb{R}^n, une alternative aux démonstrations générales ci-dessus est de déduire l'inégalité (et le cas d'égalité) d'une identité très similaire à celle de la variante géométrique, l'identité de Lagrange, qui s'écrit :

langle x,yrangle^2+sum_{1le i<jle n}(x_iy_j-x_jy_i)^2= |x|^2 |y|^2.

(Pour n=3, une preuve et une interprétation géométrique figurent dans identité de Lagrange dans R3).

Cette identité se démontre de la façon suivante.

begin{align} 2sum_{1le i<jle n}(x_iy_j-x_jy_i)^2&=sum_{1le i<jle n}(x_iy_j-x_jy_i)^2+sum_{1le j<ile n}(x_jy_i-x_iy_j)^2\ &=sum_{1le i,jle n}(x_iy_j-x_jy_i)^2\ &= (sum x_i^2)( sum y_j^2) + (sum x_j^2)( sum y_i^2 )  - 2 (sum x_i y_i)(sum x_j y_j)\ &=2|x|^2 |y|^2-2langle x,yrangle^2~.end{align}

Conséquences et applications [modifier]

Conséquences [modifier]

L'inégalité de Cauchy-Schwarz a des applications importantes. Elle permet notamment de montrer que l'application xmapstosqrt{langle x,xrangle} est une norme car elle vérifie l'inégalité triangulaire. Une conséquence est que le produit scalaire est une fonction continue pour la topologie induite par cette norme.

Elle permet également de définir l'angle non orienté entre deux vecteurs non nuls d'un espace préhilbertien réel, par la formule :

coswidehat{(x,y)}=frac{langle x,yrangle}{|x| |y|}.

Dans le cas de l'espace euclidien quad mathbb R ^n muni du produit scalaire canonique, l'inégalité de Cauchy-Schwarz s'écrit :

left|sum_{i=1}^n x_{i}y_{i}right|leqslantleft (sum_{i=1}^n x_{i}^{2}right)^{1/2}.left (sum_{i=1}^n y_{i}^{2}right)^{1/2}

Dans le cas des fonctions à valeurs complexes de carré intégrable7, elle s'écrit

left|int f. overline g, right| leqslant left( int  |f|^2,right)^{1/2}. left( int |g|^2, right)^{1/2}.

Cette inégalité est un cas particulier des inégalités de Hölder.

Autres applications [modifier]

  • L'inégalité de Cauchy-Schwarz est aussi un outil fondamental de l'analyse dans les espaces de Hilbert. Grâce à elle, on peut construire une injection du préhilbert E dans son dual topologique : pour tout vecteur y, la forme linéaire qui à x associe <x,y> est continue, de norme égale à celle de y. Ceci permet d'énoncer le théorème de représentation de Rieszselon lequel si E est un espace de Hilbert alors cette injection est un isomorphisme.
    On la retrouve aussi dans le théorème de Lax-Milgram.
  • Cependant ses applications peuvent sortir du cadre strict de l'analyse dans les espaces de Hilbert. En effet elle se retrouve parmi les ingrédients utiles à l'inégalité de Paley-Zygmunden théorie des probabilités et du traitement du signal.
    En théorie des probabilités toujours, dans l'espace des variables aléatoires admettant un moment d'ordre 2, l'inégalité de Cauchy-Schwarz fournit l'inégalité mathbb{E}(X Y) le sqrt {mathbb{E}(X^2) mathbb{E}(Y^2)}, qui compare l'espérance du produit de deux variables aléatoires au produit des espérances de leurs carrés8. Elle permet d'établir que le coefficient de corrélation de deux variables aléatoires est un réel compris entre -1 et 19.

Généralisation [modifier]

L'inégalité seule est vraie dans le contexte un peu plus général d'un semi-produit scalaire (i.e. sans supposer que la forme quadratique associée est définie), en notant encore || || la semi-norme associée :

Théorème 210 — Soit (E,langle cdot,cdotrangle) un espace vectoriel réel (resp. complexe) muni d'une forme bilinéaire symétrique positive (resp. d'une forme hermitienne positive). Alors, pour tous vecteurs x et y de E,

 |langle x,yrangle|leqslant |x| |y|.

Pour démontrer ce théorème 2, il suffit10 d'ajouter à la preuve algébrique de l'inégalité du théorème 1 un petit argument dans le cas où ||y||=0.

Cette inégalité fournit le corollaire suivant.

Corollaire10 — Pour qu'une forme bilinéaire symétrique positive (resp. une forme hermitienne positive) soit définie, (il faut et) il suffit qu'elle soit non dégénérée.

Le corollaire se démontre de la façon suivante.

Pour prouver le sens non immédiat de l'équivalence, supposons que la forme langle,rangle est positive et non dégénérée, et montrons qu'elle est définie. Soit x un vecteur dont la semi-norme est nulle. Le théorème 2 montre que pour tout vecteur y on a langle x,yrangle=0, donc, par non dégénérescence, x = 0.

Références [modifier]

Notes et références [modifier]

  1.  On trouve par exemple cette expression chez S. Lang Analyse Réelle InterEditions, Paris 1977 (ISBN 2729600595) p 148
  2.  Par exemple O. A. Ladyzhenskaya The boundary value problems of mathematical physics Springer-Verlag 1985 (ISBN 3-540-90989-3) p 2
  3.  Hermann Amandus Schwarz Ueber ein Flachen kleinsten Flacheninhalts betreffendes Problem der Variationsrechnung Acta Societatis scientiarum Fennicae Vol XV p 318 1888 Lire [archive]
  4.  Augustin Louis Cauchy Oeuvres 2 III p 373 1821
  5.  A Kirillov, A. Gvichiani, Théorèmes et problèmes d'analyse fonctionnelle, éd. Mir, 1982, p.88.
  6. ↑ a et b Michel Reed, Barry Simon, Functional Analysis
  7.  f et g sont vues comme éléments de l'espace de Lebesgue L2 ou mathcal{L}^2, selon qu'on applique le théorème 1 énoncé en début d'article ou le théorème 2 du paragraphe Généralisation.
  8.  Francine et Marc Diener, Chapitre 5 Expression et mesure de l'interdépendance p.27 Lire en ligne [archive]
  9.  Laurent Albera, Résumé de cours en calcul des probabilités (JJ bellanger), Université de Rennes I, III Espérance mathématique, pp.6&7 Lire en ligne [archive]
  10. ↑ ab et c Roger GodementCours d'algèbre, Hermann (1966) p. 476-477 (Selon cet auteur, l'inégalité de Cauchy-Schwarz n'est pas le théorème 1 (qu'il ne mentionne même pas) mais le théorème 2.)

Liens externes [modifier]

 

Bibliographie [modifier]

 

22:28 Publié dans Inégalité de Cauchy-Schwarz | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Lemme de Schwarz

Lemme de Schwarz

Cet article est une ébauche concernant les mathématiques.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le lemme de Schwarz est un lemme d'analyse complexe.

Lemme — Soit f une fonction holomorphe dans le disque ouvert D de centre 0 et de rayon 1, et telle que :

  • f(0) = 0~
  • forall z in D, ~ |f(z)| leqslant 1

Alors on a :

 qquad |f(z)| leqslant |z|  pour tout z appartenant à D et qquad |f'(0)| leqslant 1 .

Si, de plus, il existe un élément non nul z0 de D vérifiant f(z0) | = | z0 | , ou bien si f'(0) | = 1, alors il existe un nombre complexe a de module 1 tel que f(z) = az pour tout z appartenant à D.

Le lemme de Schwarz est utilisé notamment pour déterminer les automorphismes du disque D dans lui-même.

22:27 Publié dans Lemme de Schwarz | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Théorème de Schwarz

Théorème de Schwarz

Cet article est une ébauche concernant l'analyse.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Le théorème de Schwarz, également appelé théorème de Clairaut, peut s'énoncer ainsi :

Théorème de Schwarz — Soit f, une fonction numérique de n variables, définie sur un ensemble ouvert U de ℝn. Si les dérivées partielles existent à l'ordre p et sontcontinues en un point x de U, alors le résultat d'une dérivation à l'ordre p ne dépend pas de l'ordre dans lequel se fait la dérivation par rapport aux p variables considérées.

Dans le cas particulier des fonctions de deux variables x et y, on obtient :

frac{partial}{partial x}left( frac{partial f}{partial y} right) = frac{partial}{partial y}left( frac{partial f}{partial x} right)

Un contre-exemple [modifier]

Le résultat ci-dessus peut tomber en défaut lorsque les hypothèses ne sont pas vérifiées.

Considérons la fonction :

f(x,y)= begin{cases} frac{x y^3}{x^2 + y^2} & text{si }  (x,y) neq (0,0) \ 0 & text{sinon} end{cases}

Les dérivées sont :

frac{partial f}{partial x}(x,y) = begin{cases} y^3 frac{y^2- x^2}{( x^2 + y^2 )^2} & text{si }  y neq 0 \ 0 & text{sinon} end{cases}

et

 frac{partial f}{partial y}(x,y) = begin{cases} x y^2 frac{3 x^2 + y^2}{( x^2 + y^2 )^2} & text{si }  (x,y) neq (0,0) \ 0 & text{sinon} end{cases}

Les dérivées partielles croisées d'ordre 2 en (0,0) sont

frac{partial^2 f}{partial x partial y} (0,0) = 0text{ et }frac{partial^2 f}{partial y partial x} (0,0) = 1

Application du théorème de Schwarz aux formes différentielles exactes [modifier]

Considérons la forme différentielle exacte suivante, où f est une fonction de classe C2 :

mathrm df = a(x,y),mathrm dx + b(x,y),mathrm dy

Nous savons alors que :

a(x,y) = frac{partial f}{partial x}  et b(x,y) = frac{partial f}{partial y}

En appliquant le théorème de Schwarz nous en déduisons immédiatement la relation :

frac{partial a(x,y)}{partial y} = frac{partial b(x,y)}{partial x}

(par dérivation et inversion de l'ordre de dérivation...)

22:26 Publié dans Théorème de Schwarz | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Hermann Amandus Schwarz

Hermann Amandus Schwarz

Cet article est une ébauche concernant un mathématicien.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Page d'aide sur l'homonymie Pour les articles homonymes, voir Schwarz.
Page d'aide sur l'homonymie En particulier, ne pas confondre avec le mathématicien Laurent Schwartz.
Karl Hermann Amandus Schwarz.jpg

Hermann Amandus Schwarz, né le 25 janvier 1843 à Hermsdorf, en Silésie (aujourd'hui la ville de Jerzmanowa, en Pologne) et mort le 30 novembre 1921 à Berlin est un mathématicien allemand. Ses travaux sont marqués par une forte interaction entre l'analyse et la géométrie.

Il a travaillé à HalleGöttingen puis à Berlin, sur des sujets allant de la théorie des fonctions à la géométrie différentielle en passant par lecalcul des variations.

Voir aussi [modifier]

22:25 Publié dans Hermann Amandus Schwarz | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Théorème isopérimétrique

Théorème isopérimétrique

En géométrie, un théorème isopérimétrique traite d'une question concernant les compacts d'un espace métrique muni d'une mesure. Un exemple simple est donné par les compacts d'un plan euclidien. Les compacts concernés sont ceux de mesures finies ayant une frontière aussi de mesure finie. Dans l'exemple choisi, les compacts concernés sont ceux dont la frontière est une courbe rectifiable, c'est-à-dire essentiellement non fractale. Les mesures du compact et de sa frontière sont naturellement différentes, dans l'exemple choisi, la mesure du compact est celle d'une surface, celle de la frontière, une longueur.

Un théorème isopérimétrique caractérise les compacts ayant la mesure la plus grande possible pour une mesure de leur frontière fixée. Dans le plan euclidien en utilisant la mesure de Lebesgue, un théorème isopérimétrique indique qu'un tel compact est un disque. En dimension 3, toujours avec une géométrie euclidienne, une autre version du théorème indique que c'est une sphère. D'une manière plus générale, dans un espace euclidien de dimension n, muni de la mesure de Lebesgue, l'optimum est obtenu par une sphère, ce qui donne l'inégalité isopérimétrique suivante, si K est un compact et B la boule unité :

frac{(text{Vol},partial K)^n}{(text{Vol}, K)^{n-1}}  ge frac{(  text{Vol},partial B) ^n } { (text{Vol}, B) ^{n-1} }

Un autre exemple de résultat est obtenu si le choix de la mesure est celui du nombre de points d'un réseau inclus dans le solide K, et si les compacts choisis sont des polytopesconvexes à sommets entiers. En dimension 2 si le réseau est Z2, on trouve le théorème de Pick, indiquant que la mesure du polytope P (c'est-à-dire le nombre de points de Z2 qu'il contient) est égale à sa surface plus la moitié des points que contient sa surface plus un.

Un théorème isopérimétrique est souvent difficile à établir. Même un cas simple, comme celui du plan euclidien muni de la mesure de Lebesgue, est relativement technique à démontrer. Une des méthodes partielles de preuve, connue depuis la démonstration de Hurwitz en 1901 est d'utiliser un résultat d'analyse, issu de la théorie des séries de Fourier, connu sous le nom d'inégalité de Wirtinger. Le résultat reste partiel car il ne traite que des surfaces dont la frontière est une courbe de classe C1.

Les théorèmes isopérimétriques sont actuellement l'objet d'une intense recherche en mathématiques, en particulier en analyse fonctionnelle et en théorie des probabilité, suite à leurs liens étroits avec les phénomènes de concentration de la mesure.

Une approche plus élémentaire est proposée dans l'article Isopérimétrie.

Sommaire

 [masquer]

Fragments d'histoire [modifier]

Prémisses [modifier]

La connaissance de théorème isopérimétrique est ancienne, près de 3 000 ans1. Le résultat essentiel de l'époque est l'œuvre de Zénodore iie siècle av. J.-C. qui démontre un résultat que l'on exprimerait maintenant de la manière suivante : S'il existe un polygone à n côtés de surface maximale à périmètre donné, alors il est régulier2. Cette partie de l'histoire est traitée dans l'article Isopérimétrie. Les études des théorème isopérimétriques datant de l'antiquité se fonde exclusivement sur la géométrie du triangle. Ces méthodes, assez élémentaires, ne permettent pas d'aller beaucoup plus loin. Par exemple, démontrer l'existence d'une solution est hors de portée. Il faut attendre près de 2 000 ans pour que l'étude de cette question soit enrichie à l'aide d'apports théoriques de nature différente.

Jacques Bernoulli (1654-1705) étudie la question pour répondre à des questions de mécanique statique et plus précisément s'intéresse à la forme que doit posséder une poutre pour offrir le maximum de résistance possible, la résolution d'une telle question débouche sur un théorème isopérimétrique, le demi-cercle est parfois la forme offrant la meilleure résistance. Si Bernoulli ne parvient pas à finaliser un résultat, il utilise de nouveaux outils issus du calcul différentiel. Le mariage de la géométrie et de l'analyse est promis à un grand avenir, même si un théorème isopérimétrique n'est pas encore accessible.

Le xixe siècle est celui des progrès majeurs. La première avancée est le fruit du travail de Jakob Steiner (1796-1863). Il montre que, si une solution existe, elle est nécessairement unique et c'est le disque. Pour cela, il développe un outil, maintenant appelé symétrisation de Steiner3 et encore utilisé pour établir des théorèmes d'isopérimétrie. Son idée majeure consiste à remarquer que, si l'on coupe une solution à l'aide d'une droite en deux parties de surfaces égales, il est possible de construire une nouvelle surface optimale à l'aide de la duplication d'une des deux parties. Sa démonstration est présentée dans l'article Isopérimétrie.

Calcul variationnel [modifier]

Pour l'obtention d'une preuve complète, au moins en dimension 2, une difficulté majeure n'est toujours pas franchie, celle de la preuve de l'existence d'une solution. Les premiers éléments de réponse proviennent de la démarche initiée par Bernoulli. Une hypothèse supplémentaire, un peu étrange, est supposée : la frontière de la surface est lisse. L'étrangeté provient du fait qu'une ondulation sur la surface a tendance à plus augmenter le périmètre que l'aire. Plus la courbe frontière est irrégulière, plus elle est loin de l'optimale, mais plus la démonstration devient difficile4Karl Weierstrass (1815-1897) formalise le calcul des variations et établit les bases de l'analyse fonctionnelle. Cette approche consiste à étudier non pas une courbe spécifique, mais un ensemble de courbes qui varient, par exemple à l'aide d'un paramètre. En faisant varier ces courbes, on montre que le cercle est l'optimum recherché5. Au moins pour la dimension 2, une fois l'existence d'un optimum établi pour les surfaces à la frontière régulière, il n'est plus trop difficile de montrer le théorème général, on sait en effet approximer une courbe fermée continue par une autre continûment dérivable.

La généralisation aux dimensions supérieures est naturelle. Dans un premier temps, on suppose l'existence d'une solution au théorème et on montre que cette solution est nécessairement une sphère de dimension n. Le raisonnement est très physique, c'est celui qui détermine la forme d'une bulle de savon. L'équilibre de la bulle est le fruit de deux forces qui s'annulent : la pression due à l'aire enfermée dans la bulle et la tension superficielle de la surface. Un rapide calcul de variation montre que la courbure moyenne de la sphère est nécessairement constante. En 1900, on sait que le seul compact strictement convexe de courbure moyenne constante est une sphère6. Une fois encore, la démonstration de l'existence d'une solution s'avère la partie délicate. Une première démonstration en dimension 3 est l'œuvre H. A. Schwarz en 18907.8

Géométrie des convexes [modifier]

Si la démarche fondée sur le calcul variationnel débouche, la généralisation à des dimensions supérieures n'est pas aisée. Une autre approche, issue de la théorie algébrique des nombres est finalement plus prometteuse. Hermann Minkowski (1864-1909) développe une approche géométrique qui l'amène à étudier le nombre de points à coordonnées entières que contiennent certains convexes, problème proche de l'isopérimétrie. La fonction qui associe à un convexe compact de Rn, le cardinal de son intersection avec le réseau Zn est une mesure. Le théorème de Minkowski, qui procède de cette logique, permet d'élucider de manière élégante la structure du groupe des classes d'idéaux. Une nouvelle structure géométrique est étudiée ; au lieu de considérer une géométrie euclidienne de dimension n, Minkowski étudie un ensemble dont les points sont des compacts convexes. Cet ensemble est muni d'uneaddition.

Felix Hausdorff (1868-1942) trouve une distance naturelle pour un espace un peu plus vaste, celui des compacts. La topologie associée à cette distance est bien adaptée. Les fonctions volumes et surfaces, qui associent à un convexe compact sa mesure et la mesure de sa frontières sont continues. Il en est de même pour la somme de Minkwoski. Enfin, l'espace est complet ainsi que le sous-ensemble des convexes. Enfin les polytopes forment un ensemble dense.

En dimension 2, l'étude de la somme de Minkwoski et de la sphère de rayon t et de centre le vecteur nul avec un convexe compact donne l'expression polynomiale a + pt + πt2, où adésigne l'aire du convexe et p son périmètre. Démontrer le théorème isopérimétrique en dimension 2 revient à montrer que p2 est plus grand que 4πa, ce qui revient à dire que l'expression polynomiale précédente admet des racines réelles, ce que fait Minkowski9. T. Bonnesen va plus loin, en 1921 il démontre que si r est le rayon d'un cercle inscrit et R le rayon d'un cercle circonscrit, on dispose de la majoration suivante10 :

 p^2 - 4pi a ge pi^2(R^2 -r^2) ;

Autrement dit, l'égalité ne peut avoir lieu que si le convexe est un disque. Cette démarche peut être généralisée aux dimensions supérieures. A. Aleksandrov et W. Fenchel utilisent cette démarche pour établir le théorème isopérimétrique général, pour les géométries euclidiennes et la mesure de Lebesgue11 en 1937.12

Plan euclidien [modifier]

Dans tout le paragraphe, S désigne une surface fermée convexe d'un plan euclidien dont l'aire, noté a, est finie et strictement positive ; le périmètre l'est aussi et est noté p.

Dans le plan euclidien, le théorème isopérimétrique prend la forme suivante :

  • La surface S possède une aire supérieure à celle d'un disque de périmètre p. L'égalité entre les aires n'a lieu que si S est un disque.

Ce théorème est souvent exprimé sous une forme équivalente, dite inégalité isopérimétrique :

p^2 - 4pi a ge 0;

Aucune hypothèse n'est nécessaire sur la nature de la surface. Cependant, si elle n'est pas suffisamment régulière, le périmètre n'est pas fini, l'inégalité ne possède alors aucun intérêt.

Démonstrations géométriques élémentaires [modifier]

En dimension 2, on dispose d'une propriété qui simplifie grandement les choses :

  • Si une surface n'est pas convexe mais est d'aire et de périmètre fini, il existe une surface S de périmètre strictement plus petit et d'aire strictement plus grand.

Intuitivement, ce théorème est relativement évident. L'enveloppe convexe de S possède une aire strictement plus grande et un périmètre strictement plus petit que S, si l'ensemble n'est pas convexe. Pour cette raison, il est pertinent de ne s'intéresser qu'aux surfaces convexes. Comme l'aire et le périmètre, s'ils existent, d'un convexe est le même que celui de son adhérence, se limiter aux convexes fermés ne réduit en rien la généralité des solutions trouvées. Enfin, comme toute surface de périmètre fini est bornée, si elle est fermée, elle est nécessairement compacte (cf. l'article Topologie d'un espace vectoriel de dimension finie).

L'article Isopérimétrie établit encore deux résultats à l'aide de la géométrie du triangle :

  • Si un polygone à n sommets possède une aire maximale pour un périmètre donné, ce polygone est régulier.
  • Si une surface possède une aire maximale pour un périmètre donné, alors cette surface est celle d'un disque.

La partie plus difficile à établir est l'existence de telles surfaces.

Calcul des variations [modifier]

Une première manière de simplifier la question est du supposer que la frontière est suffisamment régulière. En 1904Hurwitz propose une démonstration particulièrement élégante13, qui se fonde sur l'inégalité de Wirtinger :

  • Soit une courbe fermée définie par une fonction f(t)=(x(t),y(t)) périodique, continûment dérivable définissant une surface S. La majoration suivante est vérifiée, l'égalité n'ayant lieu que si la courbe définit un cercle.
p^2geq 4pi a;

Le prix à payer contre l'élégance et la simplicité est le caractère partiel de la solution. L'existence d'une solution optimale est bien démontrée, mais uniquement si la frontière est lisse. Or la frontière peut être quelconque. Évidemment, si elle n'est pas finie, la formule est vraie mais possède peu d'intérêt.14

Polygone et Steiner [modifier]

La fonction associe à un triangle de périmètre égal à 3, son aire.

Les démonstrations historiques ont toutes un chainon manquant. Elles montrent qu'une surface, polygonale ou quelconque, qui ne possède pas la bonne propriété : être régulier ou être un disque, n'est pas un optimum. En revanche, elle ne montre pas qu'un tel optimum existe. Une fois l'existence d'un tel optimum démontrée, on sait alors qu'il est unique et l'on connait sa géométrie. Mais la démonstration de cette existence est l'élément qui bloque les démonstrations pendant de si nombreux siècles. Elle demande une compréhension d'un aspect alors mal maitrisé de la géométrie : la topologie.

Les preuves actuelles procèdent d'une démarche encore inconnue à l'époque de Steiner. La géométrie étudiée n'est plus le plan euclidien, support de la surface étudiée, mais un univers où chaque point est une surface. Elle est illustrée sur la figure de gauche dans le cas particulier des triangles. La fonction considérée est celle qui, à un triangle de périmètre 3, associe son aire. Le triangle est représenté par deux paramètres,c la longueur d'une arête et φ l'angle entre deux arêtes dont celle de longueur c. Si l'angle est de mesure nulle ou égale à π, l'aire est nulle, il en est de même si c est égal à 0 ou à 3/2. La représentation graphique montre que le maximum est bien atteint. Dans ce cas particulier, le sommet est le triangle décrit par le couple (1, π/3).

Dans le cas des polygones à n sommets, où n est un entier supérieur à 2, la configuration est relativement simple. On identifie un polygone à un vecteur de R2n. L'ensemble des polygones devient une partie d'un espace vectoriel euclidien, cette fois-ci, de dimension 2n. La topologie d'un espace euclidien dispose d'une propriété adéquate. Un théorème assure que les ensembles fermés et bornés sont des compacts. La fonction, qui à un polygone associe son aire est continue. Un des charmes des compacts est que toute fonction continue, définie sur un compact et à valeur dans R atteint ses bornes. La configuration est analogue à celle de la figure de gauche. Ce qui permet d'établir le chainon manquant :

  • Il existe un polygone à n côtés et de périmètre p qui possède une aire maximale.

Pour le cas général, une démarche analogue à la précédente ne permet pas de conclure. En se limitant aux convexes compacts, la zone qui nous intéresse est bien un fermé borné, mais la dimension de l'espace est ici infinie. Or si la dimension n'est pas finie, le théorème de Riesz montre qu'un fermé borné comme la boule unité n'est jamais compact. De plus, la fonction périmètre n'est plus continue, on peut approcher de plus en plus précisément un disque de rayon 1 par des carrés de plus en plus petits, l'approximation garde un périmètre égal à 8 sans s'approcher de la valeur 2π, même si elle devient excellente.

En revanche, il est possible d'approcher précisément la frontière d'un convexe compact par un polygone de périmètre plus petit et de surface presque égale à celle du convexe. Cette propriété, et le fait d'avoir établi le théorème isopérimétrique pour les polygones, permet aisément de montrer qu'aucune surface de périmètre p ne peut posséder une aire supérieure à celle d'un disque de même périmètre. Le disque est ainsi un des optimums recherchés, et les travaux de Steiner montrent que cet optimum est unique.

  • Toute surface S possède une aire plus petite que celle du disque de même périmètre. L'égalité n'a lieu que si la surface S est elle aussi un disque.

Somme de Minkowski [modifier]

Article détaillé : Somme de Minkowski.
Somme de Minkowski d'unhexagone de rayon 1 et de la boule unité

On pourrait croire que les deux démonstrations précédentes closent le débat du problème isopérimétrique du plan euclidien E. Il n'en est rien. La démarche d'Hurwitz n'apporte aucune information si la frontière n'est pas suffisamment lisse. Celle présentée au dernier paragraphe se généralise mal aux dimensions supérieures. A partir de la dimension 3, il ne faut plus espérer trouver des polyèdres convexes réguliers, encore appelés solides de Platon approchant avec la précision voulue la sphère. Il n'existe que 5 solides de ce type.

Hausdorff et Minkowski développent une autre approche, fondée sur une géométrie un peu différente. Ici, le terme de géométrie désigne l'étude d'un ensemble muni d'une distance et d'une opération algébrique compatible. L'espace considéré est celui des compacts non vides, la distance celle deHausdorff et l'opération est la somme de Minkowski, dont la compatibilité avec la distance se traduit par la continuité de l'opération. La somme de Minkowski P + Q correspond à l'ensemble des sommes dont le premier membre est élément de P et le second de Q :

P + Q = {x in Equad x = p + q quadtext{avec}quad p in P ;text{et}; q in Q}

Si S désigne un convexe compact non vide et t.B la boule fermée de centre le vecteur nul et de rayon t, l'aire de la somme S + t.B prend la forme suivante, connue sous le nom de formule de Steiner-Minkowski :15

A(S + tmathcal B) = a + pcdot t + pi cdot t^2 ;

Ici, a désigne l'aire de S et p son périmètre. Cette somme est illustrée sur la figure de gauche dans le cas d'un hexagone. La somme correspond à l'ensemble des points du plan à une distance inférieure ou égale à t de S. Appliquer à l'hexagone jaune de la figure de gauche, on peut décomposer cette somme en trois régions. La première correspond à la figure initiale Sen jaune, la deuxième aux points situés sur un rectangle de côté une arête du polygone et de largeur t, correspondant aux 6 rectangles bleus. L'aire des surfaces bleues est égale à p.t. Enfin, à chaque sommet est associée une portion de disque de rayon t, en vert sur la figure. L'union de ces portions de disque forme un disque complet, d'où le dernier terme de la formule. La démonstration dans le cas non polygonal est donnée dans l'article détaillé.

La surface s'exprime comme un polynôme de degré 2, son discriminant est égal à p2 - 4π.a. On reconnait là le terme de l'inégalité isopérimétrique. Démontrer le théorème revient à dire que le discriminant n'est jamais négatif, ou encore que le polynôme admet au moins une racine. Ce résultat s'obtient directement comme une conséquence de l'inégalité de Brunn-Minkowski.

Inégalité de Bonnesen [modifier]

L'opposé rayon du cercle inscrit ainsi que celui du cercle circonscrit se trouvent entre les racines du polynôme.

A y regarder de près, le paragraphe précédent propose bien une méthode généralisable pour montrer l'inégalité isopérimétrique, mais elle n'indique pas comment traiter le cas de l'égalité. Plus précisément, la démonstration n'indique pas que seul le cercle est la solution, partie difficile de la démonstration qui a bloqué tant de monde depuis l'Antiquité.

Il existe bien une preuve, donnée dans l'article isopérimétrie et fondée sur une symétrisation de Steiner. Elle est mal commode à généraliser en dimension quelconque. Bonnesen trouve une expression simple, en fonction d'un cercle inscrit et d'un circonscrit. Le cercle est dit inscrit dans un compact S s'il est inclus dans S et si son rayon r est maximal. Un cercle est dit circonscrit dans S s'il contient S et si son rayon R est minimal. L'inégalité de Bonnesen s'exprime de la manière suivante, si a est l'aire du compact et p son périmètre16 :

p^2 - 4pi a ge pi^2(R - r)^2;

Ce résultat signifie que le discriminant du polynôme du second degré, qui à t associe l'aire de la surface S + t.B admet deux racines distinctes si un cercle inscrit possède un rayon strictement plus petit qu'un cercle circonscrit. Autrement dit, pour le l'égalité isopérimétrique ait lieu, il est nécessaire que les deux rayons soient égaux, ce qui ne peut arriver que pour le cercle. Un autre résultat, un peu plus fort indique que les deux valeurs -R et -r se situent entre les deux racines, comme illustré sur la figure de droite. De la même manière, on en déduit la nécessité de l'égalité entre R et r pour atteindre l'optimal.

Dimension supérieure [modifier]

Enoncé [modifier]

Une bulle de savon est une réponse naturelle au théorème isopérimétrique en dimension 3. La tension superficielle de la bulle possède une énergie potentielle minimale si sa surface l'est. L'équilibre statique est obtenu quand la surface est minimale pour enserrer la quantité d'air enfermée dans la membrane de savon. La sphère est l'unique surface réalisant cet optimum, d'où la forme de la bulle. En dimension trois, on dispose du théorème suivant :

  • Soit K un compact d'un plan euclidien de dimension 3 et dont la surface est mesurable. La boule de même surface que celle de la frontière de K possède un volume plus grand que celui de K. Si v est le volume de K et s sa surface, la majoration suivante, dite inégalité isopérimétrique est vérifiée :
36.pi.v^2 - s^3le 0

De manière plus générale, si μ désigne la mesure de Lebesgue dans un espace euclidien de dimension n, μn-1 la mesure équivalente pour les sous-variétés de dimension n - 1 et si Kest un compact mesurable de frontière aussi mesurable, alors :

mu_{n-1} (partial K)^n - n^n mu (K)^{n-1} mu(mathcal B) ge 0 ;

Ici, B désigne la boule unité. Un rapide calcul permet de déduire de cette majoration les inégalités isopérimétriques pour n égal à 2 ou 3.

Difficultés [modifier]

Un lampion peut posséder une surface plus grande que celle du cylindre qui le circonscrit.

Certaines démonstrations, établies en dimension 2, se généralisent aisément aux dimensions quelconques. C'est, par exemple, le cas pour la formule de Leibniz donnant l'expression d'un déterminant. Un résultat faisant appel à la topologie est très souvent beaucoup plus complexe à établir. Un exemple célèbre est celui de la conjecture de Poincaré. Si le résultat équivalent en dimension 2 est relativement simple, en dimension 3 il s'avère redoutable à démontrer. Sans atteindre des extrêmes aussi techniques, démontrer le théorème isopérimétrique pour un espace euclidien de dimension quelconque est plus ardu qu'en dimension 2.

Une première difficulté, déjà citée, provient du fait qu'il n'existe pas de suite infinie de polygones réguliers convexes à partir de la dimension 3. Cependant, un contournement est aisément imaginable.

La géométrie des convexes diffère. A partir de la dimension 3, une enveloppe convexe d'un compact n'est pas nécessairement de frontière de mesure plus petite que la mesure de la frontière du compact. Un contre exemple est donné en dimension 3 par une variété analogue à la chambre à air d'un vélo. Son enveloppe convexe contient deux disques supplémentaires, dont l'aire peut être supérieure à celle de la moitié de la surface de la variété qui n'est pas à la frontière de l'enveloppe convexe.

Enfin, le sens à donner au mot mesure de la frontière n'est pas aussi simple à partir de la dimension 3, que dans le plan. Dans le plan, définir la longueur d'une courbe est aisé avec l'approche de Jordan, on considère la borne supérieure de l'ensemble des lignes polygonales sont les sommets sont ordonnés et situés sur la courbe (cf l'article Longueur d'un arc). A partir de la dimension 3, cette démarche n'est plus possible, il existe des suites de polyèdres dont les points sont tous sur la surface d'une portion de cylindre située entre deux plans parallèles dont la suite des surfaces diverge. Un exemple est donné sur la figure de droite. La notion de forme volume permet bien de définir une mesure n - 1 dimensionnelle pour la frontière du compact, elle suppose cependant que la frontière est suffisamment lisse, c'est-à-dire qu'elle définisse une variété de dimension n - 1 de classe C2.

Variété différentielle [modifier]

Contenu de Minkowski [modifier]

Le contenu 1 dimensionnel d'un lacet simple correspond à longueur de l'arc, au sens de Jordan.

Pour obtenir une définition générale de la mesure de la frontière du compact étudié dans un espace euclidien E de dimension n, Minkowski définit la notion de contenu k dimensionnel, ici k désigne un entier plus petit que n. Soit D un compact fermé de E, son contenu k dimensionnel Mn-k(D) est le suivant19 :

mathcal M_{n-k} (D) = liminf_{t to 0} frac {mu (D + tmathcal B_n)}{mu(tmathcal B_{n-k})}

Ici, Bp désigne la boule unité d'un espace euclidien de dimension p. En toute rigueur, on devrait parler de contenu k dimensionnel inférieur. La figure de droite illustre le concept pour la frontière d'un compact. La partie supérieure de la fraction définissant le contenu correspond au volume d'un tube de section un disque de rayon t si la figure est en dimension 3. Si la frontière est une variété de classe C2, le volume du tube est égal à sa longueur que multiple la surface du disque de rayon t, si t n'est pas trop grand. Le rapport définissant le contenu est toujours égal à la longueur de la variété20

Dans le cas plus général d'une variété compacte de dimension k et de classe C2, le volume du tube s'exprime comme un polynôme de degré n - kdont le terme de plus petit degré est égal à la mesure de la variété. La mesure est alors définie à l'aide de la forme volume canonique. Ce résultat se conçoit bien intuitivement, l'intersection du tube en un point de la variété par l'espace affine orthogonal à la variété en ce point est une boule de dimension n - k et de rayon t. En première approximation, le volume du tube est le produit de la mesure de cette boule par celle de la variété.

Egalité isopérimétrique pour la boule [modifier]

Le choix du contenu de Minkowski pour mesurer la frontière du compact considéré est pertinent. On peut s'en rendre compte par l'étude de l'égalité isopérimétrique dans le cas d'une boule r.B de rayon r d'un espace euclidien E de dimension n. Sa mesure est égale à21 :

mu(rmathcal B_n) = omega_n r^n quadtext{avec}quad omega_{2p+1} = frac {2^{p+1}pi^p}{1cdot 3 cdots (2p+1)};text{et}quad omega_{2p} = frac {pi^{p}}{p!}

Si la surface est désignée par la lettre S, on a :

mathcal M_{n-1}(rpartial {mathcal B_n}) = lim_{t to 0} frac {mu (rpartial {mathcal B_n} + tmathcal B_n)}{mu(tmathcal B_{1})} = lim_{t to 0} frac {mu left((r+t) {mathcal B_n} - (r-t) {mathcal B_n}right)}{2t}

La deuxième égalité indique que le tube engendré par la surface Sn-1 est composé des points de la boule de rayon r + t qui ne sont pas éléments de la boule r - t. Ce volume se calcule aisément :

mu left((r+t) {mathcal B_n} - (r-t) {mathcal B_n}right) = omega_nleft((r+t)^n - (r-t)^nright) = omega_n sum_{i=0}^n binom ni (1 - (-1)^i)r^{n-i}t^i = 2nomega_n r^{n-1}t + cdots

On en déduit :

mathcal M_{n-1}(rpartial {mathcal B_n}) = nomega_n r^{n-1} = n frac {mu (rmathcal B_n)}rquadtext{et}quad M_{n-1}(rpartial {mathcal B_n})^n - n^nomega_n mu(rmathcal B_n)^{n-1} = 0

Ce qui est bien l'égalité isopérimétrique.

Inégalité de Brunn-Minkowski [modifier]

L'inégalité de Brunn-Minkowski permet aisément de démontrer l'inégalité isopérimétrique, dans le cas d'un compact non vide K. Appliquée à K et à t.B, on obtient :

mu(K + tmathcal B) ge left(mu(K)^{frac 1n} + omega_n^{frac 1n} tright)^n ge mu(K) + nmu(K)^{frac {n-1}n} omega_n^{frac 1n} t

Autrement dit :

frac {mu(K + tmathcal B) - mu(K)}t ge nmu(K)^{frac {n-1}n} omega_n^{frac 1n}

Il suffit de remarquer que le terme de gauche admet pour limite inférieure le contenu n - 1 dimensionnel de la frontière de K. Ce résultat est connu sous le nom de formule de Steiner-Minkowski. On obtient :

mathcal M_{n-1}(partial K)^n ge n^nomega^n mu(K)^{n-1}

Ce qui correspond bien à l'inégalité isopérimétrique. Aucune hypothèse n'a été faite sur la nature du compact K.22

Inégalité d'Alexandrov-Fenchel [modifier]

La démonstration est à la fois simple et rapide, mais il manque l'unicité de la solution. Des hypothèses supplémentaires permettent une démonstration plus simple de cette unicité. Le cas général ne peut s'exprimer aisément ; pour s'en rendre compte, il suffit de considérer une boule dans laquelle on plante une aiguille infiniment fine. Il existe deux cas où le théorème isopérimétrique s'exprime aisément. Dans le cas des convexes compacts, ou dans le cas des variétés à bord de classe C2, l'unicité de l'optimum se démontre à l'aide de l'inégalité d'Alexandrov-Fenchel.

Voir aussi [modifier]

Notes [modifier]

  1.  T. Heath A History of Greek Mathematics, Vol. 2 Dover Publications (1981) (ISBN 0486240746)
  2.  P. Nahin When Least Is Best: How Mathematicians Discovered Many Clever Ways to Make Things as Small (or as Large) as Possible Princeton University Press p 47 (2007) (ISBN 0691130523)
  3.  P. J. Nahin When Least Is Best: How Mathematicians Discovered Many Clever Ways to Make Things as Small (or as Large) as Possible Princeton University Press (2003) p 55-56 (ISBN 0691070784)
  4.  Cette remarque est issue de : R. Osserman The isoperimetric inequality [archive] Bull. Amer. Math. Soc. Vol 84 (1978) p 1188
  5.  F. Dress Quelques grands problèmes en mathématiques [archive] Bulletin de la société mathématiques de France T 115 (1987) p 43
  6.  H. Liebmann Ueber die Verbiegung der geschlossenen Flächen positiver Krümmung Math. Ann. 53 (1900) p 81-112
  7.  H. A. Schwarz Gesammelte Mathematische Abhandlung Springer-Verlag Berlin (1890) I Vol. 2 p 327
  8.  L'essentiel des informations de ce paragraphe provient de : R. Osserman The isoperimetric inequality [archive] Bull. Amer. Math. Soc. Vol 84 (1978)
  9.  H. MinkowskiGesammelte Abhandlungen Chelsea Pub Co 1967 (réédition de l'original de 1911) Vol 2 p 131-229 (ISBN 0828402086)
  10.  Bonnesen T Sur une amélioration de l'inégalité isopérimetrique du cercle et la démonstration d'une inégalité de Minkowski C. R. Acad. Sci. Paris 172 (1921) p 1087–1089
  11.  W. Fenchel Inégalités quadratiques entre les volumesmixtes des corps convexes Comptes Rend. Acad. Sci. Paris 203 (1936), p. 647-650 et A. D. Alexandrov Neue Ungleichungen für die Mischvolumen konvexer Körper Dokl. Acad. Sci. URSS 14 (1937), p. 155-157
  12.  Les deux derniers paragraphes proviennent essentiellement de : B. Teissier Volumes des corps convexes, géométrie et algèbre [archive] Institut de Mathématiques de Jussieu. Leçon donnée le jeudi 7 octobre 1999 Rédigée par C. Reydy
  13.  A P Burton P Smith Isoperimetric inequalities and areas of projections in Rn Acta Mathematica Hungarica Vol 62, N° 3-4 (1993)
  14.  On trouve une démonstration, par exemple à : A. Treibergs Inequalities that Imply the Isoperimetric Inequality [archive] University of Utah
  15.  A. Treibergs Inequalities that Imply the Isoperimetric Inequality [archive] University of Utah
  16.  B. Teissier Volumes des corps convexes, géométrie et algèbre [archive] Institut de Mathématiques de Jussieu. Leçon donnée le jeudi 7 octobre 1999 Rédigée par C. Reydy p 5
  17.  T. Bonnesen Über eine Verschärfung der isoperimetrischen Ungleichheit des Kreises in der ebene und auf der Kugeloberfläche nebst einer Anwendung auf eineMinkowskischeUngleichheit für konvexe KörperMath. Annalen 84 (1921) p. 216-227
  18.  H. Hadwiger Vorlesungen Über Inhalt, Oberfläche und Isoperimetrie Springer, Berlin (1957) p. 153
  19.  On trouve cette définition dans : R. Osserman The isoperimetric inequality [archive] Bull. Amer. Math. Soc. Vol 84 (1978) p 1189
  20.  Marcel Berger, Bernard Gostiaux, Géométrie différentielle : variétés, courbes et surfaces [détail des éditions] p 254
  21.  Marcel Berger, Bernard Gostiaux, Géométrie différentielle : variétés, courbes et surfaces [détail des éditions] p 227
  22.  Cette démonstration provient de : R. Osserman The isoperimetric inequality [archive] Bull. Amer. Math. Soc. Vol 84 (1978) p 1190

Références [modifier]

  • Y.D Burago, V.A. Zallgaller, Geometric inequalities, Springer Grundlehren Math. 285, Springer 1988

22:24 Publié dans Théorème isopérimétrique | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Extrema liés - Multiplicateurs de Lagrange

Extrema liés - Multiplicateurs de Lagrange

Analyse -- Fonctions de plusieurs variables

  On parle d'extrémum lié lorsqu'on cherche à maximiser ou minimiser une fonction de plusieurs variables f(x1,...,xn) lorsque ces variables sont liées par certaines relations. Un théorème général permet bien souvent de résoudre le problème de la recherche des extrema liés.

Théorème : Soient f, g1,..., gp des fonctions de classe C1 sur un ouvert U de Rn, à valeurs dans R et X l'ensemble défini par :X={x de U; g1(x)=...=gp(x)=0}.Si la restriction de f à X admet un extrémum local en a, et si les différentielles dg1(a),...,dgp(a) sont des formes linéaires indépendantes, alors il existe des réels c1,...,cp tels que :df(a)=c1dg1(a)+...+cpdgp(a)Ces réels c1,...,cp sont appelés multiplicateurs de Lagrange.


  Ce théorème a une interprétation géométrique naturelle. Prenons un arc  tracé sur X avec . La fonction (d'une variable réelle)  admet un extrémum local en 0, d'où l'on tire :Maintenant,  est un vecteur tangent à X en a, et en fait tous les vecteurs tangents à X en a s'obtiennent de cette façon. Ainsi, df(a)(v)=0 pour tout vecteur v tangent à X en a. Mais l'ensemble de ces vecteurs tangents est l'intersection des noyaux de dgi(a) et l'inclusionentraine la relation du théorème par un résultat élémentaire d'algèbre linéaire.
Exemple
  Cherchons le maximum de la fonctionsur l'ensemble défini parEn un point où le maximum est atteint, on a forcément xi>0 et on peut appliquer le théorème précédent avec g(x)=(x1+...+xn)/n-1. On obtientMaisetce qui entraîneEn particulier, on obtient que tous les ai sont égaux et qu'il sont tous égaux à 1. Ainsi, sur X, on a f(x)<=1. Par homogénéité, on obtient l'inégalité des moyennes arithmétiques et géométriques

La méthode du Lagrangien

3.4  La méthode du Lagrangien

 

La méthode que nous étudions dans cette séance est, en fait, une généralisation de la règle du multiplicateur de Lagrange pour résoudre des problèmes d’optimisation avec des contraintes d’égalité.  Nous examinerons le cas d'une seule contrainte à deux variables .

 

Définition             Soit le problème :        s.c.  .

On appelle Lagrangien associé à ce problème la fonction :

 

 .

 

Le Lagrangien permet d’introduire la contrainte dans la fonction objectif avec une certaine pénalité  .  On se retrouve ainsi à maximiser une fonction à trois variables sans contrainte.

 

Si, maintenant, on cherche les points stationnaires  du Lagrangien , cela veut dire que nous cherchons  tel que .

 

Nous déduisons alors le système suivant comportant trois équations:

 

 

 

 

Dans les deux premières équations, on reconnaît les conditions d’optimum du premier ordre : , alors que la troisième est équivalente à la contrainte de départ imposée par le modèle :  , au point (point admissible).                

 

La méthode du Lagrangien transforme donc un problème d'optimisation d'un modèle avec contraintes d'égalité à celui de recherche des points stationnaires d’une fonction sans contrainte. De plus, puisque    pour tout point optimal  , la valeur du Lagrangien est la même que celle de l'objectif en ce point :

 

 

 

Exemple  Résoudre par la méthode du Lagrangien :

    s.c.  .

 

On forme d'abord le Lagrangien : . On optimise ensuite , une fonction à trois variables pour laquelle on cherche les points stationnaires    tel que  :

                       Þ  .

                   Þ  .

.

 

Avec et  dans la troisième équation, on a : ,

d'où          Þ        .

 

Reportant à son tour la valeur de  dans les deux premières expressions, on retrouve :

 

   et  .

 

Donc  est le seul point stationnaire du Lagrangien, et par conséquent,  est le seul point extrémal du problème original avec contrainte (trouvé sans avoir à énoncer les conditions d’optimum du premier ordre!).

 

 

Remarque sur la nature du point extrémal  Il faut faire attention car il n’est pas certain que  soit un maximum (sous contraintes) pour l'objectif.  Pour les contraintes d'égalité, le seul cas facile à résoudre au complet est celui impliquant des contraintes affines parce qu'elles définissent automatiquement un domaine convexe. On peut alors vérifier la convexité/concavité de la fonction objectif.  En pratique, on choisit généralement de construire des modèles mathématiques que l'on est capable de résoudre !

 

  • Dans l'exemple précédent, la contrainte  est affine et on peut donc vérifier que l'objectif  est strictement concave (le Hessien est toujours défini négatif). L'optimum sous contrainte trouvé est bel et bien un maximum absolu.

 

Dans les autres cas, il faut avoir recours à des outils mathématiques plus complexes, par exemple, les conditions du second ordre qui utilisent la notion de Hessien bordé  (voir Breton et Haurie, p. 185-193).

 

 

3.5  Interprétation de

 

Considérons le problème d'optimisation suivant, où le côté droit de la contrainte d'égalité est exprimé par la quantité  b :  .

 

Le Lagrangien associé à ce problème est donné par   . À  l'optimalité, nous avons déjà mentionné que . Ainsi,

 

 

 

Le coefficient de b est . Ainsi, ce multiplicateur de Lagrange  représente l'effet sur la valeur optimale de la fonction objectif  si l'on modifie d'une unité la valeur de  b. Il faut bien s'entendre que c'est un calcul approximatif.

 

 donne une approximation de la variation de  lorsqu’on augmente d'une unité le côté droit  b  de la contrainte  .

 

 

Ainsi, si  f  est une fonction de profit  (en $) et  b  représente la main-d’œuvre en nombre d’employés, alors    signifie que le profit augmenterait (approximativement) de 200$  si on augmentait la main-d’œuvre d'un employé additionnel. À noter que si l'on diminue le nombre d'employés, l'effet est en sens inverse !

 

Mentionnons finalement que dans le cas d'un modèle d'optimisation comportant plusieurs contraintes, un tel multiplicateur est associé spécifiquement à chacune d'entre elles.

 

Exemple      s.c.  .

Pour ce problème, on a trouvé :  .  Si on augmente  b de une unité (donc ), alors la valeur optimale de  devrait diminuer de 2 unités (environ).  Résoudre ce problème en utilisant EXCEL et montrer que la nouvelle solution est donnée par :

     et … une diminution de 2,04.

 

  • Vérifier que la valeur du multiplicateur est maintenant  .

 

Exercice  Une entreprise fabrique deux modèles de vélos de montagne: le modèle X est plus abordable et se vend 500$ l'unité, tandis que le modèle Y se vend 1000$ l'unité.  Les coûts totaux de fabrication (en $) sont exprimés par la fonction suivante:   où  x  est le nombre de vélos du modèle X et  y  est le nombre de vélos du modèle Y,  produits mensuellement.  On suppose que chaque vélo produit peut être vendu sur le marché.

a)      Donner , la fonction des profits totaux mensuels.  ¨ Cette fonction est-elle convexe, concave ou sans forme particulière?

b)      La capacité de production de l'entreprise est de 150 vélos par mois.  En supposant que l'entreprise désire utiliser à pleine capacité son usine, trouver la répartition de la production mensuelle permettant de maximiser les profits.  ¨ Prouvez qu'il s'agit bien d'un maximum absolu.  ¨ Donnez la valeur du profit mensuel.

c)      Le patron de l'entreprise s'interroge sur la pertinence de vouloir produire à pleine capacité.  Il se demande si la solution qu'il obtiendrait sans cette contrainte serait plus intéressante.  Aidez-le à répondre à cette question en trouvant la solution qui maximise les profits sans cette contrainte. ¨ Prouvez qu'il s'agit bien d'un maximum absolu.  ¨ La solution obtenue est-elle réalisable pour l'entreprise?  ¨ Donnez la valeur du profit mensuel.

d)      Déterminez le signe du multiplicateur de Lagrange du problème résolu en b).  ¨ Interpréter ce signe en vous appuyant sur les résultats obtenus en b) et c).

 

Solution 

a) 

     .

     ;   det(H(x, y))>0 et -10<0, "(x, y); p(x, y) est strict. concave.

b)  Par substitution :  y = 150x.

            .

            ; x = 55 (Þ y = 95).

            , "x  Þ p(x) est une fonction strictement concave.

            Þ x= 55 est un maximum absolu de p(x) .

Þ (x, y) = (55, 95) est un maximum absolu de p(x, y) avec p(55, 95) = 65 312,50$.

Ce problème peut aussi se résoudre par la méthode du Lagrangien.

c)    

Par a), ce point stationnaire est un maximum absolu car la fonction est concave.

 La solution n'est pas réalisable pour l'entreprise, dépassant la capacité de 150.

Le profit  p(80, 120)  = 70 000$.

d)   On a vu que toute augmentation de capacité est rentable. Le multiplicateur est donc de signe positif.  Par calcul, on trouve 

 

 

Exercice  Résoudre le problème précédent à l'aide d’EXCEL.

 


Problèmes résolus

 

Problème 1  Résoudre le problème suivant par la méthode du lagrangien:

                               .

 

Réponse

Le Lagrangien est . Les conditions du premier ordre sont :

 

 

On a (1) = (2)

.

 

On remplace  dans (3):

 

 

  • Si

       Þ 

  • Si

Þ     

 


Problème 2  Une grande brasserie veut allouer un budget de 500 000$ à la publicité au cours des six prochains mois.  Les annonces publicitaires seront présentées dans deux médias : la télévision et les journaux. Les profits générés par cette campagne sont estimés par la fonction suivante :

                           s.c. x + y = 500

où        x = montant investi dans la publicité dans les journaux (en milliers de $) et

y = montant investi dans la publicité à la télévision (en milliers de $).

 

En considérant que le budget est totalement dépensé, déterminer l'allocation aux deux médias qui permette de maximiser les profits de la brasserie en utilisant la méthode du Lagrangien. Quel est le profit maximum obtenu ? Vérifier que le point stationnaire est un maximum absolu. Interpréter le multiplicateur de Lagrange.

 

Réponse

Le Lagrangien est:

Les conditions du premier ordre sont :

 

En remplaçant  y = 250 + x dans L'l, on obtient :

       ,  et .

 

Le domaine est convexe car la contrainte est affine. Il suffit alors de vérifier que P(x,y) est concave pour que (125,375) soit un maximum absolu :

 

est strictement concave.

Le point (125,375) est donc un maximum absolu du problème d’optimisation sous contrainte.

 

L’interprétation économique que l’on peut donner à = 250 est que si les dépenses en publicité augmentent de 1000$, les profits augmenteront de 250$. Ce n’est donc pas rentable, même si le signe du multiplicateur de Lagrange est positif, car les unités relatives à la contrainte sont en milliers de $, ce qui amènerait une perte de 750$ dans l'éventualité où une augmentation d'une unité sur la contrainte de publicité se produisait.

 

 

Problème 3   Au ministère de l'agriculture, on a établi la fonction de profit suivante pour les fermes cultivant des germes de soja et des pistaches :

 

où  P(x, y) sont les profits annuels en $, x représente le nombre d'acres plantés en germes de soja, et y donne le nombre d'acres plantés en pistaches. Un fermier possède une terre de 500 acres. Comment devrait-il allouer ses terres à ces deux cultures pour obtenir un profit maximal ? Utiliser la méthode du Lagrangien. Montrer qu'il s'agit d'un maximum absolu et donner le montant du profit obtenu. Interpréter le multiplicateur de Lagrange. En vous basant sur cette interprétation, suggéreriez-vous au fermier d’augmenter la surface totale consacrée à ces deux cultures ou, au contraire, de la diminuer ?

 

Réponse

Le Lagrangien est: et les conditions du premier ordre sont :               

En remplaçant y* = 100 dans L'l:, on a   = 600 - 2x* - 2y* = - 400.  

 

Le point (400,100) est un maximum absolu du problème d’optimisation sous contrainte car on maximise une fonction concave sous un domaine convexe (contrainte affine).

 

L’interprétation économique que l’on peut donner à = -400 signifie qu’en ne cultivant pas tous les champs (c.-à-d. ses 500 acres de champs), le fermier augmenterait ses profits, à cause du signe négatif de .  En effet, lorsque le fermier satisfait la contrainte, ses profits ne sont que de 60 000$, alors qu'ils sont de 110 000$ lorsque l'on ne tient pas compte de la contrainte (il cultive alors 300 acres de champs).

Source : © École des Hautes Études Commerciales, Montréal, Québec, 1999.

22:20 Publié dans La méthode du Lagrangien | Lien permanent | Commentaires (1) | |  del.icio.us | | Digg! Digg |  Facebook

Multiplicateur de Lagrange

Multiplicateur de Lagrange

Page d'aide sur l'homonymie Pour les articles homonymes, voir Théorème de Lagrange.
La méthode des multiplicateurs de Lagrange permet de trouver un optimum, sur la figure le point le plus élevé possible, tout en satisfaisant une contrainte, sur la figure un point de la ligne rouge.

Le multiplicateur de Lagrange est une méthode permettant de trouver les points stationnaires (maximum, minimum...) d'une fonction dérivable d'une ou plusieurs variables, sous contraintes.

On cherche à trouver l'extremum, un minimum ou un maximum, d'une fonction φ de n variables à valeurs dans les nombres réels, ou encore d'un espace euclidien de dimension n, parmi les points respectant une contrainte, de type ψ(x) = 0 où ψ est une fonction du même ensemble de départ que φ. La fonction ψ est à valeurs dans un espace euclidien de dimension m. Elle peut encore être vue comme m fonctions à valeurs réelles, décrivant m contraintes. Si l'espace euclidien est de dimension 2 et si la fonction ψ est à valeurs dans R, correspondant à une contrainte mono-dimensionnelle, la situation s'illustre par une figure analogue à celle de droite. La question revient à rechercher le point situé le plus haut, c'est-à-dire le maximum de φ, dans l'ensemble des points rouges, c'est-à-dire ceux qui vérifient la contrainte.

Le théorème clé se conçoit aisément dans l'exemple de dimension 2. Le point recherché est celui où la courbe rouge ne monte ni ne descend. En termes plus techniques, cela correspond à un point où la différentielle de ψ possède un noyau orthogonal augradient de φ en ce point. Le multiplicateur de Lagrange est une méthode offrant une condition nécessaire. Les fonctions φ et ψ sont différentiables et leurs différentielles continues, on parle de fonction de classe C1. On considère λ un vecteur pris dans l'ensemble d'arrivée de ψ et la fonction L définie par :

L(x,lambda) = varphi(x) + lambdacdot psi(x)

L'opérateur représenté par un point est le produit scalaire. Si x0 est une solution recherchée, il existe un vecteur λ0 tel que la fonction L admet une différentielle nulle au point (x0, λ0). Les coordonnées du vecteur λ0 sont appelées multiplicateurs de Lagrange. Cette technique permet de passer d'une question d'optimisation sous contrainte à une optimisation sans contrainte, celle de la fonction L.

La méthode se généralise aux espaces fonctionnels. Un exemple est donnée par la question de la chaînette, qui revient à rechercher la position que prend au repos, une chaînette attachée à ses deux extrémités. L'optimisation correspond à la position offrant un potentiel minimal, la contrainte est donnée par la position des extrémités et la longueur de la chaînette, supposée fixe. Cette méthode permet de trouver des plus courts chemins sous contrainte, ou encore des géodésiques. Le principe de Fermat ou celui de moindre action permet de résoudre de nombreuses questions à l'aide de cette méthode.

Hugh Everett généralise la méthode aux fonctions non-dérivables, souvent choisies convexes. Pour une résolution effective, il devient nécessaire de disposer d'un algorithme déterminant l'optimum (ou les optima) d'une fonction. Dans le cas non dérivable, on utilise souvent une heuristique adéquate.

Sommaire

 [masquer]

Dimension finie [modifier]

Exemple introductif [modifier]

La nappe correspond à la surface du cylindre, la courbe bleue aux points de volume égal à v0, choisi dans la représentation égal à 1.

Soit v0 un nombre strictement positif, l'objectif est de trouver la portion de cylindre de rayon r et de hauteur h de surface minimale et de volume v0. Pour cela on définit deux fonctions, v et s qui à (r, h) associent respectivement le volume et la surface de la portion de cylindre. On dispose des égalités :

forall r,h in mathbb R_+quad v(r,h) =pi r^2h quadtext{et}quad s(r,h) =2pi r(r+h);

La figure de droite représente la fonction s, qui à r et h associe la surface. La ligne bleue correspond aux points de volume égal à 1, l'objectif est de trouver le point bleu, de plus petite surface pour un volume égal à 1.

On définit une fonction c et L de la manière suivante :

forall r,h in mathbb R_+quad c(r,h) = v(r,h) - v_0quad text{et}quad forall lambda in mathbb R quad L(r,h,lambda) = s(r,h) + lambda cdot c(r,h)

La méthode de Lagrange consiste à rechercher un point tel que la différentielle de L soit nulle. Sur un tel point, la dérivée partielle en λ est nulle, ce qui signifie que la fonction c est nulle, ou encore que la contrainte est respectée. Si l'on identifie s avec son approximation linéaire tangente, son comportement sur la contrainte, aussi identifiée à son approximation linéaire tangente est aussi nécessairement nulle. Ce comportement est illustré par la droite en vert sur la figure. Le long de cette droite, la fonction c est nulle, à l'ordre 1, la fonctions l'est alors nécessairement.

Il suffit, en conséquence, de calculer la différentielle de L, et plus précisément ses trois dérivées partielles, pour l'exemple choisi :

frac {partial L}{partial r} = 2pi (h+ 2r + lambda hr)=0 ,; frac {partial L}{partial h} = pi(2r + lambda r^2) =0,; frac {partial L}{partial lambda}  = pi r^2 h - v_0=0

On trouve les valeurs suivantes :

 r = -frac 2{lambda} = left(frac {v_0}{2pi}right)^{1/3}; h = -frac 4{lambda}=2left(frac {v_0}{2pi}right)^{1/3};text{et}; lambda = -2left(frac {2pi}{v_0}right)^{1/3}

Deuxième exemple : l'isopérimétrie du triangle [modifier]

L'exemple précédent possède l'avantage d'une représentation graphique simple, guidant l'intuition. En revanche, il est trop simple pour que la méthode du multiplicateur de Lagrange soit la meilleure dans ce cas. En effet, on peut aussi calculer la valeur de h pour que l'aire de la frontière soit égale à v0, on trouve :

h = frac {v_0 - 2pi r^2}{2pi r}

Il devient possible d'exprimer le volume du cylindre d'aire égale à v0 en fonction de r et le calcul revient à trouver le minimum d'une fonction de R dans R.

Pour se convaincre de la pertinence de la méthode, on peut rechercher le triangle d'aire maximale et de périmètre p, choisi strictement positif. Si (xyz) est le triplet des longueurs des côtés du triangle, son aire A est égale à :

A = frac 14 sqrt {(x^2 + y^2 + z^2)^2 - 2(x^4 + y^4 + z^4)}

Il est plus simple de maximiser la fonction φ qui associe le quart du carré de A, la contrainte est donnée par la fonction ψ qui associe au triangle la différence du périmètre et de p :

varphi (x,y,z) = frac 14 left((x^2 + y^2 + z^2)^2 - 2(x^4 + y^4 + z^4)right) quadtext{et}quad psi (x,y,z) = x+y+z - p

Un triangle n'est défini, pour un couple (xyz), que si les trois coordonnées sont positives et si la somme de deux coordonnées est supérieure à la troisième. Soit D cet ensemble de points, sur la frontière de D, la fonction φ est nulle. On cherche un point de l'intérieur de D tel que φ soit maximal dans l'ensemble des points d'image par ψ nulle. Comme l'intersection de l'image réciproque de 0 par ψ et de D est un compact, il existe au moins un maximum. On définit comme dans l'exemple précédent la fonction L par :

 L(x,y,z,lambda) = varphi(x,y,z) + lambdapsi(x,y,z);

Si (abc) est un triangle de périmètre p et d'aire maximale, il existe une valeur λ0 telle que la différentielle de L au point (abc, λ0) soit nulle. Un calcul de dérivée partielle montre que ce quadruplet est solution du système d'équations :

frac {partial L}{partial x} =x(-x^2 + y^2 + z^2) + lambda = 0,quad frac {partial L}{partial y} =y(x^2 - y^2 + z^2) + lambda = 0frac {partial L}{partial z} =z(x^2 + y^2 - z^2) + lambda  = 0quadtext{et}quad frac {partial L}{partial lambda} = x+y+z -p = 0

On en déduit que ab et c sont tous racines de l'équation :

(1)quad x^3 - px + q = 0 quadtext{avec}quad p = frac {a^2 + b^2 + c^2}2,quad q = -frac {lambda}2

Si les trois valeurs sont distinctes, elles correspondent aux trois racines de l'équation (1), leur somme est égale au coefficient de degré 2, c'est-à-dire à 0. Un tel point ne peut être dans l'intérieur de D car il est soit égal au triplet nul, soit contient une coordonnée strictement négative. On en conclut qu'au moins deux coordonnées sont égales, par exemple b et c. On peut alors ajouter une cinquième équation aux quatre que fournissent le calcul des dérivées partielles : y = z. En remplaçant z par y dans la première et deuxième équation, on obtient :

x(-x^2 + 2y^2) = yx^2quadtext{et}quad x(x^2 + yx -2y^2) = x(x-y)(x+2y)=0

On trouve trois cas : x = 0 correspond à un point de la frontière de D et c'est un minimum de φ, x = y correspond au triangle équilatéral et x = -2.y est un cas impossible car a est nécessairement strictement positif. L'unique solution est le triangle équilatéral de côté p/3 car a = b = c et la somme des trois longueurs est égale à p.

Remarque : L'objectif est ici d'illustrer la méthode du multiplicateur de Lagrange, on a trouvé le maximum d'une fonction φ dans l'intérieur de D, sous la contrainte définie par ψ. Si l'objectif est uniquement de résoudre le problème isopérimétrique pour le triangle, une solution plus simple est donnée dans l'article sur l'isopérimétrie.

Notations et interprétation géométrique [modifier]

Soit E et F deux espaces vectoriels réels de dimensions respectives n et m avec n plus grand que m. Soit φ une fonction de E dans mathbb{R}, que l'on cherche à optimiser. On cherche un point a tel que φ(a) soit le plus petit possible. Soit ψ une fonction de E dans F, définissant la contrainte. L'ensemble sur lequel on travaille est G, correspondant aux points x tel que ψ(x) = 0.

Si (e1, ..., en) est une base de E, chaque point x de E s'exprime comme une combinaison linéaire des éléments de la base :

x = sum_{i=1}^n x_i e_i;

Cette remarque permet de voir les fonctions φ et ψ de deux manières. Elles peuvent être vues comme des fonctions d'une unique variable x de E, ce qui rend l'écriture plus concise et favorise une compréhension plus simple, mais plus abstraite des mécanismes en jeu. Les applications peuvent aussi être vues comme fonctions de n variables x1, ..., xn, ce qui présente une rédaction plus lourde mais plus aisée pour les calculs effectifs. L'espace F est de dimension m, si (f1, ..., fm) est une base de F, la fonction ψ peut aussi être vue comme mfonctions de n variables :

forall x in E quad psi(x) = sum_{j=1}^m psi_j(x) f_j quadtext{ou encore}quad forall (x_i) in mathbb R^n quad psi(x_1,cdots, x_n) = sum_{j=1}^m psi_j(x_1,cdots, x_n) f_j

L'ensemble G peut être vu comme une unique contrainte exprimée par une fonction à valeurs dans F ou encore comme m contraintes exprimées par les égalités ψj(x) = 0, à valeurs dansR.

Un corollaire du théorème de Rolle indique que l'optimum est atteint en un point de différentielle nulle.
Le fondement théorique de la méthode du multiplicateur de Lagrange peut être vu comme analogue au théorème de Rolle.

Les fonctions φ et ψ sont de classe C1, ce qui signifie qu'elles sont différentiables, autrement dit elles admettent chacune une application linéaire tangente en chaque point. Le terme C1 signifie aussi que les applications qui, à un point associent les différentielles, soit de φ soit de ψ sont continues.

L'optimum recherché vérifie une propriété analogue à celle du théorème de Rolle. Un corollaire de ce théorème, illustré à gauche, indique que l'optimum, un maximum ou un minimum, s'il se situe dans l'intervalle ouvert ]ab[, possède une tangente horizontale, ce qui signifie encore que sa différentielle est nulle. C'est un résultat de cette nature qui est recherché. On peut le visualiser sur la figure de droite, si n et m sont respectivement égaux à 2 et à 1. On représente φ (noté f sur la figure de droite) en bleu par ses courbes de niveau, comme les géographes. Les flèches représentent le gradient de la fonction φ. La différentielle de φ est une application linéaire de E dans R, c'est-à-dire une forme duale. Il est d'usage de considérer E comme un espace euclidien, de choisir la base de E orthonormale et d'identifier la différentielle avec le vecteur de E qui représente la forme duale. Dans ce cas, l'approximation linéaire tangente s'écrit :

forall x,h in E quad varphi(x+h) = varphi(x) + mathrm{grad} ,varphi (x)cdot h + o(h)quadtext{avec}quad mathrm{grad} ,varphi(x) = sum_{i=1}^n frac {partial varphi}{partial x_i}e_i

La lettre o désigne un petit o selon la notation de Landau et le point entre le gradient de φ et h symbolise le produit scalaire. Le vecteur gradient est orthogonal à la courbe de niveau, dans le sens des valeurs croissantes de φ et de norme proportionnelle à la vitesse d'accroissement de φ dans cette direction. La contrainte vérifie une propriété analogue puisqu'elle est aussi différentiable. L'ensemble étudié est celui des valeurs x tel que ψ(x) est nul. Si x0 est élément de G, les points voisins de x0 dans G ont aussi une image nulle par ψ, autrement dit, l'espace tangent à G au point x0 est formé par les accroissements h de x0 qui ont une image par la différentielle de ψ nulle. La direction de l'espace tangent est le noyau de l'application différentielle de ψ. Une analyse par les fonctions coordonnées ψi exprime ce résultat en indiquant que l'espace tangent est l'intersection des hyperplans orthogonaux des gradients de ψi.

Une analyse au point optimal x0 recherché indique, en approximation du premier ordre, qu'un déplacement h dans la direction de l'espace tangent à G ne peut pas accroître la valeur de φ. Ceci signifie que le déplacement h est nécessairement orthogonal au gradient de φ en x0. C'est ainsi que se traduit le théorème de Rolle, dans ce contexte. Géométriquement, cela signifie que la courbe de niveau bleue et la ligne rouge sont tangentes au point recherché. Analytiquement cela se traduit par le fait que le noyau de la différentielle de ψ en x0 est orthogonal au gradient de φ en ce point.

Théorèmes [modifier]

Le problème à résoudre est de trouver le minimum suivant :

forall x in E quad min_{x in G} varphi (x) quadtext{avec}quad G = {x in E,; psi(x)=0}

Les fonctions φ et ψ ne sont pas nécessairement définies sur tout E mais au moins sur des ouverts de E. De plus, le domaine de définition de φ possède une intersection non vide avecG.

La méthode des multiplicateurs de Lagrange se fonde sur un théorème.

Théorème du multiplicateur de Lagrange —  Si le point x0 est un extremum local de φ dans l'ensemble G, alors le noyau de la différentielle de ψ au point x0 est orthogonal au gradient de φ en ce point.1

Un corollaire met en évidence le multiplicateur. Pour cela, il est nécessaire d'équiper F du produit scalaire tel que sa base soit orthonormale, le symbole t signifie la transposée d'une l'application linéaire, elle définit une application du dual de F, ici identifié à F dans le dual de E, encore identifié à E :

Corollaire 1 —  Si le point x0 est un extremum local de φ dans l'ensemble G et si la différentielle de ψ au point x0 est surjective, il existe un vecteur λ0 de F tel que la somme de l'image de λ0 par la transposée de la différentielle de ψ au point x0 et du gradient de φ en ce point soit nulle :

exists lambda_0 in F quad mathrm{grad}; varphi (x_0) + {}^t!Dpsi_{x_0} (lambda_0) = 0

Sous forme de coordonnées, on obtient :

exists (lambda_j) in mathbb R^m quad mathrm{grad}; varphi (x_0) + sum_{j=1}^m lambda_j , mathrm{grad} ; psi_j (x_0) = 0

Un deuxième corollaire est plus pragmatique, car il offre une méthode effective pour déterminer l'extremum. Il correspond à la méthode utilisée dans l'exemple introductif.

Corollaire 2 —  Si le point x0 est un extremum local de φ dans l'ensemble G et si la différentielle de ψ au point x0 est surjective, alors il existe un vecteur λ0 de F tel que la fonction L de ExF dans R admet un gradient nul en (x0, λ0) :2

forall (x,lambda) in Etimes F quad  L(x,lambda) = varphi(x) + lambda cdot psi (x)quad text{et}quad DL_{x_0,lambda_0} = 0

Ces théorèmes possèdent quelques faiblesses, de même nature que celle du théorème de Rolle. La condition est nécessaire, mais pas suffisante. Un point de dérivée nulle pour Rolle ou vérifiant les hypothèses du théorème du multiplicateur de Lagrange n'est pas nécessairement un maximum ou un minimum. Ensuite, même si ce point est un extremum, il n'est que local. Si une solution x0 est trouvée, rien n'indique que cet extremum local est le meilleur. L'approximation linéaire ne précise pas si cet optimum est un maximum ou un minimum. Enfin, comme pour le cas du théorème de Rolle, si les domaines de définition ne sont pas ouverts, il est possible qu'un point frontière soit un optimum qui ne vérifie pas le théorème. Ainsi, sur la figure de gauche, f(a) et f(b) sont des minima, mais la dérivée n'est nulle ni en a ni en b.

Écriture du problème [modifier]

Si l'écriture condensée permet de mieux comprendre la structure du théorème, les notations développées sont plus utiles pour une résolution effective. Dans la pratique, on considère souvent une fonction φ de Rn dans R et m fonctions ψj, avec j variant de 1 à m, aussi de Rn dans R. L'entier m est nécessairement plus petit que n pour pouvoir appliquer les théorèmes du paragraphe précédent. On cherche à trouver un n-uplet (a1, ..., an) tel que :

(1)quad varphi (a_1,cdots , a_n) = min_{(x_i) in G} varphi(x_1,cdots,x_n)quadtext{avec}quad  G = {(x_i)in mathbb R^n, quad  forall j in [1,m] ;psi_j (x_1,cdots, x_n)=0}

Pour cela, on définit la fonction L de Rn+m dans R par :

forall (x_i) in mathbb R^n,; forall (lambda_j) in mathbb R^m quad L(x_1cdots, x_n,lambda_1,cdots, lambda_m) =varphi(x_1,cdots,x_n) + sum_{j=1}^m lambda_j psi_j(x_1,cdots, x_n)

Le deuxième corollaire indique que résoudre les équations suivantes offrent sur condition nécessaire pour élucider le problème d'optimisation (1). Le n-uplet (a1, ..., an) est une solution de (1) seulement s'il existe un m-uplet (α1,...,αm) tel que le n+m-uplet (a1, ..., an, α1,...,αm) soit solution des n + m équations :

forall i in [1,n]quad frac {partial varphi}{partial x_i}(x_1,cdots, x_n) + sum_{j=1}^m lambda_j frac {partial psi_j}{partial x_i}(x_1,cdots, x_n) = 0 quad text{et}quad forall j in [1,m]quad  psi_j(x_1,cdots, x_n) = 0

Cette méthode peut être généralisée aux problèmes d'optimisation incluant des contraintes d'inégalités (ou non linéaires) en utilisant les conditions de Kuhn-Tucker. Mais également sur des fonctions discrètes à maximiser ou minimiser sous contraintes, moyennant un changement d'interprétation, en utilisant la méthode des multiplicateurs d'Everett (ou de Lagrange généralisés), plus volontiers appelée méthode des pénalités.

Application : inégalité arithmético-géométrique [modifier]

La méthode du multiplicateur de Lagrange permet de démontrer l'inégalité arithmético-géométrique5. On définit les applications φ et ψ de scriptstyle{ R_+^n} dans scriptstyle R par :

forall (x_i) in mathbb R_+^{n},quad varphi (x_1,cdots x_n) = prod_{i=1}^n x_iquadtext{et}quad psi(x_1,cdots x_n) = left(sum_{i=1}^n x_iright) - s,quad sin mathbb R_+^{*}

On remarque que l'ensemble G, composé des n-uplets de coordonnées positives et de somme égale à scriptstyle s est un compact de scriptstyle{ R^n}. Sur ce compact la fonction φ est continue, elle admet nécessairement un maximum. Les deux fonctions φ et ψ sont bien de classe scriptstyle{ C^1}, il est donc possible d'utiliser le multiplicateur de Lagrange pour trouver ce maximum. Pour cela, on considère la fonction L :

forall (x_i) in mathbb R_+^{n}, forall lambda in mathbb R quad L(x_1,cdots, x_n,lambda) = varphi(x_1,cdots, x_n) + lambdapsi(x_1,cdots, x_n)

Une solution vérifie les équations :

forall i in [1,n] quad frac {partial L}{partial x_i} L(x_1,cdots x_n,lambda) = 0 Leftrightarrow prod_{k neq i} x_k = -lambdaquad text{et}quad sum_{i=1}^n x_i = s

On en déduit l'existence d'une unique solution, obtenue pour tous les scriptstyle{ x_i} égaux à scriptstyle{ frac s n = bar x} et λ égal à scriptstyle{ -(s/n)^{n-1}}. Ce qui s'exprime, en remplaçant s par sa valeur :

forall (x_i) in mathbb R_+^{n} quad sqrt[n]{prod_{i=1}^n x_i} le frac{sum_{i=1}^n x_i}n

La moyenne géométrique est inférieure à la moyenne arithmétique, l'égalité n'ayant lieu que si les scriptstyle{ x_i} sont tous égaux.

Le multiplicateur de Lagrange offre une démonstration alternative de l'inégalité arithmético-géométrique.

Espace fonctionnel [modifier]

Exemple introductif : La chaînette [modifier]

Article détaillé : Chaînette.
Le Viaduc de Garabit possède une arche dont la géométrie est celle d'une chaînette.

Il existe un autre contexte, qui fait appel au multiplicateur de Lagrange. Considérons une chaînette soumis à la gravité et recherchons son équilibre statique. La chaînette est de longueur a et l'on suppose qu'elle est accrochée à deux points d'abscisses -t0 et t0 et d'ordonnée nulle en ces deux points. Si son ordonnée est notée x, elle suit une courbe y=x(t) sur l'intervalle [-t0t0], dont on se propose de calculer l'équation.

Dire qu'elle est à l'équilibre revient à dire que son potentiel Φ est minimal, où :

Phi(x) = int_{-t_0}^{t_0}alpha cdot x(t)sqrt{ 1 + left(frac {dx}{dt}right)^2} mathrm d t

Ici, α désigne une constante physique, en l'occurrence le produit de g la gravitation terrestre, par la densité linéaire de la chaînette, supposée constante. La formule donnant la longueur d'un arc en fonction d'un paramétrage est donnée dans l'article Longueur d'un arc.

La chaînette n'est pas supposée être élastique, elle vérifie donc la contrainte Ψ, indiquant que sa longueur l0 n'est pas modifiée :

Psi(x) = int_{-t_0}^{t_0}sqrt{ 1 + left(frac {dx}{dt}right)^2} mathrm d t - l_0 = 0

Si C1K(I) désigne l'ensemble des fonctions de [-t0t0] dans R, dérivables et de dérivées continues, nulles en -t0 et t0, le problème revient à rechercher la fonction x0 telle que :

 Phi (x_{0}) = min_{x in G} Phi (x)quadtext{avec}quad G = {x in mathcal C_K^1(I), Psi(x) = 0}

La similitude avec la situation précédente est flagrante. Pour pouvoir appliquer des multiplicateurs de Lagrange, il faut donner un sens au gradient de Φ et Ψ. Dans le cas où il existe deux fonctions de classe C2 de R3 dans R, notées φ et ψ telles que :

Phi(x) = int_{-t_0}^{t_0} varphileft(t, x, dot xright) mathrm d t quadtext{et}quad Psi(x) = int_{-t_0}^{t_0} psileft(t, x , dot xright) mathrm d t,quadtext{avec}quad frac {dx}{dt}(t) = dot x(t)

L'équation d'Euler-Lagrange affirme que :

mathrm{grad},Phi(x) = frac{partial varphi}{partial x}-frac{mathrm d}{ mathrm dt}left( frac{partial varphi}{partial dot x} right)quadtext{et}quad mathrm{grad},Psi(x) = frac{partial psi}{partial x}-frac{mathrm d}{ mathrm dt}left( frac{partial psi}{partial dot x} right)

Dans le cas particulier où les fonctions φ et ψ sont des fonctions de deux variables et ne dépendent pas de t, on obtient la formulation de Beltrami (cf l'article Équation d'Euler-Lagrange):

mathrm{grad},Phi(x) cdot dot x = frac d{dt}left(varphi  -frac {partial varphi}{partial dot x}dot xright) =  frac {alpha x}{sqrt{1+ dot x^2}}quadtext{et}quad mathrm{grad},Psi(x) cdot dot x = frac d{dt}left(psi  -frac {partial psi}{partial dot x}dot xright) = frac 1{sqrt{1+ dot x^2}}

Dire que les deux gradients sont colinéaires revient à dire qu'il existe un réel λ, le multiplicateur de Lagrange, tel que :

mathrm{grad},Phi(x) -lambda mathrm{grad},Psi(x) = 0 ;Rightarrow; frac {d}{dt} left(frac {alpha x - lambda}{sqrt{1+ dot x^2}}right) = 0quadtext{et}quad exists k in mathbb R quad alpha x - lambda = ksqrt{1+ dot x^2}

La résolution de cette équation différentielle est une chaînette. La méthode du multiplicateur de Lagrange permet bien de résoudre la question posée6.

Espace de Sobolev [modifier]

Article détaillé : Espace de Sobolev.

L'exemple précédent montre que le contexte de l'équation d'Euler-Lagrange n'est pas loin de celui du multiplicateur de Lagrange. Si l'ensemble de départ de la fonction x(t) recherchée est un intervalle I ouvert et borné de R et l'ensemble d'arrivée E l'espace vectoriel euclidien, la généralisation est relativement aisée.

On suppose l'existence d'une fonction Φ à minimiser, son ensemble de départ est un espace fonctionnel, c'est-à-dire un espace vectoriel de fonctions, de I dans E et son ensemble d'arrivée R. La fonction Φ est construite de la manière suivante :

Phi(x) = int_I varphi(t,x,dot x) mathrm d t

Le point sur le x indique la fonction gradient, qui à t associe le gradient de x au point t.

La fonction φ est une fonction de RxE2 dans R de classe C2. L'optimisation est sous contrainte, donnée sous une forme analogue à la précédente. On suppose l'existence d'une fonction Ψ de RxE2 dans F, un espace euclidien. La fonction Ψ est encore définie à l'aide d'une fonction ψ de classe C2 de IxE2, mais cette fois dans F un espace euclidien:

Psi(x) = int_I psi(t,x,dot x) mathrm d t

L'ensemble G est composée de fonctions deux fois dérivables de I dans E et dont l'image par Ψ est nulle. On suppose de plus que les valeurs des fonctions de G aux bornes de I sont fixes et, quitte à opérer une translation, on peut toujours supposer, sans perte de généralités, que ces fonctions sont nulles aux bornes de I.

La seule tâche un peu délicate est de définir l'espace vectoriel W2,2(I,E) sur lequel opèrent Φ et Ψ. Pour définir un équivalent de gradient, cet espace comporte nécessairement un produit scalaire. Si l'on souhaite établir des théorèmes équivalents aux précédents les fonctions dérivées et dérivées seconde sont définies et l'espace est complet. Un espace munis d'un produit scalaire et complet est un Hilbert. Sa géométrie est, de fait, suffisamment riche pour étendre les résultats précédents.

On note D l'espace des fonctions de I, à valeur dans E, de classe C^infty et à support compact et D* son dual topologique. L'espace D est muni de la norme de la borne supérieure et l'espace D* est celui des distributions. Ce premier couple n'est pas encore satisfaisant car D est trop petit et D* trop gros pour permettre de définir un bon produit scalaire, à l'origine d'une géométrie aussi simple que celle d'un Hilbert.

L'espace D* contient le Hilbert des fonctions de carrés intégrables L2(I,E). En effet une fonction f de L2(I,E) agit sur D par le produit scalaire <.,.>L défini par l'intégrale de Lebesgue :

forall g in mathcal D quad langle f,grangle = int_I f(t)cdot g(t) mathrm d t

C'est dans L2(I,E) que nous cherchons le bon espace. Dans cet espace, l'intégration par parties permet de définir la dérivée de la fonction f de L2(I). Comme g est à support compact et que I est ouvert, aux bornes de I, la fonction g est nulle. Si f est dérivable au sens classique du terme, on bénéficie des égalités :

langle dot f,grangle_L = int_I dot f(t)cdot g(t) mathrm dt = Big[f(t)cdot g(t)Big]_I - int_I  f(t)cdot dot g(t) mathrm dt = -int_I  f(t)cdotdot g(t) mathrm dt

Si la distribution dérivée de f est encore d'un élément de L2(I,E), on dit qu'elle est dérivable au sens de Sobolev. Si cette dérivée est encore dérivable au sens précédent, on dit qu'elle est deux fois dérivables au sens de Sobolev. On note W2,2(I,E) le sous-espace de L2(I,E) équipé du produit scalaire suivant <.,.>W :

forall f,g in W^{2,2}(I,E)  quad langle f,grangle_W = int_I f(t)cdot g(t) mathrm d t + int_I dot f(t)cdot dot g(t) mathrm d t + int_I ddot f(t)cdot ddot g(t) mathrm d t

Les intégrales sont bien définies car elles correspondent au produit de deux élément de L2(I,E), il est ensuite simple de vérifier que l'espace est bien complet7. Enfin, si f est une fonction dérivable au sens des distributions, il existe un représentant de f continue8. Ainsi tout élément de W2,2(I,E) admet un représentant continu et dont la dérivée admet aussi un représentant continu.

Équation d'Euler-Lagrange [modifier]

Article détaillé : Équation d'Euler-Lagrange.

La difficulté est maintenant d'exprimer le gradient des fonctions Φ et Ψ. L'équation d'Euler-Lagrange cherche dans un premier temps à trouver des fonctions de classe C2 qui minimisent Φ. L'espace vectoriel sous-jacent est celui des fonctions d'un intervalle borné et de classe C2 et nulles aux bornes de l'intervalle. Sur cet espace, le calcul du gradient de Φ n'est guère complexe, il donne aussi une idée de la solution ainsi que de la méthode pour y parvenir. En revanche, ce calcul est insuffisant dans le cas présent. Avec le bon produit scalaire, l'espace des fonctions de classe C2 n'est pas complet, ce qui empêche de disposer de la bonne géométrie permettant de démontrer la méthode du multiplicateur de Lagrange.

L'objectif est de généraliser un peu la démonstration pour permettre de disposer de l'égalité du gradient dans l'espace complet W2,2(I,E). Dans un premier temps, exprimons l'égalité qui définit la différentielle de Φ en un point x, qui représente une fonction de W2,2(I,E) :

forall h in W^{2,2}(I,E) quad Phi(x+h) = Phi(x) + Dphi_x(h) + o(h)

L'application DΦx est une application linéaire continue de W2,2(I,E) dans R, c'est-à-dire un élément du dual topologique de W2,2(I,E), que le produit scalaire permet d'identifier à W2,2(I,E). L'égalité précédente devient :

forall h in W^{2,2}(I,E) quad Phi(x+h) = Phi(x) + langle mathrm{grad} ,Phi_x, hrangle + o(h) =Phi(x) + int_I grad ,Phi_x(t)cdot h(t) mathrm d t + o(h)

Autrement dit, le gradient de Φ au point x est une fonction de L2(I,E) dans R. De fait, ce gradient s'exprime à l'aide de l'équation d'Euler-Lagrange :

  • Le gradient de Φ au point x est la fonction de I dans E, définie par :
mathrm{grad} Phi_x = frac{partial varphi}{partial x}-frac{mathrm d}{ mathrm dt}left( frac{partial varphi}{partial dot x} right)

Si la fonction φ est en général choisie au sens usuel de la dérivation, la fonction x(t) est une fonction de W2,2(I,E). Le symbole d/dt doit être pris au sens de la dérivée d'une distribution, qui n'est ici nécessairement une fonction de carrée intégrable, définie presque partout.

Pour Ψ, la logique est absolument identique, mais cette fois-ci, la fonction est à valeurs dans F. En conséquence, la dérivée partielle de ψ par rapport à sa deuxième ou troisième variable n'est plus une application linéaire de E dans R, mais une application linéaire de E dans F. Ainsi, la différentielle de Ψ au point, une fonction x de I dans E, est une application de I dansL(E,F) l'ensemble des applications linéaires de E dans F. La logique reste la même.

  • La différentielle de Ψ au point x est la fonction de I dans L(E,F), définie par :
D Psi_x = frac{partial psi}{partial x}-frac{mathrm d}{ mathrm dt}left( frac{partial psi}{partial dot x} right)

 

Théorèmes [modifier]

Ce paragraphe est très proche du précédent dans le cas de la dimension finie. Le problème à résoudre est de trouver le minimum suivant :

min_{x in G} Phi (x) quadtext{avec}quad G = {x in W^{2,2}(I,E),; Psi(x)=0quadtext{et}quad x(a) = x(b) = 0}

Théorème du multiplicateur de Lagrange —  Si le point x0 est un extremum local de Φ dans l'ensemble G, alors le noyau de la différentielle de Ψ au point x0 est orthogonal au gradient de Φ en ce point.

On obtient les mêmes corollaire, que l'on peut écrire :

Corollaire —  Si le point x0 est un extremum local de Φ dans l'ensemble G et si la différentielle de Ψ au point x0 est surjective, alors il existe un vecteur λ0 de F tel que la fonction L de W2,2(I,E)xF dans R admet un gradient nul en (x0, λ0) :

forall (x,lambda) in Etimes F quad  L(x,lambda) = Phi(x) + lambda cdot Psi (x)

Cette équation s'écrit encore :

exists (lambda_j) in mathbb R^m quad frac{partial varphi}{partial x} + sum_{j=1}^m lambda_j frac{partial psi_j}{partial x} = frac{mathrm d}{ mathrm dt}left( frac{partial varphi}{partial dot x} + sum_{j=1}^m lambda_j frac{partial psi_j}{partial dot x} right)

Le signe d/dt doit être pris au sens de la dérivée des distributions. On obtient une solution faible, c'est-à-dire une fonction x définie presque partout et dérivable dans un sens faible. En revanche, si une fonction x de classe C2 est solution du problème de minimisation, comme ses dérivées premières et secondes sont des représentants de ses dérivées au sens faible, L'équation précédente est encore vérifiée.

Application : Théorème isopérimétrique [modifier]

Article détaillé : Théorème isopérimétrique.
En répartissant uniformément lacourbure de la frontière on obtient l'optimal isopérimétrique.

On recherche la surface de plus grande aire, ayant une frontière de longueur égale à 2π. On remarque que la surface est nécessairement convexe, d'intérieur non vide. On considère une droite coupant la surface en deux. Cette droite est utilisée comme axe d'un repère orthonormal, dont les abscisses sont notées par la lettre t et les ordonnées par x. La frontière supérieure est paramétrable en une courbe x(t) et, si le repère est bien choisi, on peut prendre comme abscisse minimale -a et maximale a. On recherche alors une courbe x, définie entre -a et a tel que l'aire Asoit maximale :

A = int_{-a}^a x(t) mathrm dt

On sait de plus que la demi longueur de la frontière est égale à π :

int_{-a}^a sqrt {1 + dot x(t)^2}mathrm dt = pi

La recherche de la surface se traite aussi avec le multiplicateur de Lagrange. La même astuce que celle utilisée dans l'exemple introductif montre, avec les notations usuelles :

mathrm{grad} ,Phi(x)cdot dot x = frac d{dt}left(varphi  -frac {partial varphi}{partial dot x}dot xright) =frac d{dt} x(t)quadtext{et}quad mathrm{grad} ,Psi(x)cdot dot x = frac d{dt}left(psi  -frac {partial psi}{partial dot x}dot xright) = frac d{dt}left(frac 1{sqrt{1+ dot x^2}}right)

On en déduit l'existence de valeurs λ et k tel que :

x - frac {lambda}{sqrt{1+ dot x^2}}=k

En notant u = x - k, on obtient :

u^2(1+ dot u^2) =lambda^2

On trouve l'équation d'un demi-cercle de rayon λ, la valeur λ est égale à 1 et k à 0.9

Voir aussi [modifier]

Notes [modifier]

  1.  Ce résultat est énoncé sous une forme équivalente mais moins générale dans : D. Hoareau Cauchy-Schwarz par le calcul différentiel [archive] MégaMaths sur ifrance (2003)
  2.  On trouve ce corollaire dans : D. Klein Lagrange Multipliers without Permanent Scarring [archive] University of California at Berkeley
  3.  Voir par exemple : M. Bierlaire (2006) "Introduction à l'optimisation différentiable" [archive], Presses Polytechniques et Universitaires Romandes, Ecole polytechnique fédérale de Lausanne
  4.  Elle est explicitée dans l'article : D. Hoareau Cauchy-Schwarz par le calcul différentiel [archive] MégaMaths sur ifrance (2003)
  5.  Cet exemple est extrait de : X. Gourdon Analyse, Les maths en tête : Mathématiques pour MP* Ellipses Marketing 2ième édition (2008) (ISBN 2729837590)
  6.  Cet exemple est traité dans : C Barreteau Calcul des variations [archive] Ecole supérieure de physique et de chimie industrielle
  7.  Pour plus de détails voir : L Andry Les espaces de Sobolev [archive] Ecole polytechnique fédérale de Lausanne
  8.  Théorème VIII.2 p 122 Haïm Brezis, Analyse fonctionnelle : théorie et applications [détail des éditions]
  9.  Ce calcul est présenté, par exemple sur : S. Mehl Didon, Carthage, calcul des variations et multiplicateur de Lagrange [archive] Chronomath.com

Liens externes [modifier]

Références [modifier]

  • (fr) X. Gourdon Analyse, Les maths en tête : Mathématiques pour MP* Ellipses Marketing 2ième édition (2008) (ISBN 2729837590)
  • (fr) Haïm Brezis, Analyse fonctionnelle : théorie et applications [détail des éditions]
  • (en) W. P. Ziemer Weakly Differentiable Functions: Sobolev Spaces and Functions of Bounded Variation Springer (1989) (ISBN 0387970177)

22:03 Publié dans Multiplicateur de Lagrange | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Théorème de Lagrange sur les polynômes

Théorème de Lagrange sur les polynômes

Cet article est une ébauche concernant les mathématiques.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Page d'aide sur l'homonymie Pour les articles homonymes, voir Théorème de Lagrange.

Il s'agit d'un résultat trouvé par le mathématicien Joseph-Louis Lagrange[réf. souhaitée] concernant les polynômes. Soit P un polynôme tel que:

P(x) = x^n+sum_{i=0}^{n-1}{a_i x^i}

où les ai sont réels.

Alors si a est une racine de Pa vérifie

|a| leq 1+max(|a_0|,ldots,|a_{n-1}|).

Ce théorème reste vrai si les ai et a sont complexes et l'inégalité est même stricte. Mieux : par le théorème de Rouché, le polynôme P admet n racines (comptées avec leurs multiplicités) dans le disque complexe ouvert de centre 0 et de rayon 1+max(|a_0|,ldots,|a_{n-1}|), ce qui fournit une preuve du théorème de d'Alembert-Gauss en plus de la majoration annoncée.

Pour un panorama sur ce type de résultats, voir l'article Théorie des équations (mathématiques).

Théorème de Lagrange sur les groupes

Théorème de Lagrange sur les groupes

Page d'aide sur l'homonymie Pour les articles homonymes, voir Théorème de Lagrange.
Joseph-Louis Lagrange

En mathématiques, le théorème de Lagrange en théorie des groupes énonce un résultat élémentaire fournissant des informations combinatoiressur les groupes finis.

Sommaire

 [masquer]

Énoncé [modifier]

Théorème de Lagrange — Pour un groupe G fini, et pour tout sous-groupe H de G, le cardinal (encore appelé l'ordre) de H divise le cardinal de G :

mbox{card}(H) mid mbox{card} (G).

Démonstration [modifier]

L'indice [G:H] de H dans G est par définition le cardinal de l'ensemble G/H des classes à gauche suivant H des éléments de G. Or ces classes forment une partition de G, et chacune d'entre elles a même cardinal que H. Par le principe des bergers, on en déduit :

mbox{card}(G)= mbox{card} (H)times[G:H],.

Remarquons que cette formule reste vraie quand les trois cardinaux qu'elle relie sont infinis, et qu'elle est un cas particulier de la formule des indices.

Applications [modifier]

  • L'ordre d'un élément x d'un groupe fini peut se définir comme le cardinal du sous-groupe qu'il engendre. (C'est aussi le plus petit entier n>0 vérifiant : xn = e.) Par le théorème de Lagrange, cet ordre divise l'ordre du groupe.
  • Un groupe G d'ordre premier p est cyclique et simple. En effet, tout élément non neutre x de G est d'ordre strictement supérieur à 1 et par ce qui précède un diviseur de p. Comme pest premier, l'ordre de x est p ; autrement dit, x engendre un groupe cyclique d'ordre p, nécessairement égal à G.
  • Ce théorème peut servir à démontrer le petit théorème de Fermat et sa généralisation, le théorème d'Euler.

Réciproques partielles [modifier]

Voir le paragraphe correspondant de l'article en anglais

Un groupe fini dont l'ordre est divisible par d n'admet pas toujours de sous-groupe d'ordre d. Le plus petit contre-exemple est le groupe alterné A4, qui est d'ordre 12 mais n'a pas de sous-groupe d'ordre 6.

Le théorème de Cauchy, les théorèmes de Sylow, le théorème prouvé par Hall sur les sous-groupes de Hall, forment des réciproques partielles du théorème de Lagrange.

Historique [modifier]

Le mathématicien français Joseph-Louis Lagrange a démontré1 que, par permutation des n indéterminées d'une expression polynômiale, le nombre d'expressions obtenues est un diviseur de n!. L'ensemble des permutations est vu aujourd'hui comme un groupe à n! éléments, agissant sur les polynômes à n variables. Le travail de Lagrange se réinterprète comme le calcul du cardinal d'une orbite de cette action : il apparait ainsi comme précurseur de l'émergence de la notion de groupe, dont la définition formelle n'a été donnée qu'à la fin du XIXesiècle.

Notes et références [modifier]

  1.  J.-L. Lagrange, « Réflexions sur la résolution algébrique des équations, II », dans Nouveaux Mémoires de l’Académie Royale des Sciences et Belles-Lettres de Berlin, 1771, p. 138-254 (spéc. p. 202-203), réédité dans Œuvres de Lagrange, t. 3, Paris, 1869, p. 305-421, consultable en ligne [archive] (spéc. p. 369-370 [archive])

Arithmétique des polynômes

Arithmétique des polynômes

Il s'agit de répéter pour les polynômes des résultats similaires à ceux qui ont été énoncés pour les entiers.

 

Premier point à observer : l'arithmétique sur les polynômes est tout à fait analogue à celle sur les entiers à condition de travailler sur des polynômes sur un corps commutatif. Sur un anneau commutatif quelconque (même intègre) se glissent quelques bizarreries.

 

Second point à observer : les énoncés donnés sur les entiers l'ont été sur des entiers positifs. Ils se modifient sans trop de mal pour des entiers de $ mathbb{Z}$ mais parfois en s'alourdissant un peu ; ainsi dans $ mathbb{Z}$ on ne peut plus affirmer l'existence d'un entier $ d$ unique tel que $ n$ divise $ 10$ et $ 6$ si et seulement si $ n$ divise $ d$ (le pgcd de $ 10$ et $ 6$ ) : il en existe toujours un, mais il n'est plus unique, on peut prendre $ d=2$ mais aussi $ d=-2$ . Les polynômes unitaires joueront un rôle analogue aux entiers positifs mais ils sont légèrement moins confortables, dans la mesure où la somme de deux entiers positifs est positive alors que la somme de deux polynômes unitaires n'est pas nécessairement unitaire. Attention à ces petits détails donc, en apprenant les énoncés.

Commençons par donner une définition, à partir de laquelle on ne montrera guère de théorèmes que dans $ mathbb{K}[X]$ mais que ça ne coûte pas plus cher de donner sur un anneau commutatif quelconque.

 

 

Définition 9   Soit $ A$ un anneau commutatif. On dit qu'un polynôme $ P$ dans $ A[X]$ est un multiple d'un polynôme $ S$ dans $ A[X]$ , ou, de manière équivalente, que $ S$est un diviseur de $ P$ , lorsqu'il existe un polynôme $ T$ dans $ A[X]$ tel que $ P=ST$ .

 

Comme pour les entiers, tout repose sur la division euclidienne.

 

 

Théorème 1   Soit $ mathbb{K}$ un corps commutatif, $ A$ un polynôme de $ mathbb{K}[X]$ et $ B$ un polynôme non nul de $ mathbb{K}[X]$ . Il existe un couple $ (Q,R)$ unique de polynômes vérifiant la double condition :

 

$displaystyle A=QB+Rqquad{rm et}qquad deg R < deg B. $

 

 

 


Démonstration : On prouvera successivement l'existence et l'unicité de $ (Q,R)$ .

 

Existence de $ (Q,R)$

 

La preuve est significativement différente de celle utilisée pour les entiers. Elle est toujours basée sur une maximisation/minimisation, mais les polynômes n'étant pas totalement ordonnés, cette maximisation est un peu plus technique.

Dans le cas stupide où $ B$ divise $ A$ , prenons $ R=0$ et $ Q$ tel que $ A=BQ$ . Sinon, considérons l'ensemble

 

$displaystyle {mathcal R}={A-QB mid Qinmathbb{K}[X]}, $

 

qui est donc un ensemble non vide de polynômes non nuls ; puis l'ensemble

 

$displaystyle E={deg R mid Rin{cal R}}, $

 

qui est un ensemble d'entiers positifs non vide. Cet ensemble $ E$ possède donc un plus petit élément $ d$  ; prenons un $ R$ dans $ cal R$ dont le degré soit $ d$ et enfin un $ Q$ tel que $ A-QB=R$ .

Nous devons vérifier que ces choix conviennent ; l'identité entre $ A$ , $ B$ , $ Q$ et $ R$ est claire, reste l'inégalité concernant les degrés. Vérifions-la par l'absurde, en supposant que $ deg Bledeg R$  ; notons $ e$ le degré de $ B$ et

 

$displaystyle B=b_eX^e+b_{e-1}X^{e-1}+cdots+b_0,quad R=r_dX^d+r_{d-1}X^{d-1}+cdots+r_0. $

 

Posons

 

$displaystyle Q_1=Q+frac{r_d}{b_e}X^{d-e}. $

 

Remarquons qu'en écrivant cette définition, on utilise l'hypothèse $ deg Bledeg R$ , qui justifie que $ X^{d-e}$ ait un sens, et simultanément le fait qu'on travaille dans un corps, qui justifie la possibilité de diviser par $ b_e$ .

Considérons alors

 

$displaystyle R_1=A-Q_1B=A-QB-left(frac{r_d}{b_e}X^{d-e}right)B, $

 

donc

 

$displaystyle R_{1}= R-left(b_eX^e+b_{e-1}X^{e-1}+cdots+b_0right) left(frac{r_d}{b_e}X^{d-e}right). $

 

Dans cette dernière écriture, on voit se simplifier les termes en $ X^d$ de $ R$ et du produit qu'on lui a soustrait, et on constate donc avoir obtenu un polynôme $ R_1$ de degré strictement plus petit que celui de $ R$ . Mais alors le degré de $ R_1$ est dans $ E$ et contredit l'hypothèse de minimisation qui a fait choisir $ d$ . Contradiction !

 

Unicité de $ (Q,R)$

 

Soient $ (Q_1,R_1)$ et $ (Q_2,R_2)$ deux couples vérifiant les deux conditions exigées dans l'énoncé du théorème.

On déduit de $ A=Q_1B+R_1=Q_2B+R_2$ que $ (Q_2-Q_1)B=R_1-R_2$ . Ainsi, $ R_1-R_2$ est un multiple de $ B$ . Des conditions $ deg R_1<deg B$ et$ deg R_2<deg B$ , on déduit que $ deg(R_1-R_2)<deg B$ .

Ainsi $ R_1-R_2$ est un multiple de $ B$ de degré strictement plus petit. La seule possibilité est que $ R_1-R_2$ soit nul. On en déduit $ R_1=R_2$ , puis, en allant reprendre l'égalité $ (Q_2-Q_1)B=R_1-R_2$ , que $ Q_1=Q_2$ .$ square$

 

 

Remarque : On a choisi d'énoncer ce théorème sur un corps commutatif pour faciliter sa mémorisation et parce que l'on n'aura presque jamais besoin d'un énoncé plus général. On aura toutefois besoin une fois de l'utiliser pour des polynômes sur un anneau ; remarquons donc que la démonstration montre que le résultat reste vrai sur un anneau commutatif quelconque à condition de supposer non seulement que $ B$ est non nul, mais même que son coefficient dominant est inversible : le seul endroit où on a utilisé qu'on s'était placé dans un corps commutatif a en effet été une division par ce coefficient dominant.

 

 

Exemple 2   Concrètement, on disposera les divisions euclidiennes de polynômes comme les divisions de nombres entiers. Par exemple, pour diviser $ P=X^2+X+1$ par $ Q=X-1$ , on écrit :

 

begin{displaymath} begin{array}{lvert l} begin{array}{l} X^2+X+1\ X^2-X ... ...ray}{l} X-1\ hline X+2\ \ \ \ end{array}end{array}end{displaymath}

 

Ce qui fournit la division euclidienne :

 

$displaystyle P=(X+2)Q-1. $

 

 

Nous définissons ensuite le pgcd. On ne donnera pas ici d'énoncés concernant le $ mathrm{ppcm}$ , non qu'il n'y en ait pas (ce sont là aussi les mêmes qu'en arithmétique des entiers) mais parce qu'ils ne semblent pas très importants. Les étudiants curieux les reconstitueront eux-mêmes.

 

 

Théorème 2   Soit $ mathbb{K}$ un corps commutatif. Soient $ A$ et $ B$ deux polynômes de $ mathbb{K}[X]$ . Il existe un unique polynôme unitaire $ D$ de $ mathbb{K}[X]$ tel que pour tout polynôme $ P$de $ mathbb{K}[X]$ , $ P$ divise $ A$ et $ B$ si et seulement si $ P$ divise $ D$ .

De plus il existe deux polynômes $ S$ et $ T$ de $ mathbb{K}[X]$ tels que $ D=SA+TB$ (identité de Bézout).

 

Et tant qu'on y est avant de passer aux démonstrations :

 

 

Définition 10   Le plus grand commun diviseur de deux polynômes $ A$ et $ B$ est le polynôme unitaire $ D$ apparaissant dans l'énoncé du théorème précédent.

 

 

 

Notation 7   Le plus grand commun diviseur de $ A$ et $ B$ sera noté $ mathrm{pgcd}(A,B)$ .

 

Comme pour les entiers, plusieurs démonstrations sont possibles ; on ne donne que celle basée sur l'algorithme d'Euclide.

 


Démonstration : La démonstration est une récurrence sur le degré de $ B$ .

Merveilles du copier-coller, voici de nouveau un «résumé de la preuve»  sous forme de programme informatique récursif (le même que pour l'arithmétique des entiers) :

 

Début du programme

* Pour $ B=0$ , $ mathrm{pgcd}(A,0)=A/{}$ coefficient dominant de $ A$ .

* Soit $ R$ le reste de la division euclidienne de $ A$ par $ B$ .

Les diviseurs communs de $ A$ et $ B$ sont ceux de $ B$ et $ R$ .

D'où : $ mathrm{pgcd}(A,B)=mathrm{pgcd}(B,R)$ .

Fin du programme

 

Et voici, toujours par les vertus du copier-coller, la preuve récurrente formelle. On va démontrer par «récurrence forte»  sur le degré $ d$ de $ B$ l'hypothèse $ (H_d)$ suivante :

$ (H_{d})$ Pour tout polynôme $ A$ et tout polynôme $ B$ de degré $ d$ , il existe deux polynômes $ S$ et $ T$ tels que, pour tout polynôme $ P$ , $ P$ divise $ A$ et $ B$ si et seulement si $ P$ divise $ SA+TB$ .

Vérifions $ (H_{-infty})$ .

Il s'agit donc de traiter le cas où $ B=0$ . Soit $ A$ un polynôme ; tout polynôme $ P$ qui divise $ A$ divise aussi $ B=0$ puisque $ 0P=0$ . Pour tout $ P$ , $ P$ divise $ A$ et 0 si et seulement si $ P$ divise $ A$ . Prenons alors $ S=1$ et $ T=0$  : on a donc bien pour tout $ P$  : $ P$ divise $ A$ et 0 si et seulement si $ P$ divise $ SA+Ttimes 0$ .

 

Soit $ d$ un entier fixé. Supposons la propriété $ (H_c)$ vraie pour tout $ c$ strictement inférieur à $ d$ et montrons $ (H_d)$ .

Soient $ A$ un polynôme et $ B$ un polynôme de degré $ d$ . Notons $ A=BQ+R$ la division euclidienne de $ A$ par $ B$ (qu'on peut réaliser puisque $ Bnot=0$ ).

Vérifions l'affirmation intermédiaire suivante : pour tout $ P$ , $ P$ est un diviseur commun de $ A$ et $ B$ si et seulement si $ P$ est un diviseur commun de $ B$ et $ R$ . (Avec des mots peut-être plus lisibles : «les diviseurs communs de $ A$ et $ B$ sont les mêmes que ceux de $ B$ et $ R$ »).

Soit $ P$ un diviseur commun de $ A$ et $ B$ , alors $ P$ divise aussi $ R=A-BQ$  ; réciproquement soit $ P$ un diviseur commun de $ B$ et $ R$ , alors $ P$ divise aussi $ A=BQ+R$ .

L'affirmation intermédiaire est donc démontrée.

 

On peut alors appliquer l'hypothèse de récurrence $ (H_{deg R})$ (puisque précisément $ deg R < deg B$ ) en l'appliquant au polynôme $ B$ .

On en déduit qu'il existe deux polynômes $ S_1$ et $ T_1$ tels que pour tout $ P$ , $ P$ divise $ B$ et $ R$ si et seulement si $ P$ divise $ S_1 B+T_1 R$ .

Remarquons enfin que $ S_1 B+T_1R=S_1 B+T_1(A-BQ)=T_A A+(S_1-Q)B$ , et qu'ainsi, si on pose $ S=T_A$ et $ T=S_1-Q$ on a bien prouvé que, pour tout $ P$$ P$ divise $ Q$ et $ B$ si et seulement si $ P$ divise $ SA+TB$ .

$ (H_d)$ est donc démontrée.

 

On a donc bien prouvé $ (H_d)$ pour tout $ dinmathbb{N}cup{-infty}$ .

 

Une fois qu'on en est arrivé là, il ne reste donc plus qu'à montrer que pour un polynôme $ P$ (le polynôme $ SA+TB$ ) il existe un unique $ D$ unitaire tel que $ Q$ divise $ P$ si et seulement si $ Q$ divise $ D$ . L'existence est claire : comme le résumé le suggère, on divise $ P$ par son coefficient dominant et on obtient un polynôme $ D$ unitaire ayant les mêmes diviseurs que $ P$ . Pour ce qui est de l'unicité, elle est évidente pour $ P$ nul ; on supposera $ P$ non nul. Soit maintenant $ D_1$ un polynôme unitaire ayant exactement les mêmes diviseurs que $ P$ . Alors comme $ P$ divise $ P$ , $ P$ divise $ D_1$ , et comme $ D_1$ divise $ D_1$ , $ D_1$ divise $ P$ . Les polynômes $ P$ et $ D_1$ se divisent donc mutuellement ; soit $ Q_1$ et $ Q_2$ les quotients respectifs de $ P$ par $ D_1$ et de $ D_1$ par $ P$ . En utilisant la formule calculant le degré d'un produit, on voit que forcément, $ P$ a même degré que $ D_1$ et que les polynômes $ Q_1$ et $ Q_2$ sont de degré nul, donc des constantes $ lambda_1$ et $ lambda_2$ . Soit $ a_d$ le coefficient dominant de $ P$  ; le coefficient dominant de $ Q_1D_1=P$ vaut$ lambda_1cdot 1$ donc $ lambda_1=a_d$ et $ D_1$ est égal à $ P/$ (coefficient dominant de $ P$ ), donc à $ D$ , ce qui prouve l'unicité.$ square$

 

Nous allons ensuite définir le pgcd d'un nombre fini de polynômes. En arithmétique des entiers, cette notion n'est pas primordiale ; en revanche dans les applications des raisonnements arithmétiques à des polynômes, on est souvent dans des cas où on s'intéresse à des pgcds de plus de deux polynômes à la fois.

L'énoncé donné ci-dessus pour deux polynômes se généralise à un nombre fini, par récurrence sur ce nombre.

 

 

Proposition 9   Soit $ mathbb{K}$ un corps commutatif, $ nge1$ un entier et $ A_{1}$ , $ A_{2}$ , ..., $ A_{n}$ des polynômes de $ mathbb{K}[X]$ . Il existe un unique polynôme unitaire $ D$ de $ mathbb{K}[X]$ tel que pour tout $ P$ dans $ mathbb{K}[X]$ , $ P$ divise tous les $ A_{i}$ de $ i=1$ à $ i=n$ si et seulement si $ P$ divise $ D$ .

De plus il existe $ n$ polynômes $ S_1,ldots,S_n$ tels que

 

$displaystyle D=S_1A_1+S_2A_2+cdots+S_nA_n $

 

(identité de Bézout).

 

 


Démonstration : C'est une récurrence facile sur $ n$ . Le cas $ n=2$ est l'objet du théorème précédent (et le cas $ n=1$ a été traité dans sa démonstration, ou on peut le ramener fictivement à $ n=2$ en disant que les diviseurs de $ A_1$ sont les diviseurs communs de $ A_1$ et de 0 ).

Soit $ nge 2$ fixé, supposons la proposition vraie pour tout ensemble de $ n$ polynômes. Prenons $ n+1$ polynômes $ A_1,A_2,ldots,A_{n+1}$ . Notons $ B$ le pgcd des $ n$ premiers, qui existe par l'hypothèse de récurrence. Alors les diviseurs communs de $ A_1$ , $ A_2$ , $ ldots$ , $ A_{n+1}$ sont les diviseurs communs de $ B$ et de $ A_{n+1}$  ; donc prendre$ D=mathrm{pgcd}(B,A_{n+1})$ répond à la question. L'unicité est claire : si $ D_1$ répondait aussi à la question, les diviseurs de $ D_1$ seraient exactement les mêmes que ceux de $ D$avec $ D$ et $ D_1$ tous deux unitaires, et comme dans la preuve du théorème précédent (ou en appliquant le théorème précédent à $ D$ et 0 ), on conclut que $ D=D_1$ . La relation de Bézout est aussi le résultat d'une récurrence immédiate : il existe $ S_1,S_2,ldots,S_n$ tels que $ B=S_1A_1+S_2A_2+cdots+S_nA_n$ et $ T_1$ et $ T_2$ tels que$ D=T_1B+T_2A_{n+1}$ donc

 

$displaystyle D=(T_1S_1)A_1+(T_1S_2)A_2+cdots+(T_1S_n)A_n+T_2A_{n+1}. $

 

$ square$

 

 

 

Définition 11   Soit $ mathbb{K}$ un corps commutatif et $ nge1$ un entier. On dira que $ n$ polynômes de $ mathbb{K}[X]$ sont premiers entre eux lorsque leurs seuls diviseurs communs sont constants (en d'autres termes, quand leur $ mathrm{pgcd}$ est $ 1$ ).

 

On prendra garde à ne pas confondre «premiers entre eux»  (on dit parfois «premiers entre eux dans leur ensemble») et «deux à deux premiers entre eux»  : dans $ mathbb{R}[X]$ , les polynômes

 

$displaystyle (X-1)(X-2);,quad(X-1)(X-3);,quad (X-2)(X-3) $

 

sont premiers entre eux (dans leur ensemble) mais ils ne sont pas deux à deux premiers entre eux.

Les polynômes irréductibles sont les analogues des nombres premiers. Toutefois les usages étant ce qu'ils sont, il y a une petite nuance de vocabulaire un peu désagréable : alors que le mot «nombre premier»  est réservé à des entiers positifs, le mot «polynôme irréductible»  n'est pas réservé à des polynômes unitaires. On se méfiera de cette peu perceptible nuance qui crée de légères discordances entre énoncés analogues portant les uns sur les polynômes et les autres sur les entiers.

 

 

Définition 12   Soit $ mathbb{K}$ un corps commutatif. On dira qu'un polynôme $ P$ dans $ mathbb{K}[X]$ est irréductible lorsqu'il possède exactement deux diviseurs unitaires.

 

On remarquera tout de suite que ces deux diviseurs unitaires sont alors forcément les polynômes $ 1$ et $ P/$ (coefficient dominant de $ P$ ).

La proposition suivante est évidente, mais donne un exemple fondamental de polynômes irréductibles :

 

 

Proposition 10   Soit $ mathbb{K}$ un corps commutatif. Dans $ mathbb{K}[X]$ , les polynômes du premier degré sont irréductibles.

 

 


Démonstration : Soit $ P=aX+b$ avec $ anot=0$ un polynôme du premier degré dans $ mathbb{K}[X]$ . Cherchons ses diviseurs unitaires. Un diviseur de $ P$ doit avoir un degré inférieur ou égal à celui de $ P$ . Le seul diviseur unitaire constant de $ P$ est le seul polynôme constant unitaire : la constante $ 1$ . Cherchons les diviseurs unitaires de la forme $ X+c$ de $ P$ . Si $ X+c$ divise $ P$ , il existe un polynôme $ Q$ tel que $ P=(X+c)Q$ et en comparant les degrés, $ Q$ est nécessairement constant. En comparant les coefficients dominants, nécessairement $ Q=a$ donc $ c=displaystylefrac{b}{a}$ . Ainsi $ P$ possède exactement un diviseur unitaire du premier degré, le polynôme $ X+displaystylefrac{b}{a}$ . Le polynôme $ P$est donc irréductible.$ square$

 

Sur un corps quelconque, déterminer quels polynômes sont irréductibles et lesquels ne le sont pas est un problème très sérieux ; dans quelques pages, nous verrons que ce problème a une solution simple dans les cas particuliers des polynômes à coefficients complexes ou réels.

 

Le résultat fondamental est, comme en arithmétique entière, l'existence et unicité de la décomposition en facteurs irréductibles. Elle repose là encore sur le «lemme de Gauss». On ne réécrit pas les démonstrations pour deux raisons totalement contradictoires : d'abord parce que ce sont exactement les mêmes, et ensuite parce que ce ne sont pas exactement les mêmes -une petite difficulté se pose pour énoncer l'unicité de la décomposition en facteurs irréductibles d'un polynôme. Pour des entiers, on a convenu de classer les facteurs dans l'ordre croissant : ainsi $ 6$ se décompose en $ 2cdot 3$ et non en $ 3cdot 2$ . Une telle convention ne peut être appliquée pour décomposer des polynômes, aucun ordre «raisonnable»  n'étant à notre disposition sur l'ensemble des polynômes irréductibles ; ainsi dans $ mathbb{C}[X]$ peut-on écrire selon la fantaisie du moment$ X^2+1=(X-mathrm{i})(X+mathrm{i})$ ou $ X^2+1=(X+mathrm{i})(X-mathrm{i})$ . Quand on énonce ci-dessous que la décomposition est «unique»  on sous-entend donc qu'on considère les deux exemples qui précèdent comme la même décomposition, ce qui peut s'énoncer rigoureusement mais lourdement. Voulant glisser sur ce détail, on se condamne à rester un peu vaseux.

 

Voici donc le lemme de Gauss.

 

 

Lemme 2   Soit $ mathbb{K}$ un corps commutatif. Soient $ A$ , $ B$ et $ C$ trois polynômes de $ mathbb{K}[X]$ . Si $ A$ divise $ BC$ et est premier avec $ C$ , alors $ A$ divise $ B$ .

 

 


Démonstration : La même que pour les entiers, avec des majuscules.$ square$

 

Et voici le théorème de décomposition en facteurs irréductibles.

 

 

Théorème 3 (Énoncé moyennement précis)   Soit $ mathbb{K}$ un corps commutatif. 
Tout polynôme $ P$ non nul de $ mathbb{K}[X]$ peut s'écrire de façon «unique»  en produit :

 

$displaystyle P=lambda P_1^{alpha_1}P_2^{alpha_2}cdots P_k^{alpha_k}, $

 

dans lequel $ lambda$ est le coefficient dominant de $ P$ , les $ P_i$ pour $ 1le ile k$ sont des polynômes irréductibles unitaires deux à deux distincts, et les $ alpha_i$ sont des entiers strictement positifs.

 

 


Démonstration : À peu près la même que pour les entiers, avec un peu plus de soin pour l'unicité.$ square$

 

 


          © UJF Grenoble, 2007  

Source : http://ljk.imag.fr/membres/Bernard.Ycart/mel/pf/node4.html

19:21 Publié dans Arithmétique des polynômes | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Idéal maximal

Idéal maximal

Richard Dedekind 1831-1916 formalisateur du concept d'idéal

Un idéal maximal est un concept associé à la théorie des anneaux en mathématiques et plus précisément en algèbre.

Un idéal d'un anneau est dit maximal si, et seulement si, il n'est contenu que dans exactement deux idéaux, lui-même et l'anneau tout entier. L'existence d'idéaux maximaux est assurée par le théorème de Krull.

Cette définition permet de généraliser la notion d'élément irréductible à des anneaux différents de celui des entiers relatifs. Certains de ces anneaux ont un rôle important en théorie algébrique des nombres et en géométrie algébrique.

Sommaire

 [masquer]

Motivations [modifier]

L'arithmétique demande parfois de travailler sur des anneaux complexes comme certains parmi les entiers algébriques. Les théorèmes habituellement utilisés pour bâtir la théorie, comme celui de la décomposition en facteurs premiers, n'est plus entièrement vérifié. Dans ce cas, l'unicité de la décomposition (à l'ordre et aux éléments inversibles près) n'est pas exacte.

Pour néanmoins pouvoir construire la théorie, un autre concept reste opérationnel : celui des idéaux. Les définitions valables pour les éléments, comme irréductiblepremierpremiers entre eux dans leur ensemblepgcd ou encore Plus petit commun multiple ont souvent des définitions équivalentes pour les anneaux.

La notion d'idéal maximal correspond à celle d'éléments irréductibles, largement utilisée dans la théorie des polynômes.

Définitions [modifier]

  • Un idéal maximal est un idéal tel qu'il existe exactement deux idéaux le contenant, lui-même et l'anneau entier.
  • Un élément irréductible est un élément non nul dont l'idéal engendré est maximal parmi les idéaux principaux propres.

La dernière définition est équivalente à la suivante:

  • Un élément irréductible est un élément tel que toute décomposition en deux facteurs contient un et un seul élément inversible.

Les anneaux ne possédant qu'un unique idéal maximal sont d'une importance particulière : ce sont les anneaux locaux. Ils sont en général obtenu après un processus de localisation qui consiste à rendre inversibles suffisamment d'éléments pour qu'il ne reste qu'un idéal maximal.

Exemples [modifier]

  • Les idéaux maximaux de l'anneau (euclidien, donc principalmathbb{Z} des entiers relatifs sont les idéaux de la forme pmathbb{Z}, pour p un nombre premier. Localiser cet anneau permet de définir les anneaux d'entiers p-adiques.
  • Si K est un corps commutatif, les idéaux maximaux de l'anneau (euclidien, donc principal) K[X] sont les idéaux engendrés par les polynômes irréductibles. Dans le cas où le corps est algébriquement clos (par exemple pour le corps des nombres complexes), ce sont les polynômes de degré 1. Localiser ces anneaux amène aux anneaux de séries formelles.
  • Dans le cas de l'anneau des polynômes à coefficients dans l'anneau des entiers relatifs, un polynôme irréductible n'engendre pas forcément un idéal maximal : l'idéal engendré par Xest strictement inclus dans celui engendré par 2 et X.

Propriétés [modifier]

Anneau quotient [modifier]

  • Un idéal I d'un anneau commutatif A est maximal si, et seulement si, l'anneau quotient AI est un corps.

En conséquence, tout idéal maximal est premier.

Cette propriété est largement utilisée en théorie de Galois, elle permet de définir des extensions algébriques.

Supposons que I soit maximal.

Montrons que tout élément x non nul de A / I est inversible. Un tel élément x du quotient est la classe d'un élément a de A qui n'appartient pas à I. Comme A est commutatif, I +a.A est un idéal. Comme cet idéal contient strictement I, il est égal à A. Cela signifie qu'il existe un élément i de I et un élément b de A tels que i + a.b = 1. Cette égalité montre que la classe x de a est inversible, d'inverse la classe de b. En conséquence, A / I est bien un corps.

Réciproquement, supposons que A / I soit un corps.

Montrons que tout idéal J de A contenant strictement I est égal à A. Un tel J contient un a n'appartenant pas à I. La classe de a est un élément inversible donc il existe un élément b de A et un élément i de I tels que i + a.b = 1. Cette égalité montre que 1 est élément de J et donc J est égal à A. En conséquence, I est bien maximal.

Anneau principal [modifier]

Dans le cas d'un anneau principal, les notions d'irréductibilité et de primalité sont confondues. Le théorème suivant s'applique:

  • Si A est principal les propositions suivantes sont équivalentes :
  • (i) I est un idéal premier
  • (ii) I est engendré par un élément p différent d'une unité et qui, s'il divise un produit a.b, divise soit a soit b.
  • (iii) I est engendré par un élément p différent d'une unité et qui n'a d'autres diviseurs que lui-même et 1 aux éléments inversibles près
  • (iv) I est maximal

La démonstration est donné dans l'article sur Idéal premier et anneau principal.

Théorème de Krull et éléments inversibles [modifier]

Dans un anneau commutatif, le théorème de Krull assure que tout idéal propre (c'est-à-dire différent de l'anneau tout entier) est inclus dans au moins un idéal maximal.

En conséquence, un élément de l'anneau est inversible si et seulement s'il n'appartient à aucun idéal maximal.

(En effet, un élément est non inversible si et seulement si l'idéal qu'il engendre est propre.)

 

Voir aussi [modifier]

Liens externes [modifier]

Références [modifier]

19:16 Publié dans Idéal maximal | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Primalité dans un anneau

Primalité dans un anneau

En algèbre commutative, dans un anneau intègre, un élément p est dit irréductible s'il n'est ni nul, ni inversible, ni produit de deux éléments non inversibles. Il est dit premier s'il n'est ni nul ni inversible et si, pour tout produit ab divisible par p, l'un des deux facteurs a ou b est divisible par p. Tout élément premier est irréductible. Dans un anneau factoriel (comme l'anneau des entiers ou l'anneau des polynômes à coefficients dans un corps), ces deux notions sont équivalentes.

Deux éléments a et b sont dits premiers entre eux si tout diviseur commun à a et b est inversible.

Sommaire

 [masquer]

Introduction [modifier]

Dans l'anneau des entiers, il existe différentes caractérisations des nombres premiers et des nombres premiers entre eux qui, dans un anneau quelconque, conduisent à trois couples de notions différentes. Dans la suite, A est un anneau commutatif unifère intègre et a, b, p sont des éléments de A. Un idéal de A est dit propre s'il est différent de A. La notation (a)désigne l'idéal principal engendré par a (c'est-à-dire l'ensemble des multiples de a).

Éléments premiers entre eux et élément irréductible [modifier]

  • On dit que a et b sont premiers entre eux ou que a est premier avec b si tout diviseur commun à a et b est inversible.

Conditions équivalentes :

  1. le PGCD de a et b (existe et) est égal à 1
  2. L'idéal (a)+(b)~ n’est inclus dans aucun idéal principal propre de A~.

Probablement par influence des polynômes, la notion suivante n'est pas baptisée "élément premier", mais "élément irréductible" :

  • On dit que p~ est irréductible s'il n'est ni nul ni inversible et s'il est premier avec tout élément qu'il ne divise pas.

Conditions équivalentes :

  1. p~ n'est ni nul, ni inversible, ni produit de deux éléments non inversibles
  2. p~ n'est ni nul ni inversible, et ses seuls diviseurs sont les inversibles ou les éléments associés à p~
  3. (p)~ est non nul, et maximal dans l’ensemble des idéaux principaux propres de A~.

Éléments indissolubles entre eux et élément premier [modifier]

  • On dit que a et b sont indissolubles entre eux (ou "premiers entre eux au sens de Gauss") si pour tout élément x de A,
si a divise bx alors a divise x.

Conditions équivalentes (d'après les deux dernières, cette notion est donc symétrique en a et b) :

  1. b est simplifiable (ou : non diviseur de 0) dans l'anneau quotient A/(a)
  2. tout multiple de a et b est multiple de ab
  3. le PPCM de a et b (existe et) est égal au produit ab.

La définition correspondante est alors :

  • p est dit premier (ou indissoluble) s'il est non nul, non inversible, et indissoluble avec tout élément qu'il ne divise pas.

Conditions équivalentes :

  1. p est non nul, non inversible, et pour tout produit ab divisible par p, l'un des facteurs a ou b est divisible par p
  2. p est non nul et A / (p) est intègre
  3. (p) est un idéal premier non nul de A.

Éléments étrangers et élément extrémal [modifier]

La notion d'éléments étrangers correspond à la caractérisation des nombres premiers entre eux par le théorème de Bachet-Bézout.

  • On dit que a et b sont étrangers s'il existe des éléments u et v de A tels que au+bv=1, condition qui s'écrit aussi sous la forme (a)+(b)=A.

La définition correspondante est alors :

  • On dit que p est extrémal s'il est non nul, non inversible, et étranger à tout élément qu'il ne divise pas.

Conditions équivalentes :

  1. p est non nul et non inversible, et tout élément de A non multiple de p est inversible modulo p
  2. (p) est un idéal maximal non nul de A
  3. p est non nul et A/(p) est un corps.

Liens entre ces trois notions [modifier]

Dans les contre-exemples ci-dessous, K désigne un corps et A le sous-anneau de K[X,Y] formé des polynômes dont chaque monôme est de degré total pair.

  • étrangers => indissolubles entre eux => premiers entre eux.
    Les réciproques sont fausses :
    Dans K[X,Y]~X~ et Y~ sont indissolubles entre eux mais pas étrangers.
    Dans A~XY~ et X^2~ sont premiers entre eux mais pas indissolubles entre eux (car XY~ divise X^2Y^2~ mais pas Y^2~).
  • extrémal => premier => irréductible.
    Les réciproques sont fausses :
    Dans K[X,Y]~X~ est premier non extrémal.
    Dans A~XY~ est irréductible mais non premier (il divise X^2Y^2~ mais ni X^2~, ni Y^2~).
  • Dans un anneau de Gauss (anneau où tout couple d'éléments possède un PGCD), et donc en particulier dans un anneau factorielpremiers entre eux équivaut à indissolubles entre eux (donc irréductible équivaut à premier).
  • Dans un anneau de Bézout (anneau commutatif unitaire intègre dans lequel tout idéal de type fini est principal), et donc en particulier dans un anneau principal (comme mathbb{Z}~ ou K[X]~), les trois notions (étrangersindissolubles entre euxpremiers entre eux) sont équivalentes (donc irréductible équivaut à premier équivaut à extrémal).

Bibliographie [modifier]

Serge LangAlgèbre [détail des éditions]

19:15 Publié dans Primalité dans un anneau | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook