Ok

En poursuivant votre navigation sur ce site, vous acceptez l'utilisation de cookies. Ces derniers assurent le bon fonctionnement de nos services. En savoir plus.

14/02/2011

Multiplicateurs de Lagrange

Multiplicateurs de Lagrange

Dans mathématique optimisation problèmes, la méthode de Multiplicateurs de Lagrange, appelé ensuite Joseph Louis Lagrange, est une méthode pour trouver extrema d'a fonction de plusieurs variables sujet à un ou plusieurs contraintes; c'est l'outil de base dans l'optimisation contrainte non-linéaire.

Simplement mise, la technique peut déterminer où sur un ensemble particulier de points (tels qu'a cerclesphère, ou avion) une fonction particulière est la plus petite (ou la plus grande).

Plus formellement, les multiplicateurs de Lagrange calculent points stationnaires de la fonction contrainte. Par Le théorème de Fermat, les extrema se produisent à ces points, ou sur la frontière, ou aux points où la fonction n'est pas différentiable.

Il réduit la conclusion points stationnaires d'une fonction contrainte dedans n variables avec k contraintes à trouver les points stationnaires d'une fonction sans contrainte dedans n+k variables. La méthode présente une nouvelle variable scalaire inconnue (appelée le multiplicateur de Lagrange) pour chaque contrainte, et définit une nouvelle fonction (appelée Lagrangien) en termes de fonction originale, contraintes, et multiplicateurs de Lagrange.

Introduction

Considérez un cas bidimensionnel. Supposez que nous avons une fonction f(X,y) nous souhaitons maximiser ou réduire au minimum sujet à la contrainte

là où c est une constante. Nous pouvons visualiser découpes de f donné près

pour différentes valeurs de dn, et la découpe de g donné près g(X,y) = c.

Supposez que nous marchons suivant la ligne de découpe avec g = c. En général les lignes de découpe de f et g peut être distinct, ainsi traversant la ligne de découpe pour g = c a pu intersecter avec ou croiser les lignes de découpe de f. C'est équivalent à dire cela tout en se déplaçant suivant la ligne de découpe pour g = c la valeur de f peut changer. Seulement quand la ligne de découpe pour g = c lignes de découpe de contacts de f tangentiellement, nous n'augmentons pas ou ne diminuons pas la valeur de f qu'est, quand les lignes contact de découpe mais ne croisent pas.

Ceci se produit exactement quand composant tangentiel du dérivé total disparaît : , qui est au contraint points stationnaires de f(qui incluent les extrema locaux contraints, supposer f est différentiable). Informatique, c'est quand le gradient de f est normal aux contraintes : quand pour une certaine grandeur scalaire λ. Notez que la constante λ est exigé parce que, quoique les directions des deux vecteurs de gradient soient égales, les importances des vecteurs de gradient sont pas égale le plus susceptible.

Un exemple familier peut être obtenu à partir des cartes de temps, avec le leur lignes de découpe pour la température et la pression : les extrema contraints se produiront où les cartes superposées montrent les lignes émouvantes (lignes isoplèthes).

Géométriquement nous traduisons l'état de tangence à dire cela gradients de f et g sont les vecteurs parallèles au maximum, puisque les gradients sont toujours normaux aux lignes de découpe. Ainsi nous voulons des points (X,y) là où , et, de plus,g(X,y) = c. Pour incorporer ces deux conditions à une équation, nous présentons une grandeur scalaire inconnue, λ, et résolvez

avec

et

Justification

Comme discuté ci-dessus, nous recherchons les points stationnaires de f vu tout en voyageant sur l'ensemble de niveau g(X,y) = c. Ceci se produit au moment même où le gradient de f n'a aucun composant tangentiel aux ensembles de niveau de g. Cette condition est équivalente à pour certains λ. Points stationnaires (X,y, λ) de F satisfaites également g(X,y) = c comme peut être vu en considérant le dérivé en ce qui concerne λ.

Avertissement : extrema contre les points stationnaires

Rendez-vous compte que les solutions sont points stationnaires du lagrangien F, et soyez points de selle: ils ne sont pas nécessairement extrema de FF est illimité : donné un point (X,y) cela ne se trouve pas sur la contrainte, laissant marques Farbitrairement grand ou petit. Cependant, dans certaines prétentions plus fortes, car nous verrons au-dessous deprincipe lagrangien fort se tient, dont déclare que les maximum f maximisez le lagrangien globalement.

Une formulation plus générale : Le principe lagrangien faible

Dénotez la fonction objective près et laissez les contraintes soit donné près , peut-être par des constantes en mouvement vers la gauche, en tant que dedans . Le domaine de f devrait être un ensemble ouvert contenant tous les points satisfaisant les contraintes. En outre, f et gk doit avoir les premiers dérivés partiels continus et les gradients du gk nécessité ne pas être zéro sur le domaine.[1]Maintenant, définissez le lagrangien, Λ, As

k est un index pour des variables et des fonctions liées à une contrainte particulière, k.
sans indice inférieur indique le vecteur avec des éléments , qui sont pris pour être des variables indépendantes.

Observez que les critères et des contraintes d'optimisation gk(X) sont de manière compacte codés en tant que points stationnaires du lagrangien :

si et seulement si
moyens de prendre le gradient seulement en ce qui concerne chaque élément dans le vecteur , au lieu de toutes les variables.

et

implique gk = 0.

Collectivement, les points stationnaires du lagrangien,

,

donnez un certain nombre d'équations uniques se montant à la longueur de plus la longueur de . Ceci souvent marques il possible de résoudre pour le chaque X et λk, sans inverser gk.[1] Pour cette raison, la méthode de multiplicateur de Lagrange peut être utile dans les situations où il est plus facile de trouver des dérivés des fonctions de contrainte que pour les inverser.

Interprétation de λi

Souvent les multiplicateurs de Lagrange ont une interprétation en tant que certaine quantité saillante d'intérêt. Pour voir pourquoi ceci pourrait être le cas, observez cela :

Ainsi, λk est le taux de changement de la quantité étant optimisée en fonction de la variable de contrainte. Comme exemples, dedans Mécanique lagrangienne les équations du mouvement sont dérivées en trouvant les points stationnaires du action, l'intégrale de temps de la différence entre l'énergie cinétique et potentielle. Ainsi, la force sur une particule due à un potentiel scalaire, , peut être interprété comme multiplicateur de Lagrange déterminant le changement de l'action (transfert de potentiel à l'énergie cinétique) suivant une variation de la trajectoire contrainte des particules. Dans les sciences économiques, le bénéfice optimal à un joueur est calculé sujet à un espace contraint des actions, où un multiplicateur de Lagrange est la valeur de détendre une contrainte donnée (par exemple. par le corruption ou d'autres moyens).

La méthode de multiplicateurs de Lagrange est généralisée par États de Karush-Kuhn-Tucker.

Exemples

Exemple très simple

Supposez-toi souhaiter maximiser f(X,y) = X + y sujet à la contrainte X2 + y2 = 1. La contrainte est le cercle d'unité, et ensembles de niveau de f sont les lignes diagonales (avec pente -1), ainsi on peut voir graphiquement que le maximum se produit à (et le minimum se produit à

Formellement, ensemble g(X,y) = X2 + y2 − 1, et

Λ (X,y, λ) = f(X,y) + λg(X,y) = X + y + λ (X2 + y2 − 1)

Placez le dérivé dΛ = 0, qui rapporte le système des équations :

En tant que toujours, l'équation est la contrainte originale.

Combinaison des deux premiers rendements d'équations X = y (explicitement, (autrement (i) rapporte 1 = 0), ainsi un peut résoudre pour λ, rapportant λ = − 1/(2X), dans lequel on peut substituer (ii)).

La substitution dans (iii) rapporte 2X2 = 1, ainsi et les points stationnaires sont et . Évaluation de la fonction objective f sur ces rendements

ainsi le maximum est , au lequel est atteint et le minimum est , au lequel est atteint .

Exemple simple

Supposez que vous voulez trouver les valeurs maximum pour

dans la condition qui X et y les coordonnées se trouvent sur le cercle autour de l'origine avec le rayon √3, c'est-à-dire,

Car il y a juste un état simple, nous emploierons seulement un multiplicateur, disons le λ.

Employez la contrainte pour définir une fonction g(Xy):

La fonction g est identiquement zéro sur le cercle du rayon √3. Tellement tout multiple de g(Xy) peut être ajouté à f(Xy) partantf(Xy) sans changement dans la région d'intérêt (au-dessus du cercle où notre contrainte originale est satisfaite). Laissé

Les valeurs critiques de Λ produisez-vous quand son gradient est zéro. Les dérivés partiels sont

L'équation (iii) est juste la contrainte originale. L'équation (i) implique X = 0 ou λ = −y. Dans le premier cas, si X = 0 alors nous devons avoir par (iii) et puis par (ii) λ=0. Dans le deuxième cas, si λ = −y et substituant dans l'équation (ii) nous avons cela,

Puis X2 = 2y2. Substitution dans l'équation (iii) et solution pour y donne cette valeur de y:

Ainsi il y a six points critiques :

Évaluant l'objectif à ces points, nous trouvons

Par conséquent, la fonction objective atteint a maximum global (en ce qui concerne les contraintes) à et a minimum global à Le point est a minimum local et est a maximum local.

Exemple : entropie

Supposez que nous souhaitons trouver le discret distribution de probabilité avec maximal entropie de l'information. Puis

Naturellement, la somme de ces probabilités égale 1, ainsi notre contrainte est g(p) = 1 avec

Nous pouvons employer des multiplicateurs de Lagrange pour trouver le point de l'entropie maximum (selon les probabilités). Pour tous k de 1 à n, nous avons besoin de cela

ce qui donne

Mise en oeuvre de la différentiation de ces derniers n des équations, nous obtenons

Ceci montre cela tout pi soyez égal (parce qu'ils dépendent du λ seulement). En employant le ∑ de contraintek pk = 1, nous trouvons

Par conséquent, la distribution uniforme est la distribution avec la plus grande entropie.

Sciences économiques

L'optimisation contrainte joue un rôle central dedans sciences économiques. Par exemple, le problème bien choisi pour aconsommateur est représenté en tant qu'un d'a de maximum fonction de service sujet à a contrainte de budget. Le multiplicateur de Lagrange a une interprétation économique en tant que prix virtuel lié à la contrainte, dans ce cas-ci utilité marginale de revenu.

Le principe lagrangien fort : Dualité de Lagrange

A donné optimisation convexe problème sous le format standard

avec le domaine avoir l'intérieur non vide, Fonction lagrangienne est défini As

Les vecteurs λ et ν s'appellent variables duelles ou Vecteurs de multiplicateur de Lagrange lié au problème. Lagrange à 2 modes de fonctionnement est défini As

L'à 2 modes de fonctionnement g est concave, même lorsque le problème initial n'est pas convexe. Les limites inférieures de rendements à 2 modes de fonctionnement sur la valeur optimale p * du problème initial ; pour quels et quels ν nous avons . Si une qualification de contrainte telle que l'état du couvreur se tient et le problème original est convexe, alors nous avons la dualité forte, c.-à-d. .

Voyez également

Références

  1. a b Gluss, David et Weisstein, Eric W., Multiplicateur de Lagrange à MathWorld.

Liens externes

Pour des références au travail original de Lagrange et pour un compte de la terminologie voyez l'entrée de multiplicateur de Lagrange dedans

Exposition

Pour le texte additionnel et les applet interactifs

Source : http://www.worldlingo.com/ma/enwiki/fr/Lagrange_multipliers

Table des matières

20:23 | Lien permanent | Commentaires (0) | |  del.icio.us | | Digg! Digg |  Facebook

Les commentaires sont fermés.