fbpx
维基百科

拉格朗日乘数

拉格朗日乘数法(英語:Lagrange multiplier,以数学家约瑟夫·拉格朗日命名),在数学中的最优化问题中,是一种寻找多元函数在其变量受到一个或多个条件的约束时的局部极值的方法。这种方法可以将一个有n个变量与k个约束条件的最优化问题转换为一个解有n + k个变量的方程组的解的问题。这种方法中引入了一个或一组新的未知数,即拉格朗日乘数,又称拉格朗日乘子,或拉氏乘子,它们是在转换后的方程,即约束方程中作为梯度(gradient)的线性组合中各个向量的系数。

图1:绿线标出的是约束g(x,y) = c的点的轨迹。蓝线是f的等高线。箭头表示梯度,和等高线的法线平行。

比如,要求时的局部極值时,我们可以引入新变量拉格朗日乘数,这时我们只需要求下列拉格朗日函数的局部极值:

更一般地,对含n个变量和k个约束的情况,有:

拉格朗日乘数法所得的臨界點会包含原问题的所有臨界點,但并不保证每个拉格朗日乘數法所得的臨界點都是原问题的臨界點。拉格朗日乘数法的正确性的证明牵涉到偏微分全微分連鎖律

介绍 编辑

微积分中最常见的问题之一是求一个函数的极大极小值(极值)。但是很多时候找到极值函数的显式表达是很困难的,特别是当函数有先决条件或约束时。拉格朗日乘数则提供了一个非常便利方法来解决这类问题,而避开显式地引入约束和求解外部变量。

先看一个三维的例子:假设有函数: ,要求其极值(最大值/最小值),且满足条件

 

c为常数。對不同 的值,不难想像出

 

的等高线。而方程 的可行集所构成的线正好是 。想像我们沿着 的可行集走;因为大部分情况下 的等高线和 的可行集线不会重合,但在有解的情况下,这两条线会相交。想像此时我们移动 上的点,因为 是连续的方程,我们因此能走到 更高或更低的等高线上,也就是说 可以变大或变小。只有当  相切,也就是说,此时,我们正同时沿着  走。这种情况下,会出现极值鞍点

气象图中就很常出现这样的例子,当温度和气压两列等高线同时出现的时候,切点就意味着约束极值的存在。

向量的形式来表达的话,我们说相切的性质在此意味着  的切线在某点上平行,同时也意味着两者的梯度向量有如下关系(引入一个未知标量 ):

 

即:

 .

一旦求出 的值,将其套入下式,易求在无约束条件下的极值和对应的极值点。

  =  

新方程 在达到极值时与 相等。因为 达到极值时 ,而 ,也就是说 等于零。

证明 编辑

设函数  点处有极值 ,且在 点的邻域内连续。则在 点处有

 

另有一常值函数

 

两函数在 点处的全微分为

 
 

當中的等式右方等於零是由於極值會發生在兩者函數斜率完全相同且 在區段內有極值的時候

由于  是任取的无穷小量,故该线性方程组的系数成比例,有

 

 
 

将上二式分别乘以  ,再相加并积分,得到一新函数

 

那么,求原函数极值的问题就转化为求该函数极值的问题。

类似地,这种求极值的方法也可以推广到多维函数 

拉格朗日乘数的运用方法 编辑

f定义为在Rn上的方程,约束为gk(x)= ck(或将约束左移得到gk(x) − ck = 0)。定义拉格朗日Λ

 

注意极值的条件和约束现在就都被记录到一个式子里了:

 

 

拉格朗日乘数常被用作表达最大增长值。原因是从式子:

 

中我们可以看出λk是当方程在被约束条件下,能够达到的最大增长率。拉格朗日力学就使用到这个原理。

拉格朗日乘数法在卡罗需-库恩-塔克条件被推广。

例子 编辑

  • 很简单的例子

求此方程的最小值:

 

同时未知数满足

 

因为只有一个未知数的限制条件,我们只需要用一个乘数 .

 
 

将所有 方程的偏微分设为零,得到一个方程组,最小值是以下方程组的解中的一个:

 
 
 
  • 另一个例子

求此离散分布的最大

 

所有概率的总和是1,因此我们得到的约束是g(p)= 1即

 

可以使用拉格朗日乘数找到最高熵(概率的函数)。对于所有的k从1到n,要求

 

由此得到

 

计算出这n个等式的微分,我们得到:

 

这说明pi都相等(因为它们都只是λ的函数)。解出约束∑k pk = 1,得到

 

因此,使用均匀分布可得到最大熵的值。

经济学 编辑

约束最优化在经济学占有很重要的地位。例如一个消费者的选择问题可以被视为一个求效用方程预算约束下的最大值问题。拉格朗日乘数在经济学中被解释为影子价格,设定在某种约束下,在这里即收入的边际效用

拉格朗日乘数就是效用函数在最优解处对收入的偏导数,也就是在最优解处增加一个单位收入带来的效用增加,或者说在最优解处有效用衡量收入的价值,称之为收入的边际效用。

在企业生产问题中,拉格朗日乘数用来衡量要素投入变动所带来的收入变动,du/dm=λ,u表示效用函数或生产函数,m表示收入或要素投入。

在具体数学推导中还可以运用包络定理的内容。

参考 编辑

对外链接 编辑

参考拉格朗日原作或方法的命名:

    更深入的介绍和互动applet:

    • Conceptual introduction (页面存档备份,存于互联网档案馆) (概念介绍和对于拉格朗日乘数方法在变分法以及物理中的运用)
    • Lagrange Multipliers without Permanent Scarring (页面存档备份,存于互联网档案馆) (tutorial by Dan Klein)

    拉格朗日乘数, 此條目過於依赖第一手来源, 2019年5月14日, 请補充第二手及第三手來源, 以改善这篇条目, 此條目需要精通或熟悉相关主题的编者参与及协助编辑, 2014年7月22日, 請邀請適合的人士改善本条目, 更多的細節與詳情請參见討論頁, 英語, lagrange, multiplier, 以数学家约瑟夫, 拉格朗日命名, 在数学中的最优化问题中, 是一种寻找多元函数在其变量受到一个或多个条件的约束时的局部极值的方法, 这种方法可以将一个有n个变量与k个约束条件的最优化问题转换为一个解有n, k个变量的. 此條目過於依赖第一手来源 2019年5月14日 请補充第二手及第三手來源 以改善这篇条目 此條目需要精通或熟悉相关主题的编者参与及协助编辑 2014年7月22日 請邀請適合的人士改善本条目 更多的細節與詳情請參见討論頁 拉格朗日乘数法 英語 Lagrange multiplier 以数学家约瑟夫 拉格朗日命名 在数学中的最优化问题中 是一种寻找多元函数在其变量受到一个或多个条件的约束时的局部极值的方法 这种方法可以将一个有n个变量与k个约束条件的最优化问题转换为一个解有n k个变量的方程组的解的问题 这种方法中引入了一个或一组新的未知数 即拉格朗日乘数 又称拉格朗日乘子 或拉氏乘子 它们是在转换后的方程 即约束方程中作为梯度 gradient 的线性组合中各个向量的系数 图1 绿线标出的是约束g x y c的点的轨迹 蓝线是f的等高线 箭头表示梯度 和等高线的法线平行 比如 要求f x y displaystyle f x y 在g x y 0 displaystyle g x y 0 时的局部極值时 我们可以引入新变量拉格朗日乘数l displaystyle lambda 这时我们只需要求下列拉格朗日函数的局部极值 L x y l f x y l g x y displaystyle mathcal L x y lambda f x y lambda cdot g x y 更一般地 对含n个变量和k个约束的情况 有 L x1 xn l1 lk f x1 xn i 1kligi x1 xn displaystyle mathcal L left x 1 ldots x n lambda 1 ldots lambda k right f left x 1 ldots x n right sum limits i 1 k lambda i g i left x 1 ldots x n right 拉格朗日乘数法所得的臨界點会包含原问题的所有臨界點 但并不保证每个拉格朗日乘數法所得的臨界點都是原问题的臨界點 拉格朗日乘数法的正确性的证明牵涉到偏微分 全微分或連鎖律 目录 1 介绍 2 证明 3 拉格朗日乘数的运用方法 4 例子 5 经济学 6 参考 7 对外链接介绍 编辑微积分中最常见的问题之一是求一个函数的极大极小值 极值 但是很多时候找到极值函数的显式表达是很困难的 特别是当函数有先决条件或约束时 拉格朗日乘数则提供了一个非常便利方法来解决这类问题 而避开显式地引入约束和求解外部变量 先看一个三维的例子 假设有函数 f x y displaystyle f x y nbsp 要求其极值 最大值 最小值 且满足条件 g x y c displaystyle g left x y right c nbsp c为常数 對不同dn displaystyle d n nbsp 的值 不难想像出 f x y dn displaystyle f left x y right d n nbsp 的等高线 而方程g displaystyle g nbsp 的可行集所构成的线正好是g x y c displaystyle g x y c nbsp 想像我们沿着g c displaystyle g c nbsp 的可行集走 因为大部分情况下f displaystyle f nbsp 的等高线和g displaystyle g nbsp 的可行集线不会重合 但在有解的情况下 这两条线会相交 想像此时我们移动g c displaystyle g c nbsp 上的点 因为f displaystyle f nbsp 是连续的方程 我们因此能走到f x y dn displaystyle f left x y right d n nbsp 更高或更低的等高线上 也就是说dn displaystyle d n nbsp 可以变大或变小 只有当g x y c displaystyle g x y c nbsp 和f x y dn displaystyle f left x y right d n nbsp 相切 也就是说 此时 我们正同时沿着g x y c displaystyle g x y c nbsp 和f x y dn displaystyle f left x y right d n nbsp 走 这种情况下 会出现极值或鞍点 气象图中就很常出现这样的例子 当温度和气压两列等高线同时出现的时候 切点就意味着约束极值的存在 用向量的形式来表达的话 我们说相切的性质在此意味着f displaystyle f nbsp 和g displaystyle g nbsp 的切线在某点上平行 同时也意味着两者的梯度向量有如下关系 引入一个未知标量l displaystyle lambda nbsp f x y l g x y c displaystyle nabla f left x y right lambda nabla left g left x y right c right nbsp 即 f x y l g x y c 0 displaystyle nabla Big f left x y right lambda left g left x y right c right Big boldsymbol 0 nbsp 一旦求出l displaystyle lambda nbsp 的值 将其套入下式 易求在无约束条件下的极值和对应的极值点 F x y l displaystyle F left x y lambda right nbsp f x y l g x y c displaystyle f left x y right lambda left g left x y right c right nbsp 新方程F x y l displaystyle F x y lambda nbsp 在达到极值时与f x y displaystyle f x y nbsp 相等 因为F x y l displaystyle F x y lambda nbsp 达到极值时 F x y l 0 displaystyle nabla F x y lambda 0 nbsp 而 F l g x y c displaystyle frac partial F partial lambda g left x y right c nbsp 也就是说g x y c displaystyle g x y c nbsp 等于零 证明 编辑设函数f x y displaystyle f x y nbsp 在A displaystyle A nbsp 点处有极值k displaystyle kappa nbsp 且在A displaystyle A nbsp 点的邻域内连续 则在A displaystyle A nbsp 点处有 f x y k displaystyle f left x y right kappa nbsp 另有一常值函数 g x y c displaystyle g left x y right c nbsp 两函数在A displaystyle A nbsp 点处的全微分为 df f xdx f ydy 0 displaystyle mathrm d f frac partial f partial x mathrm d x frac partial f partial y mathrm d y 0 nbsp dg g xdx g ydy 0 displaystyle mathrm d g frac partial g partial x mathrm d x frac partial g partial y mathrm d y 0 nbsp 當中的等式右方等於零是由於極值會發生在兩者函數斜率完全相同且f x y displaystyle f left x y right nbsp 在區段內有極值的時候由于dx displaystyle mathrm d x nbsp 和dy displaystyle mathrm d y nbsp 是任取的无穷小量 故该线性方程组的系数成比例 有 f x g x f y g y l displaystyle dfrac dfrac partial f partial x dfrac partial g partial x dfrac dfrac partial f partial y dfrac partial g partial y lambda nbsp 即 f x l g x 0 displaystyle frac partial f partial x lambda cdot frac partial g partial x 0 nbsp f y l g y 0 displaystyle frac partial f partial y lambda cdot frac partial g partial y 0 nbsp 将上二式分别乘以dx displaystyle mathrm d x nbsp 和dy displaystyle mathrm d y nbsp 再相加并积分 得到一新函数 L x y l f x y l g x y displaystyle mathcal L x y lambda f x y lambda cdot g x y nbsp 那么 求原函数极值的问题就转化为求该函数极值的问题 类似地 这种求极值的方法也可以推广到多维函数f x1 xn displaystyle f left x 1 ldots x n right nbsp 拉格朗日乘数的运用方法 编辑如f定义为在Rn上的方程 约束为gk x ck 或将约束左移得到gk x ck 0 定义拉格朗日L为 L x l f klk gk ck displaystyle Lambda mathbf x boldsymbol lambda f sum k lambda k g k c k nbsp 注意极值的条件和约束现在就都被记录到一个式子里了 L 0 f klk gk displaystyle nabla Lambda 0 Leftrightarrow nabla f sum k lambda k nabla g k nbsp 和 lL 0 gk ck displaystyle nabla mathbf lambda Lambda 0 Leftrightarrow g k c k nbsp 拉格朗日乘数常被用作表达最大增长值 原因是从式子 L ck lk displaystyle frac partial Lambda partial c k lambda k nbsp 中我们可以看出lk是当方程在被约束条件下 能够达到的最大增长率 拉格朗日力学就使用到这个原理 拉格朗日乘数法在卡罗需 库恩 塔克条件被推广 例子 编辑很简单的例子求此方程的最小值 f x y x2y displaystyle f x y x 2 y nbsp 同时未知数满足 x2 y2 1 displaystyle x 2 y 2 1 nbsp 因为只有一个未知数的限制条件 我们只需要用一个乘数l displaystyle lambda nbsp g x y x2 y2 1 displaystyle g x y x 2 y 2 1 nbsp F x y l f x y lg x y x2y l x2 y2 1 displaystyle Phi x y lambda f x y lambda g x y x 2 y lambda x 2 y 2 1 nbsp 将所有F displaystyle Phi nbsp 方程的偏微分设为零 得到一个方程组 最小值是以下方程组的解中的一个 2xy 2lx 0 displaystyle 2xy 2 lambda x 0 nbsp x2 2ly 0 displaystyle x 2 2 lambda y 0 nbsp x2 y2 1 0 displaystyle x 2 y 2 1 0 nbsp 另一个例子求此离散分布的最大熵 f p1 p2 pn k 1npklog2 pk displaystyle f p 1 p 2 ldots p n sum k 1 n p k log 2 p k nbsp 所有概率的总和是1 因此我们得到的约束是g p 1即 g p1 p2 pn k 1npk 1 displaystyle g p 1 p 2 ldots p n sum k 1 n p k 1 nbsp 可以使用拉格朗日乘数找到最高熵 概率的函数 对于所有的k从1到n 要求 pk f l g 1 0 displaystyle frac partial partial p k f lambda g 1 0 nbsp 由此得到 pk k 1npklog2 pk l k 1npk 1 0 displaystyle frac partial partial p k left sum k 1 n p k log 2 p k lambda sum k 1 n p k 1 right 0 nbsp 计算出这n个等式的微分 我们得到 1ln 2 log2 pk l 0 displaystyle left frac 1 ln 2 log 2 p k right lambda 0 nbsp 这说明pi都相等 因为它们都只是l的函数 解出约束 k pk 1 得到 pk 1n displaystyle p k frac 1 n nbsp 因此 使用均匀分布可得到最大熵的值 经济学 编辑约束最优化在经济学占有很重要的地位 例如一个消费者的选择问题可以被视为一个求效用方程在预算约束下的最大值问题 拉格朗日乘数在经济学中被解释为影子价格 设定在某种约束下 在这里即收入的边际效用 拉格朗日乘数就是效用函数在最优解处对收入的偏导数 也就是在最优解处增加一个单位收入带来的效用增加 或者说在最优解处有效用衡量收入的价值 称之为收入的边际效用 在企业生产问题中 拉格朗日乘数用来衡量要素投入变动所带来的收入变动 du dm l u表示效用函数或生产函数 m表示收入或要素投入 在具体数学推导中还可以运用包络定理的内容 参考 编辑卡罗需 库恩 塔克条件 拉格朗日乘数的推广 拉格朗日方程式 哈密頓原理 作用量对外链接 编辑参考拉格朗日原作或方法的命名 Earliest known uses of some of the words of mathematics L更深入的介绍和互动applet Applet Tutorial and applet Conceptual introduction 页面存档备份 存于互联网档案馆 概念介绍和对于拉格朗日乘数方法在变分法以及物理中的运用 Lagrange Multipliers without Permanent Scarring 页面存档备份 存于互联网档案馆 tutorial by Dan Klein 取自 https zh wikipedia org w index php title 拉格朗日乘数 amp oldid 79968420, 维基百科,wiki,书籍,书籍,图书馆,

    文章

    ,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。