第二章 泛函极值及变分法(补充内容)
2.1 变分的基本概念
2.1.1 泛函和变分
泛函是一种广义的函数,是指对于某一类函数{y(x)}中的每一个函数y(x),变量J有一值与之对应,或者说数J对应于函数y(x)的关系成立,则我们称变量J是函数y(x)的泛函,记为J[y(x)]。
例1:如果表示两固定端点A(xA,yA),B(xB,yB)间的曲线长度J(图2.1.1),则由微积分相关知识容易得到:
J??xB1?(dy/dx)dx2 (2.1.1)
xA显然,对于不同的曲线y(x),对应于不同的长度J,即J是函数y(x)的函数,J=J[y(x)]。
图2.1.1 两点间任一曲线的长度
例2:历史上著名的变分问题之一——最速降线问题,如果2.1.2所示。设在不同铅垂线上的两点P1与P2连接成某一曲线,质点P在重力作用下沿曲线由点P1自由滑落到点P2,这里不考虑摩擦作用影响,希望得到质点沿什么样的曲线滑落所需时间最短。
图2.1.2 最速降线问题
选取一个表示曲线的函数y(x),设质点从P1到P2沿曲线y=y(x)运动,则其运动速度为:
v?dsdt?1?y?dt2dx
其中,S表示曲线的弧长,t表示时间,于是:
1?y?v2dt?dx
1
设重力加速度为g,则v?2gy。
因为P1和P2点的横坐标分别为x1到x2,那么质点从P1到P2所用时间便为:
J[y(x)]???x2x11?y?22g[y(x1)?y(x)dx
?x2x1?1?[y?(x)]2????2g[y(x1)?y(x)]?1/2dx (2.1.2)
则最速降线问题对应于泛函J[y(x)]取最小值。 回顾函数的微分:
对于函数的微分有两种定义: 一种是通常的定义,即函数的增量:
?y?y(x??x)?y(x)?A(x)?x??(x,?x)
(2.1.3)
其中A(x)与?x无关,且有?x→0时ρ(x,?x)→0,于是就称函数y(x)是可微的,其
线性部分称为函数的微分dy?A(x)?x?y?(x)?x,函数的微分就是函数增量的主部。
函数微分的另外一种定义:
通过引入一小参数ε,对y(x???x)关于ε求导数,并令ε→0的途径得到,即:
dy(x???x)d???0?y?(x???x)?x??0?y?(x)?x?dy (2.1.4)
上式说明y(x???x)在ε=0处关于ε的导数就是函数y(x)在x处的微分。相应地,
在泛函J[y(x)]中,变量函数y(x)的增量在其很小时称为变分,用δy(x)或δy表示,指y(x)与它相接近的y1(x)的差,即:?y(x)?泛函的变分也有类似的两个定义:
对于函数y(x)的变分δy(x)所引起的泛函的增量为?J?J[y(x)??y(x)]?J[y(x)]y(x)?y1(x)。
,当
?y(x)?0时泛函增量的线性主部就称为泛函J在函数y(x)处的变分,记为δJ,即:
?J??J[y(x)??y(x)]?J[y(x)]??y?0?L[y(x),?y(x)] (2.1.5)
其中L[y(x),δy(x)]是泛函增量的线性主部,而且其对于变分δy(x)是线性的。 另一种定义:
拉格朗日的泛函变分定义为:
2
泛函变分是J[y(x)???y(x)]对?的导数在?=0时的值,即:
?J????J[y(x)???y(x)]??0?L[y(x),?y(x)] (2.1.6)
首先,我们进行泛函:
J?J[y(x)]??x2F(x,y(x),y?(x))dx (2.1.7)
x1的变分。
此泛函的增量可以用Taylor展式表示为:
?J??x1x2x1??F?x,y(x)??y(x),y?(x)??y?(x)??F?x,y(x),y?(x)???dx
??x2222???F1??F?F?F??F?22?????y??y??(?y)??y?y?(?y)????dx ?22????y?y2?y?y?y?(y)?????? (2.1.8)
当?y?0,上式积分中的前两项是增量的线性主部,后面的项为高阶无穷小量。 根据变分的定义,该泛函的变分为:
?J??x2x1??F??F??dx (2.1.9) ??y??y??y???y??(2.1.9)也称为泛函J的一阶变分,而(2.1.8)式的后三项为二阶变分,记作δ2J,即:
?J?2?x2x122??2F??F?F22??(?y)??y?y?(?y) ??dx (2.1.10)22??y?y??y?(y)??也可以通过拉格朗日泛函变分的定义,得到:
?J????J?y(x)???y(x)???0??F?y?F?y??x2x1?????dx ???F(x,y???y,y???y)?????0??x2(?y?x1?y?)dx (2.1.11)
此结果与(2.1.9)是相同的。
类似地,如果泛函的值决定于两个函数,并且这些函数是两个变量的函数,如:
J?J?u(x,y),v(x,y)???s F(x,y,u,v,ux,uy,vx,vy)ds (2.1.12)
其变分为:
?J??s??F??F?F?F?F?F?u??v??ux??uy??vx??vy?ds (2.1.13) ??u?v?u?u?v?v??xyxy??依此类推,不难得到多个多元函数的变分。
3
此处,泛函的变分满足下面的一些运算规律:
??J1?y(x)??(1)
J2?y(x)????J1?y(x)???J2?y(x)?
(2.1.14a)
(2)??J1?y(x)??J2?y(x)????J1?y(x)??J2?y(x)??J1?y(x)???J2?y(x)? (2.1.14b) (3)???J1?y(x)????J1?y(x)??J2?y(x)??J1?y(x)???J2?y(x)????2Jy(x)???2??J2?y(x)????nn?1 (2.1.14c)
(4)??J?y(x)???n?J?y(x)????J?y(x)? (2.1.14d)
2.1.2 泛函的极值和变分问题
本节将讨论泛函的极值和变分。 微积分知识:
函数取极值的必要条件(但不是充分条件):对于一个连续可导函数,如果其在定义域的某(些)点函数有极值,那么这个函数的一阶导数在这(些)点等于零,这个(些)点就是函数的极值点或驻点。
对于泛函的极值问题,也有类似的结论,即泛函取极值的必要条件是其一阶变分?J?0。 简要证明:
假设函数y(x)是泛函J所定义的函数集合中的任一函数,这里不妨设泛函J[y(x)]在函数y(x)处有极大值,那么对于任一实变量?,必有:
J?y(x)?≥J?y(x)???y(x)?
(2.1.15)
令f(?)?J?y(x)???y(x)?,则有:
f(?)?J?y(x)??J?y(x)???y(x)??f(?) (2.1.16)
??0上式表示f(?)在??0处有极大值,根据函数取极值的必要条件:
df(?)d?df(?)d???0??0?0,得到: ?dJ?y(x)???y(x)?d???0??J?0 (2.1.17)
由此就得到泛函取极大值的必要条件是其一阶变分为零。
同样的方法可以证明,泛函取极小值的必要条件也是其一阶变分为零。 泛函实现局部极大或极小值的充要条件:
泛函实现局部极大或极小值的充要条件与函数取极值的充要条件类似,除了其一阶变分为零外,还需要考察二阶变分的情况:
4
1) 若泛函J[y(x)]在y(x)处取局部极大值,其充分必要条件为:
2 ?J?y(x)??0, ?J?y(x)?<0 (2.1.18)
2) 若泛函J[y(x)]在y(x)处取局部极小值,其充分必要条件为:
2 ?J?y(x)??0, ?J?y(x)?>0 (2.1.19)
通常,我们将求泛函极值的问题称为变分问题。
变分法的基本预备定理:
如果函数F(x)在线段(x1,x2)上连续,且对于只满足某些一般条件的任意选取的函数?y(x),有:
?x2F(x)?y(x)dx?0 (2.1.20)
x1则在线段(x1,x2)上有:F(x)?0 (2.1.21) 这里?y(x)满足的一般条件为: ① 一般或若干阶可微; ② 在(x1,x2)的端点外为0;
③ ?y(x)??或?y(x)??和?y?(x)??等。
对于多变量问题,也有类似的变分定理。
二维:函数F(x,y)在(x,y)平面S内连续,设?u(x,y)在S的边界上为零,
?u??,?u??,?uy??且满足连续性以及一阶或若干阶的可微性,对于这样选取的
?u(x,y),若有:
?s F(x,y)?u(x,y)dxdy?0 (2.1.22)
则在区域S内有:
F(x,y)?0 (2.1.23)现在我们来研究最简单的泛函:
J?J?y(x)???x2x1F?x,y(x),y?(x)?dx (2.1.24)
的极值问题。
其中F为x,y和y?的函数,且F(x,y,y?)是三阶可微的。
确定泛函极值的曲线y?y(x)的边界是固定不变的,且有:
y(x1)?y1,y(x2)?y2
(2.1.25)
5