§1 二次型的矩阵表示
一、二次型的定义
1.问题的引入
在解析几何中,我们看到,当坐标原点与中心重合时,一个有心二次曲线的一般方程是
ax2+2bxy+cy2=f (1)
为了便于研究这个二次曲线的几何性质,我们可以选择适当的角度θ,作转轴(反时针方向转轴)
?x?x'cos??y'sin???? (2) ''?y?xsin??ycos??把方程(1)化成标准方程。在二次曲面的研究中也有类似的情况。
(1)的左端是一个二次齐次多项式。从代数的观点看,所谓化标准方程就是用变量的线性替换(2)化简一个二次齐次多项式,使它只含有平方项。二次齐次多项式不但在几何中出现,而且在数学的其它分支以及物理、力学中也常常会碰到。这一章就是来介绍它的一些最基本的性质。
2.n元二次型
设P是一数域,一个系数在数域P中的x1,x2,…,xn 的二次齐次多项式
2 f (x1,x2,…,xn) = a11x12+2a12x1x2+…+2a1nx1xn+a22x2 +…+2a2nx2xn+…+annx2n (3)
称为数域P上的一个n元二次型,简称二次型。例如
2 x12+x1x2+3x1x2+2x +4x2x3+3x3
就是有理数域上的一个三元二次型。为了以后讨论上的方便,在(3)中,xixj(i 在讨论二次型时,矩阵是一个有力的工具,因此我们先把二次型与线性替换用矩阵来表示。 令 aji=aij, i 21+a12x1x2+…+a1nx1xn+a21x2x1+a22x 2nnn22+…+a2nx2xn…………+an1xnx1+an2xnx2+…+annx=??aijxixj (4) i?1j?1把(4)的系数排成一个n×n 矩阵 ?a11?aA=?21????an1a12a22?an2?a1n??a2n?? (5) ?????ann?称为二次型(4)矩阵。因为 aij=aji i,j=1,…,n , 所以 A =A? 此时称A为对阵矩阵,因此,二次型的矩阵都是对称的。 令 ?x1??x? X=?2? . ??????xn?于是,二次型就可以用矩阵的乘积表示出来: ?a11?af (x1,x2,…,xn)=X?AX?(x1,x2,…,xn)?21????an1a12a22?an2?a1n??x1??x??a2n???2? ??????????ann??xn??a11x1?a12x2???a1nxn?nn?=ax?ax???ax=(x1,x2,…,xn) ?aijxixj 2222nn????121i?1j?1??an1x1?an2x2???annxn??故 f (x1,x2,…,xn)= X?AX 注: (1)二次型的矩阵总是对称的。 (2)二次型和它的矩阵是相互唯一决定的。即若二次型 f (x1,x2,…,xn)=X?AX=X?BX 且 A'=A,B'=B,则A=B . 三、线性替换 1.线性替换的定义 设x1,x2,…,xn ; y1,y2,…,yn 是两组文字,系数在数域P中的一组关系式 ?x1?c11y1?c12y2???c1nyn??x?cy?cy???cy??22112222nn??? (6) ??????????????xn?cn1y1?cn2y2???cnnyn??称为由x1, … xn 到y1,…,yn 的一个线性替换,或简称线性替换。如果系数行列式 | cij|≠0 , 那么线性替换(6)就称为非退化的。 2.线性替换的矩阵表示 令 ?c11?x1??c?x?2X =?? C=?21????????x?cn1?n??c1n??y1??y?c22?c2n?? ,Y=?2? . ??????????cn2?cnn??yn?c12于是线性替换(6)可以写成 ?x1??c11?x??c?2?=?21?????????xn??c1n?c1n??y1??y?c22?c2n???2? , ??????????c2n?cnn??yn?c12或者 X=CY。 3.二次型经过非退化的线性替换仍为二次型 设 f (x1,x2,…,xn)= X?AX, A=A? (7) 是一个二次型,作非退化线性替换 X=CY, (8) 我们得到一个y1,y2…,yn 的二次型 Y?BY 现在来看矩阵B与A的关系。把(8)代入(7),有 '' f (x1,x2,…,xn)= X'AX=(CY')A(CY)=Y'C?CY=Y(CAC)=YBY '容易看出,矩阵C?AC也是对称的。事实上, ' (CAC?)?=C?A?C??=CAC 由此,即得 B=C?AC 四、矩阵的合同 定义 数域P上n×n矩阵A,B称为合同的,如果有数域P上可逆的n×n矩阵C,使 B=C?AC 合同是矩阵之间的一个关系。合同关系具有 1) 反身性:A=E?AE; ?1?12) 对称性:由B=C?AC 即得A=(C)?BC; ?AC1和A2=C2?AC2 即得 3) 传递性:由A1=C1 A2=(C1C2)?A(C1C2) 因之,经过非退化的线性替换,新二次型的矩阵与原二次型的矩阵是合同的。这样,我们就把二次型的变换通过矩阵表示出来,为以下的讨论提供了有力的工具。 最后指出,在变换二次型时,我们总是要求所作的线性变换是非退化的。从几何上看,这一点是自然的,因为坐标变换一定是非退化的,一般地,当线性替换 X=CY 是非退化时,由上面的关系即得 ?1 Y=CX 这也是一个线性替换,它把所得的二次型还原。这样就使我们从所得二次型的性质可以推知原来的二次型的一些性质。