fbpx
维基百科

矩阵

數學上,一個矩陣是一个由行(row)列(column)元素排列成的矩形阵列。矩陣裡的元素可以是数字符号或数学式。

线性代数

向量 · 向量空间  · 行列式  · 矩阵

m-by-n matrix」的各地常用別名
中国大陸列矩阵
港臺行矩陣
「横排(row)」的各地常用別名
中国大陸
港臺
「纵排(column)」的各地常用別名
中国大陸
港臺

大小相同(行数列数都相同)的矩阵之间可以相互加减,具体是对每个位置上的元素做加减法。矩阵的乘法则较为复杂。两个矩阵可以相乘,当且仅当第一个矩阵的列数等于第二个矩阵的行数。矩阵的乘法满足结合律分配律,但不满足交换律

矩阵的一个重要用途是解线性方程组。线性方程组中未知量的系数可以排成一个矩阵,加上常数项,则称为增广矩阵。另一个重要用途是表示线性变换,即是诸如之类的線性函數的推广。设定基底后,某个向量可以表示为的矩阵,而线性变换可以表示为列数为的矩阵,使得经过变换后得到的向量可以表示成的形式。矩阵的特征值特征向量可以揭示线性变换的深层特性。

矩陣是高等代数学中的常见工具,也常见于统计分析等应用数学学科中。在物理学中,矩阵在力学电路学光学量子物理等領域中都有应用;计算机科学中,三维动画制作也需要用到矩阵。矩阵的运算是数值分析领域的重要问题。将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算。对一些应用广泛而形式特殊的矩阵,例如稀疏矩阵和准对角矩阵,有特定的快速运算算法。关于矩阵相关理论的发展和应用,請參考矩陣理論。在天体物理量子力学等领域,也会出现无穷维的矩阵,是矩阵的一种推广。

词源

中文中矩阵的概念最早见于1922年。1922年,北京师范大学附属中学數學老師程廷熙在一篇介绍文章中将矩阵译为“纵横阵”。1925年,在科学名词审查会算学名词审查组刊登於《科学》第十卷第四期的审定名词表中,矩阵被翻译为“矩阵式”,方块矩阵翻译为“方阵式”,而各类矩阵如“正交矩阵”、“伴随矩阵”中的“矩阵”则被翻译为“方阵”。1935年,中国数学会审查后,中华民国教育部审定的《数学名词》(并“通令全国各院校一律遵用,以昭划一”)中,“矩阵”作为译名首次出现。1938年,曹惠群在接受科学名词审查会委托就数学名词加以校订的《算学名词汇编》中,认为应当的译名是“长方阵”。1949年中华人民共和国成立后编订的《数学名词》中,则将译名定为“(矩)阵”。1993年,中国自然科学名词审定委员会公布的《数学名词》中,“矩阵”被定为正式译名,并沿用至今[1]

發展

作為解決線性方程的工具,矩陣也有不短的歷史。成书最迟在东汉前期的《九章算术》中,已经出现过以矩阵形式表示线性方程组系数以解方程的图例,可視為矩阵的雏形[2]。矩阵正式作为数学中的研究对象出现,则是在行列式的研究发展起来后。逻辑上,矩阵的概念先于行列式,但在历史上则恰好相反。日本数学家关孝和(1683年)与微積分的發現者之一戈特弗里德·威廉·萊布尼茨(1693年)近乎同时独立建立了行列式論。其后行列式作为解线性方程组的工具逐步发展。1750年,加布里尔·克拉默发现了克莱姆法则[3]

 
阿瑟·凯莱被认为是矩阵论的奠基人

进入十九世纪后,行列式的研究进一步发展,矩阵的概念也应运而生。奧古斯丁·路易·柯西是最早将行列式排成方阵并将其元素用双重下标表示的数学家。他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论[4]。其后,詹姆斯·約瑟夫·西爾維斯特注意到,在作为行列式的计算形式以外,将数以行和列的形式作出的矩形排列本身也是值得研究的。在他希望引用数的矩形阵列而又不能用行列式来形容的时候,就用“matrix”一词来形容[3]。而在此之前,数学家已经开始将增广矩阵作为独立的对象引用了。西尔维斯特使用“matrix”一词是因为他希望讨论行列式的子式,即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式,所以实际上“matrix”被他看做是生成各种子式的“母体”:

我在先前的文章中将矩形排布的序列称为“Matrix”,盖因从中可以产生出各种不同的行列式,就如由同一个母体的子宫中孕育出来一样。[5]

阿瑟·凯莱被公认为矩阵论的奠基人[3]。他开始将矩阵作为独立的数学对象研究时,许多与矩阵有关的性质已经在行列式的研究中被发现,这也使得凯莱认为矩阵的引进是十分自然的。他说:“我决然不是通过四元数而获得矩阵概念的;它或是直接从行列式的概念而来,或是作为一个表达线性方程组的方便方法而来的。[3]”他从1858年开始,发表了《矩阵论的研究报告》等一系列关于矩阵的专门论文[6][7],研究了矩阵的运算律、矩阵的逆以及转置和特征多项式方程。凯莱还提出了凯莱-哈密尔顿定理,并验证了3×3矩阵的情况,又说进一步的证明是不必要的。哈密尔顿证明了4×4矩阵的情况,而一般情况下的证明是弗罗贝尼乌斯于1898年给出的[3]

此后更多数学家开始对矩阵进行研究。埃尔米特证明了如果矩阵等于其复共轭转置,则特征根为实数。这种矩阵后来被称为埃尔米特矩阵[3]。弗罗贝尼乌斯对矩阵的特征方程、特征根、矩阵的秩、正交矩阵、矩阵方程等方面做了大量工作。1878年,在引进了不变因子、初等因子等概念的同时,弗罗贝尼乌斯给出了正交矩阵、相似矩阵合同矩阵的概念。同年,他探讨了矩阵的最小多项式(最小方程)问题。1894年的论文中,他讨论了矩阵理论和四元数理论的关系。1896年,他给出了凯莱-哈密尔顿定理的完整证明[1]。矩阵理论在19世纪沿着两个方向发展,分别是作为抽象代数结构和作为代数工具描述几何空间的线性变换。矩阵理论为群论和不变量理论的发展。

无限维矩阵的研究始于1884年。庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究[1]。1906年,希尔伯特引入无限二次型(相当于无限维矩阵)对积分方程进行研究,极大地促进了无限维矩阵的研究。在此基础上,施密茨、赫林格和特普利茨发展出算子理论,而无限维矩阵成为了研究函数空间算子的有力工具[1]

定义

将一些元素排列成若干行,每行放上相同数量的元素,就是一个矩阵。这里说的元素可以是数字,例如以下的矩阵:

 

排列成的形状是矩形,所以称为矩阵。在中國大陸,橫向的元素组称為「行」,縱向称為「列」,而在臺灣則相反,橫向称為「列」,縱向称為「行」[8]。矩阵一般用大写拉丁字母表示,需要具体写出其中元素时,一般用方括号或圆括号括起。以上的矩阵 是一个4行3列的矩阵。

行数是1或列数是1的矩阵又可分别称为行向量列向量。这是因为一个向量可以表示成行数或列数是1的矩阵形式。矩阵的任一行/列都是一个行/列向量,例如矩阵 的第一行 就是一个行向量。行/列向量可以看成一个向量,因此可以称矩阵的两行/列相等,或者某一行等于某一列,表示其对应的向量相等。

标记

一个矩阵 從左上角數起的第 行第 列上的元素称为第 項,通常记为    。在上述例子中 。如果不知道矩阵 的具体元素,通常也会将它记成  。反之,如果 的元素可以写成只与其行数 和列数 有关的统一函数 ,那么也可以用 作为 的简写。例如 是矩阵

 

的简写。要注意的是,在计算机编程中,由于数组的首项是第0项,故编程者可能会将第1行/列称为第0行/列,从而对矩阵的写法产生影响,比如矩阵 就要改写成 

矩阵的元素可以是数字、符号或数学表达式。一般为了支援矩阵的运算,矩阵的元素之间应当能做加减法和乘法,所以是某个裡的元素。最常见的是元素属于实数域或复数域的矩阵,简称为实矩阵和复矩阵。更一般的情况下,矩阵的元素可以是由一个环中的元素排成。给定一个环 ,所有由 中元素排成的 矩陣的集合写作  。若 ,則通常記以  ,称其为 维矩阵或方阵

矩陣的基本運算

矩阵的最基本运算包括矩阵加(减)法,数乘和转置运算。被称为“矩阵加法”、“数乘”和“转置”的运算不止一种[9],其中最基本最常用的定义如下:

运算 定义 例子
加(减)法  矩陣  的和(差): 為一个 矩陣,其中每个元素是  相应元素的和(差),
 
其中 

 

数乘 标量 与矩陣 的数乘: 的每个元素是 的相应元素与 的乘积,
 
 
转置  矩阵 的转置是一个 的矩阵,记为 (有些书中也记为   ),其中的第 个行向量是原矩阵 的第 个列向量;或者说,转置矩阵  行第 列的元素是原矩阵  行第 列的元素,
 
 

矩阵的加法运算满足交换律: [10]。矩阵的转置和数乘运算对加法满足分配律:

 
 

矩阵加法和数乘兩種運算使得 成為一个 维的實數線性空間。而转置和数乘运算满足类似于结合律的规律:

 

矩阵也有类似行列式的初等变换,即对矩阵的某些行和某些列进行三类操作:交换两行/列,将一行/列的每个元素都乘以一个固定的量,以及将一行/列的每个元素乘以一个固定的量之后加到另一行/列的相应元素上。这些操作在求其逆矩阵时有用。

矩阵乘法

 
矩阵AB相乘得到AB的示意图

两个矩阵的乘法仅当第一个矩陣 的列數(column)和另一个矩阵 的行數(row)相等时才能定义。如  矩陣和  矩陣,它們的乘積 是一個 矩陣,它的一个元素

 

其中 '[11]

例如

 

矩阵的乘法满足结合律和对矩阵加法的分配律(左分配律和右分配律):

  • 结合律: 
  • 左分配律: 
  • 右分配律: 

矩阵的乘法与数乘运算之间也满足类似结合律的规律;与转置之间则满足倒置的分配律。

 
 

矩阵乘法不满足交换律。一般来说,矩陣  的乘积 存在,但 不一定存在,即使存在,大多数时候 。比如下面的例子:

 

这一特性使得矩阵代数与常见的一些数域(有理数、实数、复数)以及环(多项式环、整数环)都不同。给定一个 维的方块矩阵 ,与 交换的所有方块矩阵构成一个环,称为 的交换子环。这些矩阵也构成 的一个子空间,称为 的可交换空间[12]。与 中所有矩阵交换的矩阵只有形如 的矩阵(称为数乘矩阵)。其中的 单位矩阵,也就是主对角线上的元素为1,其它元素为0的矩阵。任意矩阵 乘以单位矩阵都得到自身: 

除了最常见的矩阵乘法定义以外,也有一些较不常见的矩阵乘法,比如阿达马乘积和克罗内克乘积[13]

线性方程组

矩阵乘法的一个基本应用是在线性方程组上。线性方程组是方程组的一种,它符合以下的形式:

 

其中的 以及 等等是已知的常数,而 等等则是要求的未知数。运用矩阵的方式,可以将线性方程组写成一个向量方程:

 

其中, 是由方程组里未知量的系数排成的 矩陣 是含有 个元素的行向量, 是含有 个元素的行向量[14]

 

这个写法下,将原来的多个方程转化成一个向量方程,在已知矩阵 和向量 的情况下,求未知向量 

线性变换

矩陣是线性变换的便利表達法。矩陣乘法的本质在联系到线性变换的时候最能体现,因为矩阵乘法和线性变换的合成有以下的联系: 以 表示所有長度為 的行向量的集合。每个 的矩阵 都代表了一个从 射到 的线性变换。反过来,对每個线性变换 ,都存在唯一m×n矩陣 使得对所有 中的元素  。这个矩阵  行第 列上的元素是正则基向量 (第j个元素是1,其余元素是0的向量)在 映射后的向量 的第 个元素。

也就是说,从 射到 的线性变换构成的向量空间 上存在一个到 一一映射 

以下是一些典型的2维实平面上的线性变换对平面向量(图形)造成的效果,以及它们对应的2维矩阵。其中每个线性变换将蓝色图形映射成绿色图形;平面的原点(0, 0)用黑点表示。

推移
幅度m=1.25.
水平鏡射变换 挤压”变换,
压缩程度r=3/2
伸縮,3/2倍 旋轉,左转30°
         
         

设有 的矩陣 代表线性變換 ,則矩陣積 代表了綫性變換的复合 [15],因为

 

矩阵的秩是指矩阵中线性无关的行/列向量的最大个数[16],同时也是矩阵对应的线性变换的像空间的维度[17]秩-零化度定理说明矩阵的列数量等于矩阵的秩与零空间维度之和[18]

方块矩阵

行数与列数相同的矩阵称为方块矩阵,简称方阵。所有 维的方块矩阵构成一个线性空间,这个空间对矩阵乘法也是封闭的,因此也是一个代数。方阵 称为可逆或非奇异的,如果存在另一个方阵 ,使得

 

成立。这时候可以证明也有 成立[19],可将矩阵 称为 的逆矩阵[20]。一个矩阵 的逆矩阵如果存在的话,就是唯一的,通常记作 

矩阵 的元素 称为其主对角线上的元素。方块矩阵 的所有主对角线元素之和称为它的,写作 。尽管矩阵的乘法不满足交换律,方阵相乘时交换顺序会导致乘积变化,但它们的迹不会变,即 [21]。除此以外,矩阵转置的迹等于其自身的迹, 

如果一个方阵只有主对角线上的元素不是0,其它都是0,那么称其为对角矩阵。如果主对角线上方的元素都是0,那么称为下三角矩阵;反之如果主对角线下方的元素都是0,那么称为上三角矩阵。例如 的时候,这些矩阵分别写作:

 (对角矩阵), (下三角矩阵)和 (上三角矩阵)。

行列式

 
R2裡的一个线性变换f将蓝色图形变成绿色图形,面积不变,而顺时针排布的向量x1和x2的变成了逆时针排布。对应的矩阵行列式是-1.

方块矩阵 的行列式是一个将其映射到标量的函数,记作  ,反映了矩阵自身的一定特性。一个方阵的行列式等于0当且仅当该方阵不可逆。系数是实数的时候,二维(三维)方阵 的行列式的绝对值表示单位面积(体积)的图形经过 对应的线性变换后得到的图形的面积(体积),而它的正负则代表了对应的线性变换是否改变空间的定向:行列式为正说明它保持空间定向,行列式为负则说明它逆转空间定向。

2×2矩阵的行列式是

 

3×3矩阵的行列式由6项组成。更高维矩阵的行列式则可以使用莱布尼兹公式写出[22],或使用拉普拉斯展开由低一维的矩阵行列式递推得出[23]

两个矩阵相乘,乘积的行列式等于它们的行列式的乘积: [24]。将矩阵的一行/列乘以某个系数加到另一行/列上不改变矩阵的行列式,将矩阵的两行/列互换则使得其行列式变号[25]。用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵,而后两种矩阵的行列式就是主对角线上元素的乘积,因此能方便地计算。运用行列式可以计算线性方程组的解(见克萊姆法則[26]

特征值与特征向量

 的方块矩阵 的一个特征值和对应特征向量是满足

 [27]的标量 以及非零向量 。特征值和特征向量的概念对研究线性变换很有帮助。一个线性变换可以通过它对应的矩阵在向量上的作用来可视化。一般来说,一个向量在经过映射之后可以变为任何可能的向量,而特征向量具有更好的性质[28]。假设在给定的基底下,一个线性变换对应着某个矩阵 ,如果一个向量 可以写成矩阵的几个特征向量的线性组合:
 

其中的 表示此向量对应的特征值是 ,那么向量 经过线性变换后会变成:

 

可以清楚地知道变换后向量的结构。

另一个等价的特征值定义是:标量 为特征值,如果矩阵 是不可逆矩阵。根据不可逆矩阵的性质,这个定义也可以用行列式方程描述: 为特征值,如果

 [29]这个定义中的行列式可以展开成一个关于 n多项式,叫做矩阵A特征多项式,记为 。特征多项式是一个首一多项式(最高次项系数是1的多项式)。它的根就是矩阵 特征值[30]哈密尔顿-凯莱定理说明,如果用矩阵 本身代替多项式中的不定元 ,那么多项式的值是零矩阵[31]
 

对称

转置等于自己的矩阵,即满足 的方块矩阵 叫做对称矩阵。满足 的矩阵称为反对称矩阵。在复系数矩阵中,则有埃尔米特矩阵的概念:满足 的方块矩阵称为埃尔米特矩阵,其中的 表示 共轭转置矩阵。

根据谱定理,实对称矩阵和复埃尔米特矩阵拥有特征基,即由矩阵的特征向量组成的基底。因此任何向量都能表示成矩阵特征向量的线性组合。此外,这两类矩阵的特征值都是实数[32]

正定性

矩阵表达式    
正定性 不定矩阵 正定矩阵
对应二次型    
取值图像  
说明 正定矩阵对应的二次型的取值范围永远是正的,
不定矩阵对应的二次型取值则可正可负

 的实对称矩阵 如果满足对所有非零向量 ,对应的二次型

 

函数值都是正数,就称 为正定矩阵。类似地还有半正定矩阵、负定矩阵、不定矩阵等概念[33]。对称矩阵的正定性与其特征值密切相关。矩阵是正定的当且仅当其特征值都是正数[34]

矩阵的计算

矩阵在许多学科领域中都有应用,在很多时候,除了需要知道矩阵的理论性质以外,还需要计算矩阵的数值。为了矩阵的计算能够足够精确与快捷,数值线性代数中专门有研究矩阵的数值计算方法[35]。与其它的数值计算一样,矩阵的数值计算注重的主要也是算法复杂度数值稳定性。矩阵的数值计算可以使用直接计算,也可以用迭代算法,例如在计算方块矩阵的特征值时,可以从一个非零向量 开始,通过特定迭代方法得到一个逼近某个特征向量的向量序列[36]

测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次数,或者找出它的一个上界。例如按照定义计算的话,两个 阶方阵的乘法需要 次数字乘法计算,因为其乘积是一个 阶方阵,有 个元素,计算每个元素需要 次数字乘法。如果使用施特拉森算法的话,可以将数字乘法的次数减低到大约 [37]。此外,编程语言或环境本身对算法的复杂度也会有影响。

某些特殊类型的矩阵携带的数据量比一般矩阵要少,同时带来的信息量比一般矩阵多。一个重要的例子是稀疏矩阵,这类矩阵中绝大部分的元素是零。有关稀疏矩阵的计算,如计算稀疏矩阵 的线性方程组 时,可以使用一些专用于稀疏矩阵的特殊算法(比如共轭梯度法[38]),减低计算复杂度。

算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差。例如计算矩阵的逆时,可以用以下的算法(其中 表示 伴随矩阵 表示 行列式

 

这个算法在 的行列式接近0的时候会引起很大的舍入误差[39]。而如果使用全选主元的高斯消去法求逆,则在复杂度降低的同时能够避免舍入误差,保证数值稳定性。

矩阵分解

矩阵研究的一大方向是将一般的矩阵用一些比较“简单”的矩阵来表示。这种表示方式称为矩阵的变换与分解。矩阵变换与分解的方法有很多,它们的目的都是希望化简后的矩阵保持原矩阵的某些性质,比如行列式、秩或逆矩阵,而形式相对简单,因而能用容易地进行讨论和计算,或者能使得某些算法更易执行。

LU分解将矩阵分解为一个下三角矩阵 和一个上三角矩阵 的乘积[40]。分解后的矩阵可以方便某些问题的解决。例如解线性方程组时,如果将系数矩阵 分解成 的形式,那么方程的求解可以分解为求解  两步,而后两个方程可以十分简洁地求解(详见三角矩阵中“向前与向后替换”一节)。又例如在求矩阵的行列式时,如果直接计算一个矩阵 的行列式,需要计算大约 次加法和乘法;而如果先对矩阵做 分解,再求行列式,就只需要大约 次加法和乘法,大大降低了计算次数。这是因为做 分解的复杂度大约是 次,而后注意到  是三角矩阵,所以求它们的行列式只需要将主对角线上元素相乘即可。

 
若尔当矩阵,其中灰色框内的是若尔当块

高斯消去法也是一种矩阵分解方法。通过初等变换操作,可以将任何矩阵变为阶梯形矩阵,而每个操作可以看做是将矩阵乘上一个特定的初等矩阵[41]奇异值分解则是另一种分解方法,将一个矩阵表示成3个矩阵的乘积: 。其中  酉矩阵 对角矩阵

特征分解是将一个矩阵 写成 的形式,其中 是一个可逆矩阵, 是对角矩阵[42]。如果 的特征分解存在,就称它是可对角化的矩阵。不能对角化的矩阵,也有类似的分解方式。任意的矩阵 都可以写成 的形式,其中的矩阵 若尔当标准型。若尔当标准型是矩阵的一种,它与对角矩阵类似,只不过主对角线上的元素不是数值,而是若尔当块:主对角线上为同一元素 ,主对角线右上一行的次对角线上都是1,其它元素都是0的矩阵(见右图)[43]。特征分解可以方便计算矩阵的幂次和多项式,如要计算 

 

而其中对角矩阵的幂次 要比 容易计算得多。同理还可计算矩阵指数 (在线性微分方程中有应用)、矩阵对数矩阵的平方根[44]。为了提高算法的数值稳定性,还有舒尔分解等矩阵分解方法[45]

矩阵的推广

矩阵的元素除了可以是实数和复数以外,也可以任意环或中元素。在线性代数中,矩阵的性质可以经由有限维的线性空间中的线性变换定义。更广泛的,无限维空间中的线性算子,则可以定义更广泛的无穷维矩阵。矩阵的另一种推广是张量。标量可以看成零维方式排列的数据(只有一个“点”),向量可以看成是一维方式排列的数据(若干个“点”排成的“线段”),矩阵可以看成是二维方式排列的数据(若干个“线段”排成的“矩形”),而张量的概念则包括了这几种排列方式。在张量的概念中,标量是零维张量,向量是一维张量,矩阵是二维張量,而更高维方式排列的数据方式就是高维张量[46]

一般域和环上的矩阵

矩阵的元素除了可以是实数和复数以外,还可以是任何能够使得矩阵的运算律成立的元素。首先,矩阵的元素可以是任意一个域(即能够进行“加减乘除”运算的集合)中元素。例如编码理论中会出现系数为有限域中元素的矩阵,以及有理数系数的矩阵。如果矩阵的系数所在域 不是代数闭域,那么在求矩阵的特征值时,由于特征值是相应的特征多项式的根,可能不在系数域 中,而是在系数域的某个扩域L中。反过来,如果考虑扩域 ,以及 中的一个元素 ,以及 中线性变换 ,那么由于 也是一个 -线性变换,它可以表示成一个  系数矩阵 ,其中的 是扩域 的阶数。 是这个矩阵的特征值,这个矩阵的特征多项式   中的最小多项式 的幂次:

 。其中的 是扩域   的阶数[47]

更一般的情况是矩阵的元素属于某个环 [48]。环是比域更广泛的概念,只要求其中元素能够进行加减法和乘法运算(不一定能定义除法)。给定一个环  中的矩阵之间可以相互加减以及相乘,所以 关于矩阵的加法和乘法也构成一个环,称为矩阵环 维方阵的环 與左 - 自同態同構[49]

 交换环,則 是一个帶單位元 -代數,满足结合律,但不满足交换律。其中的矩阵仍然可以用莱布尼兹公式定義行列式。一个矩阵可逆当且仅当其行列式为环 中的可逆元(域上的矩阵可逆只需行列式不等于0)[50]

矩阵与线性变换

前面已经提到,所有 的线性变换都对应着一个 中的矩阵。更一般地,给定了基底后,任意两个有限维线性空间之间的线性映射 也对应着一个矩阵 。设空间  的基底分别是  ,那么

对任意   

矩阵 实际上“记录”了 中每个基底向量经过变换后得到的 中的像在基底 下的形式。要注意矩阵的内容取决于基底的选择。可以说,矩阵是线性变换f在特定“角度”(基底)下的“素描”。不同的“角度”下,描述 的矩阵是不同的,但这些矩阵都是相似矩阵[51]。与矩阵有关的基本概念都可以用线性变换的层面来解释,比如一个矩阵的转置可以用f对偶变换 来表示[52]

当矩阵的元素是带单位元的环

矩阵, 數學上, 一個m, displaystyle, times, 的矩陣是一个由m, displaystyle, displaystyle, column, 元素排列成的矩形阵列, 矩陣裡的元素可以是数字, 符号或数学式, 线性代数a, displaystyle, mathbf, begin, bmatrix, bmatrix, 向量, 向量空间, 行列式, 向量标量, 向量, 向量空间, 向量投影, 外积, 向量积, 内积, 数量积, 与行列式, 行列式, 线性方程组, 單位矩陣, 初等, 方块, 分块, 三. 數學上 一個m n displaystyle m times n 的矩陣是一个由m displaystyle m 行 row n displaystyle n 列 column 元素排列成的矩形阵列 矩陣裡的元素可以是数字 符号或数学式 线性代数A 1 2 3 4 displaystyle mathbf A begin bmatrix 1 amp 2 3 amp 4 end bmatrix 向量 向量空间 行列式 矩阵向量标量 向量 向量空间 向量投影 外积 向量积 内积 数量积 矩阵与行列式矩阵 行列式 线性方程组 秩 核 迹 單位矩陣 初等矩阵 方块矩阵 分块矩阵 三角矩阵 非奇异方阵 转置矩阵 逆矩阵 对角矩阵 可对角化矩阵 对称矩阵 反对称矩阵 正交矩阵 幺正矩阵 埃尔米特矩阵 反埃尔米特矩阵 正规矩阵 伴随矩阵 余因子矩阵 共轭转置 正定矩阵 幂零矩阵 矩阵分解 LU分解 奇异值分解 QR分解 极分解 特征分解 子式和余子式 拉普拉斯展開 克罗内克积线性空间与线性变换线性空间 线性变换 线性子空间 线性生成空间 基 线性映射 线性投影 线性无关 线性组合 线性泛函 行空间与列空间 对偶空间 正交 特征向量 最小二乘法 格拉姆 施密特正交化查论编 m by n matrix 的各地常用別名中国大陸m displaystyle m 行n displaystyle n 列矩阵港臺m displaystyle m 列n displaystyle n 行矩陣 横排 row 的各地常用別名中国大陸行港臺列 纵排 column 的各地常用別名中国大陸列港臺行 a 11 a 12 a 13 a 1 j a 1 n a 21 a 22 a 23 a 2 j a 2 n a 31 a 32 a 33 a 3 j a 3 n a i 1 a i 2 a i 3 a i j a i n a m 1 a m 2 a m 3 a m j a m n displaystyle begin bmatrix a 11 amp a 12 amp a 13 amp dots amp a 1j amp dots amp a 1n a 21 amp a 22 amp a 23 amp dots amp a 2j amp dots amp a 2n a 31 amp a 32 amp a 33 amp dots amp a 3j amp dots amp a 3n vdots amp vdots amp vdots amp ddots amp vdots amp ddots amp vdots a i1 amp a i2 amp a i3 amp dots amp a ij amp dots amp a in vdots amp vdots amp vdots amp ddots amp vdots amp ddots amp vdots a m1 amp a m2 amp a m3 amp dots amp a mj amp dots amp a mn end bmatrix 大小相同 行数列数都相同 的矩阵之间可以相互加减 具体是对每个位置上的元素做加减法 矩阵的乘法则较为复杂 两个矩阵可以相乘 当且仅当第一个矩阵的列数等于第二个矩阵的行数 矩阵的乘法满足结合律和分配律 但不满足交换律 矩阵的一个重要用途是解线性方程组 线性方程组中未知量的系数可以排成一个矩阵 加上常数项 则称为增广矩阵 另一个重要用途是表示线性变换 即是诸如f x 4 x displaystyle f x 4x 之类的線性函數的推广 设定基底后 某个向量v displaystyle mathrm v 可以表示为m 1 displaystyle m times 1 的矩阵 而线性变换f displaystyle f 可以表示为列数为m displaystyle m 的矩阵A displaystyle A 使得经过变换后得到的向量f v displaystyle f mathrm v 可以表示成A v displaystyle A mathrm v 的形式 矩阵的特征值和特征向量可以揭示线性变换的深层特性 矩陣是高等代数学中的常见工具 也常见于统计分析等应用数学学科中 在物理学中 矩阵在力学 电路学 光学和量子物理等領域中都有应用 计算机科学中 三维动画制作也需要用到矩阵 矩阵的运算是数值分析领域的重要问题 将矩阵分解为简单矩阵的组合可以在理论和实际应用上简化矩阵的运算 对一些应用广泛而形式特殊的矩阵 例如稀疏矩阵和准对角矩阵 有特定的快速运算算法 关于矩阵相关理论的发展和应用 請參考矩陣理論 在天体物理 量子力学等领域 也会出现无穷维的矩阵 是矩阵的一种推广 目录 1 词源 2 發展 3 定义 3 1 标记 4 矩陣的基本運算 5 矩阵乘法 5 1 线性方程组 5 2 线性变换 6 方块矩阵 6 1 行列式 6 2 特征值与特征向量 6 3 对称 6 4 正定性 7 矩阵的计算 7 1 矩阵分解 8 矩阵的推广 8 1 一般域和环上的矩阵 8 2 矩阵与线性变换 8 3 矩阵群 8 4 无限维矩阵 8 5 空矩阵 8 6 分塊矩陣 9 应用 9 1 图论 9 2 数学分析 9 3 概率论与统计 9 4 物理学上的对称性及线性变换 9 5 量子态的线性组合 9 6 简正模式 9 7 幾何光學 9 8 電子學 10 参见 11 注释与参考 11 1 脚注 11 2 参考文献 12 外部链接词源 编辑中文中矩阵的概念最早见于1922年 1922年 北京师范大学附属中学數學老師程廷熙在一篇介绍文章中将矩阵译为 纵横阵 1925年 在科学名词审查会算学名词审查组刊登於 科学 第十卷第四期的审定名词表中 矩阵被翻译为 矩阵式 方块矩阵翻译为 方阵式 而各类矩阵如 正交矩阵 伴随矩阵 中的 矩阵 则被翻译为 方阵 1935年 中国数学会审查后 中华民国教育部审定的 数学名词 并 通令全国各院校一律遵用 以昭划一 中 矩阵 作为译名首次出现 1938年 曹惠群在接受科学名词审查会委托就数学名词加以校订的 算学名词汇编 中 认为应当的译名是 长方阵 1949年中华人民共和国成立后编订的 数学名词 中 则将译名定为 矩 阵 1993年 中国自然科学名词审定委员会公布的 数学名词 中 矩阵 被定为正式译名 并沿用至今 1 發展 编辑作為解決線性方程的工具 矩陣也有不短的歷史 成书最迟在东汉前期的 九章算术 中 已经出现过以矩阵形式表示线性方程组系数以解方程的图例 可視為矩阵的雏形 2 矩阵正式作为数学中的研究对象出现 则是在行列式的研究发展起来后 逻辑上 矩阵的概念先于行列式 但在历史上则恰好相反 日本数学家关孝和 1683年 与微積分的發現者之一戈特弗里德 威廉 萊布尼茨 1693年 近乎同时独立建立了行列式論 其后行列式作为解线性方程组的工具逐步发展 1750年 加布里尔 克拉默发现了克莱姆法则 3 阿瑟 凯莱被认为是矩阵论的奠基人 进入十九世纪后 行列式的研究进一步发展 矩阵的概念也应运而生 奧古斯丁 路易 柯西是最早将行列式排成方阵并将其元素用双重下标表示的数学家 他还在1829年就在行列式的框架中证明了实对称矩阵特征根为实数的结论 4 其后 詹姆斯 約瑟夫 西爾維斯特注意到 在作为行列式的计算形式以外 将数以行和列的形式作出的矩形排列本身也是值得研究的 在他希望引用数的矩形阵列而又不能用行列式来形容的时候 就用 matrix 一词来形容 3 而在此之前 数学家已经开始将增广矩阵作为独立的对象引用了 西尔维斯特使用 matrix 一词是因为他希望讨论行列式的子式 即将矩阵的某几行和某几列的共同元素取出来排成的矩阵的行列式 所以实际上 matrix 被他看做是生成各种子式的 母体 我在先前的文章中将矩形排布的序列称为 Matrix 盖因从中可以产生出各种不同的行列式 就如由同一个母体的子宫中孕育出来一样 5 阿瑟 凯莱被公认为矩阵论的奠基人 3 他开始将矩阵作为独立的数学对象研究时 许多与矩阵有关的性质已经在行列式的研究中被发现 这也使得凯莱认为矩阵的引进是十分自然的 他说 我决然不是通过四元数而获得矩阵概念的 它或是直接从行列式的概念而来 或是作为一个表达线性方程组的方便方法而来的 3 他从1858年开始 发表了 矩阵论的研究报告 等一系列关于矩阵的专门论文 6 7 研究了矩阵的运算律 矩阵的逆以及转置和特征多项式方程 凯莱还提出了凯莱 哈密尔顿定理 并验证了3 3矩阵的情况 又说进一步的证明是不必要的 哈密尔顿证明了4 4矩阵的情况 而一般情况下的证明是弗罗贝尼乌斯于1898年给出的 3 此后更多数学家开始对矩阵进行研究 埃尔米特证明了如果矩阵等于其复共轭转置 则特征根为实数 这种矩阵后来被称为埃尔米特矩阵 3 弗罗贝尼乌斯对矩阵的特征方程 特征根 矩阵的秩 正交矩阵 矩阵方程等方面做了大量工作 1878年 在引进了不变因子 初等因子等概念的同时 弗罗贝尼乌斯给出了正交矩阵 相似矩阵和合同矩阵的概念 同年 他探讨了矩阵的最小多项式 最小方程 问题 1894年的论文中 他讨论了矩阵理论和四元数理论的关系 1896年 他给出了凯莱 哈密尔顿定理的完整证明 1 矩阵理论在19世纪沿着两个方向发展 分别是作为抽象代数结构和作为代数工具描述几何空间的线性变换 矩阵理论为群论和不变量理论的发展 无限维矩阵的研究始于1884年 庞加莱在两篇不严谨地使用了无限维矩阵和行列式理论的文章后开始了对这一方面的专门研究 1 1906年 希尔伯特引入无限二次型 相当于无限维矩阵 对积分方程进行研究 极大地促进了无限维矩阵的研究 在此基础上 施密茨 赫林格和特普利茨发展出算子理论 而无限维矩阵成为了研究函数空间算子的有力工具 1 定义 编辑将一些元素排列成若干行 每行放上相同数量的元素 就是一个矩阵 这里说的元素可以是数字 例如以下的矩阵 A 9 13 5 1 11 7 3 9 2 6 0 7 displaystyle mathbf A begin bmatrix 9 amp 13 amp 5 1 amp 11 amp 7 3 amp 9 amp 2 6 amp 0 amp 7 end bmatrix dd 排列成的形状是矩形 所以称为矩阵 在中國大陸 橫向的元素组称為 行 縱向称為 列 而在臺灣則相反 橫向称為 列 縱向称為 行 8 矩阵一般用大写拉丁字母表示 需要具体写出其中元素时 一般用方括号或圆括号括起 以上的矩阵A displaystyle mathbf A 是一个4行3列的矩阵 行数是1或列数是1的矩阵又可分别称为行向量和列向量 这是因为一个向量可以表示成行数或列数是1的矩阵形式 矩阵的任一行 列都是一个行 列向量 例如矩阵A displaystyle mathbf A 的第一行 9 13 5 displaystyle begin bmatrix 9 amp 13 amp 5 end bmatrix 就是一个行向量 行 列向量可以看成一个向量 因此可以称矩阵的两行 列相等 或者某一行等于某一列 表示其对应的向量相等 标记 编辑 一个矩阵A displaystyle mathbf A 從左上角數起的第i displaystyle i 行第j displaystyle j 列上的元素称为第i j displaystyle i j 項 通常记为A i j displaystyle mathbf A i j A i j displaystyle mathbf A ij a i j displaystyle mathrm a ij 或A i j displaystyle mathbf A i j 在上述例子中A 4 3 7 displaystyle mathbf A 4 3 7 如果不知道矩阵A displaystyle mathbf A 的具体元素 通常也会将它记成A a i j m n displaystyle mathbf A mathbf a ij m times n 或A a i j m n displaystyle mathbf A mathbf a i j m times n 反之 如果A displaystyle mathbf A 的元素可以写成只与其行数i displaystyle i 和列数j displaystyle j 有关的统一函数f displaystyle f 那么也可以用A f i j m n displaystyle mathbf A left f i j right m times n 作为A displaystyle mathbf A 的简写 例如B i 2 j 2 3 displaystyle mathbf B left i 2j right 2 times 3 是矩阵 B 3 5 7 4 6 8 displaystyle mathbf B begin bmatrix 3 amp 5 amp 7 4 amp 6 amp 8 end bmatrix dd 的简写 要注意的是 在计算机编程中 由于数组的首项是第0项 故编程者可能会将第1行 列称为第0行 列 从而对矩阵的写法产生影响 比如矩阵B displaystyle mathbf B 就要改写成B i 2 j 3 2 3 displaystyle mathbf B left i 2j 3 right 2 times 3 矩阵的元素可以是数字 符号或数学表达式 一般为了支援矩阵的运算 矩阵的元素之间应当能做加减法和乘法 所以是某个环裡的元素 最常见的是元素属于实数域或复数域的矩阵 简称为实矩阵和复矩阵 更一般的情况下 矩阵的元素可以是由一个环中的元素排成 给定一个环R displaystyle mathbf R 所有由R displaystyle mathbf R 中元素排成的m n displaystyle m times n 矩陣的集合写作M m n R displaystyle mathcal M m n mathbf R 或M m n R displaystyle mathcal M m times n mathbf R 若m n displaystyle m n 則通常記以M m R displaystyle mathcal M m mathbf R 或M m R displaystyle mathcal M m mathbf R 称其为n displaystyle n 维矩阵或方阵 矩陣的基本運算 编辑主条目 矩阵加法 转置矩阵和初等矩阵 矩阵的最基本运算包括矩阵加 减 法 数乘和转置运算 被称为 矩阵加法 数乘 和 转置 的运算不止一种 9 其中最基本最常用的定义如下 运算 定义 例子加 减 法 m n displaystyle m times n 矩陣A displaystyle mathbf A 和B displaystyle mathbf B 的和 差 A B displaystyle mathbf A pm mathbf B 為一个m n displaystyle m times n 矩陣 其中每个元素是A displaystyle mathbf A 和B displaystyle mathbf B 相应元素的和 差 A B i j A i j B i j displaystyle mathbf A pm mathbf B i j mathbf A i j pm mathbf B i j 其中1 i m 1 j n displaystyle 1 leq i leq m 1 leq j leq n 1 3 1 1 0 0 0 0 5 7 5 0 1 0 3 0 1 5 1 7 0 5 0 0 1 3 6 8 5 0 displaystyle begin bmatrix 1 amp 3 amp 1 1 amp 0 amp 0 end bmatrix begin bmatrix 0 amp 0 amp 5 7 amp 5 amp 0 end bmatrix begin bmatrix 1 0 amp 3 0 amp 1 5 1 7 amp 0 5 amp 0 0 end bmatrix begin bmatrix 1 amp 3 amp 6 8 amp 5 amp 0 end bmatrix 数乘 标量c displaystyle c 与矩陣A displaystyle mathbf A 的数乘 c A displaystyle c mathbf A 的每个元素是A displaystyle mathbf A 的相应元素与c displaystyle c 的乘积 c A i j c A i j displaystyle c mathbf A i j c cdot mathbf A i j 2 1 8 3 4 2 5 2 1 2 8 2 3 2 4 2 2 2 5 2 16 6 8 4 10 displaystyle 2 cdot begin bmatrix 1 amp 8 amp 3 4 amp 2 amp 5 end bmatrix begin bmatrix 2 cdot 1 amp 2 cdot 8 amp 2 cdot 3 2 cdot 4 amp 2 cdot 2 amp 2 cdot 5 end bmatrix begin bmatrix 2 amp 16 amp 6 8 amp 4 amp 10 end bmatrix 转置 m n displaystyle m times n 矩阵A displaystyle mathbf A 的转置是一个n m displaystyle n times m 的矩阵 记为A T displaystyle mathbf A mathrm T 有些书中也记为A t r displaystyle mathbf A mathrm tr 或t A displaystyle mathrm t mathbf A A displaystyle mathbf A 其中的第i displaystyle i 个行向量是原矩阵A displaystyle mathbf A 的第i displaystyle i 个列向量 或者说 转置矩阵A T displaystyle mathbf A mathrm T 第i displaystyle i 行第j displaystyle j 列的元素是原矩阵A displaystyle mathbf A 第j displaystyle j 行第i displaystyle i 列的元素 A T i j A j i displaystyle mathbf A mathrm T i j mathbf A j i 1 2 3 0 6 7 T 1 0 2 6 3 7 displaystyle begin bmatrix 1 amp 2 amp 3 0 amp 6 amp 7 end bmatrix T begin bmatrix 1 amp 0 2 amp 6 3 amp 7 end bmatrix 矩阵的加法运算满足交换律 A B B A displaystyle mathbf A mathbf B mathbf B mathbf A 10 矩阵的转置和数乘运算对加法满足分配律 A B T A T B T displaystyle mathbf A mathbf B mathrm T mathbf A mathrm T mathbf B mathrm T c A B c A c B displaystyle c mathbf A mathbf B c mathbf A c mathbf B 矩阵加法和数乘兩種運算使得M m n R displaystyle mathcal M m n mathbb R 成為一个m n displaystyle mn 维的實數線性空間 而转置和数乘运算满足类似于结合律的规律 c A T c A T displaystyle c mathbf A mathrm T c mathbf A mathrm T 矩阵也有类似行列式的初等变换 即对矩阵的某些行和某些列进行三类操作 交换两行 列 将一行 列的每个元素都乘以一个固定的量 以及将一行 列的每个元素乘以一个固定的量之后加到另一行 列的相应元素上 这些操作在求其逆矩阵时有用 矩阵乘法 编辑主条目 矩陣乘法 矩阵A 和B 相乘得到AB 的示意图 两个矩阵的乘法仅当第一个矩陣A displaystyle mathbf A 的列數 column 和另一个矩阵B displaystyle mathbf B 的行數 row 相等时才能定义 如A displaystyle mathbf A 是m n displaystyle m times n 矩陣和B displaystyle mathbf B 是n p displaystyle n times p 矩陣 它們的乘積A B displaystyle mathbf AB 是一個m p displaystyle m times p 矩陣 它的一个元素 A B i j A i 1 B 1 j A i 2 B 2 j A i n B n j r 1 n A i r B r j displaystyle mathbf AB i j A i 1 B 1 j A i 2 B 2 j cdots A i n B n j sum r 1 n A i r B r j 其中1 i m 1 j p displaystyle 1 leq i leq m 1 leq j leq p 11 例如 1 0 2 1 3 1 3 1 2 1 1 0 1 3 0 2 2 1 1 1 0 1 2 0 1 3 3 2 1 1 1 1 3 1 1 0 5 1 4 2 displaystyle begin bmatrix 1 amp 0 amp 2 1 amp 3 amp 1 end bmatrix times begin bmatrix 3 amp 1 2 amp 1 1 amp 0 end bmatrix begin bmatrix 1 times 3 0 times 2 2 times 1 amp 1 times 1 0 times 1 2 times 0 1 times 3 3 times 2 1 times 1 amp 1 times 1 3 times 1 1 times 0 end bmatrix begin bmatrix 5 amp 1 4 amp 2 end bmatrix 矩阵的乘法满足结合律和对矩阵加法的分配律 左分配律和右分配律 结合律 A B C A B C displaystyle mathbf AB mathbf C mathbf A mathbf BC 左分配律 A B C A C B C displaystyle mathbf A mathbf B mathbf C mathbf AC mathbf BC 右分配律 C A B C A C B displaystyle mathbf C mathbf A mathbf B mathbf CA mathbf CB 矩阵的乘法与数乘运算之间也满足类似结合律的规律 与转置之间则满足倒置的分配律 c A B c A B A c B displaystyle c mathbf AB c mathbf A mathbf B mathbf A c mathbf B A B T B T A T displaystyle mathbf AB mathrm T mathbf B mathrm T mathbf A mathrm T 矩阵乘法不满足交换律 一般来说 矩陣A displaystyle mathbf A 及B displaystyle mathbf B 的乘积A B displaystyle mathbf AB 存在 但B A displaystyle mathbf BA 不一定存在 即使存在 大多数时候A B B A displaystyle mathbf AB neq mathbf BA 比如下面的例子 1 2 3 4 0 1 0 0 0 1 0 3 0 1 0 0 1 2 3 4 3 4 0 0 displaystyle begin bmatrix 1 amp 2 3 amp 4 end bmatrix begin bmatrix 0 amp 1 0 amp 0 end bmatrix begin bmatrix 0 amp 1 0 amp 3 end bmatrix qquad quad begin bmatrix 0 amp 1 0 amp 0 end bmatrix begin bmatrix 1 amp 2 3 amp 4 end bmatrix begin bmatrix 3 amp 4 0 amp 0 end bmatrix 这一特性使得矩阵代数与常见的一些数域 有理数 实数 复数 以及环 多项式环 整数环 都不同 给定一个n displaystyle n 维的方块矩阵A displaystyle mathbf A 与A displaystyle mathbf A 交换的所有方块矩阵构成一个环 称为A displaystyle mathbf A 的交换子环 这些矩阵也构成M n R displaystyle mathcal M n mathbb R 的一个子空间 称为A displaystyle mathbf A 的可交换空间 12 与M n R displaystyle mathcal M n mathbb R 中所有矩阵交换的矩阵只有形如l I n l R displaystyle lambda mathbf I n lambda in mathbb R 的矩阵 称为数乘矩阵 其中的I n displaystyle mathbf I n 是单位矩阵 也就是主对角线上的元素为1 其它元素为0的矩阵 任意矩阵M displaystyle mathbf M 乘以单位矩阵都得到自身 M I n M I n M displaystyle mathbf M mathbf I n mathbf M mathbf I n mathbf M 除了最常见的矩阵乘法定义以外 也有一些较不常见的矩阵乘法 比如阿达马乘积和克罗内克乘积 13 线性方程组 编辑 主条目 线性方程组 矩阵乘法的一个基本应用是在线性方程组上 线性方程组是方程组的一种 它符合以下的形式 a 1 1 x 1 a 1 2 x 2 a 1 n x n b 1 a 2 1 x 1 a 2 2 x 2 a 2 n x n b 2 a m 1 x 1 a m 2 x 2 a m n x n b m displaystyle begin cases a 1 1 x 1 a 1 2 x 2 cdots a 1 n x n b 1 a 2 1 x 1 a 2 2 x 2 cdots a 2 n x n b 2 vdots quad quad quad vdots a m 1 x 1 a m 2 x 2 cdots a m n x n b m end cases 其中的a 1 1 a 1 2 displaystyle a 1 1 a 1 2 以及b 1 b 2 displaystyle b 1 b 2 等等是已知的常数 而x 1 x 2 displaystyle x 1 x 2 等等则是要求的未知数 运用矩阵的方式 可以将线性方程组写成一个向量方程 A x b displaystyle mathbf A mathbf x mathbf b 其中 A displaystyle mathbf A 是由方程组里未知量的系数排成的m n displaystyle m times n 矩陣 x displaystyle mathbf x 是含有n displaystyle n 个元素的行向量 b displaystyle mathbf b 是含有m displaystyle m 个元素的行向量 14 A a 1 1 a 1 2 a 1 n a 2 1 a 2 2 a 2 n a m 1 a m 2 a m n x x 1 x 2 x n b b 1 b 2 b m displaystyle mathbf A begin bmatrix a 1 1 amp a 1 2 amp cdots amp a 1 n a 2 1 amp a 2 2 amp cdots amp a 2 n vdots amp vdots amp ddots amp vdots a m 1 amp a m 2 amp cdots amp a m n end bmatrix quad mathbf x begin bmatrix x 1 x 2 vdots x n end bmatrix quad mathbf b begin bmatrix b 1 b 2 vdots b m end bmatrix 这个写法下 将原来的多个方程转化成一个向量方程 在已知矩阵A displaystyle mathbf A 和向量b displaystyle mathbf b 的情况下 求未知向量x displaystyle mathbf x 线性变换 编辑 主条目 线性变换 矩陣是线性变换的便利表達法 矩陣乘法的本质在联系到线性变换的时候最能体现 因为矩阵乘法和线性变换的合成有以下的联系 以R n displaystyle mathbb R n 表示所有長度為n displaystyle n 的行向量的集合 每个m n displaystyle m times n 的矩阵A displaystyle mathbf A 都代表了一个从R n displaystyle mathbb R n 射到R m displaystyle mathbb R m 的线性变换 反过来 对每個线性变换f R n R m displaystyle f mathbb R n rightarrow mathbb R m 都存在唯一m n 矩陣A f displaystyle mathbf A f 使得对所有R n displaystyle mathbb R n 中的元素x displaystyle x f x A f x displaystyle f x A f x 这个矩阵A f displaystyle mathbf A f 第i displaystyle i 行第j displaystyle j 列上的元素是正则基向量e j 0 0 1 0 0 T displaystyle mathbf e j 0 cdots 0 1 0 cdots 0 T 第j 个元素是1 其余元素是0的向量 在f displaystyle f 映射后的向量f e j displaystyle f mathbf e j 的第i displaystyle i 个元素 也就是说 从R n displaystyle mathbb R n 射到R m displaystyle mathbb R m 的线性变换构成的向量空间L R n R m displaystyle mathcal L left mathbb R n mathbb R m right 上存在一个到M m n R displaystyle mathcal M m n mathbb R 的一一映射 f A f displaystyle f mapsto A f 以下是一些典型的2维实平面上的线性变换对平面向量 图形 造成的效果 以及它们对应的2维矩阵 其中每个线性变换将蓝色图形映射成绿色图形 平面的原点 0 0 用黑点表示 推移 幅度m 1 25 水平鏡射变换 挤压 变换 压缩程度r 3 2 伸縮 3 2倍 旋轉 左转30 1 1 25 0 1 displaystyle begin bmatrix 1 amp 1 25 0 amp 1 end bmatrix 1 0 0 1 displaystyle begin bmatrix 1 amp 0 0 amp 1 end bmatrix 3 2 0 0 2 3 displaystyle begin bmatrix frac 3 2 amp 0 0 amp frac 2 3 end bmatrix 3 2 0 0 3 2 displaystyle begin bmatrix frac 3 2 amp 0 0 amp frac 3 2 end bmatrix cos p 6 sin p 6 sin p 6 cos p 6 displaystyle begin bmatrix cos frac pi 6 amp sin frac pi 6 sin frac pi 6 amp cos frac pi 6 end bmatrix 设有k m displaystyle k times m 的矩陣B displaystyle mathbf B 代表线性變換g R m R k displaystyle g mathbf R m rightarrow mathbf R k 則矩陣積B A displaystyle mathbf BA 代表了綫性變換的复合g f displaystyle g circ f 15 因为 g f x g f x g A x B A x B A x displaystyle g circ f x g f x g mathbf Ax mathbf B mathbf Ax mathbf BA mathbf x 矩阵的秩是指矩阵中线性无关的行 列向量的最大个数 16 同时也是矩阵对应的线性变换的像空间的维度 17 秩 零化度定理说明矩阵的列数量等于矩阵的秩与零空间维度之和 18 方块矩阵 编辑主条目 方块矩阵 行数与列数相同的矩阵称为方块矩阵 简称方阵 所有n displaystyle n 维的方块矩阵构成一个线性空间 这个空间对矩阵乘法也是封闭的 因此也是一个代数 方阵A displaystyle mathbf A 称为可逆或非奇异的 如果存在另一个方阵B displaystyle mathbf B 使得 A B I n displaystyle mathbf AB mathbf I n 成立 这时候可以证明也有B A I n displaystyle mathbf BA mathbf I n 成立 19 可将矩阵B displaystyle mathbf B 称为A displaystyle mathbf A 的逆矩阵 20 一个矩阵A displaystyle mathbf A 的逆矩阵如果存在的话 就是唯一的 通常记作A 1 displaystyle mathbf A 1 矩阵A displaystyle mathbf A 的元素A i i displaystyle A i i 称为其主对角线上的元素 方块矩阵A displaystyle mathbf A 的所有主对角线元素之和称为它的迹 写作t r A displaystyle mathrm tr mathbf A 尽管矩阵的乘法不满足交换律 方阵相乘时交换顺序会导致乘积变化 但它们的迹不会变 即t r A B t r B A displaystyle mathrm tr mathbf AB mathrm tr mathbf BA 21 除此以外 矩阵转置的迹等于其自身的迹 t r A t r A T displaystyle mathrm tr mathbf A mathrm tr mathbf A mathrm T 如果一个方阵只有主对角线上的元素不是0 其它都是0 那么称其为对角矩阵 如果主对角线上方的元素都是0 那么称为下三角矩阵 反之如果主对角线下方的元素都是0 那么称为上三角矩阵 例如n 3 displaystyle n 3 的时候 这些矩阵分别写作 d 11 0 0 0 d 22 0 0 0 d 33 displaystyle begin bmatrix d 11 amp 0 amp 0 0 amp d 22 amp 0 0 amp 0 amp d 33 end bmatrix 对角矩阵 l 11 0 0 l 21 l 22 0 l 31 l 32 l 33 displaystyle begin bmatrix l 11 amp 0 amp 0 l 21 amp l 22 amp 0 l 31 amp l 32 amp l 33 end bmatrix 下三角矩阵 和 u 11 u 12 u 13 0 u 22 u 23 0 0 u 33 displaystyle begin bmatrix u 11 amp u 12 amp u 13 0 amp u 22 amp u 23 0 amp 0 amp u 33 end bmatrix 上三角矩阵 dd 行列式 编辑 主条目 行列式 R2 裡的一个线性变换f将蓝色图形变成绿色图形 面积不变 而顺时针排布的向量x 1和x 2的变成了逆时针排布 对应的矩阵行列式是 1 方块矩阵A displaystyle mathbf A 的行列式是一个将其映射到标量的函数 记作det A displaystyle det mathbf A 或 A displaystyle mathbf A 反映了矩阵自身的一定特性 一个方阵的行列式等于0当且仅当该方阵不可逆 系数是实数的时候 二维 三维 方阵A displaystyle mathbf A 的行列式的绝对值表示单位面积 体积 的图形经过A displaystyle mathbf A 对应的线性变换后得到的图形的面积 体积 而它的正负则代表了对应的线性变换是否改变空间的定向 行列式为正说明它保持空间定向 行列式为负则说明它逆转空间定向 2 2矩阵的行列式是 a b c d a d b c displaystyle begin vmatrix a amp b c amp d end vmatrix ad bc 3 3矩阵的行列式由6项组成 更高维矩阵的行列式则可以使用莱布尼兹公式写出 22 或使用拉普拉斯展开由低一维的矩阵行列式递推得出 23 两个矩阵相乘 乘积的行列式等于它们的行列式的乘积 det A B det A det B displaystyle det mathbf AB det mathbf A cdot det mathbf B 24 将矩阵的一行 列乘以某个系数加到另一行 列上不改变矩阵的行列式 将矩阵的两行 列互换则使得其行列式变号 25 用这两种操作可以将矩阵变成一个上三角矩阵或下三角矩阵 而后两种矩阵的行列式就是主对角线上元素的乘积 因此能方便地计算 运用行列式可以计算线性方程组的解 见克萊姆法則 26 特征值与特征向量 编辑 主条目 特征向量 n n displaystyle n times n 的方块矩阵A displaystyle mathbf A 的一个特征值和对应特征向量是满足 A v l v displaystyle mathbf Av lambda mathbf v 27 的标量l displaystyle lambda 以及非零向量v displaystyle mathbf v 特征值和特征向量的概念对研究线性变换很有帮助 一个线性变换可以通过它对应的矩阵在向量上的作用来可视化 一般来说 一个向量在经过映射之后可以变为任何可能的向量 而特征向量具有更好的性质 28 假设在给定的基底下 一个线性变换对应着某个矩阵A displaystyle mathbf A 如果一个向量x displaystyle mathbf x 可以写成矩阵的几个特征向量的线性组合 x c 1 x l 1 c 2 x l 2 c k x l k displaystyle mathbf x c 1 mathbf x lambda 1 c 2 mathbf x lambda 2 cdots c k mathbf x lambda k 其中的x l i displaystyle mathbf x lambda i 表示此向量对应的特征值是l i displaystyle lambda i 那么向量x displaystyle mathbf x 经过线性变换后会变成 A x c 1 l 1 x l 1 c 2 l 2 x l 2 c k l k x l k displaystyle mathbf Ax c 1 lambda 1 mathbf x lambda 1 c 2 lambda 2 mathbf x lambda 2 cdots c k lambda k mathbf x lambda k 可以清楚地知道变换后向量的结构 另一个等价的特征值定义是 标量l displaystyle lambda 为特征值 如果矩阵A l I n displaystyle mathbf A lambda mathbf I n 是不可逆矩阵 根据不可逆矩阵的性质 这个定义也可以用行列式方程描述 l displaystyle lambda 为特征值 如果 det l I n A 0 displaystyle det lambda mathbf I n mathbf A 0 29 这个定义中的行列式可以展开成一个关于l displaystyle lambda 的n阶多项式 叫做矩阵A 的特征多项式 记为p A displaystyle p mathbf A 特征多项式是一个首一多项式 最高次项系数是1的多项式 它的根就是矩阵A displaystyle mathbf A 特征值 30 哈密尔顿 凯莱定理说明 如果用矩阵A displaystyle mathbf A 本身代替多项式中的不定元l displaystyle lambda 那么多项式的值是零矩阵 31 p A A 0 displaystyle p mathbf A mathbf A 0 对称 编辑 主条目 对称矩阵 转置等于自己的矩阵 即满足A A T displaystyle mathbf A mathbf A mathrm T 的方块矩阵A displaystyle mathbf A 叫做对称矩阵 满足A A T displaystyle mathbf A mathbf A mathrm T 的矩阵称为反对称矩阵 在复系数矩阵中 则有埃尔米特矩阵的概念 满足A A displaystyle mathbf A mathbf A 的方块矩阵称为埃尔米特矩阵 其中的A displaystyle mathbf A 表示A displaystyle mathbf A 的共轭转置矩阵 根据谱定理 实对称矩阵和复埃尔米特矩阵拥有特征基 即由矩阵的特征向量组成的基底 因此任何向量都能表示成矩阵特征向量的线性组合 此外 这两类矩阵的特征值都是实数 32 正定性 编辑 矩阵表达式 1 4 0 0 1 4 displaystyle begin bmatrix frac 1 4 amp 0 0 amp frac 1 4 end bmatrix 1 4 0 0 1 4 displaystyle begin bmatrix frac 1 4 amp 0 0 amp frac 1 4 end bmatrix 正定性 不定矩阵 正定矩阵对应二次型 Q x y 1 4 x 2 y 2 displaystyle Q x y frac 1 4 x 2 y 2 Q x y 1 4 x 2 y 2 displaystyle Q x y frac 1 4 x 2 y 2 取值图像 说明 正定矩阵对应的二次型的取值范围永远是正的 不定矩阵对应的二次型取值则可正可负主条目 正定矩阵 n n displaystyle n times n 的实对称矩阵A displaystyle mathbf A 如果满足对所有非零向量x R n displaystyle mathbf x in mathbf R n 对应的二次型 Q x x T A x displaystyle Q mathbf x mathbf x mathrm T mathbf Ax 函数值都是正数 就称A displaystyle mathbf A 为正定矩阵 类似地还有半正定矩阵 负定矩阵 不定矩阵等概念 33 对称矩阵的正定性与其特征值密切相关 矩阵是正定的当且仅当其特征值都是正数 34 矩阵的计算 编辑矩阵在许多学科领域中都有应用 在很多时候 除了需要知道矩阵的理论性质以外 还需要计算矩阵的数值 为了矩阵的计算能够足够精确与快捷 数值线性代数中专门有研究矩阵的数值计算方法 35 与其它的数值计算一样 矩阵的数值计算注重的主要也是算法的复杂度和数值稳定性 矩阵的数值计算可以使用直接计算 也可以用迭代算法 例如在计算方块矩阵的特征值时 可以从一个非零向量x 0 displaystyle x 0 开始 通过特定迭代方法得到一个逼近某个特征向量的向量序列 36 测量一个算法的复杂度是指估计此算法需要的基本运算如数字的加法和乘法的次数 或者找出它的一个上界 例如按照定义计算的话 两个n displaystyle n 阶方阵的乘法需要n 3 displaystyle n 3 次数字乘法计算 因为其乘积是一个n displaystyle n 阶方阵 有n 2 displaystyle n 2 个元素 计算每个元素需要n displaystyle n 次数字乘法 如果使用施特拉森算法的话 可以将数字乘法的次数减低到大约n 2 8 displaystyle n 2 8 次 37 此外 编程语言或环境本身对算法的复杂度也会有影响 某些特殊类型的矩阵携带的数据量比一般矩阵要少 同时带来的信息量比一般矩阵多 一个重要的例子是稀疏矩阵 这类矩阵中绝大部分的元素是零 有关稀疏矩阵的计算 如计算稀疏矩阵A displaystyle mathbf A 的线性方程组A x b displaystyle mathbf Ax mathbf b 时 可以使用一些专用于稀疏矩阵的特殊算法 比如共轭梯度法 38 减低计算复杂度 算法的数值稳定性是指输入值的小变化不会让计算结果产生很大偏差 例如计算矩阵的逆时 可以用以下的算法 其中a d j A displaystyle mathrm adj mathbf A 表示A displaystyle mathbf A 的伴随矩阵 d e t A displaystyle mathrm det mathbf A 表示A displaystyle mathbf A 的行列式 A 1 adj A det A displaystyle mathbf A 1 frac operatorname adj mathbf A det mathbf A 这个算法在A displaystyle mathbf A 的行列式接近0的时候会引起很大的舍入误差 39 而如果使用全选主元的高斯消去法求逆 则在复杂度降低的同时能够避免舍入误差 保证数值稳定性 矩阵分解 编辑 主条目 矩阵分解 对角化 高斯消去法和巴莱斯算法 矩阵研究的一大方向是将一般的矩阵用一些比较 简单 的矩阵来表示 这种表示方式称为矩阵的变换与分解 矩阵变换与分解的方法有很多 它们的目的都是希望化简后的矩阵保持原矩阵的某些性质 比如行列式 秩或逆矩阵 而形式相对简单 因而能用容易地进行讨论和计算 或者能使得某些算法更易执行 LU分解将矩阵分解为一个下三角矩阵L displaystyle mathbf L 和一个上三角矩阵U displaystyle mathbf U 的乘积 40 分解后的矩阵可以方便某些问题的解决 例如解线性方程组时 如果将系数矩阵A displaystyle mathbf A 分解成A L U displaystyle mathbf A mathbf LU 的形式 那么方程的求解可以分解为求解L y b displaystyle mathbf Ly mathbf b 和U x y displaystyle mathbf Ux mathbf y 两步 而后两个方程可以十分简洁地求解 详见三角矩阵中 向前与向后替换 一节 又例如在求矩阵的行列式时 如果直接计算一个矩阵A displaystyle mathbf A 的行列式 需要计算大约 n 1 displaystyle n 1 次加法和乘法 而如果先对矩阵做L U displaystyle mathbf LU 分解 再求行列式 就只需要大约n 3 displaystyle n 3 次加法和乘法 大大降低了计算次数 这是因为做L U displaystyle mathbf LU 分解的复杂度大约是n 3 displaystyle n 3 次 而后注意到L displaystyle mathbf L 和U displaystyle mathbf U 是三角矩阵 所以求它们的行列式只需要将主对角线上元素相乘即可 若尔当矩阵 其中灰色框内的是若尔当块 高斯消去法也是一种矩阵分解方法 通过初等变换操作 可以将任何矩阵变为阶梯形矩阵 而每个操作可以看做是将矩阵乘上一个特定的初等矩阵 41 奇异值分解则是另一种分解方法 将一个矩阵表示成3个矩阵的乘积 A U D V displaystyle mathbf A mathbf UDV 其中U displaystyle mathbf U 和V displaystyle mathbf V 是酉矩阵 D displaystyle mathbf D 是对角矩阵 特征分解是将一个矩阵A displaystyle mathbf A 写成P D P 1 displaystyle mathbf PDP 1 的形式 其中P displaystyle mathbf P 是一个可逆矩阵 D displaystyle mathbf D 是对角矩阵 42 如果A displaystyle mathbf A 的特征分解存在 就称它是可对角化的矩阵 不能对角化的矩阵 也有类似的分解方式 任意的矩阵A displaystyle mathbf A 都可以写成P J P 1 displaystyle mathbf PJP 1 的形式 其中的矩阵J displaystyle mathbf J 是若尔当标准型 若尔当标准型是矩阵的一种 它与对角矩阵类似 只不过主对角线上的元素不是数值 而是若尔当块 主对角线上为同一元素l i displaystyle lambda i 主对角线右上一行的次对角线上都是1 其它元素都是0的矩阵 见右图 43 特征分解可以方便计算矩阵的幂次和多项式 如要计算A n displaystyle mathbf A n A n P D P 1 n P D P 1 P D P 1 P D P 1 P D n P 1 displaystyle mathbf A n mathbf PDP 1 n mathbf PDP 1 mathbf PDP 1 ldots mathbf PDP 1 mathbf PD n mathbf P 1 而其中对角矩阵的幂次D n displaystyle mathbf D n 要比A n displaystyle mathbf A n 容易计算得多 同理还可计算矩阵指数 e A displaystyle e mathbf A 在线性微分方程中有应用 矩阵对数和矩阵的平方根 44 为了提高算法的数值稳定性 还有舒尔分解等矩阵分解方法 45 矩阵的推广 编辑矩阵的元素除了可以是实数和复数以外 也可以任意环或域中元素 在线性代数中 矩阵的性质可以经由有限维的线性空间中的线性变换定义 更广泛的 无限维空间中的线性算子 则可以定义更广泛的无穷维矩阵 矩阵的另一种推广是张量 标量可以看成零维方式排列的数据 只有一个 点 向量可以看成是一维方式排列的数据 若干个 点 排成的 线段 矩阵可以看成是二维方式排列的数据 若干个 线段 排成的 矩形 而张量的概念则包括了这几种排列方式 在张量的概念中 标量是零维张量 向量是一维张量 矩阵是二维張量 而更高维方式排列的数据方式就是高维张量 46 一般域和环上的矩阵 编辑 矩阵的元素除了可以是实数和复数以外 还可以是任何能够使得矩阵的运算律成立的元素 首先 矩阵的元素可以是任意一个域 即能够进行 加减乘除 运算的集合 中元素 例如编码理论中会出现系数为有限域中元素的矩阵 以及有理数系数的矩阵 如果矩阵的系数所在域K displaystyle mathbf K 不是代数闭域 那么在求矩阵的特征值时 由于特征值是相应的特征多项式的根 可能不在系数域K displaystyle mathbf K 中 而是在系数域的某个扩域L中 反过来 如果考虑扩域L K displaystyle mathbf L K 以及L displaystyle mathbf L 中的一个元素a displaystyle alpha 以及L displaystyle mathbf L 中线性变换m a x a x displaystyle m alpha x mapsto alpha x 那么由于m a displaystyle m alpha 也是一个K displaystyle mathbf K 线性变换 它可以表示成一个n n displaystyle n times n 的K displaystyle mathbf K 系数矩阵X a displaystyle X alpha 其中的n displaystyle n 是扩域L K displaystyle mathbf L K 的阶数 a displaystyle alpha 是这个矩阵的特征值 这个矩阵的特征多项式p X a displaystyle p X alpha 是a displaystyle alpha 在K displaystyle mathbf K 中的最小多项式min K a displaystyle operatorname min mathbf K alpha 的幂次 p X a min K a r displaystyle p X alpha left operatorname min mathbf K alpha right r 其中的r displaystyle r 是扩域L K displaystyle mathbf L K a displaystyle alpha 的阶数 47 更一般的情况是矩阵的元素属于某个环R displaystyle mathbf R 48 环是比域更广泛的概念 只要求其中元素能够进行加减法和乘法运算 不一定能定义除法 给定一个环R displaystyle mathbf R M m n R displaystyle mathcal M m n mathbf R 中的矩阵之间可以相互加减以及相乘 所以M m n R displaystyle mathcal M m n mathbf R 关于矩阵的加法和乘法也构成一个环 称为矩阵环 n displaystyle n 维方阵的环M n R displaystyle mathcal M n mathbf R 與左R displaystyle mathbf R 模R n displaystyle mathbf R n 的自同態環同構 49 若R displaystyle mathbf R 是交换环 則M m R displaystyle mathcal M m mathbf R 是一个帶單位元的R displaystyle mathbf R 代數 满足结合律 但不满足交换律 其中的矩阵仍然可以用莱布尼兹公式定義行列式 一个矩阵可逆当且仅当其行列式为环R displaystyle mathbf R 中的可逆元 域上的矩阵可逆只需行列式不等于0 50 矩阵与线性变换 编辑 前面已经提到 所有R n R m displaystyle mathbf R n rightarrow mathbf R m 的线性变换都对应着一个M m n R displaystyle mathcal M m n mathbf R 中的矩阵 更一般地 给定了基底后 任意两个有限维线性空间之间的线性映射f V W displaystyle f mathbf V rightarrow mathbf W 也对应着一个矩阵A f a i j displaystyle mathbf A f a ij 设空间V displaystyle mathbf V 和W displaystyle mathbf W 的基底分别是v 1 v n displaystyle mathbf v 1 ldots mathbf v n 和w 1 w m displaystyle mathbf w 1 ldots mathbf w m 那么 对任意 j 1 n displaystyle j 1 ldots n f v j i 1 m a i j w i displaystyle f mathbf v j sum i 1 m a i j mathbf w i 矩阵A f displaystyle mathbf A f 实际上 记录 了V displaystyle mathbf V 中每个基底向量经过变换后得到的W displaystyle mathbf W 中的像在基底 w 1 w m displaystyle mathbf w 1 ldots mathbf w m 下的形式 要注意矩阵的内容取决于基底的选择 可以说 矩阵是线性变换f在特定 角度 基底 下的 素描 不同的 角度 下 描述f displaystyle f 的矩阵是不同的 但这些矩阵都是相似矩阵 51 与矩阵有关的基本概念都可以用线性变换的层面来解释 比如一个矩阵的转置可以用f的对偶变换f W V displaystyle f mathbf W rightarrow mathbf V 来表示 52 当矩阵的元素是带单位元的环R displaystyle mathbf R img, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。