教练!我想学线性代数!!! | HyperPlane

教练!我想学线性代数!!!

线性代数很多人都学过了,不过本科的线性代数这门课程基本上只教如何计算,学完之后心里简直不要有太多疑惑。行列式到底是什么?矩阵乘法为什么是这样的形式?特征值特征向量到底有什么意义?线性方程组为什么这样有解那样又没解?当然还有其他的很多问题,这篇文章不一定能解答所有的困惑,但是希望能和大家一起窥探一下线性代数到底是什么。如果有错误或者有其它更好的理解欢迎一起讨论~

既然是数学还是从定义开始比较好吧

说到线性代数,肯定要先讲线性这个东西,什么是线性我也不能自己胡说八道,翻了一本教材找到几个定义:


线性空间
XX是一个非空集合,K\mathbb{K}是数域(实数域R\mathbb{R}或复数域C\mathbb{C}),XX称为数域K\mathbb{K}上的线性空间,若x,yX\forall x,y \in X,都有唯一的一个元素zXz \in X与之对应,称为xxyy的和,记作

z=x+y;z=x+y ;

xX,αK\forall x \in X,\alpha \in \mathbb{K},都有唯一的一个元素uXu \in X与之对应,称为α\alphaxx的积,记作

u=αx.u = \alpha x.

x,y,zX,α,βK\forall x,y,z \in X, \alpha , \beta \in \mathbb{K},上述的加法与数乘运算(称为线性运算)满足下列8条运算规律:

  1. x+y=y+xx+y=y+x
  2. (x+y)+z=x+(y+z)(x+y)+z = x+(y+z)
  3. XX中存在零元素θ\theta,使得xX\forall x \in X

θ+x=x;\theta + x = x;

  1. xX\forall x \in X,存在负元素xX-x \in X,使得

x+(x)=θ;x + (-x) = \theta;

  1. 1x=x;1 \cdot x = x;
  2. α(βx)=(αβ)x;\alpha (\beta x) = (\alpha \beta)x;
  3. (α+β)x=αx+βx;(\alpha + \beta)x = \alpha x + \beta x;
  4. α(x+y)=αx+αy.\alpha (x+y) = \alpha x + \alpha y.

线性子空间
MM是线性空间XX的非空子集,若MMXX上的线性运算封闭,即x,yM,α,βK\forall x,y \in M, \alpha , \beta \in \mathbb{K},都有

αx+βyM,\alpha x + \beta y \in M ,

则称MMXX线性子空间


线性变换
从域K\mathbb{K}上的一个线性空间到另一个线性空间的线性变换T:VWT:V \rightarrow W是一个映射,它与加法和标量乘法相容:

T(v1+v2)=T(v1)+T(v2),T(cv1)=cT(v1)T(v_1 + v_2) = T(v_1) + T(v_2), T(c v_1) = cT(v_1)

v1,v2V\forall v_1, v_2 \in VcKc \in \mathbb{K}成立。

定义太抽象了,来点直观的吧

看完了枯燥的定义之后,我们来点形象一点的东西吧,从形如

y=kxy=kx

的函数开始。也许会有同学问为什么不是考虑形如y=kx+by=kx+b的函数,结合上面给的一些定义看看,答案应该很简单。
那么y=kxy=kx是什么呢?将它画在坐标系中,它是一条穿过原点的直线;将它看作一个函数,它是一个线性变换;将它看作一系列满足条件的点的集合,它是一个线性(子)空间。私认为,这就是线性最简单最直观的表示了。
让我们回到线性代数中经常提到的多维变量和矩阵中来,在使用线性代数的时候经常是要用来求解形如

Ax=bAx=b

的方程。是否和刚刚讨论的东西有点像呢?我就不把说过的一些内容再说一遍了。言归正传,接下来就对每一个点展开讨论一下吧。

矩阵乘法

可能在刚接触线性代数的时候,大家最迷糊的就是为什么矩阵乘法的计算规则是这样的,接下来就开始一番推理吧。

矩阵乘法的形式

讲回刚刚提到的,线性代数使用最多的场景应该就是求解形如

Ax=bAx = b

的方程。那么这个方程到底是怎么来的呢?如果你线性代数学的好应该很清楚,这就是一个多元一次方程组(懒得打这个式子来太麻烦了,大家这里脑补一下)。在多元一次方程组中,每一个未知量都要写好多遍啊,好烦啊怎么办,能不能只写一遍。(接下来我要开始编了)好的,我们把未知量提取出来于是有了xT=[x1,x2,,xn]x^T = [x_1, x_2, \dots, x_n]。那系数和等式右边的量怎么办呢?好的,先搞成AAbb排列起来再说吧。系数通常是要写在未知量左边的,等号两边的位置是不能变的,好了,这个等式形式就先排成这样吧

A[x1x2xn]=bA \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} = b

通过观察构造计算法则,于是大家节约了很多墨水和草稿纸,过上了幸福的生活。

矩阵乘法的几何意义

我们提起矩阵和向量,通常都会用几维几维这样的字眼。我们知道维度通常被认为是个几何概念,线性这个东西也是由过原点的直线得来,所以线性代数的讨论不能离开几何。
所以再一次让我们回到

Ax=bAx=b

这个东西上来。此时我们需要考虑一个问题,这里需要求解的xx到底是个什么东西?再具体的说明之前我觉得先进行一个简单的推导比较合适

[a1,a2,,an][x1x2xn]=bx1a1+x2a2++xnan=b \begin{aligned} [a_1, a_2, \dots, a_n] \begin{bmatrix} x_1 \\ x_2 \\ \vdots \\ x_n \end{bmatrix} &= b \\ x_1 a_1 + x_2 a_2 + \dots + x_n a_n &= b \end{aligned}

这个时候我们就需要提到一个概念了,基。回想一下我们刚学向量的时候,向量是什么?向量是一个点的坐标,也是一个带有大小的方向。可以看作是每个坐标轴上投影坐标的组合,也可以看作是带有大小的坐标轴方向的组合。那么问题来了,如果这个点的位置不变,但是坐标系的基变了呢?虽然点是同一个点,但是在不同的坐标系中坐标就不同了。如果[a1,a2,,an][a_1, a_2, \dots, a_n]是新的基呢?答案也就应该很明晰了。我们要求解得到的xx其实就是bb在新的坐标系中的新坐标。 矩阵乘法其实就是变换坐标系的基。

行列式

为什么要写行列式,理由很简单,因为我们的教材上一开始都上说的行列式。但是很遗憾的是,教材上只有行列式怎么计算。没有哪一本教材解答过行列式是什么,行列式为什么这么计算这样的问题。所以接下来就想聊聊这个东西。

行列式到底是要算什么东西

简单点说是新基和旧基的单位体积比。

行列式为什么这么算

特征值和特征向量

特征值和特征向量与上面说到的矩阵乘法的几何意义还有行列式之间有千丝万缕的联系。
希望能填上的坑有:

  • 矩阵列向量空间和特征向量空间的包含关系
  • 特征向量与特征值的含义(可能要涉及到复数),基变换后方向不变的向量和大小缩放,可以考虑为在标准基下圆的垂直半径变化为椭圆得到的长短轴。
  • 特征值与行列式的关系

(未完待续)