开启辅助访问
 找回密码
 立即注册

有哪些数学教材是你深恶痛绝、绝不推荐的?

dienhoo 回答数5 浏览数1111
oosoochin | 未知
所有强调矩阵计算而不是几何图像的解析几何教材。
事实上按照国内大部分解析几何教材的处理方式,还不如在高代教材中专门加一章讲二次曲面,然后再开一门几何课讲讲射影几何或者庞加莱圆盘上的双曲几何。花一个学期的时间练习二次型化简真的是浪费时间。
回复
使用道具 举报
justrocky | 来自北京
作为学渣,我是工作好久以后才把微积分和线代真正整明白的。
按照我的想法,工科数学入门书,就应该把微积分和线代一块写了。上来先讲清楚矩阵的几何意义,指明矩阵每一列都是变换过的基向量。再从导数定义出发,阐明导数不仅是斜率,而且还是是线性变换。这样把偏微分当基向量,利用矩阵的几何直观,直接写出雅克比矩阵。
然后回过头讲行列式几何上是空间缩放倍率,再用雅克比行列式推导微分变换和微元缩放之类。这样才算真正搞清楚微分,之后积分就很简单,就是举例子,什么曲线曲面标量场向量场都来一遍。接着趁热打铁,讲场的梯度散度旋度,完了顺手列出电磁场方程,然后开始讲微分方程。
直接点出微分算子也是线性变换,再阐明矩阵的特征向量和特征值的几何意义:“旋转轴”和轴上的缩放。从而揭示解微分方程的几何意义,再对微分方程做适度展开,推导出电磁场方程的解。
然后再接再厉,借着微分算子是线性变换的概念,把函数就是向量这一点讲讲,从而引入希尔伯特空间。接着先讲施密特正交化从三维到n维的推广,然后讲定义内积就是定义空间,最后利用正交化构造各种各样的正交基函数,比如傅里叶啊勒让德啊,以这些工科数学工具收尾。
这样用线性变换一条线就穿起工科数学了,而且全程强调了几何意义。数学书为啥不能这么写,哎。
<hr/>这么个小众问题下居然还有几百赞。看来我等工科生苦数学久矣。我打算写写雅克比矩阵的几何直观,能力非常有限保证不了严密性,就是走马观花、到此一游的性质。不知道有没有人看?
1 特征向量和行列式的直观

既然是走马观花,首先要骑个马吧。这马就是矩阵的直观。熟悉的同学可以跳过。
当有人说:“一个矩阵  把向量  变换成向量  ”,他到底在说什么?
最简单的解释就是线性组合,即用a缩放列向量  ,用b缩放另一个列向量  ,然后加起来:


矩阵乘向量最直观的看法:矩阵的每列都是某个“坐标系”的一个基向量,然后用一组数字去缩放各个基向量并叠加(线性组合)。

然而,想真正“直观的”理解这个做法,其实还要绕个弯,因为这里隐含了一些预设信息。
首先,矩阵M之所以能被写出来,是因为M的列向量  和  都具有“意义”——它俩都是定义在某个“绝对空间”或说“父空间”里的实实在在的向量。
这里提到的“绝对空间”“相对空间”很不科学,只是方便指称。
能把矩阵写出来这件事本身就隐含着,存在某个  的“绝对空间”。那么很自然的,此“绝对空间”也有两个基向量。但这俩基向量具体是什么我们故意不去关心,只记为  。
矩阵是个“操作”,这里说的“隐含的绝对空间”其实就是矩阵要操作的对象。正是因为不关心隐含的绝对空间到底是什么,矩阵才成为一种通用的操作。类似于,  是具体计算,但从中可以抽象一个称为 的通用操作,它并不关心到底对谁x2。再规定被操作的对象写在右边,这样就有  ,或者 。而且多个操作还能合并运算,例如: 。相比之下,矩阵作为操作的特点在于不同的合并顺序结果不同。
然后,在向量  张成的“绝对空间”里,数字对  通过线性组合肯定可以确定一个向量 : 。
而在向量 和 张成的“矩阵空间”里,同样的数字对  通过线性组合肯定可以确定另一个向量:  。
注意上面的  有两种表示,这其实意味着两个事实。
第一个事实,  和  是存在于同一个“绝对空间”的,完全不同的两个向量。这当然是对的,两者都是对基  的线性组合,这也是  具有“意义”的基础。这时候矩阵就是所谓线性变换,把向量  “线性”的变成了向量  。
第二个事实,  还生活在向量 和 张成的“矩阵空间”或说“相对空间”里。在这个空间里,  的表示是  。这也是对的,而且这也是线性组合的精髓所在(即,不太关心基到底是啥)。这时候矩阵就是所谓基变换。基变换相当于问,如果在“矩阵空间”里有个向量  ,那么它在“绝对空间”的表示是什么?
从这两个事实出发,由于  是任意取值的,可以代表空间里所有的点,因而直观上不难认同:矩阵M是个映射,它把某个“绝对空间”里的每个向量  ,都映射成另一个“矩阵空间”里的向量  。
考虑到矩阵M只是由几个基向量(坐标轴)组成的,上面这句话其实是个很强大的结论:只要找到了两个空间的“坐标轴”或说“标架”的关系,就相当于找到了两个空间中一切向量的关系。
而两个空间的“标架的关系”到底是什么?其实就是矩阵自己:矩阵的每个列向量,都是矩阵所张成的“相对空间”标架的基向量在绝对空间的表示。
也就是说,把“相对空间”标架的每个基向量并排写出,就是矩阵了。
只要理解了这一点,二维平面空间的旋转:


网图,意会即可

其矩阵就可以直接写出来:  。第一列就是标架{1}的基向量  逆时针转过  的样子,第二列就是标架{1}的另一个基向量  逆时针转过  的样子。如果假设黄色向量  在标架{2}的坐标是  ,那么  在标架{1}的坐标自然就是  对标架{2}的基的线性组合:  
另一种解读是,标架{1}中存在一个(未画出的)  ,被矩阵旋转成了同个标架下的  
同样的道理,三维空间中,绕z轴旋转  角度的旋转矩阵也可以直接写出来:  
这是因为x轴和y轴的旋转跟二维情况是一样的,而z轴作为旋转轴本身不变。
对于这个旋转矩阵,考虑和旋转轴z轴重合的任一向量  ,可以发现一个很平凡的现象:

也就是和z轴(旋转轴)重合的所有向量  都满足  。
说人话就是,z轴方向的一切向量被矩阵施加了“绕z轴旋转的操作”以后方向不变。这几乎是废话,但也给出了关于“旋转轴”的直观理解:如果空间里存在某个方向能够在矩阵操作下保持不变,那这个方向就可称为矩阵的旋转轴。
矩阵的特征向量  和特征值  的定义就是:满足等式  的向量  和标量  。
说人话就是,在矩阵  对空间进行了旋转、缩放操作后,有可能存在一个或多个方向保持不变的旋转轴(特征向量)  。另外,由于矩阵的基是可以“随便写”的,矩阵完全可以产生各种不规则的缩放,这导致旋转轴上的向量虽然能够保持方向不变,但大小却会缩放,这个缩放的倍率就是特征值。
对于“特征向量/特征值”里的“特征”的理解:随便写个矩阵  ,那么它就应该有个特征向量  (旋转轴),除非它没有……
因为随手写的矩阵,似乎不一定会有“旋转轴”,具体判断方法我不懂。但是就算有,找起来也挺麻烦的。
关于找“旋转轴”的难度可以举个例子。我们已经写出了绕z轴旋转某个角度的矩阵  。同样的道理,可以写出绕x轴旋转某个角度的矩阵  ,绕y轴旋转的矩阵  。那么如果耐心的话,三个矩阵合体后的矩阵  也能写出来。问题来了,这个合体矩阵  的旋转轴存在吗,是啥?
这其实是个转换四元数的问题,超纲了,不展开。
下面会看到,微分算符  可以看成是从函数  映射到(导)函数  的“矩阵”,这就是微分方程的通用形式:

和矩阵的特征向量形式:

长得一模一样的原因——对微分方程  寻找解  的过程,就是找微分算符的“旋转轴”。
为啥微分方程不好解呢,因为旋转轴不好找……
除了特征向量之外,矩阵的第二个“固有特性”也很直观:矩阵的所有基向量(列向量)张成的那个几何体的“泛体积”。只有2个基的矩阵张成的就是平行四边形的面积,多于3个基的矩阵张成的就是高维“超体积”。
这里的“体积”和日常谈论的体积有个细微但关键的差别——“单位”。当我们说一个集装箱的容量是若干个立方米时,隐含约定是:三个维度上的“测量单位”或者说三个基的长度都是1m。但线性组合的精髓是:对基的要求非常宽容。甚至不要求基有真正可测量的长度。而且就算基有长度,各个基的“长度”也不一定相等。所以这里的“体积”准确说,是对各个基向量的“缩放倍率”构成的“倍率几何体”的体积。
当矩阵是方阵时,各个基向量张成的几何体的“体积”就称为行列式(把determinant翻成这样也是人才)。
如果把3x3矩阵  写为  ,其行列式的计算公式等价于  。这个式子先叉积就是求底面积,再点积就是乘以高,此处不展开了,总之这就是在计算基向量  所张成的平行四面体的体积。
例如前面提到的绕z轴旋转的矩阵:

因为  ,所以它前两个列向量的长度都是1,第三个列向量长度也是1,而且三个列向量彼此正交(点积为0),那么此矩阵的3个基向量就构成了一个边长为1的立方体,体积或说行列式就是1。
有了行列式的几何直观,这个  是可以直接看出来的,都不用算。
而且不光是绕z轴旋转的  ,把任意个旋转操作叠加起来,得到的还是旋转操作,典型代表是:

贴一张wiki的图吧:


这么复杂的矩阵,也不用算就能肯定行列式是1。因为用到的每个旋转都保证了不改变体积。

所有这样靠旋转得到的矩阵,它们的“体积”或说行列式肯定都是1,都不用算。这样的全部矩阵的集合就被称为:3维特殊正交群Special Orthogonal Group(3),简称SO(3)。所谓特殊,其实就是说这类矩阵不改变体积。
而在改变体积的矩阵里,有一类直接把体积变成0,这样的矩阵虽然“生活”在n维里,却张不成n维体积。所谓行列式为0的矩阵不可逆,其实就是说这些张不出n维体积的虚假的n维矩阵,会把n维空间降为小于n维的空间。被这样的矩阵操作的向量至少会失去一个维度的信息,于是这个向量就不回去了。具体失去几个维度还可以分类,比如可以把立方体拍扁成面,也可以直接浓缩成线……
另外,行列式虽然要求矩阵必须是方阵,并不意味着非方矩阵的基向量就不配张成几何体了。而是说行列式这个概念它比较高冷,它只关心矩阵所生存的那个空间的最高维度N的体积,即N维体积。非方阵如果能张成N-m维的“泛面积”,那么这些面积也会有点用处的。
例如,当矩阵为非方阵时,考虑3x2矩阵  ,由  (就是a、b是三维向量的意思)组成 。  显然是张不出来  体积的,因而没有行列式。但  可以在三维空间里张成一个二维的平行四边形,它有面积,不至于完全没用。如果观察这个矩阵的效果:  ,它把二维向量变成了三维向量,似乎是“升维”的。虽然升完以后还是在三维空间里的二维平面上。
另一方面,给这个3x2矩阵补上一列0向量,  ,这三列还是张不出体积,行列式依然为0,于是它似乎又变成“降维”的了:把三位向量投影到二维平面上。
根本原因还在于  描述了三维空间里的一组二维平面。
好的,准备过程到此结束。矩阵的特征向量和行列式就好比人的身高和体重,一旦直观上认识了这两个特性,应该就能“走马观花”了。
下面终于进入正题,多元函数的微分到底怎么理解。
(待续...
2 多元函数的雅克比矩阵

考虑最简单的多元函数  ,忽略连续可微这些细节。
在  点处,沿着x方向的偏导数可以通过固定  求得,
记作:  
相当于用  点的x-z平面:  去“切片”  ,平面上留下的就是  ,从而可求  在  处的切线斜率,就是 。这属于基础知识不展开了。
现在问题是,如果站在  点,向x方向走一个单位长度,即  ,那么x-z平面的这条切线上升了多少?
由于切线斜率就是  ,那么如果x增加1,切线就上升  。
此时在切线上增加的这一段(注意并不是函数值增加,这时候完全不考虑函数值变化),用向量描述就是  
之所以切线能用向量描述,是因为形如  这样的函数,也就是 的映射,总归能看成  的映射,只要给  的每个  值配上 和  ,差不多就变成  了。前者表示二维平面上的标量场,后者表示三维空间中的曲面,这两个其实就是一回事。  既然是三维空间里的曲面,那它的切线当然能用三维向量描述了。
收一收思路。上面的讨论说明,沿着x方向求偏导,其实给出了这样一个基向量到“切线上向量”的对应关系:

同样的,y方向的偏导也有:

根据前面讲的矩阵直观,这是什么?这不就是矩阵的两个基嘛!直接写出雅克比矩阵:

显然,如果站在函数定义域,也就是xy平面上的某个p点,向任意方向走个二维向量  ,那么  就给出了切平面上对应的向量。
实际上雅克比矩阵  本身就是切平面。更无畏的说,  就是多元函数真正的导数
有了雅克比矩阵,这时候就可以讨论微元变换了。
例如求曲面  在某个范围内的面积分。这里面的关键环节就是,在定义域xy平面里那个微元小方块  的面积,被雅克比矩阵变换到切平面后的缩放倍率  到底是啥?
毕竟有了  才能写出积分式  
根据前面讨论过得矩阵的直观,这个问题就等价于求雅克比矩阵的各个基张成的那个几何体的“泛体积”(面积,体积,高维体积)。
当  是方阵时,  自然是行列式。
当不是方阵时,比如一直讨论的这个:  
这个3x2矩阵的列向量张成的平行四边形的面积,就是缩放倍率  ,也就是  的两个列向量的叉乘(的大小)。
首先叉乘:

再计算叉乘结果的大小:

从而得到第一类曲面积分的通式:

类似的,所有涉及微元变换的都能这么干。比如曲线曲面积分,球坐标转换之类的,就不展开了。
<hr/>额外提个问题,为什么一元函数导数的值是个数字,多元函数导数的值就是个矩阵了呢?其实是一元下把向量省略成数字了。仿照上面的思路,可以写出一元情况下雅克比矩阵:  ,这就是切线向量。但是一元下不说  是导数,而说  的y分量  才是导数。而且给定x方向的微小变化  ,虽然直接引起了切线上的变化(微分):  ,但一元下却规定这个变化的y方向的分量  才是微分。
这肯定有历史原因或其他考量,但这种规定在多元时的不协调就造成多元情况下的理解困难。特别是工科微积分普遍不讲雅克比矩阵的几何含义,就使得多元情况更加模糊。
如果我们私下里把一元的切线方向看成导数( 对应的把切线方向的一段变化的向量  看成微分),那么在二元下说切平面是导数,以及  是微分就很自然了。而且在更多元的情形下,虽然不好再说“切体”和“N维超切体”之类过于中二的词汇,但至少可以明确导数就是雅克比矩阵描述的那个N维的线性变换。
<hr/>3 从雅克比矩阵导出梯度

回到雅克比矩阵本身。  的这个雅克比矩阵:

实际上把  点的定义域平面,也就是xy平面,线性映射到了   点对应的切平面上。
所谓“从平面线性映射到平面”,意思就是,站在 xy平面 的  点上朝着任意方向走一步,所得的那个二维向量  ,总是能在切平面上找到对应的三维切向量  。
这个切向量  的斜率,其实就是方向导数
那么从  点出发的所有向量里,一定有个特殊的二维向量 (称为梯度),它恰好能对应到切平面上斜率(方向导数)最大的那个三维切向量
的特殊性来自于方向,或说角度,因而可设为  ,则对应的  就是:

由向量的斜率  ,那么  的斜率就是:

把等号右边看成是向量点积:

显然只有在  和  重合时点积才最大,从而斜率最大。
既然如此,又考虑到  只在乎方向,可以直接取  ,就能使  的斜率最大。
前面说了,这个  就是梯度,记作 :  
而且,一旦梯度这么简单粗暴的取值了,  就是  ,它的最大斜率就是:

这就是梯度方向最大的导数(斜率)的真正来源。这个斜率值只是“恰好”等于梯度向量的模长而已。或者说,是我们在最大斜率方向上挑选了模长恰好是斜率的向量,定义为梯度。
然而我看过的微积分书里,关于梯度的逻辑链条是很无语的。
先给出方向导数的极限定义,附带几个用极限定义求方向导数的例子。(先给定义,嗯,严谨!)
接着直接定义梯度!说梯度方向的导数最大,而且最大值是  !(开始懵了,为啥梯度这么定义,为啥梯度的模就是最大方向导数?)
最后说,方向导数的方向和梯度点积一下就是方向导数值,完了附送一堆例题。(上当了,原来极限定义就是逗我玩的?原来我只需要死记梯度定义,死记点积就行了么?果然工科生不配理解这些啊!)
好了收一收。现在从梯度里抽象出Nabla算子 :  
所谓算子,简单理解就是函数的函数,吃掉一个函数,吐出另一个函数。
注意微分算子  是向量形式,事情开始复杂了。
注意标量和向量之间的三种运算:

  • 标量(数乘)向量=向量,相当于把1维的标量“升维”到多维的向量。
  • 向量(点乘)向量=标量,相当于把多维的向量“降维”到1维的标量。
  • 向量(叉乘)向量=向量,相当于……勉强相当于计算法向量吧。
考虑到函数可分为标量场函数  和m维向量场函数  
那么 算子作为“形式向量”,和这两类函数之间也存在三种运算:

  • ,即  ,标量场函数  数乘m维算子
  • ,即  ,m维向量场函数  点乘m维算子
  • ,即  ,m维向量场函数  叉乘m维算子
微分算子的这三种运算得的分别就是梯度场函数,散度场函数,和旋度场函数。
再往下写应该也没人看了,打住。
wtf,公式显示抽风了……
用Deepseek满血版问问看
回复
使用道具 举报
xu_yanbin | 来自江苏
粗略浏览了一下底下的回答,被点名批评的教材包括但不限于同济的高数/线代、华东师大的数分、欧阳光中的数分、卓里奇的数分、裴礼文的数分典型问题与方法、周民强的实变、Rudin的数分/实分与复分/泛函三部曲、Stein的Fourier分析/复分/实分/泛函四部曲、王萼芳的高代、丘维声的高代、张贤科的高代、Artin的代数、冯克勤的近世代数、赵春来的两册抽代、丘维声的群表示论、Munkres的拓扑、尤承业的拓扑、白正国的黎曼几何、Hartshorne的代数几何、Hatcher的代数拓扑、Carmo的微分几何…
没有被点名批评的教材有林亚南的高等代数、李红的复变函数与积分变换、周民强的数学分析习题演练、张禾瑞的近世代数基础、江辉有的拓扑学基础、卢开澄的组合数学、人教版的必修一/二/三/四/五/2-1/2-2/2-3…
哪些教材值得一看,这样可谓一目了然。
回复
使用道具 举报
kleon06 | 来自北京
深恶痛绝谈不上吧,我先随便说说几本看了之后略微不爽的书

  • Munkres的代数拓扑。这本书的前几章事无巨细的写了simplicial complex的simplicial homology的计算,包括barycentric subdivision还有simplicial approximation等等非常细致的话题,但是然后呢?这些能干什么呢?书里面的应用太少了,很难看到几个让人眼前一亮的例子。有些完全可以展开成更多应用的点,比如CW complex就点到为止。当然了,这种讲法对有些学科是适用的,但代数拓扑其实更加问题导向所以这样讲我觉得不太好。
    我当时第一本看的代数拓扑的书是这个,看完了还是不知所措被水淹没,真正给我启蒙感的反而是张筑生的微分拓扑新讲,这本书抛出并解决了很多问题,就能让人感觉到学这个是有用的。
  • 白正国沈一兵的黎曼几何,还是一样,没有对比就没有伤害。学黎曼几何先看的这本书,读下来一遍也说不上哪里不好,但就是觉得难受。然后朋友推荐了梅加强的流形与几何初步才开朗了许多。一比较就发现,黎曼几何这种公式计算特别特别特别多的,真的需要很多无关紧要的非数学的解释把这些东西串起来。一两句承上启下的话,就能让人大概知道下面这坨公式是想干什么了。还有一点就是排版,白沈的排版公式还有文字的行间距都差不多而且都很小,定理的字体也没有特别变化,另外还吃了开本的亏,所以对这种公式巨多而且上下标巨多的看起来就很累。
  • 某些中文翻译的书。数学书一旦翻译出来就很容易吃语法的亏。比如说,英文有一些明显的词比如that或者where等等,能够帮助我们一眼就把一个长句子的主谓宾拎出来,但是这些词是翻译不出来的,如果保持原有句式,那么中文其实更难读出主谓宾,所以翻译不好的话,看中文真的比看英文累。比如说,我觉得GTM94还有Munkres的代数拓扑的翻译就属于比较糟糕的(这俩好像翻译是同一个人)。
  • 打字机风格的书,比如Chern的complex manifold还有Milnor的characteristic classes,应该还有很多。书都是好书,就是看起来有点费劲,尤其是公式的字体,得盯着他看,看半天,这个公式才能告诉你他是谁,因为字体与现在熟悉的latex风格的字体相去甚远。但是没办法,将就着看吧,Milnor的书都不读学个捷豹拓扑啊。
话又说回来,上面的最多是差点意思,真正真正深恶痛绝的是——贵到飞起的原版书。随便一本GTM什么的,三四十刀算便宜的,六十几刀正常价格,厚一点的上百刀。这一点我真的非常感谢国内的出版商,一本二三十块的价格(影印版是不是合法我不是百分百确定,但是既然书店都有卖那肯定ok吧)能让我本科的时候一个穷学生在自己寝室摆一书架的GTM。而在美帝,港真,我拿老板的funding买我都心疼。
什么?六十多刀不算贵?两百五十刀James Stewart的微积分教材见过没?大开本,板砖那么厚,里边全是铜版纸彩页满满的插图。我真的怀疑知乎上那些骂同济高数吹国外教材的有没有真动手去买一本,说真的,我不觉得一本微积分教材搞这么花里胡哨有什么好的,而且还贵到炸裂。出版商——人类文明的绊脚石。
回复
使用道具 举报
随风飘荡 | 来自北京
这个系列的很多书我都不太喜欢,尤其是《高等代数》和《概率论》(评论区里有提到这本概率论实际上是中文教材里顶尖的水准。我不是学概率的,所以评价带了强烈的个人好恶而不客观,这本书当时确实让我迅速丧失了对概率论的兴趣……


Warner这本gtm94我实在不知道他是面向什么样的读者的。我入门微分流形读的是Chern的《微分几何讲义》,被很多人评价说是非常不适合入门的书,然而也并未像这本书一样让我觉得别扭。可能它的唯一亮点是能稍微学一点层的上同调,并且详细写了Hodge分解。
此外我也很讨厌任何占用大量篇幅讲拓扑线性空间的泛函分析教材。大多数人只需要封装好的各种收敛性结论就够了。(所以我很喜欢张恭庆的《泛函分析讲义》,虽然据我观察它在知乎上的口碑很差。张恭庆先生在序言里说的很清楚,他并不想写一本自我陶醉于“完备的美感”自嗨的书,而是更多想展示作为工具如何应用)
当然对某本书的看法是会随着阅读量和心态改变的,我研一时非常讨厌Conway那本泛函,现在回头看看也觉得还不错。我近来已没有认真从头啃一本书的精力,反而更注重“可查性”,越来越觉得大多数书都只适合用来当字典查,只要他里面写清楚了某个你需要了解的问题,并且可读,那么他对你就是有价值的,从这个角度来看,那种对初学者重大利好的循循善诱、脉络清晰也不是很重要。
回复
使用道具 举报
快速回复
您需要登录后才可以回帖 登录 | 立即注册

当贝投影