向量

点乘

内积、数量积 ps:怎么多个别名有意思?还有叫点积 😡

  • a·b>0 方向基本相同,夹角在0°到90°之间
  • a·b=0 正交,相互垂直
  • a·b<0 方向基本相反,夹角在90°到180°之间

法线 法向量

法线是垂直于该平面的三维向量

坐标轴 正交 基的数量少于向量本身的维数,达到降维效果

选择最优基

第一维度

最大程度保留原有的信息,希望投影后的投影值尽可能分散,不会重叠一起,离散程度用方差

二维平面中选择一个方向,将所有数据都投影到这个方向所在直线上,用投影值表示原始记录。这是一个实际的二维降到一维的问题。

寻找一个一维基,使得所有数据变换为这个基上的坐标表示后,方差值最大方差最大的方向

下一个投影方向

如果我们还是单纯只选择方差最大的方向,很明显,这个方向与第一个方向应该是几乎重合在一起,显然这样的维度是没有用的,因此,应该有其他约束条件。 从直观上说,让两个字段尽可能表示更多的原始信息,我们希望它们之间不存在(线性)相关性的,因为相关性意味着两个字段不是完全独立,必然存在重复表示的信息。

相关性用协方差表示