NumPy 矩阵核心操作入门

张开发
2026/4/10 5:18:13 15 分钟阅读

分享文章

NumPy 矩阵核心操作入门
乘法、加法、转置与广播机制入门解析前言NumPy 是 Python 生态中数值计算的基石库而矩阵数组操作是线性代数、数据分析、机器学习等领域的核心基础。本文将系统梳理 NumPy 中最常用的矩阵操作包含矩阵乘法、矩阵加法、转置矩阵的实现方法同时通俗讲解新手最容易困惑的广播Broadcasting机制全程附带可直接运行的代码示例零基础也能轻松上手。前置准备所有示例均基于 NumPy 库运行前请先安装并导入# 安装若未安装pip install numpyimportnumpyasnp一、矩阵乘法矩阵乘法是线性代数的核心运算特别注意NumPy 中*是元素级乘法不是数学定义的矩阵乘法。实现标准矩阵乘法有两种推荐方式运算符语义清晰写法简洁优先使用、np.matmul()函数。1.1 矩阵 × 矩阵数学规则若矩阵 A 的形状为m × n矩阵 B 的形状为n × p则二者可相乘结果矩阵 C 的形状为m × p其中 C 的每个元素是 A 对应行与 B 对应列的点积。代码示例# 定义2个矩阵A(2×3)B(3×2)Anp.array([[1,2,3],[4,5,6]])Bnp.array([[7,8],[9,10],[11,12]])# 矩阵乘法两种写法完全等价C1A B C2np.matmul(A,B)print(矩阵A×B的结果\n,C1)输出结果注意事项必须满足前一个矩阵的列数 后一个矩阵的行数否则会触发维度不匹配报错。例如 2×3 的矩阵无法直接和 2×2 的矩阵相乘因为3≠2。1.2 矩阵 × 向量向量可以看作是「列数为1的特殊矩阵」运算规则和矩阵乘法完全一致。数学规则若矩阵 A 的形状为m × n向量 v 的维度为n一维数组则相乘结果为m维的向量。代码示例# 定义矩阵A(2×3)向量v(3维)Anp.array([[1,2,3],[4,5,6]])vnp.array([2,1,3])# 矩阵×向量resultA vprint(矩阵A×向量v的结果,result)输出结果补充说明一维向量无需手动转置为列向量运算符会自动匹配维度若向量是二维行向量形状1×n则需严格保证维度匹配否则会触发报错。二、矩阵加法矩阵加法是对应位置元素相加主要分为两种场景同形状矩阵相加、矩阵与标量单个数字相加。2.1 同形状矩阵加法核心规则两个矩阵必须形状完全一致行数、列数均相同对应位置的元素两两相加结果矩阵的形状与原矩阵保持一致。代码示例# 定义两个形状均为2×3的矩阵Anp.array([[1,2,3],[4,5,6]])Bnp.array([[10,20,30],[40,50,60]])# 矩阵加法CABprint(矩阵AB的结果\n,C)输出结果2.2 矩阵与标量相加标量会和矩阵的每一个元素分别相加这是 NumPy 广播机制的基础应用后文会详细讲解广播的完整规则。代码示例Anp.array([[1,2,3],[4,5,6]])num10# 矩阵标量resultAnumprint(矩阵A10的结果\n,result)输出结果三、求转置矩阵转置矩阵的核心是将原矩阵的行和列互换原矩阵形状为m × n转置后形状为n × m。NumPy 中实现转置有两种常用方式数组的.T属性写法最简洁推荐日常使用、np.transpose()函数。代码示例# 定义3×2的矩阵Anp.array([[1,2],[3,4],[5,6]])# 求转置两种写法等价A_T1A.T A_T2np.transpose(A)print(原矩阵A\n,A)print(转置矩阵A.T\n,A_T1)输出结果新手避坑提示一维数组的转置还是其本身比如v np.array([1,2,3])v.T不会变成列向量依然是一维数组。若要将一维数组转为列向量需用reshape调整维度vnp.array([1,2,3])# 转为3×1的列向量v_colv.reshape(-1,1)print(列向量\n,v_col)print(列向量转置行向量\n,v_col.T)四、矩阵的广播Broadcasting机制广播是 NumPy 最核心的特性之一它解决了不同形状的数组/矩阵进行数值运算的问题无需我们手动复制数据既大幅简化了代码又提升了运算效率。4.1 通俗理解广播广播可以简单理解为NumPy 会自动把「形状不匹配但符合规则」的数组扩展成相同的形状再进行对应元素的运算。举个最直观的例子2×3 的矩阵加一个数字10NumPy 会自动把10「扩展」成一个和原矩阵形状相同、所有元素都是10的 2×3 矩阵再和原矩阵相加这个自动扩展的过程就是广播。4.2 广播的核心规则两个数组能否广播只需要遵循2条核心规则从数组的最右侧末尾的维度开始向左依次比较对应维度的大小相等对应维度的大小其中一个是1。只要满足其中一条该维度就可以广播如果所有维度都满足规则两个数组就可以完成广播运算。额外补充如果两个数组的维度数量不同维度少的数组会自动在左侧补1再进行维度比较。4.3 示例详解示例1基础场景矩阵标量矩阵A形状(2, 3)标量num可看作形状()0维广播过程num先补维度为(1, 1)再扩展为(2, 3)和A形状完全匹配完成加法运算。示例2二维数组广播# 数组a形状(3, 1)数组b形状(1, 4)anp.array([[1],[2],[3]])# 3行1列bnp.array([[10,20,30,40]])# 1行4列# 广播运算resultabprint(a的形状,a.shape)print(b的形状,b.shape)print(广播相加结果\n,result)print(结果的形状,result.shape)输出结果维度匹配过程从右往左比第一个维度a的1 和 b的4 → 其中一个是1符合规则第二个维度a的3 和 b的1 → 其中一个是1符合规则最终广播为(3, 4)的形状完成运算。示例3不能广播的反例# 数组a形状(2,3)数组b形状(3,2)anp.ones((2,3))bnp.ones((3,2))# 直接相加会触发报错ab报错原因从右往左对比维度第一个维度3≠2且都不是1不符合广播规则无法完成运算。总结本文梳理了 NumPy 矩阵最核心的4类操作核心知识点速记矩阵乘法用运算符或np.matmul()遵循「前列后行」的维度规则矩阵加法同形状矩阵直接对应元素相加标量相加依赖广播机制转置矩阵用.T属性即可实现行列互换一维数组需用reshape转为列向量广播机制核心是「从右往左比维度相等或其中一个为1即可广播」是 NumPy 高效运算的核心。这些操作是 Python 数值计算的基础无论是数据分析、图像处理还是机器学习模型开发都会高频使用建议大家把示例代码完整跑一遍加深对规则的理解。

更多文章