温馨提示:本文翻译自stackoverflow.com，查看原文请点击：python - Understanding the logic behind numpy code for Moore-Penrose inverse

matrix numpy python

python - 了解Moore-Penrose逆的numpy代码背后的逻辑

发布于 2020-04-11 00:18:11

我正在阅读一本名为《使用Scikit-Learn，Keras和Tensorflow进行动手机器学习》的书，作者在解释如何在线性回归的情况下计算矩阵的伪逆（Moore-Penrose逆）。我在这里逐字引用：

伪逆本身是使用称为奇异值分解（SVD）的标准矩阵分解技术，可以分解训练集矩阵计算X成的三个矩阵的矩阵乘法û Σ V T（参照numpy.linalg.svd（））。伪逆的计算公式为X + = V * Σ + * UT。为计算矩阵 Σ +，该算法将Σ并将所有小于微小阈值的值设置为零，然后将所有非零值替换为其反值，最后，它转置所得矩阵。这种方法比计算法线方程更有效。

我从这篇文章中了解了伪逆和SVD是如何关联的。但是我无法掌握将所有小于阈值的值设置为零的理由。对角矩阵的逆是通过对角元素的倒数获得的。然后在逆矩阵中将小值转换为大值，对吗？那为什么我们要删除较大的值呢？

我去看了一下numpy代码，它看起来像下面，仅供参考：

@array_function_dispatch(_pinv_dispatcher)
def pinv(a, rcond=1e-15, hermitian=False):
a, wrap = _makearray(a)
    rcond = asarray(rcond)
    if _is_empty_2d(a):
        m, n = a.shape[-2:]
        res = empty(a.shape[:-2] + (n, m), dtype=a.dtype)
        return wrap(res)
    a = a.conjugate()
    u, s, vt = svd(a, full_matrices=False, hermitian=hermitian)

    # discard small singular values
    cutoff = rcond[..., newaxis] * amax(s, axis=-1, keepdims=True)
    large = s > cutoff
    s = divide(1, s, where=large, out=s)
    s[~large] = 0

    res = matmul(transpose(vt), multiply(s[..., newaxis], transpose(u)))
    return wrap(res)

提问者

Bitswazsky

被浏览

142

查看英文版

查看原文

senderle 2020-02-03 23:06

几乎可以肯定，这是对数字误差的调整。要了解为什么这样做可能是必要的，请看一下采用svd1x 2x2秩矩阵时会发生什么。我们可以通过像这样获取向量的外积来创建一个秩矩阵：

>>> a = numpy.arange(2) + 1
>>> A = a[:, None] * a[None, :]
>>> A
array([[1, 2],
       [2, 4]])

尽管这是一个2x2矩阵，但它只有一个线性独立的列，因此其等级为1而不是2。因此，我们应该期望在将其传递给时svd，其中一个奇异值将为零。但是看看会发生什么：

>>> U, s, V = numpy.linalg.svd(A)
>>> s
array([5.00000000e+00, 1.98602732e-16])

其实我们得到的是一个奇异值，是不是很为零。鉴于我们正在使用有限精度浮点数，因此在很多情况下此结果都是不可避免的。因此，尽管您确定的问题是一个真实的问题，但实际上我们将无法分辨出奇异值很小的矩阵和奇异值应该为零但没有的矩阵之间的区别。将小值设置为零是解决该问题的最安全实用方法。

相关问题

1

如何使用python cut方法创建bin，接受一个参数并返回适当的bin？

2

从具有特定条件的列表列表创建字典

3

根据行值选择列，Python，Pandas

4

在数据框中绘制零和一的计数

5

python函数。

6

在两个DataFrame之间执行大量Pandas查找的最佳方法

7

如何获取Pandas数据透视表中的列数和每列的宽度？

8

在Pandas数据框中分组时缺少所需值时显示一列

9

Python隐藏壁虱但显示壁虱标签

10

获取Entry和checkbutton值Tkinter时出现问题

热门github

1

Fast, easy and reliable testing for anything that runs in a browser. (翻译：Cypress 是为现代网络而构建的下一代前端测试工具，用于解决开发者和 QA 工程师在测试现代应用程序时面临的关键难题)

2

An AI Hedge Fund Team

3

🤘 TT-NN operator library, and TT-Metalium low level kernel programming model.

4

Lightweight coding agent that runs in your terminal

5

Fine-tuning & Reinforcement Learning for LLMs. 🦥 Train OpenAI gpt-oss, Qwen3, Llama 4, DeepSeek-R1, Gemma 3, TTS 2x faster with 70% less VRAM.

6

Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages. (翻译：PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库，助力开发者训练出更好的模型，并应用落地。)

7

3D Reconstruction for all

8

基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.

9

Main repository for the Linera protocol

10

AI wearables. Put it on, speak, transcribe, automatically

11

A complete computer science study plan to become a software engineer. (翻译：一个如何成为软件工程师的完整、科学的学习计划。)

12

Open-source framework for conversational voice AI agents.

13

14

Tongyi DeepResearch, the Leading Open-source DeepResearch Agent

15

Flutter makes it easy and fast to build beautiful apps for mobile and beyond (翻译：Flutter 可以轻松快速地为移动设备及其他应用构建漂亮的应用程序)