Warm tip: This article is reproduced from serverfault.com, please click

algorithm graph graph-algorithm

algorithm-如何在图中找到顶点子集的“中心”？

(algorithm - How to find the "center" of a subset of vertices in a graph?)

发布于 2020-11-20 15:05:55

我有一个无向的，正加权的，具有顶点V和边的连通图E。我也有一个S顶点子集。现在V包含大约22000个顶点和E大约23000个边，但是对于较大的输入，这些点预计将增加到大约一百万个。S另一方面，通常包含少于1000个顶点，并且它们在图中相对靠得很近。

我想找到的“中心” S，它是一个顶点c，V从该顶点到最远顶点的距离应S尽可能小。它就像图中心，但仅用于部分顶点。[编辑：]这也是图形上的1个中心的问题；更为普遍的k中心问题是NP困难的，但这一问题可能更容易。

是否有一种算法可以有效地找到该中心？理想情况下，性能仅取决于S其周围环境，而不取决于整个图形。

我想过开始从所有顶点的广度优先搜索s_i的S同时，当一个顶点停止v_i已经被所有遇到的s_i，但是这是不是太有效。在这种情况下这可能是可行的，但感觉似乎有更好的方法。

Questioner

Thomas

Viewed

0

Original

English

David Eisenstat 2020-11-28 22:54:56

我不知道如何分析该算法，也没有引文，但似乎可行。

选择一个出发中心。你当前的近似值应该可以很好地解决此问题。
计算从当前中心到S的最短路径树。
修剪树，以便所有叶子都属于S并计算其中心。
如果此中心比根中心好，请返回到步骤2。

关于该算法，我可以真正声明的两个形式属性是：它总是终止，并且永远不会比起始中心差（因为如果树的中心不是根，那么它必须是比根更好的中心，因为缺少的边缘可以改善它，但不能改善根部）。

为了有效地计算树的中心，请在每个节点的所有后代中以最大距离标记每个节点（在线性时间内，通过按后顺序访问这些节点）。然后通过带有最大标签的子项下降到树中，只要它能改善半径。孩子的子树中的所有内容都将随着孩子的父边缘的长度而变得更近。其他一切都将以相同的数量增长。

Thomas 2020-11-29 19:10:51

简洁，好用。它的边缘数量不会比二次方更糟：如果将每个顶点作为潜在中心进行测试，就会发生这种情况，但是我很难想象这种情况。我可以想象（但没有尝试给出一个例子）它可能会陷入局部最小值，但是我认为我不必为此担心。

Thomas 2020-12-04 10:10:03

我还没有时间进行测试，但是我现在就接受它，因为它最简单，应该可以完成工作。尝试过此方法后，我将进行更新。

Thomas 2021-01-27 14:31:48

原来我正确地放置了复选标记。即使我将k设置为低至3，该算法也会在运行时方面优于您的其他建议。在输出质量方面，我需要将k = 36设置为从另一种算法中获得更好的结果，这时运行时间要超过10倍。

David Eisenstat 2021-01-27 14:42:21

@Thomas感谢您的更新。这对我来说并不奇怪，因为另一点是最坏情况的保证，但通常输入数据与对抗性数据相差甚远。

David Eisenstat 2021-01-27 16:01:55

@Thomas是的，我的意思是古怪。如前所述，我们最初计算每个子树的高度。然后随着下降，我们得到当前的候选中心v以及从v到不在v的子树中的节点的最大距离（最初为零）。v的离心率是v的高度和非子树的最大值。一旦确定了高度最大的v的子w，我们将分两步更新max非子树。首先，对于v的每个子x，其中x≠w，我们将max非子树更新为max（max non-subtree，length（vx）+ height（x））。然后，我们将最大非子树的长度增加（vw）。

热门帖子

1

最近对很多事情都没有感觉了

2

我这辈子是不是彻底和 Airpods Pro 无缘了

3

难道 Go 就没有好用的工作审批流框架吗

4

跟风贴自家软路由实现

5

Mac 上有什么 pdf 阅读器比较好用？

6

再开一个贴，问界发布新 M5，请各位老哥或者老车主骂醒我

7

微信读书非付费会员有每月导入数量限制了

8

不知道从什么时候，普通 USB-C 双头线不能给 iPhone15 充电了

9

程序员想开发漂亮的个人网站是不是用 react 会比 vue 简单一些？

10

有关于上海居住证 120 积分

热门github

1

Implementation of paper - YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information (翻译：论文实现——YOLOv9: Learning What You Want to Learn using Programmable Gradient Information（利用可编程梯度信息学习您想学的内容）)

2

A Windows and Office activator using HWID / Ohook / KMS38 / Online KMS activation methods, with a focus on open-source code and fewer antivirus detections. (翻译：使用 HWID / KMS38 / Online KMS 激活方法激活 Microsoft 产品的脚本集合，重点是开源代码、较少的防病毒检测和用户友好性。)

3

Get up and running with Llama 2, Mistral, Gemma, and other large language models. (翻译：启动并运行 Llama 2、Mistral、Gemma 和其他大型语言模型。)

4

该项目可以让你通过订阅的方式使用Cloudflare WARP+，自动获取流量。This project enables you to use Cloudflare WARP+ through subscription, automatically acquiring traffic.

5

Multi functional app to find duplicates, empty folders, similar images etc. (翻译：多功能应用程序可查找重复项、空文件夹、相似图像等。)

6

Xray panel supporting multi-protocol multi-user expire day & traffic & ip limit (Vmess & Vless & Trojan & ShadowSocks & Wireguard) (翻译：Xray面板支持多协议多用户到期日&流量&IP限制（Vmess & Vless & Trojan & ShadowSocks & Wireguard)

7

The Free Software Media System (翻译：Jellyfin 是一个免费软件媒体系统，可让您控制管理和流式传输您的媒体。它是专有 Emby 和 Plex 的替代方案，通过多个应用程序从专用服务器向最终用户设备提供媒体。)

8

lightweight, standalone C++ inference engine for Google's Gemma models. (翻译：适用于 Google Gemma 模型的轻量级独立 C++ 推理引擎。)

9

📚 Freely available programming books (翻译：📚 免费提供的编程书籍)

10

A collective list of free APIs (翻译：免费 API 的集合列表)

11

1️⃣🐝🏎️ The One Billion Row Challenge -- A fun exploration of how quickly 1B rows from a text file can be aggregated with Java (翻译：十亿行挑战 —— 使用 Java 对文本文件中的 10 亿行数据进行聚合的有趣探索)

12

🎓 Path to a free self-taught education in Computer Science! (翻译：🎓计算机科学免费自学教程！)

13

Curso para aprender el lenguaje de programación Python desde cero y para principiantes. 75 clases, 37 horas en vídeo, código, proyectos y grupo de chat. Fundamentos, frontend, backend, testing, IA... (翻译：从零开始学习 Python 编程语言的课程，适合初学者)

14

This repository contains System Design resources which are useful while preparing for interviews and learning Distributed Systems (翻译：该存储库包含系统设计资源，在准备面试和学习分布式系统时非常有用)

15

Mamba is a new state space model architecture showing promising performance on information-dense data such as language modeling, where previous subquadratic models fall short of Transformers. It is based on the line of progress on structured state space models, with an efficient hardware-aware design and implementation in the spirit of FlashAttention. (翻译：Mamba 是一种新的状态空间模型架构，在信息密集型数据（例如语言建模）上显示出良好的性能，而之前的二次模型在 Transformers 方面存在不足。它基于结构化状态空间模型的进展，并本着FlashAttention的精神进行高效的硬件感知设计和实现。)