邻接矩阵 vs 邻接表：如何为你的图算法选择最佳数据结构（附Python代码示例）

最新推荐文章于 2026-06-29 15:30:28 发布

原创

最新推荐文章于 2026-06-29 15:30:28 发布 · 186 阅读

标签

#图算法 #数据结构 #邻接矩阵 #Python

邻接矩阵 vs 邻接表：如何为你的图算法选择最佳数据结构（附Python代码示例）

在算法工程师和数据科学家的日常工作中，图结构无处不在。从社交网络的好友关系推荐，到电商平台的商品关联分析，再到知识图谱的实体链接，图都是描述复杂关系最直观的数学模型。然而，当我们真正动手实现一个图算法时，第一个要面对的抉择往往不是算法本身，而是如何存储这个图。这个看似基础的选择，却能在实际运行中带来数倍甚至数百倍的性能差异。

我见过不少项目，初期为了快速验证想法，随手选了一种图表示方式，结果在数据量增长后陷入性能泥潭。有的团队在处理千万级节点的社交网络时，因为使用了邻接矩阵而导致内存爆炸；也有的在实现实时推荐路径搜索时，由于邻接表的遍历效率低下，导致接口响应缓慢。选择合适的数据结构，就像为算法挑选趁手的兵器——用错了，再精妙的剑法也施展不开。

这篇文章，我将结合多年实战经验，深入剖析邻接矩阵和邻接表这两种核心表示方法。我们不仅会讨论它们的内存占用、时间复杂度等理论指标，更会聚焦于实际工程场景下的权衡：什么时候该用哪种结构？如何根据图的特点动态选择？如何在Python中高效实现并集成到现有系统中？我会用真实的代码示例和性能对比数据，帮你建立起一套清晰的决策框架。

1. 理解图的两种核心表示：从数学定义到内存布局

在离散数学的教科书里，图被抽象为顶点集合V和边集合E的组合G=(V, E)。但在计算机的内存中，这个抽象的数学概念需要被具体化为字节的排列。邻接矩阵和邻接表，正是两种最经典、最根本的“翻译”方式。

1.1 邻接矩阵：用二维数组映射顶点关系

邻接矩阵的思想非常直观：既然图描述的是顶点之间的关系，那么用一个二维表格（矩阵）来记录每对顶点之间是否有边相连，再自然不过了。

对于一个有n个顶点的图，我们创建一个n×n的矩阵A。如果顶点i和顶点j之间存在一条边，那么矩阵元素A[i][j]就设为1（或者边的权重）；否则设为0。对于无向图，这个矩阵是对称的，因为如果i到j有边，j到i也一定有边。

class AdjacencyMatrixGraph:
    def __init__(self, num_vertices, directed=False):
        self.num_vertices = num_vertices
        self.directed = directed
        # 初始化一个全0的n×n矩阵
        self.matrix = [[0] * num_vertices for _ in range(num_vertices)]
    
    def add_edge(self, v1, v2, weight=1):
        if 0 <= v1 < self.num_vertices and 0 <= v2 < self.num_vertices:
            self.matrix[v1][v2] = weight
            if not self.directed:
                self.matrix[v2][v1] = weight
    
    def has_edge(self, v1, v2):
        return self.matrix[v1][v2] != 0
    
    def get_neighbors(self, vertex):
        neighbors = []
        for i in range(self.num_vertices):
            if self.matrix[vertex][i] != 0:
                neighbors.append((i, self.matrix[vertex][i]))
        return neighbors

邻接矩阵的最大优势在于查询速度。判断任意两个顶点是否相邻，只需要O(1)的时间——直接访问矩阵的对应位置即可。这种随机访问的特性，使得它在某些算法中表现优异。

但它的代价也显而易见：空间复杂度是O(n²)。无论图中有多少条边，都需要分配n×n的存储空间。对于有10000个顶点的图，即使只有100条边，也需要存储1亿个元素的矩阵。在实际项目中，我遇到过团队用邻接矩阵存储用户关系图，结果在用户量达到50万时，服务器内存直接告警。

提示：虽然邻接矩阵的空间效率低，但在图非常稠密（边数接近n²）时，它的空间浪费相对较小。当边的数量超过n²/2时，邻接矩阵甚至可能比邻接表更节省内存。

1.2 邻接表：用链表集合记录连接关系

邻接表采取了完全不同的思路：不为不存在的边分配存储空间。对于每个顶点，我们只记录它实际连接到的邻居顶点。

具体实现上，通常用一个数组（或字典）来存储所有顶点，每个顶点对应一个链表（或列表、集合），链表中存储该顶点的所有邻居信息。对于有权图，还需要存储边的权重。

from collections import defaultdict

class AdjacencyListGraph:
    def __init__(self, directed=False):
        self.graph = defaultdict(list)  # 顶点 -> [(邻居, 权重), ...]
        self.directed = directed
        self.vertices = set()
    
    def add_vertex(self, vertex):
        self.vertices.add(vertex)
        if vertex not in self.graph:
            self.graph[vertex] = []
    
    def add_edge(self, v1, v2, weight=1):
        self.add_vertex(v1)
        self.add_vertex(v2)
        self.graph[v1].append((v2, weight))
        if not self.directed:
            self.graph[v2].append((v1, weight))
    
    def has_edge(self, v1, v2):
        for neighbor, _ in self.graph.get(v1, []):
            if neighbor == v2:
                return True
        return False
    
    def get_neighbors(self, vertex):
        return self.graph.get(vertex, [])

邻接表的空间复杂度是O(V + E)，其中V是顶点数，E是边数。对于稀疏图（边数远小于V²），这比邻接矩阵节省了大量内存。在实际的社交网络分析中，大多数用户的直接好友不会超过几百个，用邻接表存储可能只需要邻接矩阵1%甚至更少的内存。

但邻接表也有自己的短板：查询任意两个顶点是否相邻需要O(degree(v))的时间，在最坏情况下可能是O(V)。虽然对于稀疏图这通常很快，但在需要频繁进行此类查询的场景下，性能可能成为瓶颈。