链表

基本概念

链表（Linked List）是用于存储元素的一种基本数据结构。它经常被拿来与数组做比较，链表中的元素不是顺序存储的，而是通过指针连接在一起。

链表中的每个元素被称为节点。每个节点通常由两部分组成：数据部分和指针部分。数据部分存储元素的值，而指针部分存储指向下一个节点的引用。链表的第一个节点称为头节点。我们通常使用头节点来代表整个链表。链表的最后一个节点称为尾节点。尾节点的指针部分通常指向 None，表示链表的结束。

链表图示

基本操作

链表最基本的操作包括：

创建一个空链表
插入新节点。链表没有索引，所以在插入新节点的时候，通常会用一个已有节点做参考，比如在给定节点的前面或后面插入新节点；或者在链表头或尾插入新节点。
删除给定节点
遍历和查找

下面的程序实现了这几个最基本操作：

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

class LinkedList:
    def __init__(self):
        self.head = None

    def append(self, data):       # 将一个新节点添加到链表的末尾
        new_node = Node(data)     # 创建一个新节点
        if not self.head:         # 空链表
            self.head = new_node
            return
        last_node = self.head
        while last_node.next:     # 找到链表尾
            last_node = last_node.next
        last_node.next = new_node # 链接到新节点

    def print_list(self):
        cur_node = self.head
        while cur_node:           # 遍历每个节点
            print(cur_node.data, end=" -> ")
            cur_node = cur_node.next
        print("None")

    def insert_after_node(self, prev_node, data):
        if not prev_node:
            print("Previous node is not in the list")
            return
        new_node = Node(data)
        new_node.next = prev_node.next # 新节点的指针指向参考节点的下一个节点
        prev_node.next = new_node      # 参考节点的指针指向新节点

    def find_node_by_key(self, key):
        cur_node = self.head
        while cur_node:                # 遍历所有节点，一一比较
            if cur_node.data == key:   # 直到找到目标节点
                return cur_node
            cur_node = cur_node.next
        return None

    def delete_node(self, node_to_delete):
        if not node_to_delete:
            return

        # 如果被删除的是头结点
        if self.head == node_to_delete:
            self.head = self.head.next
            return

        prev_node = None
        cur_node = self.head    
        while cur_node and cur_node != node_to_delete:
            prev_node = cur_node        # 找到前面的节点
            cur_node = cur_node.next
        
        # 如果节点不在链表里则直接返回
        if not cur_node:
            return
        
        # 把当前节点从链表中移除
        prev_node.next = cur_node.next

# 使用链表
llist = LinkedList()
llist.append(1)
llist.append(2)
llist.append(3)
llist.print_list()  # 输出: 1 -> 2 -> 3 -> None

node_to_delete = llist.find_node_by_key(2)
llist.delete_node(node_to_delete)
llist.print_list()  # 1 -> 3 -> None

在上面的程序中，Node 类用于表示链表中的每一个节点。每个节点都有两个属性：data (用于存储值) 和 next (指向下一个节点的引用)。

LinkedList 类用于表示整个链表。它包含一个属性 head，指向链表的第一个节点。append() 方法将一个新节点添加到链表的末尾。insert_after_node() 方法可以在给定的 prev_node 后面插入一个新节点。 find_node_by_key() 方法可以根据数据找到一个节点。delete_node() 方法则可以删除一个节点。

从上面的示例的实现就可以看出来，在队列中插入数据的时间复杂度是 $O(1)$ ，因为插入操作不需要挪动任何其它元素。但是查找一个节点时间复杂度是 $O(n)$ ，链表不能做索引，只能一个一个节点查看。

上面的链表中，删除节点的时间复杂度是 $O(n)$ ，因为只有找到当前节点的上一个节点之后才能删除。如果有一个函数，是删除下一个节点，那就不需要遍历整个链表了，时间复杂度可以降低到 $O(1)$ 。或者，如果是在双向链表中，删除节点的时间复杂度也可以是 $O(1)$ 。

双向链表

images/009.png

在双向链表（Doubly Linked List）中，每个节点都记录了上一个节点和下一个节点的位置。因此，在双向链表中，可以从一个节点直接跳转到它的上一个或下一个节点上去，也就是正向或反向遍历整个链表。如果链表的最后一个节点（尾节点）的下一个节点指向的是头结点；而头结点的前一个节点又指向了尾节点，那么这就构成了一个环状双向链表，如上图所示。

单向链表也可以有环。有环的链表不一定所有节点都在环内，也可以一些节点在环外，另一些节点构成环。在实际应用中，非环状的链表更为常见。

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None
        self.prev = None

class DoublyLinkedList:
    def __init__(self):
        self.head = None

    # 插入一个节点到链表的尾部
    def append(self, data):
        new_node = Node(data)
        if not self.head:
            self.head = new_node
            return
        last_node = self.head
        while last_node.next:
            last_node = last_node.next
        last_node.next = new_node
        new_node.prev = last_node

    # 插入一个节点到链表的头部
    def prepend(self, data):
        new_node = Node(data)
        new_node.next = self.head
        if self.head:
            self.head.prev = new_node
        self.head = new_node

    # 删除一个节点
    def delete(self, node):
        cur_node = self.head
        while cur_node:
            if cur_node == node:
                # 删除头部节点
                if cur_node.prev:
                    cur_node.prev.next = cur_node.next
                else:
                    self.head = cur_node.next
                # 删除尾部节点
                if cur_node.next:
                    cur_node.next.prev = cur_node.prev
                return  # 节点已删除，退出循环
            cur_node = cur_node.next

    # 打印链表
    def print_list(self):
        cur_node = self.head
        while cur_node:
            print(cur_node.data, end=" <-> ")
            cur_node = cur_node.next
        print("None")

# 使用双向链表
dllist = DoublyLinkedList()
dllist.append(1)
dllist.append(2)
dllist.append(3)
dllist.print_list()  # 1 <-> 2 <-> 3 <-> None

node_to_delete = dllist.head.next  # 此处选择第二个节点（值为2）进行删除
dllist.delete(node_to_delete)
dllist.print_list()  # 1 <-> 3 <-> None

上面的示例演示了一个双向链表，它的实现方法与单向链表非常类似。但是它的每个节点有两个指针，分别指向上一个节点和下一个节点。

常见问题

反转链表

编写一个函数来反转单链表。翻转链表的算法是比较直观的，就是遍历每个节点，把结点指针的指向换个方向。需要注意的是，要考虑如何暂存节点，用于设置指针。可以用循环，也可以用递归。

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

class LinkedList:
    def __init__(self):
        self.head = None

    def append(self, data):
        new_node = Node(data)
        if not self.head:
            self.head = new_node
            return
        last_node = self.head
        while last_node.next:
            last_node = last_node.next
        last_node.next = new_node

    def print_list(self):
        cur_node = self.head
        while cur_node:
            print(cur_node.data, end=" -> ")
            cur_node = cur_node.next
        print("None")

    def reverse(self):
        prev = None
        current = self.head
        while current:
            next_node = current.next  # store the next node
            current.next = prev  # change the current node's pointer to previous
            prev = current  # move the previous to this current
            current = next_node  # move to the next node
        self.head = prev
        
    def reverse_recursive(self):
        self.head = self._reverse_recursive(self.head)

    def _reverse_recursive(self, node):
        if node is None or node.next is None:
            return node
        
        next_node = node.next
        new_head = self._reverse_recursive(next_node)
        
        next_node.next = node
        node.next = None
        
        return new_head

# 测试
llist = LinkedList()
llist.append(1)
llist.append(2)
llist.append(3)
llist.append(4)
llist.print_list()  # 1 -> 2 -> 3 -> 4 -> None

llist.reverse()
llist.print_list()  # 4 -> 3 -> 2 -> 1 -> None

llist.reverse_recursive()
llist.print_list()  # 1 -> 2 -> 3 -> 4 -> None

无论循环还是递归，翻转链表都需要遍历链表每个节点一次，所以时间复杂度为 $O(n)$ ，n 是节点数量。算法利用了原来的节点，并不用生成新链表，所以空间复杂度是 $O(1)$ .

检测环

检测链表中是否有环。如果有环，那么说明遍历链表的时候，走着走着就又会遇到一个之前遇到过的节点。所以最直接的办法，就是把所有遍历过的节点都标注一下。如果节点有额外的空间可以存放新数据，那么就在遍历的时候，在每个节点上添加个新数据，表明已经走过了。当遍历链表时，遇到了已经标记过的节点，则表示链表有环。如果不能在节点上直接标注，就只好在额外开辟一块内存用于记录，最方便的是使用集合数据。遍历时，把每个节点都存入集合，如果发现节点已经在集合里了，就说明有环。

上面这两种算法的空间复杂度都是 $O(n)$ ，因为都需要额外的数据来记录每个节点。还有一种空间复杂的为 $O(n1)$ 的“快慢指针”算法。基本思想是使用两个指针，一个移动得快（两步一次），另一个移动得慢（一步一次）。如果链表中存在环，那么两个指针最终会相遇。程序示例如下：

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

class LinkedList:
    def __init__(self):
        self.head = None

    def append(self, data):
        new_node = Node(data)
        if not self.head:
            self.head = new_node
            return
        last_node = self.head
        while last_node.next:
            last_node = last_node.next
        last_node.next = new_node

    def create_cycle(self, pos):
        # 这个方法是用来为测试目的创建一个循环的
        tail = self.head
        while tail.next:
            tail = tail.next
        
        cycle_start = self.head
        for i in range(pos):
            cycle_start = cycle_start.next
        tail.next = cycle_start

    def has_cycle(self):
        slow_pointer = self.head
        fast_pointer = self.head

        while fast_pointer and fast_pointer.next:
            slow_pointer = slow_pointer.next
            fast_pointer = fast_pointer.next.next

            if slow_pointer == fast_pointer:
                return True

        return False

# 使用单链表
llist = LinkedList()
llist.append(1)
llist.append(2)
llist.append(3)
llist.append(4)

print(llist.has_cycle())  # False

# 创建一个循环作为测试
llist.create_cycle(1)
print(llist.has_cycle())  # True

删除倒数第 n 个节点

删除单向链表中的倒数第 n 个节点。因为是单向链表，我们没发从后往前找，只能从前向后遍历。为了不错过倒数第 n 个节点，直观的做法就是开辟一个缓存，在遍历过程中保存遍历过的最后 n 个节点，当走到链表尾的时候，把倒数第 n 个节点删除。但是这个方法有点浪费空间，毕竟我们只需要倒数第 n 个，而不需要把倒数的 n 个都记录下来。比较节约内存的方法是使用两个指针，让它们之间保持 n 个位置，这样当前一个指针遍历到最后一个节点的时候，后面的指针正好指向倒数第 n 个节点：

class Node:
    def __init__(self, data):
        self.data = data
        self.next = None

class LinkedList:
    def __init__(self):
        self.head = None

    def append(self, data):
        new_node = Node(data)
        if not self.head:
            self.head = new_node
            return
        last_node = self.head
        while last_node.next:
            last_node = last_node.next
        last_node.next = new_node

    def print_list(self):
        cur_node = self.head
        while cur_node:
            print(cur_node.data, end=" -> ")
            cur_node = cur_node.next
        print("None")

    def remove_nth_from_end(self, n):
        first = self.head
        second = self.head

        # Advance the second pointer by n nodes.
        for _ in range(n):
            if not second.next:  # If n is equal to the length of the linked list
                if second == self.head:  # Move head to the next node
                    self.head = self.head.next
                return
            second = second.next

        # Move both pointers until the second reaches the end
        while second:
            second = second.next
            prev = first
            first = first.next

        # Now, the first pointer points to the node to be removed
        prev.next = first.next

# Using the LinkedList
llist = LinkedList()
llist.append(1)
llist.append(2)
llist.append(3)
llist.append(4)
llist.append(5)

print("Original List:")
llist.print_list()

llist.remove_nth_from_end(2)
print("\nAfter removing the 2nd node from the end:")
llist.print_list()

两个链表的交点

要找到两个链表的交叉点，可以先遍历两个链表，得到它们的长度。计算长度差，并在较长的链表上先行遍历这个差值的步数。然后同时遍历两个链表，直到找到一个共同的节点。

class ListNode:
    def __init__(self, x):
        self.val = x
        self.next = None

def get_intersection_node(headA, headB):
    def get_count(node):
        count = 0
        while node:
            count += 1
            node = node.next
        return count
    
    countA = get_count(headA)
    countB = get_count(headB)
    diff = abs(countA - countB)
    
    # Move the pointer for the longer list by the difference in counts
    long_list = headA if countA > countB else headB
    short_list = headB if countA > countB else headA
    for _ in range(diff):
        long_list = long_list.next
    
    # Move both pointers of both lists till they collide
    while long_list and short_list:
        if long_list == short_list:
            return long_list  # Intersection point
        long_list = long_list.next
        short_list = short_list.next
    
    return None  # No intersection

# 测试：
# 创建两个链表，让它们相交与值为 8 的节点
intersect_val = 8
listA = [4,1,8,4,5]
listB = [5,0,1,8,4,5]
intersect_node = ListNode(intersect_val)
headA = curA = ListNode(0)
headB = curB = ListNode(0)

# 链表 A
for val in listA:
    curA.next = ListNode(val)
    curA = curA.next
    if val == intersect_val:
        break

# 链表，加入交叉点
for val in listB:
    curB.next = ListNode(val)
    curB = curB.next
    if val == intersect_val:
        curB.next = intersect_node
        break

# 找到交点
result = get_intersection_node(headA.next, headB.next)
if result:
    print(f"The intersection point's value is: {result.val}")
else:
    print("No intersection found.")

如果两个链表完全不相交，那么函数将返回 None。

基本概念​

基本操作​

双向链表​

常见问题​

反转链表​

检测环​

删除倒数第 n 个节点​

两个链表的交点​