数据布局和基本操作

对于新的链表来说,最重要的就是我们可以自由地操控列表的尾部( tail )。

数据布局

例如以下是一个不太常见的持久化列表布局:

list1 = A -> B -> C -> D
list2 = tail(list1) = B -> C -> D
list3 = push(list2, X) = X -> B -> C -> D

如果上面的不够清晰,我们还可以从内存角度来看:

list1 -> A ---+
              |
              v
list2 ------> B -> C -> D
              ^
              |
list3 -> X ---+

这里大家可能会看出一些端倪:节点 B 被多个链表所共享,这造成了我们无法通过 Box 的方式来实现,因为如果使用 Box,还存在一个问题,谁来负责清理释放?如果 drop list2,那 B 节点会被清理释放吗?

函数式语言或者说其它绝大多数语言,并不存在这个问题,因为 GC 垃圾回收解千愁,但是 Rust 并没有。

好在标准库为我们提供了引用计数的数据结构: Rc / Arc,引用计数可以被认为是一种简单的 GC,对于很多场景来说,引用计数的数据吞吐量要远小于垃圾回收,而且引用计数还存在循环引用的风险!但... 我们有其它选择吗? :(

不过使用 Rc 意味着我们的数据将无法被改变,因为它不具备内部可变性,关于 Rc/Arc 的详细介绍请看这里

下面,简单的将我们的数据结构通过 Rc 来实现:

#![allow(unused)]
fn main() {
// in third.rs
use std::rc::Rc;

pub struct List<T> {
    head: Link<T>,
}

type Link<T> = Option<Rc<Node<T>>>;

struct Node<T> {
    elem: T,
    next: Link<T>,
}
}

需要注意的是, Rc 在 Rust 中并不是一等公民,它没有被包含在 std::prelude 中,因此我们必须手动引入 use std::rc::Rc (混得好失败 - , -)

基本操作

首先,对于 List 的构造器,可以直接复制粘贴:

#![allow(unused)]
fn main() {
impl<T> List<T> {
    pub fn new() -> Self {
        List { head: None }
    }
}
}

而之前的 pushpop 已无任何意义,因为新链表是不可变的,但我们可以使用功能相似的 prependtail 来返回新的链表。

#![allow(unused)]
fn main() {
pub fn prepend(&self, elem: T) -> List<T> {
    List { head: Some(Rc::new(Node {
        elem: elem,
        next: self.head.clone(),
    }))}
}
}

大家可能会大惊失色,什么,你竟然用了 clone,不是号称高性能链表实现吗?别急,这里其实只是 Rc::clone,对于该方法而言,clone 仅仅是增加引用计数,并不是复制底层的数据。虽然 Rc 的性能要比 Box 的引用方式低一点,但是它依然是多所有权前提下最好的解决方式或者说之一。

还有一点值得注意, headOption<Rc<Node<T>>> 类型,那么为何不先匹配出内部的 Rc<Node<T>>,然后再 clone 呢?原因是 Option 也提供了相应的 API,它的功能跟我们的需求是一致的。

运行下试试:

$ cargo build

warning: field is never used: `elem`
  --> src/third.rs:10:5
   |
10 |     elem: T,
   |     ^^^^^^^
   |
   = note: #[warn(dead_code)] on by default

warning: field is never used: `next`
  --> src/third.rs:11:5
   |
11 |     next: Link<T>,
   |     ^^^^^^^^^^^^^

胆战心惊的编译通过(胆战心惊? 日常基本操作,请坐下!)。

继续来实现 tail,该方法会将现有链表的首个元素移除,并返回剩余的链表:

#![allow(unused)]
fn main() {
pub fn tail(&self) -> List<T> {
    List { head: self.head.as_ref().map(|node| node.next.clone()) }
}
}
$ cargo build

error[E0308]: mismatched types
  --> src/third.rs:27:22
   |
27 |         List { head: self.head.as_ref().map(|node| node.next.clone()) }
   |                      ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ expected struct `std::rc::Rc`, found enum `std::option::Option`
   |
   = note: expected type `std::option::Option<std::rc::Rc<_>>`
              found type `std::option::Option<std::option::Option<std::rc::Rc<_>>>`

看起来这里的 map 多套了一层 Option,可以用 and_then 替代:

#![allow(unused)]
fn main() {
pub fn tail(&self) -> List<T> {
    List { head: self.head.as_ref().and_then(|node| node.next.clone()) }
}
}

顺利通过编译,很棒!最后就是实现 head 方法,它返回首个元素的引用,跟之前链表的 peek 方法一样:

#![allow(unused)]
fn main() {
pub fn head(&self) -> Option<&T> {
    self.head.as_ref().map(|node| &node.elem )
}
}

好了,至此,新链表的基本操作都已经实现,最后让我们写几个测试用例来看看它们是骡子还是马:

#![allow(unused)]
fn main() {
#[cfg(test)]
mod test {
    use super::List;

    #[test]
    fn basics() {
        let list = List::new();
        assert_eq!(list.head(), None);

        let list = list.prepend(1).prepend(2).prepend(3);
        assert_eq!(list.head(), Some(&3));

        let list = list.tail();
        assert_eq!(list.head(), Some(&2));

        let list = list.tail();
        assert_eq!(list.head(), Some(&1));

        let list = list.tail();
        assert_eq!(list.head(), None);

        // Make sure empty tail works
        let list = list.tail();
        assert_eq!(list.head(), None);

    }
}
}
$ cargo test

     Running target/debug/lists-5c71138492ad4b4a

running 5 tests
test first::test::basics ... ok
test second::test::into_iter ... ok
test second::test::basics ... ok
test second::test::iter ... ok
test third::test::basics ... ok

test result: ok. 5 passed; 0 failed; 0 ignored; 0 measured

哦对了... 我们好像忘了一个重要特性:对链表的迭代。

#![allow(unused)]
fn main() {
pub struct Iter<'a, T> {
    next: Option<&'a Node<T>>,
}

impl<T> List<T> {
    pub fn iter(&self) -> Iter<'_, T> {
        Iter { next: self.head.as_deref() }
    }
}

impl<'a, T> Iterator for Iter<'a, T> {
    type Item = &'a T;

    fn next(&mut self) -> Option<Self::Item> {
        self.next.map(|node| {
            self.next = node.next.as_deref();
            &node.elem
        })
    }
}
}
#![allow(unused)]
fn main() {
#[test]
fn iter() {
    let list = List::new().prepend(1).prepend(2).prepend(3);

    let mut iter = list.iter();
    assert_eq!(iter.next(), Some(&3));
    assert_eq!(iter.next(), Some(&2));
    assert_eq!(iter.next(), Some(&1));
}
}
$ cargo test

     Running target/debug/lists-5c71138492ad4b4a

running 7 tests
test first::test::basics ... ok
test second::test::basics ... ok
test second::test::iter ... ok
test second::test::into_iter ... ok
test second::test::peek ... ok
test third::test::basics ... ok
test third::test::iter ... ok

test result: ok. 6 passed; 0 failed; 0 ignored; 0 measured

细心的同学可能会觉得我在凑字数,这不跟之前的链表迭代实现一样一样的嘛?恭喜你答对了 :)

最后,给大家留个作业,你可以尝试下看能不能实现 IntoIterIterMut,如果实现不了请不要打我,冤有头债有主,都是 Rc 惹的祸 :(