基于 Send 和 Sync 的线程安全
为何 Rc、RefCell 和裸指针不可以在多线程间使用?如何让裸指针可以在多线程使用?我们一起来探寻下这些问题的答案。
无法用于多线程的Rc
先来看一段多线程使用Rc
的代码:
use std::thread; use std::rc::Rc; fn main() { let v = Rc::new(5); let t = thread::spawn(move || { println!("{}",v); }); t.join().unwrap(); }
以上代码将v
的所有权通过move
转移到子线程中,看似正确实则会报错:
error[E0277]: `Rc<i32>` cannot be sent between threads safely
------ 省略部分报错 --------
= help: within `[closure@src/main.rs:5:27: 7:6]`, the trait `Send` is not implemented for `Rc<i32>`
表面原因是Rc
无法在线程间安全的转移,实际是编译器给予我们的那句帮助: the trait `Send` is not implemented for `Rc<i32>`
(Rc<i32>
未实现Send
特征), 那么此处的Send
特征又是何方神圣?
Rc 和 Arc 源码对比
在介绍Send
特征之前,再来看看Arc
为何可以在多线程使用,玄机在于两者的源码实现上:
#![allow(unused)] fn main() { // Rc源码片段 impl<T: ?Sized> !marker::Send for Rc<T> {} impl<T: ?Sized> !marker::Sync for Rc<T> {} // Arc源码片段 unsafe impl<T: ?Sized + Sync + Send> Send for Arc<T> {} unsafe impl<T: ?Sized + Sync + Send> Sync for Arc<T> {} }
!
代表移除特征的相应实现,上面代码中Rc<T>
的Send
和Sync
特征被特地移除了实现,而Arc<T>
则相反,实现了Sync + Send
,再结合之前的编译器报错,大概可以明白了:Send
和Sync
是在线程间安全使用一个值的关键。
Send 和 Sync
Send
和Sync
是 Rust 安全并发的重中之重,但是实际上它们只是标记特征(marker trait,该特征未定义任何行为,因此非常适合用于标记), 来看看它们的作用:
- 实现
Send
的类型可以在线程间安全的传递其所有权 - 实现
Sync
的类型可以在线程间安全的共享(通过引用)
这里还有一个潜在的依赖:一个类型要在线程间安全的共享的前提是,指向它的引用必须能在线程间传递。因为如果引用都不能被传递,我们就无法在多个线程间使用引用去访问同一个数据了。
由上可知,若类型 T 的引用&T
是Send
,则T
是Sync
。
没有例子的概念讲解都是耍流氓,来看看RwLock
的实现:
#![allow(unused)] fn main() { unsafe impl<T: ?Sized + Send + Sync> Sync for RwLock<T> {} }
首先RwLock
可以在线程间安全的共享,那它肯定是实现了Sync
,但是我们的关注点不在这里。众所周知,RwLock
可以并发的读,说明其中的值T
必定也可以在线程间共享,那T
必定要实现Sync
。
果不其然,上述代码中,T
的特征约束中就有一个Sync
特征,那问题又来了,Mutex
是不是相反?再来看看:
#![allow(unused)] fn main() { unsafe impl<T: ?Sized + Send> Sync for Mutex<T> {} }
不出所料,Mutex<T>
中的T
并没有Sync
特征约束。
武学秘籍再好,不见生死也是花拳绣腿。同样的,我们需要通过实战来彻底掌握Send
和Sync
,但在实战之前,先来简单看看有哪些类型实现了它们。
实现Send
和Sync
的类型
在 Rust 中,几乎所有类型都默认实现了Send
和Sync
,而且由于这两个特征都是可自动派生的特征(通过derive
派生),意味着一个复合类型(例如结构体), 只要它内部的所有成员都实现了Send
或者Sync
,那么它就自动实现了Send
或Sync
。
正是因为以上规则,Rust 中绝大多数类型都实现了Send
和Sync
,除了以下几个(事实上不止这几个,只不过它们比较常见):
- 裸指针两者都没实现,因为它本身就没有任何安全保证
UnsafeCell
不是Sync
,因此Cell
和RefCell
也不是Rc
两者都没实现(因为内部的引用计数器不是线程安全的)
当然,如果是自定义的复合类型,那没实现那哥俩的就较为常见了:只要复合类型中有一个成员不是Send
或Sync
,那么该复合类型也就不是Send
或Sync
。
手动实现 Send
和 Sync
是不安全的,通常并不需要手动实现 Send 和 Sync trait,实现者需要使用unsafe
小心维护并发安全保证。
至此,相关的概念大家已经掌握,但是我敢肯定,对于这两个滑不溜秋的家伙,大家依然会非常模糊,不知道它们该如何使用。那么我们来一起看看如何让裸指针可以在线程间安全的使用。
为裸指针实现Send
上面我们提到裸指针既没实现Send
,意味着下面代码会报错:
use std::thread; fn main() { let p = 5 as *mut u8; let t = thread::spawn(move || { println!("{:?}",p); }); t.join().unwrap(); }
报错跟之前无二: `*mut u8` cannot be sent between threads safely
, 但是有一个问题,我们无法为其直接实现Send
特征,好在可以用newtype
类型 :struct MyBox(*mut u8);
。
还记得之前的规则吗:复合类型中有一个成员没实现Send
,该复合类型就不是Send
,因此我们需要手动为它实现:
use std::thread; #[derive(Debug)] struct MyBox(*mut u8); unsafe impl Send for MyBox {} fn main() { let p = MyBox(5 as *mut u8); let t = thread::spawn(move || { println!("{:?}",p); }); t.join().unwrap(); }
此时,我们的指针已经可以欢快的在多线程间撒欢,以上代码很简单,但有一点需要注意:Send
和Sync
是unsafe
特征,实现时需要用unsafe
代码块包裹。
为裸指针实现Sync
由于Sync
是多线程间共享一个值,大家可能会想这么实现:
use std::thread; fn main() { let v = 5; let t = thread::spawn(|| { println!("{:?}",&v); }); t.join().unwrap(); }
关于这种用法,在多线程章节也提到过,线程如果直接去借用其它线程的变量,会报错:closure may outlive the current function,
, 原因在于编译器无法确定主线程main
和子线程t
谁的生命周期更长,特别是当两个线程都是子线程时,没有任何人知道哪个子线程会先结束,包括编译器!
因此我们得配合Arc
去使用:
use std::thread; use std::sync::Arc; use std::sync::Mutex; #[derive(Debug)] struct MyBox(*const u8); unsafe impl Send for MyBox {} fn main() { let b = &MyBox(5 as *const u8); let v = Arc::new(Mutex::new(b)); let t = thread::spawn(move || { let _v1 = v.lock().unwrap(); }); t.join().unwrap(); }
上面代码将智能指针v
的所有权转移给新线程,同时v
包含了一个引用类型b
,当在新的线程中试图获取内部的引用时,会报错:
error[E0277]: `*const u8` cannot be shared between threads safely
--> src/main.rs:25:13
|
25 | let t = thread::spawn(move || {
| ^^^^^^^^^^^^^ `*const u8` cannot be shared between threads safely
|
= help: within `MyBox`, the trait `Sync` is not implemented for `*const u8`
因为我们访问的引用实际上还是对主线程中的数据的借用,转移进来的仅仅是外层的智能指针引用。要解决很简单,为MyBox
实现Sync
:
#![allow(unused)] fn main() { unsafe impl Sync for MyBox {} }
总结
通过上面的两个裸指针的例子,我们了解了如何实现Send
和Sync
,以及如何只实现Send
而不实现Sync
,简单总结下:
- 实现
Send
的类型可以在线程间安全的传递其所有权, 实现Sync
的类型可以在线程间安全的共享(通过引用) - 绝大部分类型都实现了
Send
和Sync
,常见的未实现的有:裸指针、Cell
、RefCell
、Rc
等 - 可以为自定义类型实现
Send
和Sync
,但是需要unsafe
代码块 - 可以为部分 Rust 中的类型实现
Send
、Sync
,但是需要使用newtype
,例如文中的裸指针例子