多线程详解之开篇

2020-07-10 14:29:01

多年来，并发就像是阻在程序员面前的一座大山，令无数人“闻之色变”。我们或者不知道何为并发，或者不知道为何需要并发，即使知道了也不一定能写出一个安全的并发程序。如果写的并发程序出了问题，我们也不知道问题出在哪里，连为什么会出现问题都要考虑好一阵子。它就是这么“可恶”，但却谁都没有办法摆脱。

多线程的出现，有很深的历史背景。可以说多线程是计算机硬件、操作系统以及CPU多核化发展的必然产物。在改进人机交互体验方面，多线程也有着无与伦比的优势。

计算机硬件发展

多年来，计算机的发展一直与摩尔定律十分吻合，这一定律表明：集成电路上可容纳的晶体管数目，约每隔两年便会增加一倍。以下介绍来源维基百科：

摩尔定律（英语：Moore's law）是由英特尔（Intel）创始人之一戈登·摩尔提出的。其内容为：集成电路上可容纳的晶体管数目，约每隔两年便会增加一倍；经常被引用的“18个月”，是由英特尔首席执行官大卫·豪斯（David House）提出：预计18个月会将芯片的性能提高一倍（即更多的晶体管使其更快）。

半导体行业大致按照摩尔定律发展了半个多世纪，对二十世纪后半叶的世界经济增长做出了贡献，并驱动了一系列科技创新、社会改革、生产效率的提高和经济增长。个人计算机、因特网、智能手机等技术改善和创新都离不开摩尔定律的延续。

计算机的摩尔定律我们每个人都切身体会过，从这短短十多年智能手机的发展就能窥得一二。然而，计算机并不能如摩尔定律所述的那样，无限制的发展下去。

再厉害的芯片，再多的晶体管，终都不得不受限于物理结构的极限。CPU的时钟频率不能无限制的提高，内存的读写速度也不会无限制的增加，当这一切用尽，想要提升计算机的能力，就只好另寻他法了。

有一个定论应当显而易见：越大的东西会越显笨重。计算机的组成部分也逃不开这个定论。所以从寄存器到一级缓存、二级缓存，再到内存，再到磁盘，虽然存储量越来越大，但是速度却越来越慢了，不过价格也低了许多。

寄存器位于CPU内部，是快的存储组件，CPU访问寄存器时可以即读即取，然而寄存器只有几百字节大小，主要用来存储指令和程序计数器。

寄存器之后，是高速缓存，通常有一级缓存和二级缓存，现在许多PC上都有了三级缓存。一级缓存比寄存器慢3-10倍，二级缓存又比一级缓存慢5-10倍，三级缓存就更慢了，但是容量会更大一些。

而内存，我们都十分熟悉的，要比缓存慢5-10倍，这样就和CPU速度相差了百倍以上。

那磁盘呢？我们通常说IO是性能的瓶颈是有道理的，传统的机械硬盘速度比内存相差百倍有余，即使是新的SSD硬盘也没有显著减小这一差距。所以当CPU读取磁盘时，本可以一个指令完成的操作，要等待一万倍的时间之后才能完成。

而等待中如果CPU什么都不做，就白白浪费了大量的时间，这个问题直到操作系统出现才得以解决。

操作系统的发展

计算机发展早期是没有现在的桌面系统的，例如在Windows中通过 cmd 打开的命令行，要执行任何指令都必须等待上一条指令完成。如果进行一次IO耗时操作，CPU只能“空转”许久。

操作系统的出现也不是一蹴而就的，它经历了批处理系统、多道程序系统、分时系统和实时系统等多个阶段。这部分历史可以在许多讲述计算机系统的书籍中看到，但不是我们关注的重点。我们主要关注计算机可以同时（“伪”）处理多个程序，并且每个程序都在独立的进程中，互相独立。

虽然CPU依然只能按序执行指令，但它具备无与伦比的速度，使得它可以在各进程间迅速切换，给人造成同时执行的错觉。

CPU的速度早就一骑绝尘，内存和硬盘却依然在负重前行，此时此刻进一步提高CPU的运行速度显然毫无意义，于是CPU向多核心化发展。

CPU的多核化

即使依靠CPU的高速切换实现了“伪并行”，计算机的能力也远没有到达极限。CPU在进程间切换并不能瞬间完成，所以切换本身也是一种对性能的消耗。给CPU增加多个核心，可以减小切换的影响。

如果计算机有两颗CPU，或者同一颗CPU有两个核心，计算机就可以真正同时执行两条指令，也就可以使两个程序真正并行执行，计算机的性能也就翻了一倍。

现在只剩下一个问题，虽然增加CPU核心数可以同时运行多个进程，但是每个进程还是只能在一个CPU调度下执行。假如在一个网页中同时加载文字和多张图片，那么直到所有的文字和图片全部下载完毕后，用户才能看到网页，这个过程随着图片的增多也会变得格外漫长，很可能大部分用户会直接关闭网页，这种体验可能是任何人都不想看到的。

线程的出现

经历了以上种种问题，我们的线程终于派上用场了。要在一个进程中还拥有同时做多件事的体验，就要让CPU处理进程的能力渗透进来，但是在进程间操作和在进程内部有质的区别。

每一个进程都是一个独立的空间，它拥有自己的堆栈，自己的方法区等等，进程之间除了争夺CPU时间片之外再无交集，甚至一个进程挂了也不影响其他进程执行。但是在进程内部，所有的区域都是公共的，如果要同时访问一个内存单元，很可能造成数据混乱，这也是书写多线程程序较为复杂的原因之一。

后我们还是用一个经典案例，来说明进行多线程开发时面临的问题。

考虑统计一个网页被用户打开的次数，每有一个用户访问，计数器加一。这个问题可以抽象成多个线程对一个数字进行自增的操作，以下是一个可能的结果：

出现以上问题的原因是 i++ 是一个组合操作，实际完成的过程是先取得 i 的值，给它加 1，然后把新的值写回 i 。如果两个线程一起执行，有可能它们会取到相同的值，然后又一起写入，所以就出现了上图的情况。

总结

现在，我们已经知道为何需要多线程，就不会在处理多线程时带着“它怎么搞的这么复杂”的负面情绪。我们知道它解决了多么复杂的事情，也就有了足够的动力去研究如何实现它。

好在，多线程的技术有了长足的发展，在JDK中也有了一整套完备的方案，使我们能够轻松的应对大部分场景。但要学会如何使用它，就要先了解它是什么，它做了哪些事情，使用时需要注意哪些问题。而了解何为多线程，就是这一切的开始。

分享好友

分享这个小栈给你的朋友们，一起进步吧。

飞机酱的IT之旅

创建时间：2020-04-28 18:20:39

飞机酱是一个Android开发攻城狮，除了要攻陷Android外，还会进攻数据结构、算法、网络、计算机系统等方面的知识。关注我，一起学IT吧。

展开

订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅：虚拟交易，一经交易不退款；若特殊情况，可3日内客服咨询

• 专区发布评论属默认订阅所评论专区（除付费小栈外）

栈主、嘉宾

查看更多

大大纸飞机
栈主

小栈成员

查看更多

?
小雨滴
人工智能频道
栈栈