今日,Github 发布年度报告。作为开发者社区大的开源项目托管平台,Github 的年度 Octoverse 报告能为我们了解开发社区提供直接的洞见。报告中明显的两个趋势是:中国开源贡献仅次于美国,Python 超越 Java 成为第二受欢迎的编程语言
4000 万开发者,80% 美国外用户
据报告介绍,当前使用 Github 的开发者数量超过 4000 万,大部分来自美国之外(80%)。过去一年时间,约有 1000 万新的开发者用户加入,超过 44% 用户在 2019 年创建了自己的 repo,130 万开发者为开源项目做贡献。
学校中的学生正在成长为下一代开发者,今年超过 76 万开发者在 Github 上学习,Github 上共有 170 万学生在上面学习编程,比去年多了 55%。
仅次于美国,中国开发者贡献大量开源项目
开源成为了当前推动开发社区前进的一大手段。据报告显示,从 2014 年开始,非美国的开发者贡献就超过了美国。
下图则展示了美国之外,使用开源项目多的 20 个国家和地区。当前,Github 上约有 300 万公司/组织账号,除了美国外,去年中国、印度、德国的开源使用多。其中,中国的开发者去年 fork、clone 了超过 48% 的项目。
JavaScript 霸榜,Java 被 Python 超越
从编程语言的受欢迎程度(即代码库贡献)来看,JavaScript 多年来一直处于榜首。而榜单第二名则在今年从 Java 变成了 Python。此外,C# 和 Shell 语言在今年的排名也出现了上升。
从包管理工具上也可以看到相似的趋势。上榜的每个编程语言的生态系统都十分活跃,依赖项目都很多。
而快增长的语言方面,Dart 是增长快的编程语言。此外,Rust、Kotlin 和 *cript 的社区都在快速增长。
受欢迎的开源软件和项目
今年,受欢迎的开源项目已经有 10K 的贡献者。其中,有两个自从 2016 年就已经上榜:vscode(微软)和 ansible。在 2019 年新上榜的有:flutter、first-contributions 和 home-assistant。
图注:今年的项目排行榜。
年度高光项目:TensorFlow
TensorFlow 被评为今年的高光项目,这是因为它是 GitHub 上面受欢迎的项目之一。有上千名开发者对 TensorFlow 的依赖进行了贡献,包括 Numpy、Pytest 等。
值得关注的 IT 领域:数据科学
报告指出,全球范围内的编程环境发生了很大变化。Python 语言的高速增长,无疑是数据科学从业者和爱好者的功劳。这包括了很多通过 Python 完成的工具,以及很多降低了使用门槛的相关工具。这些工具同时也成为了很多学术研究和企业的基础项目。
在 Python 语言背后,诸如深度学习、自然语言处理和机器学习等已经成为了数据科学社区受关注的领域。
Jupyter Notebooks的增长, 2016-2019
Jupyter Notebooks 的使用率(将 Jupyter 作为主要语言)在过去三年增长了 以上。
自然语言处理代码库从 2016 年到 2019 年的增长。
自然语言处理在 GitHub 上也成为了一个新的趋势。类似 NLTK 的工具已经降低了 NLP 工作的成本。