绑定完请刷新页面
取消
刷新

分享好友

×
取消 复制
区块链分布式存储革命:IPFS+IPSE能挑战IBM+Google吗?
2019-08-08 11:29:25

随着云计算和金融科技的发展,文件系统架构的设计正在不断强化。常见的分布式文件系统有GFS、HDFS等,也有新兴的基于区块链IPFS/Filecoin等。有的广泛应用,有的开始挑战,有的是闭源,有的开源。在不同的领域和不同的计算机发展阶段,它们都对数据存储起到了各自的作用。那么这些分布式文件系统都有什么优缺点?基于区块链技术的解决方案能调整谷歌等科技巨头吗?

HDFS:被雅虎开源的分布式文件系统

提起分布式文件系统,就不得不说起HDFS。Hadoop分布式文件系统(HDFS),是一个分布式、可扩展的Hadoop框架,具有高容错、低成本部署优势。HDFS提供对应用程序数据的高吞吐量访问,适用于具有大型数据集的应用程序。HDFS初是作为Apache Nutch网络搜索引擎项目的基础设施而构建的,现在是Apache Hadoop子项目。

开始,雅虎公司为了加强广告服务和搜索引擎功能,推出了Hadoop分布式文件系统。由于优势明显,Facebook,eBay,LinkedIn和Twitter都开始使用它来处理不断增长的应用程序数据,还被纽约时报用作大规模图像转换。2006年,Hadoop的创始人将HDFS交给了Apache软件基金会。2009年6月,雅虎把Hadoop开源了源代码可供开源社区使用。截至2013年,Hadoop的应用已经变得非常普遍,且非常成功:超过一半的财富50强公司使用Hadoop。

实际上,HDFS的主节点“数据分块”属性借鉴了谷歌文件系统(GFS)和IBM的GPFS的设计。尽管在Google算法的打击下,雅虎梦断搜索。但HDFS却躲开了攻击,成为知名的分布式文件系统解决方案之一。从搜索业务上,雅虎是“失败”和无奈的,但是从计算机数据处理和全球商业设施上讲,软件开源的价值是无价的。

可以说HDFS源于谷歌,终于雅虎,归于开源。它带着荣誉和成功完美谢幕。

你可能不知道,HDFS的初灵感来自2003年10月发布的谷歌文件系统论文,可见谷歌在分布式文件系统上研究不仅早,而且行业领先。

GFS谷歌文件系统:原来数据还会热和冷

GFS(Google File System)又称为谷歌文件系统,是一种分布式文件系统。GFS的节点分为两类:主节点和大量的Chunkservers。Chunkservers存储数据文件,这些单个的文件象常见的文件系统中的簇或者扇区那样被分成固定大小的数据块(这也是名字的由来)。

流程简析:

GFS采用中心服务器模式,即Master管理分布式文件系统中的所有元数据。文件划分为Chunk进行存储,对于Master来说,每个Chunk Server只是一个存储空间。Client发起的所有操作都需要先通过Master才能执行。

Google的核心需求是数据存储和使用。初的GFS主要是为搜索引擎服务,后变为云计算战略的一部分。如果要评价GFS,给予任何溢美之词都不为过,因为GFS从理念和设计都是划时代的。

随着谷歌的壮大,凭借搜索、流媒体和云服务,霸占了数据高地。逐渐地,GFS的单点损坏和效率已经严重制约谷歌的下一步计划。

2013年,Google公布了Colossus(直译“巨象”)项目,作为下一代的Google文件系统。它的使命只有一个:效率。它的重要的特点之一就是自动分片元数据层。

2017年,国际并行数据系统研讨会(PDSW)上,谷歌的软件工程师Denis Serenyi讲述了Colossus是如何提升存储效率。他指出了GFS架构问题:

●一台机器不足以满足大型文件存储

●元数据操作的单一瓶颈

●容错不够高

●延迟问题(尽管可以预见)

鉴于此,GFS master节点只能被Colossus替代。Colossus存储效率对于优化谷歌的产品非常有用,它体现在:

●元数据扩展可以对资源进行分块

●能够组合不同大小的磁盘和各种类型的工作负载

●冷热数据的平衡与新分发

Colossus是一个进化版,而非全新的版本。Colossus重新平衡了旧的冷数据,并在磁盘上进行进行新数据的分发。这样,像Youtube这样的视频平台,大量的数据存储和播放需求,会在分布式系统中以快的效率触达用户。

小知识:什么是冷数据?热数据?

数据冷热管理是非常重要的一部分。比如IBM就会开发一套解决方案来测量数据的“温度”,并协助制定包含数据的运营和业务决策。

热数据: 指的是将被频繁访问的数据,它们通常存储在快速存储器中。

温数据:是指被访问频率相对较低的数据则,它们存储在相对较慢的存储器中。

冷数据:极少被访问的数据,它们则会被存储在企业慢的存储器中。

IBM通用并行文件系统GPFS:不仅存储,更是全球共享经济

IBM通用并行文件系统(General Parallel File System,简称GPFS)是一个面向企业的文件系统,用于替代HDFS。

根据IBM官方的描述,GPFS支持数千个节点和PB级存储,数据在多个节点上复制存储,因此不存在单点故障。官方还不忘diss了一下HDFS的单点故障问题。解决IBM单点故障的方法是:如果节点出现故障,则会将更改复制到其他节点,GPFS会快速确定并恢复哪些块。节点崩溃时发生的更改也将复制恢复到上一个节点,以便节点与集群让的其他节点同步。

IBM还使用了新的磁盘阵列技术(GPFS Native RAID),针对破碎数据的重建和资源消耗,比传统的阵列减少了三到四倍。因为GPFS跨集群管理,整个系统性能表现对单个节点的重建存储阵列速度的依赖更加小。这让规模磁盘管理、镜像、基于策略的自动化和灾难恢复等成为GPFS的主要特点。

GPFS是面向大规模高性能计算和大规模存储环境,可以跨多个服务器分发和管理数据。在GPFS集群之间的共享文件系统效率更高,提高了系统性能和文件一致性数据可用性和系统灵活性也提高,并简化了存储管理。

2015年,IBM改名部将GPFS改为Spectrum Scale,成为IBM Spectrum Storage(光谱存储)的一部分。下图为IBM官方架构图:

IBM Spectrum Scale是针对云计算、大数据、数据、对象等的非结构化数据的存储管理系统,具备许多特点:高扩展性能、极高吞吐量、低延迟、数据感知和智能管理、全球协作、利用身份验证和加密保证数据完整性和安全性。在官网中,IBM称“企业组织的底层存储必须支持新时代的大数据和人工智能工作负载以及传统应用程序,同时确保安全性,可靠性和高性能。”而IBM Spectrum Scale作为一种高性能的大规模数据管理解决方案,正是为此而生。

而且它还可在Amazon Web Services上使用。可见,IBM已经不甘心于做一个只存文件的文件系统,而是一个将文件存储作为底层设施的数据经济系统。将存储成本降低已经不再是优先目标,全局管理、全球共享、人工智能,都预示着IBM转变数据经济学的发展战略。

区块链时代的分布式系统IPFS/IPSE:安全与通证激励

IPFS(InterPlanetary File System)星际文件系统,是一个点对点的分布式存储和超媒体传输协议,使用内容寻址的进行数据分发。IPFS依靠分散的全球网络节点构成一个分布式系统,使得网络更加安全和高效。IPFS属于开源项目,创始人为斯坦福大学Juan Benet,他建立了协议实验室Protocol Labs,主导开发了IPFS、Filecoin等协议。

IPFS旨在让全球计算设备连接到同一个文件系统中,且是分布式和结构。IPFS提供了一个高吞吐量、按内容寻址的块存储模型,IPFS没有单点故障,并且节点不需要相互信任。为了激励更多节点,IPFS官方发布了一个由加密数字货币驱动的分布式存储网络——Filecoin建立在IPFS协议之上,它是IPFS的激励层。

Filecoin建立的是一个去中心化的存储市场,客户支付FIL进行存储数据,矿工(存储节点)提供硬盘空间存下数据获得FIL奖励。这是其基本经济模型。

Filecoin的DSN市场

Filecoin的文件经过哈希算法,安全存储于分布式节点,经过点对点传输。存储节点并不知道存储的数据副本具体是什么,因为Filecoin采用了端对端加密技术。由于采用分布式哈希路由,同上文中的HDFS\GPFS等系统一样,IPFS同样具备高容错性。

不过Filecoin突出的地方在于,它是区块链技术形态下的分布式文件系统,意味着它是去中心化架构。没有中心化服务器控制,没有单点故障(并不意味着不会发生,而是有专门的修复机制),无需中间人,节点之间也无需第三方来保证信任。Filecoin是一个透明、开发、可信的网络,区块链就是它的信任链,在链上,数据交易全部可查。基于Filecoin的文件版本机制,文件可溯源,解决数据大量重复存储和冗余问题。

作为去中心化的存储网络,都会设计共识Proof of Storage(存储证明),Filecoin和Sia等网络均如此。不过,Filecoin设计了新的证明机制叫做PoRep(复制证明),用于证明机器设备存储了数据。还有PoST(时空证明),用于锚定存储数据和时间戳,证明在某一时间矿工存储着数据。依靠两种算法机制,有效防止女巫攻击等数据造假、欺骗等行为。Filecoin存储网络大的特征就是安全。

截至2019年8月,Filecoin主网并未上线。根据官方路线图, 预计上线时间为2019 Q3/Q4,在上线之前之前将会(必须)进行代码冻结并申请美国的审计。从时间点上看,Filecoin还未真正步入全球云存储市场,但是它的设计将会为分布式文件系统带来新的解决方案。

Filecoin是IPFS官方激励层,同样在IPFS生态,IPSE承担着IPFS应用检索层的重任。Filecoin重存储,IPSE重搜索。但这并不代表Filecoin网络没有检索,实际上,检索市场也是其数据验证环节的关键部分。同样不能将IPSE单纯规类为分布式搜索,因为它也有底层的存储方案。

IPSE的分布式存储结构和共识机制

为了让分布式节点的数据能以快的速度触达,IPSE采用效率优先原则。基于区块链共识机制PoST(存真证明)和数据持有证明PDP,使数据安全存储在磁盘介质上。尽管如此,为了实现更好的存储安全性,IPSE的数据多份保存和多节点分散保存。矿工如果无法完成对挑战到的数据切片做出PDP持有性证明将会遭受惩罚。对于陈旧的数据,IPSE采用智能嗅探和周期性任务分发,使数据保存期限将和机器硬件使用寿命同步。

为了数据被访问到,依靠强大的检索引擎,IPSE数据索引能能够获取分布式节点网络上的数据。从数据源-数据存储-数据检索-数据访问,构建了完整的数据生命流程。

总结IPFS/IPSE分布式架构的优点:

●去中心化

●分布式节点网络,无单点问题

●加密技术保护数据完整性和安全性

●存储成本和传输成本远低于中心化系统

●通证激励

除了上述网络,分布式文件系统的解决方案包括:Sia和Sotrj。它们都建立了一个租用和支付通证的存储空间,去中心化,数据为自己的私有,存储都将进行加密。目前,Sia已经进行了商用,Storj还在Alpha 4开发阶段。

总结:新旧替代的革命

分布式文件系统初是为响应逐渐增大的数据规模而设计,相继出现了不同的解决方案。有谷歌、IBM等传统科技大公司为自己设计的系统,也有进行开源而被大众使用的系统。

它们都想获得这样的目标:满足PB级的数量存储、高吞吐量、尽可能低的访问延迟、快速部署与低成本应用。

它们都使用了相同或相似的技术架构和思路:集群系统、节点管理系统、可扩展结构、副本备份、容错管理。

它们都遇到了同样的问题:一致性事物处理、通信资源消耗、数据的存取结构复杂、数据的安全性和保密性。

因此,只要存储存在,机会和挑战就并存。

毫无疑问,对比通用文件系统,分布式文件系统非常适合大规模数据集上应用,为企业组织的业务部署带来了成本和管理优势。不过如果追求高效,那么就要有数据丢失和安全方面的牺牲。如果着重安全,效率又会收到影响。如果问,哪个分布式文件系统好?闭源还是开源?中心化和去中心化应该如何选择?

寻找分布式文件系统的佳答案,不如先从计算机网络发展的三个主要阶段中寻找。

阶段,集中式网络。这是个计算机网络。它们以一台主计算机(服务器)为中心代表,周围有有许多其他计算机连接到它。结果,如果主计算机上的信息被擦除或丢失,数据就从整个网络中消失了。

第二阶段,去中心化的网络。意味着有多个主服务器连接了多个辅助服务器。因此,其中一个服务器的问题不会影响整个网络。弊端是控制主服务器就控制了关联数据。

第三个阶段,分布式网络。目前,我们正在见证一种全新的、革命性的计算机网络的兴起——分布式网络节点内的所有计算机都作为对等体存在,且互相连接。假如其中一个节点关闭或者崩溃,数据信息仍将在网络中的其余计算机节点上可用(直到后一个节点关闭)。

传统的分布式文件系统(无论谷歌闭源的GFS还是开源的HDFS),在效率上和应用上都具备实践优势。但它们都为摆脱中心化结构。因此,引发了安全和信任问题。随着计算机网络进入新的阶段,分布式存储文件系统的技术要求将更高,同时要在开发难度和易用性做出平衡,在部署上要取得更好的成本优势。这意味新旧替代的革命不可避免。基于区块链技术的分布式文件系统(如IPFS/Filecoin/IPSE/Sia)提供了透明可信任的网络,展示了不同的数据形态。尽管,这些网络在大规模商用上还处于探索和初步实践阶段,但是,他们敢于向Google、IBM等传统科技公司发起了挑战,不仅是云存储,甚至整个互联网和线下的数据形态都将变革,行业不可避免将会洗牌。

参考资料

●HDFS介绍

●《GFS谷歌文件系统论文(2003)》

●谷歌工程师Denis Serenyi《Cluster-Level Storage at Google,How we use Colossus to improve storage efficiency?》

●IBM Spectrum Scale 5.0.0: Administration Guide

●《IBM红皮书:IBM Spectrum Scale (formerly GPFS) 》

●IPFS星际文件系统技术文档

●IPSE技术黄皮书

●Sia白皮书

●Filecoin白皮书

分享好友

分享这个小栈给你的朋友们,一起进步吧。

IT职场
创建时间:2020-06-15 15:59:08
在这里可以吐槽,可以分享,可以做想做的一切!
展开
订阅须知

• 所有用户可根据关注领域订阅专区或所有专区

• 付费订阅:虚拟交易,一经交易不退款;若特殊情况,可3日内客服咨询

• 专区发布评论属默认订阅所评论专区(除付费小栈外)

技术专家

查看更多
  • 小雨滴
    专家
戳我,来吐槽~