数据可以通过一次性收费而被永久储存的说法,意味着我们与数据的关系和使用方式的范式转变。
许多人对数据永久存储的想法持怀疑态度,因为这似乎是不可能的,而且以前从未实现过。与任何如此大规模的创新一样,它需要进一步研究和证明自己的可行性。
对于那些刚加入ArDrive的人来说,要知道我们并没有发明数据永久。Arweave发明了 "permaweb",你可以在这里阅读Arweave的更深入的概述。ArDrive是建立在Arweave网络基础上的其中一个应用程序,是普通用户将文件放到Arweave网络上的最简单和最好的方法。
在这里,我们将重点讨论Arweave网络如何永久性地存储数据。
那么,数据如何能被永久存储呢?通过经济激励结构的结合,使数据的存储者能够长期获得报酬,以及围绕区块链数据库的技术革新(区块纺),所以Arweave能够使数据被永久存储。
上面这段话中夹杂着许多概念。让我们逐一解读,看看Arweave是如何让数据安全、并且在极长的时间可靠地存储。
在这篇文章中,我们将介绍以下内容。
- 永久数据存储的经济激励
- 区块链的技术创新
希腊人发明了带USB接口的笔记本吗?
1. 永久数据储存的经济激励
在几乎所有的软件业务中,如果有人不为服务付费,软件公司就不会提供服务。如果将来没有任何人再为服务付费,软件将不复存在。
这在数据存储方面也是正确的:如果没有人付钱来托管数据,数据就不会被托管。而如果没有人继续为数据付费,它将停止被托管并消失。这就是为什么网络托管公司的典型商业模式需要持续或按月订购。
这种商业模式似乎很明显,我们倾向于认为它是托管业务可以运作的唯一方式。如果我想要一个持续的服务,我需要提供持续的付款。
那么,Arweave网络上的ArDrive怎么做到永久存储只需支付一次费用呢?
Areave网络是由世界各地愿意存储他人数据的矿工组成的,每周都有更多人加入这一网络。
本文将重点讨论这些人如何长期存储其他人的数据并从中获利。那么,让我们来分析一下这其中的经济学原理。
首先要知道的是,你上传数据到Arweave网络的费用是用来支付200年的存储费用的。现在,200年是一个很长的时间—听起来还贵吗?
这听起来很贵,因为我们已经习惯了生活中几乎所有领域的价格上涨,但数据存储是少数几个与此趋势相反的领域之一。在过去的50年里,数据存储的成本平均每年下降30.5%以上。
值得注意的是,随着时间推移,数据存储价格的这种下降是相当一致和稳定的。
这一趋势实际上可以追溯到更久远的年代。信息存储成本的下降远远早于计算机时代。在古代,世界上最早的图书馆中存放的纸莎草纸是极其罕见和昂贵的。但是,从兽皮到羊皮纸再到印刷机,印刷技术的成本和难度都在稳步提高。几千年来,人类一直在寻找方法,使信息的记录更加便宜。
每张羊皮纸可以记录约2KB的数据
当然,过去并不能决定未来,那么我们怎么能确定存储的价格会随着时间的推移而继续下降?
有两个主要变量可以使存储得到改善:数据密度和数据可靠性。据Arweave估计,数据密度,即一个物理空间可存储的数据量,在达到其理论极限之前,以目前的速度还有大约400多年的改进空间。数据可靠性有更大的能力可以改进。
Arweave的假设是,存储的价格将随着时间的推移继续下降。鉴于技术上仍有待改进,加上社会对数据存储的需求不断增加,这其实是一个非常合理的假设。
因此,为了使永久存储的经济性发挥作用,Arweave是否在赌数据存储成本将每年持续下降30.5%?
不,绝对不是!
Arweave对永久存储的经济性可行的假设是极其保守的。Arweave假设数据存储成本每年仅下降0.5%。
用户为上传数据到Arweave网络而支付的初始费用涵盖了前200年的存储。如果数据存储的下降幅度每年大于0.5%,其实就增加了数据的存储年限。
其结果是随着时间的推移,数据存储成本极其低廉。按照目前的费率,Arweave上前200年的存储费用仅为每MB只需要0.007美元。
下面是一个表格,它考察了在未来200年内,如果存储成本以30.5%、20%、10%或1%的速度下降,你将获得多少年的额外数据存储:
正如你所看到的,如果存储成本即使下降1%,数据可以保存的年限也会成倍增加。这个时间长度对我们来说确实是难以想象的。
即使在1%的情况下,储存量积累的时间长度也可以用人生的长度来衡量。在10%或更高的下降率下,数字是以百万年为单位。这就是永久性的数据存储。
储存激励:为长时间持续存储而支付
在这一点上,经常有人提出反对意见。"一旦有人拿到存储数据的费用,他们有什么理由要真的继续保存这些数据呢?"
需要理解的一个重要因素是,付款不是支付给最初存储数据的人。在一开始,只有一小部分被支付。其余的付款将进入一个捐赠基金。这个捐赠基金中的费用将随着时间的推移而增值,就像银行账户中的现金积累利息一样。
随着捐赠基金的增值,它被设计为根据需要提供支付,以保持存储数据的回报高于存储成本。
Arweave估计,在数据集比目前的表层网络(公众可随时使用的互联网部分)的规模大很多倍之前,不需要从捐赠基金中提款,这可以用Petabytes(数百万吉字节)衡量。简而言之,在需要使用这笔捐赠资金之前,我们还有很长的路要走。
即使Arweave网络还很新,捐赠也已经存储了相当大量的代币。
因此,即使存储数据的人来了又走(他们会这样),其他人也会来接替他们的位置,继续存储数据。只要经济动机存在(他们存储数据的价格大于存储数据的成本),人们就会继续维护permaweb。
总而言之:随着新的数据被上传到Arweave网络中,前期利润的产生使存储数据的人参与其中,而捐赠的存在是为了确保在很长一段时间内对他们保持经济激励。
永远不必为下载数据而付费
值得一提的是,任何人都不必为从Arweave网络或ArDrive中检索数据而付费。一次性付款涵盖了将数据放到网络上的成本,而检索这些数据永远不会有额外费用。
现在我们已经介绍了经济概况,让我们把重点转移到Arweave开发的技术创新上。
数据永久化,而不是网络永久化
在我们转向技术创新之前,还有最后一点要注意。Arweave并没有承诺网络的永久性,而是数据的永久性。这有什么区别?
技术革新是一波接一波的,所以可能(很可能)有一天,数据可以以更便宜的成本被永久存储。由于存储数据的成本极其低廉,这个新的网络工作将 "吞并 "Arweave网络。
因此,Arweave网络可能不会是永久性的,但网络上的数据会是永久性的。因此,数据的永久性才是最重要的,这也是将继续存在的东西。
2. 区块纺(Blockweave)的技术进步
在技术方面,有许多创新组成了永久储存,但有一项是创新的核心:区块纺。
区块链是一种类似区块链的结构,旨在以最有性价比的方式实现不变的和可扩展的链上存储。
这句话有很多东西需要解读,但让我们从区块链这个词开始。
如果你对由比特币推广的区块链技术感到陌生,这里有一段介绍视频,很详细地解释了它的概念:
区块链技术引入了一种新型的数据库来验证交易。它本质上是一个长长的账本列表,随着新的交易被添加到其中而不断追加。每次有新的交易,整个区块链都会通过将其添加到 "链 "的末端来记录它。这是一种非常安全的交易验证方法:从来没有人黑过比特币。但由于极端的能源需求和漫长的交易时间,它仍然不是一个存储大量数据的好地方。
为了让你了解比特币区块链的效率有多低,整个账本的大小约为320GB(截至2021年),竞争着去验证或者奖励所需的电量约为新西兰或奥地利等国家每年的电量。
为了保持区块链可验证的特点,同时也为了加入以高性价比和可扩展的方式存储大量信息的能力,Arweave想出了一个区块链的变种,他们称之为区块纺织。
是什么使区块纺如此独特?
在这一点上,我们将对Arweave的技术部分进行概述,但如果你想深入了解该项目技术,请访问Arweave黄皮书。
Proof-of-Access (SPoRA)
SPoRA是Succinct Random Proofs of Access的缩写,它是构成区块纺的核心。
虽然SPoRA不是一个很好念的名字,但它是区块链的一个极其强大的创新。
SPoRA要求接收新数据进入区块链的矿工,从网络中以前的交易中随机“回忆”一条信息。
一个节点不需要拿出整个账本,而只需要回忆一下由算法随机选择的“大块(chunk)”信息。一旦之前的 "大块 "信息被验证,新的数据就可以被上传到系统中。
与比特币相比,这个系统的作用是,它需要的运行能源要少得多。这导致信息存储者的开销大大减少。这种机制抵消了区块链网络中通常被浪费的价值,以极低的价格提供有用的、节能的数据存储。
此外,放入系统的每条信息都有时间戳,并有一个独特的交易标识符。一旦进入系统,信息就不能被改变或删除。
SPoRA对所有的信息块所做的是,它创建了一个多方向的数据 "编织网"--而不是单一的长链:因此,它是区块纺。
这种新的和改进的区块链验证形式允许大量的数据以高度安全和性价比的方式被存储。这也意味着permaweb上所有的每一个数据都标有一个时间戳的ID,无法改变。向Arweave网络上传任何新的信息(以及存储这些新数据的经济效益)都需要保持permaweb上所有旧信息的完整性,因为它将被持续验证。
野火(Wildfire)
区块纺通过一个名为 “野火”的概念进一步区别于大多数其他区块链。
区块纺的“野火”将合作置于竞争之上:人们不与优化过的服务器和低价的能源竞争,或是以解决数学问题来获取奖励(如比特币),而是被激励着相互分享他们拥有的数据。
虽然这是一个复杂的过程,但野火可以被描述为 "如果你与我分享,我将与你分享"。
分享就是关怀
网络中的每个人都由他们的同伴根据他们分享数据的速度来进行排名。为了获得新的数据,你需要有旧的数据,如果你不分享旧的数据,你的排名会降低。较低的排名意味着你将不能像以前那样容易地在permaweb上存储新的信息--因此也就不能获得经济奖励。
该系统最终所做的是激励数据的存储者相互分享。
最终的结果是,块状网络上的数据被密集地复制。数据不是被孤零零地放在几个不同的存储区域,而是被分散到各地,并被复制数百或数千次。因此,你上传到ArDrive的家庭照片不会只存放在一个云服务器上,它将被保存在世界各地的数百或数千个地方。
那么,数据如何不在系统中丢失?
对permaweb上的数据进行持续的验证是比较难理解的。Arweave的创始人Sam Williams分享了系统内的数据因SPoRA技术创新而被验证的频率统计。
如果你在网络上有一个交易:
- 一开始,你的数据被读取并验证了大约1,890次
- 每天,你的交易会被进行超过5,670次验证
- 你的数据的完整性每4秒会被检查一次
总结
人类是数据保存者。古往今来,我们总是找到方法来记录我们的想法、信念、记忆和艺术品。我们保存数据的方法已经变得显著地越来越有效。
Arweave并不掌握着未来数据存储的钥匙。但正如本文所概述的那样,它有理由说自己已经开发出一种以简单的一次性价格存储数据的方法,并在数个世纪内都是如此。这是一个世界第一,我们相信在未来几年将看到越来越多的采用。它有可能是一种零对一的创新,永远改变数据存储的格局。
但在你尝试之前,你永远不会知道是否可行。
ArDrive是你将你的个人照片、音乐、文件和视频放到Arweave网络上的最简单方法。上传一些你的文件,看看它们如何保持 "凿在数字石碑上",而其他网盘上的数据则可能消失或需要持续支付。试试ArDrive