原标题:比特币的数据版图
Original title: Bitcoin data layout
一位码农用10000个比特币换披萨的故事,在9年后的今天已不复存在。去年一年,比特币狂涨十几倍。尽管与上涨百倍的山寨币对比,这一增速还算保守,但它横竖秒杀了大多数城市在过去20年里的房价涨幅。数字货币在近几年席卷的疯狂浪潮,催生了1700多个币种,连大妈都谈起了区块链,网络上围绕比特币展开的讨论也不计其数。这篇文章想通过数据分析来看数字货币市场。比特币的数据十分透明公开,为讨论的展开提供了基础。我们可以获取所有的账号、转账记录、计算机节点和交易所的信息(交易所的数据某种意义上是有水份的);交易所的游戏规则和证券、期货等交易系统有些相似。
1、币的市场
人民币、美元等各国法定的货币被统称为法币。BTC(比特币)、ETH(以太币)等则被定义为数字货币,它们同属于代币(指经过加密的虚拟货币)的范畴。
生日大PK
数字货币是一个庞大的家族,专注统计加密货币市值的网站CoinMarketCap记录了1000多种。这1000多种数字货币分别诞生于何时?CoinMarketCap从2013年4月开始记录各种上线的代币,从它的历史记录中可以查到每个币种被监控的最早时间。统计每周诞生的代币个数,就有了这张柱状图: 将代币的诞生数与比特币价格进行对比,可以发现两者基本是正相关的。去年十月,代币数量达到峰值,与去年频繁的ICO(首次代币发行)进行对照,似乎也对应得上。
那么如何衡量某种代币在数字货币交易市场上的位置?市场流通量(market_cap)是一个重要的参数,它指的是在市场上流通的数字货币所折合的美元数额。不过因为有些交易者只将数字货币静静存放在钱包里,比如比特币发明者中本聪的账户就已许久未发生变化,还有一些人将代币密码存在硬盘中,因为硬盘丢失或损坏,他们持有的代币也永远消失了;这类代币都不参与市值统计。
为更精确地估计代币的市场表现,可以定义一个新的参数——流通比例。其计算公式为流通比例=24小时内活跃的资金 / 总可用的存量。它指代的是代币持有者们在过去24小时内,将百分之多少的代币取出进行投资;或者说,是活跃资金占总资金的比例。
将代币的资金总量和流通比例分别用柱状图和折线图表示,放在一张图表中进行对比: 从图中,我们可以发现一个有意思的现象:前几名的币种,活跃度最大的是USDT,一种和美元等值的货币。它成为比特币行情变化的避险通道,因而利用率最高。而市场流通量排名靠后的一些山寨币,活跃度也很高,这可能与这些代币投机性较高有关。
山寨币大行其道
这里顺便解释一下山寨币的概念。
目前除了比特币和以太币,大部分数字货币都被称为山寨币。“山寨”首先体现在命名上。通过词频统计(注①),发现BIT、BTC、COIN、TH、TC、RC都是非常高频的词,它们似乎是从BTC(BITCOIN)、ETH和LRC衍生而出的。比特币的缩写是BTC,许多山寨币使用了相似的命名,比如BTM、BCC、BTCZ、BTCS、BTCR等。
山寨币数量之所以多,很大的一个原因是虚拟币都是开源的,这意味着开发者可以通过修改现有的代码造币。因而CoinMarketCap将虚拟币分为两种,Token是使用现有平台制造的代币,即光明正大地表示自己是基于别人的代码开发的,而Coins是各种基础货币,其中应该也有很多山寨币。
在下图中展示了山寨币的不同源头,基于ETH(以太币)开发的山寨币占比高达84%: 2、币的交易网络
代币和法币可以交易,代币之间也可以交易,原理类似于外汇交易——在外汇市场上,能用美元换欧元,也能用欧元换日元,瞬息万变的价格体现的是供需关系短暂的平衡。
用A币买B币,这种交易关系被称为交易对(别名pair/symbol/market)。如果市场上有n种代币,理论上它们之间存在n*(n+1)个交易的可能,这是一个天文数字。但现实情况是,不是所有的两两交易都能达成。每个交易所都不会那么灵活,比如在币币交易平台币安上,所有交易都需与四种币种有关:BNB(币安币)、BTC(比特币)、USDT(和美元挂钩的泰达币)和ETH(以太币)。
如果交易对很多,每个交易对之间的交易量就会减少,即交易深度会变浅,价格变化也会非常不连续。所以,人们都会选择哪些交易对进行交易呢?
从CoinMarketCap上能够抓取到9000多个分布在几百个交易所中的交易对。利用这些数据,可以搭建了一个交易关系网络,每一个币种用一个点来表示,点的大小和颜色用来指代该币种的市场流通量,币种之间的交易则用一条条边来表示,边的粗细和颜色同交易对24小时内的流量相关,由此得出了它们之间的亲疏关系: 对这张图表进行初步的解读,我们可以得到下图: 在这个网络中,我们可以清晰地得到以下发现:
1.最大的交易发生在USD和BTC之间,不过由于美元没有计算流通量,所以美元的点很小;
2.资金流动最大的币种是BTC,排名第二的是ETH;
3.第二世界阵营是炙手可热的,它们的点相对较大,彼此之间的交易比较多,又可以和美元、USDT、BTC直接交易,这一阵营的代表有莱特币、小蚁、EOS、量子链;
4.第三世界阵营可以和ETH、BTC和美元进行交易,但是和第二阵营币之间没有很高的交易关联度;
5.从边的关系看,日元和韩元都很本土化,日本人很喜欢买卖BTC,而韩国人在BTC之外,还很喜欢第二世界阵营的币。
3、谁是交易的中心?
在数字货币交易中,中心是一个重要的概念。它就像地理中的交通枢纽,中心度高的币种就像陆路贸易时代连接大唐与西域十六国的敦煌,可以和其他的许多币种连成交易对。
城市间的通商成本是交通,代币之间的成本是每次交易所需支付的千分之几的交易费。如果一个币种可以和各种币种进行兑换,它的价格会比较稳定,体量也会更大。这样的币种也更受交易者的青睐,因为他们一旦持有了该币种,就可以自由地购买不同的货币和商品。比特币在数字货币市场上的地位就像美元在国际贸易中一样,大部分山寨币都可用比特币进行兑换。
如何用数据定义一种货币的中心度?加入某种代币可以和n种货币进行交易,我们就将它的中心度定为n。由于比特币和以太币的中心度过高,我们在数据分析中剔除了这两种货币,关联上币种在24小时内的流通量,我们得出了下图: 我们发现,在前文的交易网络中存在的第二世界和第三世界阵营,在这个抽象空间中依然是邻居。
图中右下角的两个孤立点是日元和韩元,它们数量大,但连通度小。这是因为在许多国家的交易所,如果用货币进行交易,通常会对交易者是否在洗黑钱、是否已缴税等进行监察,所以用法币开交易对并不容易。不过人们买币总归需要支付法币,因而法币的资金量会很大,但中心度却很小。
如果进一步过滤掉大币种,我们发现剩下的币种差异性很大: 位于左侧的币,连通度很大但交易量不大,这或许是因为最近山寨币在收缩、归零,即便交易对很多也难以改变其交易量很小的命运。只有少数的币种在右侧空间中,以正常的交易量流通着。
4、币的竞争
比特币最初一家独大,但近几年大量诞生的山寨币是否分割了比特币的市场?如果以市值=流通供给量*价格的公式进行计算,比特币的最大竞争对手是以太币。
CoinMarketCap的图表比较清晰地呈现了不同货币的市场占比,黄线代表比特币,黑线代表以太币: 是不是觉得他们很有规律呢?
1.从统计上看,比特币的市值比例是下降的,从去年年初到年中,降幅非常明显;
2.竞争关系很明显,以太币上涨时,比特币就下跌,但这不是绝对的,因为这个图呈现的是百分比,因为其他币种的市值很小,所以比特币和以太币之间会出现此消彼长的趋势;
3.去年12月左右,比特币大跌,占有率也在下跌,但在今年2月开始,又逐渐上升了。
5、币的价差
每个国家兑换比特币的价格是不同的。
以韩国为例,他们的交易所比较封闭,除了bithumb,很多交易所都没有外语版本;如果你要申请提款,据说必须在韩国生活半年,持有一张韩国特定银行的卡。外国人很难进入韩国的数字货币市场。因而去年币市火热的时候,韩国的比特币比国外贵了50%,不过这个利差现在已差不多消失了。
因而价差的本质,一是买卖平衡,二是政府管制。那么如何衡量国家管制呢?我想到的一个办法是,通过场外交易价格来衡量。
以中国为例,由于如今任何平台都不能用人民币来兑换比特币,而在国外交易监察很严且要收税,正规流程的提款周期又很长,因而一种新业务——场外交易——随之诞生。交易平台为这种交易提供担保,交易则局限在交易者之间、私下进行。除了手续费高,这种交易方式受政策因素影响较小,因而在我看来,交易价格也更接近人们的心理预期。
我们在一个交易量非常大的交易平台LocalBitcoin上抓取了3100多次交易,做了简单分析后,得出了下图,蓝色柱状图代表交易价格,黄色曲线达标交易数量: 其中,委内瑞拉的价格换兑换美元的价格很高,是外界的10倍。这个国家保持着全球最高的通胀率纪录,这或许是导致其兑换价格高的一个原因。许多小国家也热衷于比特币交易,比如尼日利亚、秘鲁、伊朗。这些小国尽管人口不多,但是比特币的交易量比较大,这或许和这些国家法币不稳定性有关。
说明:全文的数据分析基于PostgreSQL和众安科技开发的数据可视化产品Zatlas(v.anlink.com)
注①:我们用一个PostgreSQL看词频,里面用的show_trgm函数, 可以把一个词分解为相邻序列,BTC=> BT、TC、BTC,然后统计有几个。
作者:周宁奕 众安科技数据科学前端&设计负责人
数据分析作品包括:上海买房攻略/杭州房价研究/共享单车的违停大数据计算
注册有任何问题请添加 微信:MVIP619 拉你进入群
打开微信扫一扫
添加客服
进入交流群
发表评论