以太坊网络上记录了多种类型的钱包地址,其中大部分是普通用户了,但也可以按照某些规则将他们进行分类,例如:

  • 交易所钱包地址
  • 矿工钱包地址
  • 区块链项目方用户用于 ICO 的钱包地址
  • ETH 的大户 参与早期 ICO
  • 鲸鱼账户 有大量 ETH 和 ERC20 Token 并且经常「摆动尾巴」震荡市场上的币价

上面这些类型的账户,他们一般都会把资产分散到不同的地址当中,这样关注币价的人们就很难追踪他们的动向。然而,区块链公开透明,这些地址的链上交易记录是可追踪的,我们可以根据地址间的转账关系来找到一些猫腻。

用户画像的意义又是什么呢?

人们想追踪一个地址的原因有许多:

  • 一些币圈的投资者可以根据它来预测一些币价的走势
  • 区块链的项目方可以选择优质的地址来做空投糖果
  • 政府机构可以追踪一些可疑的地址活动
  • 分析人员能更深入的理解区块链上到底都在发生些什么
  • 幸运的是我们有大量的区块数据可以追踪不同类型的以太坊账户。

最简单的一种方式就是分析钱包地址中的以太坊余额,结果是鹅妹子嘤的!

结果做了对数缩放,按照 ETH 的持有量排序 第一组是 Top10 的钱包地址,随后是11 - 100 再到后面突破 35,000,000 大关。

** 换句话说前 10,000 个以太坊地址占据了以太坊总数的 83.3%!**

如果这还不够鹅妹子嘤的话,top10的地址占据以太坊总数的11.4% 。

区块链的匿名性使得追踪这些顶级账户变得更加困难了,好在所有交易透明可追踪。目前以太坊这 6M 个区块都可以帮助我们对这些地址分组归类。(交易所、项目方等等)

链上数据可视化

通过绘制前10,000 地址的区块数据,我们可以观察下是否可以有些更好的模式。因为每个地址所具有的数据不能连贯地拟合到一个图形中,所以就我们从四个重要变量开始:

  • 发送和接受的 tx (transactions)
  • 当前账户余额
  • ERC20 Token 余额 这些变量体现了账户的活跃度和Token的持有情况,是非常有价值的。

这些数据表达了这样一个事实,即以太坊网络中的顶级账户存在非常多样化的主体。首先,它显示了发送很多的 tx 账户并不会收到很多 tx,反之亦然。它还表明,大部分顶级账户(平持有1.5兆 ETH)相对不太活跃。拥有大量 Token 的账户收到的 tx 数要大于他们发出的 tx 数。

通过使用标记地址的数据集,我们可以进一步检查这些组的行为是否不同 - 这次只查看收到的tx、发出的tx、以及ETH 余额 (颜色为地址类型)

标记的数据集仅限于交易所,矿池和项目方的钱包。

每个用户组之间有一些明显的区别,平均而言:

  • 矿池发送的 tx 多
  • 项目方钱包有较高余额
  • 交易所发出和接受的 tx 很多非常活跃 以上不是仅有的的可用链上数据。我们另一个可用的维度是每个钱包中 Token 的持有情况,不同 Token 的持有情况可以让我们了解主体的投资喜好。还有一个维度是账户是智能合约地址与普通地址。 智能合约是一种独特的地址类型,它排除了大多数普通用户地址,因此有助于按照地址功能进行分类。

由上图可见:

  • 项目方的 Token 持有主要是在智能合约中,矿工都使用普通账户的。
  • 交易所的钱包地址会持有 100+ 种类型的 Token。
  • 交易所的可以用智能合约也可以用普通地址来持有token。这主是去中心化与中心化交易所之间的区别.

创建链上用户画像

我们可以将这些分析转化成用户画像 - 这样我们能够更容易地识别未标记的地址。这些用户画像如下图所示:

未来的探索方向

使用仅有标记地址的数据集,我们能够映射一些知名的以太坊账户。 我们还要标记更多地址,这样能使得数据更加的全面。

我们对未来探索是无穷尽的。 例如,通过对交易所地址的追踪,可追踪到用户的投资收益状况,甚至可以通过追踪历史数据来分析早期投资整的投资行为与收益等等。

随着区块链玩家的丰富各 dApp 中的用户交互数据、ERC-721、ERC-1155 的持有偏好亦可作为用户画像的依据。这也将是 LORDLESS Team 后面要重点探索的方向。

路漫漫其修远兮,吾将上下而求索。

数据来源 :

  • tokenanalyst.io
  • etherscan.io

感谢 Aliaga 整理数据