2. Analysis of Scale-out Ability of Akka Sharding cluster¶

跟很多分片集群解决方案不同，akka 分片集群（sharding cluster）中每一个节点都在直接访问本地数据的同时，也都可以作为 proxy 访问集群中其它节点的数据。在我看来，这是 akka 分片集群水平扩展（scale-out）能力可能接近线性的关键。

Comparing to some sharding solutions, Akka let you access whole sharding cluster data via any node.

2.1. Benchmark¶

在采用 Raspberry Pi 2 Model B 组成的 10 x nodes cluster ，我用 astore 测试了 akka 分片的水平扩展能力，结果显示出非常好的线性。我们不妨在此做个简单的分析。

2.2. Evaluate¶

设 c 为 number of connections， $\tau$ 为average response time（平均响应时间），则单节点（single node）时 qps 为：

$qps = c \left(\frac{1}{\tau}\right)$

当节点数（number of nodes）为 n 时，数据（data）有 $\frac{1}{n}$ 的概率（probability）在本节点（local node），而 $\frac{n-1}{n}$ 的概率（probability）在其它节点（remote nodes）。假设在本节点（local node）的平均响应时间（average response time）仍然为 $\tau_1$ ，在其它节点的则为 $\tau_2$ ，则总体的平均响应时间（total average response time）为：

$\tau=\frac{\tau_1 + (n-1)\tau_2}{n}$

这时，qps 为：

$qps = cn \left(\frac{1}{\tau}\right) = cn \left(\frac{1}{\frac{\tau_1 + (n-1)\tau_2}{n}}\right) = cn \left(\frac{n}{\tau_1 + (n-1)\tau_2}\right) = cn \left(\frac{n}{\tau_2n - (\tau_2-\tau_1)}\right)$