Part 5 - サンドボックスへようこそ

ここまでのチュートリアルでは、ホックや全てのワーカーを一つ一つ初期化していました。しかし、この一連の作業は、まずはインタフェースがどうなっているのかだけ確認したいとか、どんな感じなのかちょっと試したいっていう時にはちょっと面倒かもしれません。そこで、今後のチュートリアルでは便利関数を使って設定を一発で済ませてしまいましょう。


In [ ]:
import torch
import syft as sy
sy.create_sandbox(globals())

サンドボックスで作成されるもの

見ての通り、何名かの擬似ワーカーとデータセットをロードしています。そして、Federated Learningに代表されるプライバシーに配慮したディープラーニングのテクニックを簡単に試せるよう、各ワーカーへデータを分散して送っています。

サンドボックスの機能を使って6名のワーカーを作成しました。


In [ ]:
workers

また、すぐに使えるくのグローバル変数も用意されています。


In [ ]:
hook

In [ ]:
bob

Part 2: ワーカーを検索できる機能

データがリモートにある事を前提としてデータサイエンスを行うなら、どこにどんなデータがあるのか検索できる必要があります。 例えば、病院が持つ、放射線に関するデータセットにアクセスしたい研究所を思い浮かべてみてください。 どこの病院がどんなデータを持っているのか検索できる事は重要です。


In [ ]:
torch.Tensor([1,2,3,4,5])

In [ ]:
x = torch.tensor([1,2,3,4,5]).tag("#fun", "#boston", "#housing").describe("The input datapoints to the boston housing dataset.")
y = torch.tensor([1,2,3,4,5]).tag("#fun", "#boston", "#housing").describe("The input datapoints to the boston housing dataset.")
z = torch.tensor([1,2,3,4,5]).tag("#fun", "#mnist",).describe("The images in the MNIST training dataset.")

In [ ]:
x

In [ ]:
x = x.send(bob)
y = y.send(bob)
z = z.send(bob)

# 下記は完全一致のタグ、もしくは部分一致のdescriptionを検索します。
results = bob.search(["#boston", "#housing"])

In [ ]:
results

In [ ]:
print(results[0].description)

Part 3: バーチャルグリッド

次にグリッドという概念を紹介します。 グリッドは単純にワーカーのグループです。ワーカーのグループを作る事で、グループの持っているデータセットが検索可能になります。


In [ ]:
grid = sy.PrivateGridNetwork(*workers)

In [ ]:
results = grid.search("#boston")

In [ ]:
boston_data = grid.search("#boston","#data")

In [ ]:
boston_target = grid.search("#boston","#target")

In [ ]:


In [ ]: