これは、このセクションの複数ページの印刷可能なビューです。印刷するには、ここをクリックしてください.

fastai

1: fastai v1

もしあなたが fastai を使ってモデルを訓練しているなら、W&B には WandbCallback を使用した簡単なインテグレーションがあります。インタラクティブなドキュメントと例についてはこちらをご覧ください →

登録と APIキーの作成

APIキーは、あなたのマシンを W&B に認証します。APIキーは、ユーザープロフィールから生成できます。

よりスムーズな方法として、直接 https://wandb.ai/authorize にアクセスして APIキーを生成することができます。表示された APIキーをコピーし、パスワードマネージャーなどの安全な場所に保存してください。

右上のユーザープロフィールアイコンをクリックします。
User Settings を選択し、API Keys セクションまでスクロールします。
Reveal をクリックします。表示された APIキーをコピーします。APIキーを非表示にするには、ページを再読み込みしてください。

`wandb` ライブラリのインストールとログイン

wandb ライブラリをローカルにインストールしログインするには:

WANDB_API_KEY 環境変数をあなたの APIキーに設定します。
```
export WANDB_API_KEY=<your_api_key>
```
wandb ライブラリをインストールしログインします。
```
pip install wandb

wandb login
```

pip install wandb

import wandb
wandb.login()

!pip install wandb

import wandb
wandb.login()

`learner` または `fit` メソッドに `WandbCallback` を追加する

import wandb
from fastai.callback.wandb import *

# wandb run を開始してログをとる
wandb.init(project="my_project")

# トレーニングフェーズの一部のみログする場合
learn.fit(..., cbs=WandbCallback())

# すべてのトレーニングフェーズで継続的にログをとる場合
learn = learner(..., cbs=WandbCallback())

Fastai のバージョン1を使用している場合は、Fastai v1 ドキュメントを参照してください。

WandbCallback 引数

WandbCallback は以下の引数を受け入れます:

Args	説明
log	モデルをログするかどうか: `gradients` 、`parameters`, `all` 、または `None` (デフォルト)。損失とメトリクスは常にログされます。
log_preds	予測サンプルをログしたいかどうか (デフォルトは `True`)。
log_preds_every_epoch	予測をエポックごとにログするか、最後にログするか (デフォルトは `False`)
log_model	モデルをログしたいかどうか (デフォルトは False)。これには `SaveModelCallback` も必要です。
model_name	保存する `file` の名前、`SaveModelCallback` をオーバーライドします。
log_dataset	`False` (デフォルト) `True` は learn.dls.path が参照するフォルダをログします。ログするフォルダを参照するパスを明示的に定義できます。注: サブフォルダ “models” は常に無視されます。
dataset_name	ログされたデータセットの名前 (デフォルトは `フォルダ名`)。
valid_dl	予測サンプルに使用する `DataLoaders` (デフォルトは `learn.dls.valid` からランダムなアイテム)
n_preds	ログする予測の数 (デフォルトは 36)。
seed	ランダムサンプルを定義するために使用します。

カスタムワークフローのために、データセットとモデルを手動でログすることができます:

log_dataset(path, name=None, metadata={})
log_model(path, name=None, metadata={})

注: サブフォルダ “models” は無視されます。

分散トレーニング

fastai はコンテキストマネージャー distrib_ctx を使用して分散トレーニングをサポートしています。W&B はこれを自動的にサポートし、マルチGPU実験をすぐにトラッキングできるようにします。

この簡単な例を確認してください:

import wandb
from fastai.vision.all import *
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = rank0_first(lambda: untar_data(URLs.PETS) / "images")

def train():
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    wandb.init("fastai_ddp", entity="capecape")
    cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(sync_bn=False):
        learn.fit(1)

if __name__ == "__main__":
    train()

そして、ターミナルで以下を実行します:

$ torchrun --nproc_per_node 2 train.py

この場合、マシンには 2 つの GPU があります。

ノートブック内で直接分散トレーニングを実行することができます。

import wandb
from fastai.vision.all import *

from accelerate import notebook_launcher
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = untar_data(URLs.PETS) / "images"

def train():
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    wandb.init("fastai_ddp", entity="capecape")
    cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(in_notebook=True, sync_bn=False):
        learn.fit(1)

notebook_launcher(train, num_processes=2)

メインプロセスのみでログを取る

上記の例では、wandb はプロセスごとに1 つの run を起動します。トレーニングの終了時には、2 つの run ができます。これが混乱を招くこともあり、メインプロセスだけでログを取りたい場合があります。そのためには、手動でどのプロセスにいるかを検出し、他のプロセスでは run (すなわち wandb.init の呼び出し) を作成しないようにする必要があります。

import wandb
from fastai.vision.all import *
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = rank0_first(lambda: untar_data(URLs.PETS) / "images")

def train():
    cb = []
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    if rank_distrib() == 0:
        run = wandb.init("fastai_ddp", entity="capecape")
        cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(sync_bn=False):
        learn.fit(1)

if __name__ == "__main__":
    train()

ターミナルで以下を実行します:

$ torchrun --nproc_per_node 2 train.py

import wandb
from fastai.vision.all import *

from accelerate import notebook_launcher
from fastai.distributed import *
from fastai.callback.wandb import WandbCallback

wandb.require(experiment="service")
path = untar_data(URLs.PETS) / "images"

def train():
    cb = []
    dls = ImageDataLoaders.from_name_func(
        path,
        get_image_files(path),
        valid_pct=0.2,
        label_func=lambda x: x[0].isupper(),
        item_tfms=Resize(224),
    )
    if rank_distrib() == 0:
        run = wandb.init("fastai_ddp", entity="capecape")
        cb = WandbCallback()
    learn = vision_learner(dls, resnet34, metrics=error_rate, cbs=cb).to_fp16()
    with learn.distrib_ctx(in_notebook=True, sync_bn=False):
        learn.fit(1)

notebook_launcher(train, num_processes=2)

例

Visualize, track, and compare Fastai models: 十分に文書化された手順
Image Segmentation on CamVid: インテグレーションのサンプルユースケース

1 - fastai v1

このドキュメントは fastai v1 向けです。現在のバージョンの fastai を使用している場合は、fastai ページを参照してください。

fastai v1 を使用するスクリプトの場合、モデルのトポロジー、損失、メトリクス、重み、勾配、サンプル予測、および最適な訓練モデルを自動的にログすることができるコールバックがあります。

import wandb
from wandb.fastai import WandbCallback

wandb.init()

learn = cnn_learner(data, model, callback_fns=WandbCallback)
learn.fit(epochs)

ログされるデータは、コールバックのコンストラクタを介して設定可能です。

from functools import partial

learn = cnn_learner(
    data, model, callback_fns=partial(WandbCallback, input_type="images")
)

また、トレーニングを開始するときにのみ WandbCallback を使用することも可能です。この場合、それをインスタンス化する必要があります。

learn.fit(epochs, callbacks=WandbCallback(learn))

その段階でカスタムパラメータを与えることもできます。

learn.fit(epochs, callbacks=WandbCallback(learn, input_type="images"))

コード例

インテグレーションがどのように機能するかを見るために、いくつかの例を作成しました：

Fastai v1

シンプソンキャラクターの分類: Fastai モデルを追跡し比較するためのシンプルなデモ
Fastai を用いたセマンティックセグメンテーション: 自動運転車のニューラルネットワークを最適化する

オプション

WandbCallback() クラスは多くのオプションをサポートしています：

キーワード引数	デフォルト	説明
learn	N/A	フックする fast.ai learner。
save_model	True	モデルが各ステップで改善されれば保存します。また、トレーニング終了時に最適なモデルをロードします。
mode	auto	`min`、`max`、または `auto`: ステップ間で指定されたトレーニングメトリクスをどのように比較するか。
monitor	None	最適なモデルを保存するために使用されるトレーニングメトリクス。None はデフォルトで検証損失になります。
log	gradients	`gradients`、`parameters`、`all`、または None。損失とメトリクスは常にログされます。
input_type	None	`images` または `None`。サンプル予測を表示するために使用されます。
validation_data	None	`input_type` が設定されている場合にサンプル予測に使用されるデータ。
predictions	36	`input_type` が設定され、`validation_data` が `None` の場合に行う予測の数。
seed	12345	`input_type` が設定され、`validation_data` が `None` の場合にサンプル予測のためのランダムジェネレータを初期化します。