Amazon FSx for Lustre

# Amazon FSx for Lustre(ラスター)

https://d1.awsstatic.com/webinars/jp/pdf/services/20190319_AWS-Blackbelt-Amazon_FSx_Lustre.pdf

## 主目的

コンピュートインテンシブワークロード

 

## 活用方法・事例

  • オンプレミスからFSx に接続してデータコピーすることで高速化を実現
  • AWS ParallelCluster との連携
    • AWS 上に簡単にオートスケールするHPCクラスタを構築できるツール
  • Fix for Lustre による真相学習の高速化
    • EC2(GPU) を並列に動かすとストレージで律速になってしまうが、FSx for Lustre だとスケールできる

 

## パフォーマンスTips

  • 容量1TB ごとに200MB/s スループット
  • EBS最適化オプションの影響を受けないので、インスタンスタイプのネットワーク帯域に比例する
  • 高いパフォーマンスを得るために多数のインスタンスからの接続が必要
  • ファイルごとにOSTに格納されるのでそれぞれのOSTで使用率に差がないかチェック
  • データはレプリケーションされないので長期保存に適していなく、データ処理用の一時領域として利用するのが吉
  • 自動アップデートなどでストレージが一時的に利用不可能になることがある
  • 容量の変更はできない
  • S3からexport した場合、ファイル所有者やパーミッションなどの情報は保存されない

 

## コスト

東京だとスクラッチ 0.164USD * 3600GB(最低) = 590USD なので 7万円くらい。それと連携しているS3料金。実際は3.6TB なんて少量のデータは使わないので。。。

 

## まとめ

  • Lustre のマネージドサービス
  • 長期保存データはS3に保存し、計算用の一時領域としてFSx for Lustreを利用する
  • ワークロードに適したパフォーマンスタイプ・ファイルストレージ(EFS, FSx for Lustre, FSx for Windows)を選択

 

## 雑感

Lustre 自体を知らなかったのでへぇってなった。大規模な計算を行う場合にファイルシステムボトルネックになった時に選択肢として出てきそう。

それ以上にデータを処理して価値に変える方に価値があるワークロードで使えるサービス。

面白いが、自分が使う機会は、、、あるのだろうか。。。