AIの性能を観測・改善する

Fixstars AIBooster

GPUサーバーにインストールするだけで、実行中のAI処理を分析し、ボトルネックを可視化。自動でパフォーマンスを改善します。

Fixstars AIBoosterとは

GPUサーバーにインストールすることで、実行中のAI処理のパフォーマンスデータを収集し、処理のボトルネックを可視化。取得したデータを活用して、パフォーマンスを改善します。

Performance Observability
パフォーマンス観測機能
  • AI学習や推論などのパフォーマンス情報を常に監視・保存
  • 性能の劣化や処理のボトルネックなどを可視化
Performance Intelligence
パフォーマンス改善機能
  • パフォーマンス観測で収集されたデータをもとに、自動で高速化するためのツール群を提供
  • Performance Observabilityが提供するデータをもとに、ユーザーが手動で高速化することで、更なるパフォーマンス改善が可能

処理速度 最大
x5.0
アップ(当社実績)
GPU利用コスト 最大
80%
削減(当社実績)
Performance Observability

パフォーマンス観測機能

Performance Intelligence

パフォーマンス改善機能

ワークフロー
1

分析

POビューワーを確認し、CPU/GPU 利用率・I/O 帯域・メモリ消費・フレームグラフなどからパフォーマンスの課題を特定。

2

高速化

  • 分析結果をもとに、自動で高速化するためのツール群を提供
  • 高速化に必要なドキュメントを提供。これを利用して、ユーザーが手動で高速化を実現可能

パフォーマンスエンジニアリングサービス(要問い合わせ)

さらなる高速化が必要な場合、AIBoosterの分析データを元に、Fixstarsの高速化エキスパートがお客様の開発環境やご要望に応じたパフォーマンス改善を行います。

学習高速化の例
  • ハイパーパラメータチューン(詳しく見る
  • モデル軽量化
  • AIモデルの適切な並列化手法の適用
  • 通信ライブラリのパラメータ最適化
  • 再計算によるメモリバンドの効率改善
推論高速化の例
  • 全自動推論高速化(詳しく見る
  • 自動混合精度量子化
ハイパーパラメータチューニングツール(ZenithTune)

アプリケーションの潜在能力を最大限に引き出し、ユーザーのコーディングを最小限に抑えながら最高の性能を実現するライブラリ「ZenithTune」を提供しています。

ZenithTuneについて詳しく見る
最適化履歴プロット
全自動推論高速化ツール(AcuiRT)

深層学習モデルの推論をNVIDIA GPU向けに高速化する際の課題

  • 複雑なモデル構造:最新AIモデルは巨大で複雑な構造
  • 手動最適化の限界:全パターンの手動変換は工数が膨大で現実的でない
  • 専門知識の必要性:GPUやTensorRTの深い技術知識と経験が必要

PyTorchで構築されたAIモデルを完全自動でTensorRT化。専門知識不要で、開発工数を劇的に短縮しながら推論速度を向上します。

AcuiRTについて詳しく見る
自動最適化プロセス
PyTorchモデル
複雑なマルチモジュール構造
自動構造解析
モジュール構造を自動把握
段階的最適化
完全自動で最適化を実行
最適化済みモデル
すぐに利用可能

Fixstars AIBoosterによる高速化実績

  • 放送会社様・LLM70Bモデル継続事前学習
  • 通信会社様・LLM70Bモデル継続事前学習
  • LLM7Bモデル学習
  • LLMシングルバッチ推論
  • LLMマルチバッチ推論

※Fixstars AIBoosterの自動高速化と、取得したパフォーマンスデータを元にした手動高速化の両方の結果を含む

ホワイトペーパー

自動運転AI開発環境におけるGPU利用効率の可視化と改善

ソニー・ホンダモビリティの自動運転AI開発環境において、AIBoosterを活用しGPU利用効率の可視化と改善に取り組んだ技術協業の記録です

Fixstars AIBoosterを用いたGPU最適化によるAI開発効率の革新的向上

多くの企業が見過ごしているGPU活用の課題にフォーカスした実践的なホワイトペーパーです。

NVIDIA H200によるAI高速化とパフォーマンスエンジニアリングの実践

最新GPUの真の実力を引き出すための実践的なホワイトペーパーです。

Fixstars AIBoosterで
パフォーマンスエンジニアリング

見えないボトルネックを発見し自動で高速化
取得したパフォーマンスデータを活用して、手動で更なる高速化を実現