「AIのコントロールを取り戻す」NVIDIAとMCデジタル・リアルティが提供するソリューションとは?
近年、企業のAI活用や導入が進んでいるが、その際に問題となるのがAIの学習コストだ。クラウド上でGPUを使用する場合は従量課金制のプラットフォームが多く、AIの学習量が多ければ多いほどコストが増大する。また、2022年初頭から始まった円安も、AIの学習コスト増加に拍車をかける。クラウドベースのGPUを提供する企業は外資系ベンダーが多く、ユーザーには円安による値上がりの影響が直撃しているのが実態だ。
こうしたAIの学習コストの増加トレンドに一石を投じるのが、エヌビディア合同会社(以下、NVIDIA)のハイスペックGPUサーバーであるDGXシリーズだ。そして、このDGXシリーズの設置に適したデータセンターを提供するのが、三菱商事とDigital Realty Trustが日本に設立したMCデジタル・リアルティ(以下、MCDR)である。
今回は、NVIDIA エンタープライズ事業本部の鈴木元哉氏、MCDR 営業本部の高師克治氏に、同ソリューションについて話を聞いた。
エヌビディア合同会社
エンタープライズ事業本部
シニアマネージャー DGXビジネスデベロップメント
鈴木 元哉 氏
国内某IT企業にて、パソコン、携帯電話、ウェアラブルデバイスなどの製品に向けたソフト開発の中で、足掛け10年に渡る米国駐在経験を持つ。IoT、AIなど顧客現場での様々な課題解決に向けた現場実証・ビジネス開発を国内外で主導。2022年6月 NVIDIA入社。エンタープライズ向けGPUサーバーであるDGXの国内ビジネス開発を担務。
MCデジタル・リアルティ株式会社
営業本部
シニアセールスエンジニア
高師 克治 氏
建築学科を卒業後、ゼネコンで設備電気の施工管理を経験。SIerでDC in DCの計画・構築・運用、データセンターの構築、既存データセンターの更新経験を経て、MCDRのセールスエンジニアとして現在に至る。
ビジネスが大きくなればなるほど、GPUサーバー管理コストは増大
近年、AIの産業活用が進んでいる。NVIDIAの鈴木氏は、AIの現状認識についてこう説明する。
鈴木 元哉氏 エヌビディア合同会社 エンタープライズ事業本部 シニアマネージャー DGXビジネスデベロップメント
── 鈴木氏
「すでにAIは私たちの暮らしに大きく“染み出して”きています。ビジネスにおいてはイネーブラーとして、生活においてはコンシェルジュのような存在になりつつあります。近年ではAI活用で取り扱われるデータは構造化データのみならず、画像、動画、音声などの非構造化データも加わりマルチモーダル化しています。それに伴い、企業が扱うデータの量が大幅に増えているのが現状です」
異常検知や需要予測など、すでに一部の企業では当たり前のようにAIが使われている。近年では画像生成や汎用言語モデルなどの発展も目覚ましい。産業利用のみならず、一般利用の事例も生まれてきた。それに伴い、AI開発を目的としたデータの量は爆発的に増えている。
データが増えれば、当然さまざまなデータを処理するパワーを持ったマシンが必要だ。データ処理量の増大を賄うため、近年ではNVIDIA DGXのような処理能力の高いGPUサーバーを活用する企業は多い。その背景として、鈴木氏が指摘するのが「GPUサーバーの管理コストの増大」だ。
▲NVIDIA社のGPUサーバー「NVIDIA DGX A100」
AI開発にはAIに学習させる大量のデータが必須だが、データの生成・収集に関わるのはAI開発を担当するAI技術部門だけではなく、時には営業、マーケティングや製造現場などの複数部署が関わるケースも出てくる。このようにデータ量のみでなくAI開発に関わる部署・人材が多様化したことも、AI開発のコストが増大する一因だという。
── 鈴木氏
「AIの発展に伴って、AIエンジニアと呼ばれるようなAIモデルの専門家が、GPUサーバーの構築や開発・管理などの本業以外の周辺業務に忙殺されるケースが増えてきました。AIを活用してビジネスを大きくしようとすればするほど、設置環境の整備・運用などの管理業務の負担も増大していきます。GPUサーバーの管理業務にAIエンジニアの貴重な工数を使ってしまうのは非常に憂うべき状況だと感じています。この状況を解消するソリューションの1つがデータセンターを活用したAI設備のアウトソースです」
MCDRは国内で6棟のデータセンターを運用中だ。MCDRのデータセンターは高集積対応が可能であり、AIやHPCといった膨大な計算を実行するサーバーと相性が良い。高師氏はこう語る。
高師 克治氏 MCデジタル・リアルティ株式会社 営業本部 シニアセールスエンジニア
── 高師氏
「例えば先日、自前のエリアでGPUサーバーを設置・運用しているお客様から、増設スペースや電源容量、空調容量の確保ができなくなりデータセンターを利用したいというご相談がありました。本来は他のことに時間を使えていたはずの人材の時間をサーバーの管理業務に費やしてしまうのは大きな損失です。データセンターを利用すれば、サーバー管理業務や物理セキュリティ・防災面の検討に要する時間を節約出来ます」
データセンターを利用することで、AIのコントロールを取り戻す
近年では自前でGPUサーバーを調達する以外にも、クラウドという選択肢がある。しかし、ここにも落とし穴があると鈴木氏は強調する。
── 鈴木氏
「クラウドが普及した背景に、「データの処理をクラウドで行えば安くなる」という企業の根強い感覚がありました。しかし、2022年に進んだ円安の影響で、現在ではクラウドの利用はコスト削減の安定的な手段では無くなりました。それに、為替変動で値段が上がっても性能が上がるわけでもない。企業が自社のGPUサーバー管理に対する“コントロールを失っている”状況なのです」
クラウド上でAIを使う場合、USドルベースでの従量課金制が主流なので円安の影響を強く受ける。つまり、同じ使用量であっても課金額が大幅に増える恐れがあるのだ。
このように、クラウドを利用した場合も為替変動によりコストコントロールが失われてしまっている。そこで、MCDRは手持ちのGPUサーバーをデータセンターに設置することでコントロールを取り戻すソリューションを提唱している。
高師氏は、同社のソリューションの強みをこう話す。
── 高師氏
「データセンターにGPUサーバーを設置する事で、クラウドの従量課金制からの解放が期待出来ます。さらに、MCDRのデータセンターは高集積が特徴で、複数台のGPUサーバーを効率的に設置できます。例えば、MCDRではNVIDIA DGX A100を1ラックに4台集積するソリューションを検討してきました。既にCFD検証まで終了し、サービスメニューに加えています。従来2ラック分必要だったデータセンターの初期投資費用をMCDRなら1ラックに抑えることが可能です」
加えて同社は、同じエリア内に複数棟のデータセンターを構築する「キャンパス型データセンター」を展開する。各々のデータセンターは物理的に接続され、高集積のような縦方向のソリューションだけではなく、横方向への集積性・拡張性も担保されている。
▲KIXキャンパス
── 高師氏
「MCDRを使うメリットは、これからAIの導入を検討される企業のみならず、既にAIを使いこなしていて、さらに拡張したいと考えている企業にも享受いただけます。NVIDIA DGXをご利用されている企業は、後者に当てはまるのではないでしょうか。実際、ある企業から「DGXを2台積みから4台積みに拡張したいが設置場所に困っている」とのご相談があり、MCDRのソリューションを提示しています。GPUサーバーの時代の到来を肌で感じています」
▲NRT10データセンター
NVIDIA鈴木氏も、MCDRのデータセンターソリューションをこう評価する。
── 鈴木氏
「MCDRはNVIDIAのエリートパートナーであり、DGXシリーズを安心してお使いいただけるデータセンター事業者として認定されています。企業のAI活用において、GPUサーバーの管理はプロに任せることで人件費を削減できます。そして、これまでオンプレ設置用の準備やクラウドのコスト変動に振り回されてきたAI処理能力の“コントロールを取り戻す”ことで、さらにAIの活用に資源を集中することができます」
コスト削減にとどまらないAI活用を
DX推進におけるAI活用は、「コスト削減」という文脈で語られるケースも多い。しかし、鈴木氏はこうした現状をこう憂う。
── 鈴木氏
「DXはコスト削減といった文脈ではなく、“ビジネス環境の変化を継続的に捉え自らの変化を起こす手段“として捉えて頂きたい。今後、顧客のニーズもますます多様化するなか、個々のニーズにどう答えていくか。その中でAI活用という選択肢があるという理解です。当社が提供するDGXは強力なGPUサーバーですが、すべての企業が必要とするものではありません。自社で達成したい大きなミッションがあり、その達成にAIも使い加速度的な対応能力を身につけたい。そして業務デマンドに応え続けるには…、このような掘り下げた検討の中でその必要性・価値がご理解頂けるようなイメージでしょうか。とはいえ、まずは試してみなければわからないという方は、当社のNVIDIA LaunchPadというハンズオンでトライができる無料プログラムをご用意しているので、ぜひお試しいただければと思います」
MCDR 高師氏も、企業がAIへの投資をするうえで、少しでも費用を抑える助けがしたいと意気込む。
── 高師氏
「データセンター側としては、AI活用に必要な投資はしていただいた上で、それに付随する設備機器のCAPEXや、電力・メンテナンス・運用人件費などのOPEXを最適化する手助けをしたいと考えています。AI活用を掘り下げたいのに、設置環境の整備や回線の調達などの業務に忙殺されているご担当者の業務を”まるっと”肩代わりします。データセンターを活用することで、GPUサーバー管理のコントロールを取り戻し、本業に注力いただけるサポートをさせていただきます」
NVIDIAは2023年から、現行の「NVIDIA DGX A100」よりも格段に処理性能が上がった「NVIDIA DGX H100」の出荷をスタートする。こうしたGPUサーバーは多様化、かつ大規模にNLPなどを活用する企業にとって魅力的だ。自社課題を特定した後、データセンターを利用するのもよし、NVIDIA H100をさらなるAI活用のために自社導入するのもよし。また、これらをハイブリッドに組み合わせることも可能だ。