Google、オンプレ環境でも使えるGeminiを正式提供

2025年9月11日

境界の内側で動くAI、ついに解禁

Googleが、企業や行政のデータセンターの内側で動かせる Gemini の提供を正式に始めました。
基盤は Google Distributed Cloud（GDC）。ネット分離のエアギャップ構成にも対応し、厳格なコンプライアンス要件の現場でも本番運用が視野に入ります。

モデルは Gemini 2.5 Flash / Pro を中心に想定。機密データは社外に出さず、生成AIの推論をローカルで完結できます。
「最新AIか、データ保護か」の二者択一は、ここで終わりへ向かいます。

正式提供のポイント総ざらい

GDC上でGeminiが一般提供（GA）。ネット分離（エアギャップ）構成もサポート
Gemini 2.5 Flash / Proの運用を想定。テキスト、画像、音声、動画のマルチモーダルに対応
高セキュリティ組織（公共、金融、医療、製造）でも社内運用が容易に
Vertex AI on GDCにより、エージェントやRAG、評価・監視までローカルで完結
NVIDIA Blackwell世代のインフラにも対応予定で高性能な推論を狙える

アナウンスの経緯は、Google公式や国内メディアの報道でも確認できます。
Google Cloud 公式ブログ／Publickey／CodeZine／ITmedia

「最も高性能なモデルの Gemini が Google Distributed Cloud (GDC) で利用可能になることを発表」

出典：Google Cloud 公式ブログ

GDCのしくみを一気に理解する

Google Distributed Cloudは、Google Cloudの機能をオンプレやエッジに持ち込む分散クラウド基盤です。
専用アプライアンス上でKubernetesベースのスタックを動かし、AI/データ/ネットワーク機能をローカル提供します。

通常はGoogle Cloudと安全に連携しますが、エアギャップ構成では外部ネットワークから完全に切り離した運用が可能。
オフラインでも稼働でき、アップデートは管理プロセスに沿って段階適用します。

この上にVertex AI on GDCが載り、モデル提供、評価、監視、セーフティ、ガバナンスを一体で扱えます。
つまり、クラウド級のAI体験をデータセンターの内側へ持ち込む考え方です。

エアギャップとコネクテッドの二刀流

運用モードは大きく二つ。エアギャップとコネクテッドです。
前者は外部ネットワークからの完全分離。後者はクラウドと制御された接続を保ちます。

エアギャップ：機密度が極めて高い領域向け。更新はオフライン手順で計画的に実施。
長所…データ主権・秘匿性が最大化／留意…アップデート頻度とパッチ運用の設計が肝
コネクテッド：管理性や最新機能を重視。安全な接続でメタ管理を受ける。
長所…最新モデル・運用改善の取り込みが容易／留意…接続要件と監査の設計が必須

要件に応じて領域分割も有効。ミッションクリティカルはエアギャップ、試験や省人化はコネクテッドなど、使い分けが現実的です。
報道では、エアギャップ構成の一般提供が進み、コネクテッドは段階展開の様子がうかがえます（参考：Publickey）。

対応モデルと周辺機能の全体像

現時点の主役はGemini 2.5 Flash / Pro。
高速・低コストのFlashと、汎用性・推論品質に優れたProをワークロードで使い分けます。

マルチモーダル：テキスト／画像／音声／動画を横断
エージェント：ツール呼び出しやワークフロー実行を統合
Vertex AI on GDC：評価、ガードレール、モニタリング、フィードバックループ
Agentspace：社内情報の横断検索・取得を支えるエージェント基盤（報道より）

NVIDIA Blackwell対応のインフラ導入も進む見込みで、最新GPUでの高密度推論が視野に入ります。
公式発表・メディア記事：Google Cloud／日経xTECH

まずは触る：社内での使い方ロードマップ

ステップ1：基盤準備

GDCアプライアンス導入（設置、電源・ネットワーク、ラック計画）
セグメント設計（エアギャップ領域と一般領域の分離、ゼロトラスト原則）
アイデンティティ連携（既存ID基盤や鍵管理との統合）

ステップ2：データとアプリ設計

データ分類と最小持込（PII/機密は原則ローカル、RAGはメタデータ最小化）
ベクトルDB/RAGの配置（クエリはローカル完結）
プロンプト/評価（品質指標、毒性・幻覚検知、ヒューマン評価の仕組み）

ステップ3：本番運用

監査・ログ（操作・推論ログの保全、モデル切替のチェンジ管理）
SLO/可用性（GPU割当、キュー制御、障害時フェイルセーフ）
継続改善（フィードバック収集、データドリフト検知、セーフティ更新）

開発者はVertex AIのAPI/SDKをGDC向けに利用。
既存の社内業務やRPAとつなぎ、問い合わせ、文書要約、対話UIなどから着手するとスムーズです。

どこで効く？ユースケース集

ナレッジRAG：規程・設計書・監査文書を横断し、根拠付き回答を提示
ヘルプデスク/コンタクトセンター：マニュアル生成、要約、後処理自動化
製造・OT/エッジ：現場画像の異常検知＋自然言語レポート、低遅延での整備支援
医療・公共：機微情報を境界内で扱い、症例要約や申請支援の効率化
ソフト開発：要件要約、テスト生成、変更差分のリスク説明

ポイントは「社外に出せないデータでもAI化できる」こと。
従来止まっていた領域に、業務インパクトが生まれます。

セキュリティとガバナンスの設計図

GDCはデータ主権と分離性を第一に設計。
IAM、KMS、監査ログ、ネットワーク分離、機密コンピューティング等の機能で防御を多層化します。

最小権限と境界防御（プロンプト/ツール権限もゼロトラストで）
モデルセーフティ（有害出力抑制、PIIフィルタ、脱漏防止）
評価と監査（ガードレール試験、プロンプト変更の追跡、SBoM/依存の可視化）
DR/BCP（モデル資産・インデックスのバックアップと復旧訓練）

Google Workspace連携のデータ保護姿勢も参考になります。
Geminiアプリの管理（Google管理コンソール）

コストの考え方と見積りの勘所

価格は構成依存です。
ハード（GDCアプライアンス）、GPU/アクセラレータ、モデル推論の利用量、運用・監視の4点が主なドライバ。

需要予測とスロット設計：ピーク同時接続、プロンプト長、マルチモーダル比率
モデル選定：Flash/Proの使い分けでコスト・レイテンシを最適化
キャッシュ/RAG：文書前処理・再利用で推論コストを圧縮
段階展開：PoC→限定部門→全社展開で無駄な過剰投資を抑制

見積りはGoogle/パートナーと共同で詰めるのが近道。
まずはパイロットで単価×需要の実測を取るのが王道です。

エコシステムと比較：どこが違う？

分散クラウドという文脈では、AWS Outposts、Azure Stack HCI/Arc、Oracle Cloud@Customerなどが近い立ち位置です。
今回のポイントはGoogleの最新生成AI（Gemini）を前提に、オンプレ内で完結できること。

一方でGoogleはOracle Cloudと連携し、OCI上でもGeminiを提供する動きを示しています（参考：ITmedia）。
クラウド〜オンプレ〜他クラウドまで、ユースケースに応じた配置の自由度が増したのが実情です。

要件がデータの完全内包と低遅延ならGDC。
マルチクラウド連携や既存ワークロード共存なら、他基盤とのハイブリッドも選択肢です。

導入の失敗を防ぐチェックリスト

評価軸：正確性、根拠提示率、ガバナンス遵守、運用コスト
データ設計：持込データの最小化、メタデータの扱い、マスキング
ワークフロー：人間の最終承認、説明責任、逸脱時の止め方
継続改善：プロンプト版管理、A/Bテスト、利用者フィードバック

技術導入だけでなく、業務設計とガバナンスをワンセットで。
ここがGDC×Geminiの価値を最大化する分岐点です。

参考リンク

まとめ：社内AIの新しい当たり前へ

GDC上でのGemini一般提供により、ネット分離を含む厳格な環境でも生成AIの本番活用が可能になりました。
Gemini 2.5 Flash/Proでスピードと品質を使い分け、データは境界の内側に留めたまま価値化できます。

まずは小さく始め、効果と安全性を測りながら段階展開を。
あなたのデータセンターが、“内製AIの最前線”に変わるタイミングです。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

この記事を書いた人

AI好きなラボの住人