MENU

AWS re:Invent 2025で見えた「エージェント時代のクラウド基盤」──Amazon S3 VectorsやTrn3 UltraServersの狙い

目次

エージェントを前提に再設計されたAWS

AWS re:Invent 2025は、生成AIの次の一手を「エージェント」を軸に描き直したイベントだった。
SaaSの裏側にあるクラウド基盤は、いまやLLMアプリと自律エージェントのために最適化されつつある。

象徴的なのが、Amazon S3 Vectorsの一般提供、EC2 Trn3 UltraServersの投入、そしてLambda Durable Functionsによる長時間ワークフローの解禁だ。
ストレージ・計算・実行の三層が、連携して「記憶」「推論」「行動」を支える。

本稿では、それぞれの狙いを読み解き、エージェント時代のアーキテクチャを設計視点で整理する。
個別の機能紹介にとどめず、どう組み合わせて現実のプロダクトを強くするかを掘り下げる。

S3を“長期記憶”に変える:Amazon S3 Vectorsの本質

RAGやエージェントに必要なのは、検索を超えた“文脈の持続”だ。
Amazon S3 Vectorsは、最も一般的なオブジェクトストレージを、ネイティブなベクトル保存・クエリに対応させ、アプリの長期記憶として使えるようにした。

AWS公式の発表は、規模とコストでのブレイクスルーを強調している。
以下は日本語の週刊AWSからの引用だ。

Amazon S3 Vectors の一般提供が開始されました。ベクトルデータの保存とクエリをネイティブにサポートする初のクラウドオブジェクトストレージで、専用のベクトルデータベースソリューションと比較して総コストを最大 90% 削減できます。単一のインデックスで最大 20 億のベクトルを保存および検索できるようになり…

出典:週刊AWS – re:Invent 2025 特別号 part 3

About Amazonでも、S3 VectorsをAI検索やレコメンドの基盤として位置づけ、ベクトルをS3に直置きする意味を明確にした。
バケットの“眠っているデータ”を、エージェントのアクティブメモリへと変換する流れだ。

要点

  • 一体化したデータ重心:コンテンツと埋め込みをS3で同居させ、ETLや複製の複雑性を縮減
  • スケールと遅延:ホットなクエリで100ms級、スパースなクエリでもサブセカンドを目指す設計
  • 運用の一貫性:S3のライフサイクル、バージョニング、ACLと親和性が高くデータガバナンスが簡素

RAGだけでなく、エージェントの作業履歴・暫定結論・長期メモリをベクトル化して蓄積する用途が筋が良い。
社内ナレッジのパーソナライズ、顧客ごとの“対話継続性”、チームエージェント間の“共有記憶”などだ。

推論エンジンの刷新:EC2 Trn3 UltraServersの狙い

推論のボトルネックは、精度だけでなくトークン・エコノミクスにある。
EC2 Trn3 UltraServersは、3nm世代のTrainium3を搭載し、性能と電力効率を押し上げた。

Trainium3 is our fastest accelerator, delivering up to 3× faster performance than Trainium2 with over 5× higher output tokens per megawatt… Each Trainium3 chip provides 2.52 PFLOPs of FP8 compute and 144 GB of HBM3e.

出典:AWS What’s New – Amazon EC2 Trn3 UltraServers

エージェントは、計画→ツール実行→振り返りのループを何度も回す。
そのたびにトークン消費が跳ねるため、出力トークン/電力の効率は運用コストに直結する。

運用で効くポイント

  • 小規模から大規模へ:Bedrockの推論とTrn3学習を役割分担し、モデル更新のリードタイムを短縮
  • マルチモーダル/推論強化:MXFP8/MXFP4などのデータ型で、動画・推論・EoT探索のレイテンシを削減
  • Neuron SDK:プロファイルとカーネル最適化で、ピーク性能に近づける運用ループを確立

行動を持続させる実行基盤:Lambda Durable Functions

エージェントは時に長時間の対話と分岐を伴う。
従来の関数はタイムアウトや状態管理の制約が強かったが、Lambda Durable Functionsは長期・再開・再試行を前提に、状態遷移をコードで宣言的に扱える。

これは一見地味だが、Step Functionsのオーケストレーションと併用することで、「グルーコード地獄」を減らす。
エージェントのタスク分解、外部API呼び出し、ユーザー確認待ち、再開の一連を、耐久的に走らせられるからだ。

re:Inventの総括記事でも、エージェント時代の実行パターンを支える要素として位置づけられている。
参考:Frontier agents, Trainium chips, and Amazon Nova(About Amazon)

ストレージの地力強化:巨大オブジェクトとS3エコシステム

AI時代のデータは肥大化する。
S3は最大オブジェクトサイズを50TBへ拡張し、巨大データを分割せずに扱えるようになった。

…保存できるオブジェクトのサイズが5TBから50TBへ拡大する。AI学習データなどのファイル管理を簡素化…

出典:ITmedia テックターゲット

さらに、S3 TablesのレプリケーションやIntelligent-Tiering拡張、Storage Lensの新メトリクスも登場。
ベクトル“以外”のデータ運用も抜かりなく、データ重心の一体化を後押しする。

押さえたい拡張

  • S3 Tablesのリージョン/アカウント間レプリケーション
  • Storage Lensのパフォーマンス可視化でホットスポット特定
  • S3 Batch Operationsの最大10倍高速化でメタデータ一括更新を加速(参考:Qiita速報

Agenticアーキテクチャ設計図:S3 Vectors × Bedrock × Durable

全体像

エージェントの“記憶・推論・行動”を並べると、次のリファレンスに収斂する。

  • 記憶:S3 Vectors(ドキュメント埋め込み、会話メモ、タスク履歴)+ S3原本
  • 推論:Amazon Bedrock(モデル群)+ Trn3学習/微調整ライン
  • 行動:Lambda Durable Functions + Step Functions + EventBridge
  • 統治:IAM境界、CloudTrail/Bedrockログ、GuardDuty拡張検知

データフロー

  • 取り込み:AWS Glue/ETLで原本をS3、同時に埋め込みをS3 Vectorsへ投入
  • クエリ:BedrockエージェントがS3 Vectorsをヒットし、プロンプトに文脈を注入
  • 実行:Durable Functionsが外部APIやDBを呼び、ステップを耐久的に継続
  • 学習ループ:ユーザー評価をS3に蓄積し、Trn3ラインで継続学習/微調整

なお、AWSはMCP(Model Context Protocol)系の整備も加速している。
週刊生成AI with AWSでは、AWS MCP Serverのプレビューが紹介され、IDEやAIエージェントからのマルチステップ操作が滑らかになりつつある。

実装のはじめ方:最小プロトタイプの使い方ガイド

1. データと埋め込みの同居

  • S3バケットを原本用・ベクトル用で分離し、同一アカウント/リージョンで管理
  • 埋め込みはBedrockのテキスト/マルチモーダル系を使い、S3 Vectorsにインデックス作成
  • バージョニングとライフサイクルで、コストと可監査性を両立

2. 検索拡張生成(RAG)の最小ループ

  • ユーザー入力 → S3 Vectorsクエリ → コンテキスト付与 → Bedrock推論
  • 応答と根拠(document_id)をS3へ保存し、次回の会話文脈として利用

3. エージェントの行動計画

  • Durable Functionsで計画→実行→検証→再計画のオーケストレーションをコード化
  • 人の承認が要るタスクはイベントで中断・再開できるように設計
  • 失敗時の補償トランザクション再試行ポリシーを明記

4. 継続学習の芽を埋め込む

  • フィードバックをS3に貯め、定期的にTrn3でミニバッチの再学習/微調整
  • 評価指標(ヘルプ率、タスク完了率、平均ステップ数)をCloudWatchで可視化

ガバナンスとコスト:運用で効かせるチェックリスト

GuardDuty Extended Threat DetectionがEC2/ECSに拡大し、攻撃シーケンスの可視化が進んだ。
Bedrockのエージェント権限は最小化し、ツール実行の境界をIAMで厳格に区切る。

  • データ境界:S3 Vectorsのインデックスを機密度で分割。クロスアカウントは条件付き委任
  • モデル境界:本番系はBedrockマネージド、研究系はTrn3直制御で分離
  • コスト境界:トークン上限、Durableの実行上限、Batch Operationsの実行窓口を定義

About Amazonの総括記事は、S3 VectorsのGAやDurable Functionsを含む広範な更新を俯瞰している。
詳細はこちら

まとめ:クラウドは“エージェントの都市計画”へ

S3 Vectorsが記憶を、Trn3が推論を、Durable Functionsが行動を支える。
三位一体で見ると、各サービスは単なる機能追加ではなく、エージェントを前提にした都市計画になっている。

まずはRAGの最小構成から始め、Durableで行動ループを実装し、トークン経済をTrn3で改善する。
その上で、MCPやガバナンスを重ねて、企業規模でのエージェント運用に備えたい。

2026年は、「データ重心×推論効率×耐久実行」を制したチームが、エージェントの生産性を本番で引き出す年になるだろう。


参考リンク

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

コメント

コメントする

目次