交差点に立つ:エージェントとオープントレーニング
今年のre:Inventは、AIの主役がはっきりと「エージェント」と「オープントレーニング」に移った一週間でした。
Amazon Bedrock AgentCoreはポリシー、評価、メモリまで広がり、開発から運用までを一枚でつなぐ基盤へ進化しました。
一方、Novaは新世代へ。Nova 2とNova Forgeが発表され、クラウド上でのオープントレーニングと軽量なカスタマイズが現実的になりました。
インフラ側もTrainium3 UltraServersやAI Factoryで最適化が進み、AIのTCOと実行速度の両立が見えてきました。
電通総研ブログ/iretまとめ/ASO World
まずは俯瞰:主要アップデートの要点
- AgentCoreの強化:Policy(Preview)、Evaluations、Runtime双方向ストリーミング、Observability、Identity、長期メモリ拡張など。参考/詳細
- Nova 2 & Nova Forge:推論・コストのバランス改善、extended thinkingの選択的ON、サーバーレスなモデルカスタマイズ。参考/参考
- オープンウェイト拡充:18のオープンウェイトモデルが追加され、マルチモデル運用が加速。参考まとめ
- AIインフラ:Trainium3 UltraServers、AI Factoryで学習・推論の効率を底上げ。参考/参考
- 周辺アップデート:API GatewayのMCPプロキシ、Strands AgentsのTypeScript対応、レスポンスストリーミングなど。Qiita/AWSブログ
Bedrock AgentCoreの現在地:本番運用のための機能群
Policy in AgentCore:ツール使用をドメインポリシーで制御
エージェントが呼び出すツールや操作を宣言的なポリシーで許可・拒否できる機能が公開(Preview)。
AgentCore Gatewayと統合され、認可・検査を通過した呼び出しのみを実行します。監査可能性とコンプライアンスの担保が一段上がりました。
電通総研/Qiitaまとめ
Evaluations:オンライン×オフライン評価で継続的改善
AgentCore Evaluationsは、オンライン評価でニアリアルタイムに品質を追跡し、オフライン評価でバッチ的に精度を検証。
「正確性」「目的達成率」「ツール選択精度」「有害性」などの指標を組み合わせ、モデル更新やプロンプト改訂の意思決定に反映できます。
詳細解説/iret
Runtime/Observability/Identity:運用レディな土台
Runtimeは双方向ストリーミングに対応し、音声・会話体験の自然さを強化。
Observabilityはメトリクス/ログ/トレースを外部とも連携し、高度なAPMと組み合わせた一次解決率の向上に効きます。
Identityは外部SaaS連携の認証連携・フェデレーションを整備し、エージェントの実行権限を厳密に扱えます。
双方向ストリーミング/観測性×Dynatrace
メモリ拡張:長期・エピソード記憶へ
ユーザー嗜好や履歴を活かす長期メモリやエピソード記憶が話題に。
S3をコスト効率の良い記憶層として活用する設計も示され、RAGとメモリの融合が現実的になりました。
現地レポート
Nova 2とNova Forge:オープントレーニングの実装論
Nova 2は速度・精度・コストのバランスを最適化。Liteでは、推論の思考過程を段階化するextended thinkingを必要時だけONにでき、エージェント的な意思決定にフィットします。
ForgeVision
Nova Forgeは、クラウド上でのオープントレーニングとサーバーレスなモデルカスタマイズを前提にした開発体験を提案。
小さく安全に回し、評価で効果を見極め、段階的に拡張する“ビルダー志向”が実務に馴染みます。
ASO World/電通総研
マルチモデル×オープンウェイト:18モデル追加のインパクト
Bedrock上で18のオープンウェイトモデルが追加され、用途別の最適モデル選択が現実的になりました。
GuardrailsやPolicy、Evaluationsが前提にあることで、オープン/クローズドを横断しつつ一貫した安全性・品質管理が可能になります。
まとめ/AWSブログ
さらに、API GatewayのMCPプロキシ対応で既存REST APIをエージェントから扱いやすくなり、既存資産の接続コストも低下。
Strands AgentsのTypeScript対応も発表され、フロントからバックまで一貫した型安全な実装が取りやすくなりました。
MCPプロキシ/TypeScript対応
インフラの底力:Trainium3 UltraServersとAI Factory
Trainium3 UltraServersは、学習コストとスループットのボトルネックを直撃。
エージェントや細粒度カスタマイズを前提にしたAI Factoryの設計と合わせ、トレーニング→評価→配備→観測のサイクルをクラウド内で閉じられます。
Networld 現地速報/ASO World
結果、SaaSや社内プロダクトにおけるTTV(Time to Value)短縮とTCO最適化が同時に狙えます。
クラウド・ネットワーク・カスタムシリコンまで一気通貫でチューニングできるのは、AWSの強みが最も効く領域です。
実装ガイド:SaaS/自社プロダクトでの活用の道筋
1. 小さく始めるアーキテクチャ
- 用途分解:問い合わせ対応、バックオフィス自動化、ナレッジ検索、開発支援などに分割。
- モデル選定:Nova 2を起点に、ドメインタスクはNova Forgeやオープンウェイトで軽量カスタマイズ。
- 接続戦略:既存RESTはAPI Gateway MCPプロキシでエージェント対応に。参考
2. 本番運用の品質と安全性
- Evaluationsでオンライン・オフラインの二段評価を確立。
- PolicyとGuardrailsでツール実行と出力をガバナンス。
- ObservabilityでCloudWatch GenAI+外部APM(例:Dynatrace)を併用。参考
3. メモリとデータ設計
- 長期/エピソード記憶を導入し、個人化と連続性を担保。コスト重視ならS3+ベクトルインデックスの構成を検討。参考
- ナレッジはKnowledge Basesで管理し、再学習なしで更新反映。
4. 継続改善のループ
- 評価結果をNova Forgeの微調整やプロンプト改訂に反映。
- 新しいオープンウェイトが増えたらABテストで置換可能性を検証。
観測とガバナンス:OSとしてのエージェント
エージェントは多段の判断・行動を行うため、ステップ単位の可視化とツール権限制御が生命線です。
CloudWatch GenAI Observabilityの可視化と、外部APMの相関で障害の因果を絞り込みやすくなりました。
Dynatrace連携
AI エージェントは、生成 AI モデルの OS 的な存在といえます。
この視点に立てば、ポリシー=権限管理、評価=品質保証、観測=運用監査として、クラウド全体のSREプラクティスに気持ちよく接続できます。
組織は「モデル開発チーム」「プロダクトチーム」「SRE/セキュリティ」が同じ指標で会話できるようになります。
まとめ:クラウドで完結するエージェント時代へ
AgentCoreのポリシー・評価・メモリ、Nova Forgeのオープントレーニング、そしてTrainium3 UltraServers/AI Factory。
AWSはエージェント型AIとマルチモデル運用をクラウド内で完結させる道筋を鮮明にしました。
SaaSも社内プロダクトも、小さく作って評価し続ける姿勢が最短距離です。
2026年に向けては、長期メモリ活用とツール権限設計の“作法”が差になるはず。今から評価と観測の土台を整え、継続改善のループを回していきましょう。

コメント