トレンドは生成AIからAIエージェントへ
- なかむら
- 9月5日
- 読了時間: 3分
こんにちは「なかむら」です。
生成AIが世の中に浸透し始めていると感じています。キャズム理論で言ったらキャズムを超えてアーリーマジョリティに差し掛かっていると言われています。
そうこうしている間に、流行の波として次はAIエージェントがアーリーアダプタに差し掛かっているということで、どういったものか簡単に紹介して、いこうかなと思います。
本記事の想定読者
AIについて早期に情報をキャッチアップしていきたい方
AIエージェントとは、というところから知りたい方
生成AIとAIエージェントの明確な違い
生成AIとAIエージェントの最も重要な違いは、その目的と行動にあります。
生成AI:人間のプロンプト(指示)に基づいて、テキスト、画像、音声、コードなどの新しいコンテンツを生成することに特化。その役割は、基本的にユーザーからの指示を待つ「受動的」なもの。
AIエージェント:自律的に目標を設定し、複数のツールやシステムを連携させ、タスクを実行することに特化。その役割は、目標達成に向けて積極的に行動する「能動的」なもの。
Googleが定義するAIエージェントの概念図

上記図では、人による指示(目標)に対し、AIエージェントが様々なツールを駆使し、作業を確認しながら実行していくイメージとなっています。
といっても、今時点この説明だけではわかりづらいかなと思います。
AIエージェントの特性と役割
改めて説明しますと、AIエージェントは、特定のゴールを達成するために、複数のステップを自律的に計画し、実行します。人間の介入なしに、外部ツール(検索エンジン、API、ソフトウェアなど)と連携してタスクを完遂します。
主な機能::目標達成のための自律的なタスク実行。
得意なこと:
タスクの自動化: 「週末の旅行プランを立てて」という指示に対し、フライトやホテルの検索、予約、現地の観光情報収集などを一貫して行う。
複雑な問題解決: 複数の情報源からデータを収集・分析し、解決策を導き出す。
システム連携: ソフトウェア間のデータ移行や、複数のサービスを跨いだワークフローの実行。
つまりAIエージェントは様々な情報の連携と自律的動作を特性としています。だからといって生成AIの上位互換というわけではなく、画像/動画を作る、文章を書くといった部分では生成AIのほうが優れています。なので、そもそも活躍の場が違うのです。
AIエージェント実践
ここでは、ChatGPTのエージェントモードを使って、実際にAIエージェントの動きを見てもらおうと思います。
ChatGPTの有料プランで、以下のようにエージェントモードが選択できます。ここでは、新幹線の予約をしたい、ということで日時と駅を指定しています。

ここからは動画です。実際にAIエージェントが仮想のPCデスクトップのような画面を立ち上げ、予約サイトにアクセスしていく様子が見られます。※長いので途中で動画は切っています
ユーザーIDやパスワードなどセンシティブな情報の入力だったり、サイト側がロボットを拒否したりしているなどもありますので、その場合はこちら側でその部分だけ手入力といったこともできます。
以下のように一通り進めたら、こちらに入力情報を入れるように指示がきました。

ということで、自律的に動いているイメージがだいぶ湧いてきたのではないでしょうか。
もう一つやってみましょう。私がかねてから気にしているAIでパワポを作る作業もやってみてもらいましょう。



さて・・・結果は・・・・



残念です!まだまだスライド作成はイマイチでしたね。
最後に
AIエージェント、なんとなくAIで便利になる未来に少し近づいているような気がしませんか?これからも能動的に動くAIが多く出てくると予想されます。人間も負けないようにしていかなければ、ですね。
【今日の格言】
「想像できることは、実現できる。」
ウォルト・ディズニー


コメント