モデル
まずこれだけ
AIのモデルは、AIの能力や得意分野を決める中核部分です。利用者から見ると「AIの頭脳の種類」に近いものです。ChatGPT(チャットジーピーティー)、Gemini(ジェミニ)、Claude(クロード) のようなサービスは、画面やアプリの名前です。その中で動き、文章を読んだり、画像を見たり、音声を扱ったりする仕組みがモデルです。LLM(エルエルエム) は、言葉を扱うモデルの代表的な種類です。家電にたとえると、サービスは使う製品、モデルはその製品の中で動くエンジンや処理方式のようなものです。
どこで見かけるか
モデルという言葉は、AIサービスのモデル選択画面、API(エーピーアイ)ドキュメント、料金表、ニュース、比較記事などで見かけます。GPT(ジーピーティー)、Gemini(ジェミニ)、Claude(クロード)、画像生成モデル、音声モデル、動画モデルなど、さまざまな名前で出てきます。モデル名には数字、Pro(プロ)、Flash(フラッシュ)、mini(ミニ)のような言葉が付くことがあり、速さ、費用、精度、得意分野が違うことを表す場合があります。
具体例
文章の相談に向いたモデル、長い資料を読むモデル、画像を作るモデル、音声を文字にするモデル、動画を作るモデルなどがあります。生成AI(エーアイ) のサービスでは、利用者が意識しなくてもモデルが選ばれていることがあります。一方、開発者向け画面では、目的に合わせてモデルを選ぶことがあります。たとえば速さを優先するのか、難しい推論を優先するのかで選び方が変わります。
つまずきやすいところ
サービス名とモデル名は混ざりやすいです。ChatGPT(チャットジーピーティー)、Gemini、Claudeは利用者が使う入口として出てくることが多く、GPT(ジーピーティー)や各サービス内のモデル名は中で動く頭脳として出てきます。また、新しいモデルが常に優れているとは限りません。費用、速さ、入力できる形式、使える機能、利用規約が違うことがあります。モデルの答えも間違えるため、重要な内容は確認します。
研究会では
研究会では、細かいモデル名を暗記するより、「サービスの中にモデルがある」という関係を重視します。Sora(ソラ) や Suno(スーノ) のような動画・音楽系AIでも、中では目的に合ったモデルが動いていると考えると全体像が見えます。
