AIモデルの比較記事を読んでいると、「70B」「175B」といった数字がよく出てきます。大きいほど賢いのかなと思いつつ、実際に使う場面では「返答が遅い」「思ったほど日本語が自然ではない」と感じることもあります。
LLMのパラメータとは、AIが学習の中で調整した内部の数値です。学習データそのものではなく、言葉のつながりや文脈の傾向を扱うためのクセのようなものです。
この記事では、パラメータ数の意味を、モデル選びで迷いやすい場面に沿って整理します。数字の大きさだけで判断せず、自分の用途に合うAIを見分けるための手がかりにしてください。
【1】LLMのパラメータとは何か
LLMのパラメータとは、AIが学習の中で調整した、モデル内部の数値です。ざっくり言えば、AIが文章を作るときに使う「判断のクセ」のようなものです。
AIは大量の文章を学びながら、「この言葉の次にはどんな言葉が来やすいか」「この文脈では何を重く見るべきか」といった傾向を数値として身につけていきます。ニュースや比較記事で見かける「70B」という数字は、この調整値がモデルの中に約700億個あることを表しています。
ただし、パラメータ数は人間の脳の大きさそのものではありません。AIの中に、計算のための細かな数値がどれだけ用意されているかを示す数字です。まずはこのくらいの理解で十分です。
【関連記事|A02】LLMとは?GPTの仕組み・学習データ・使い方までを一気に理解する
パラメータはAI内部の調整値
パラメータは、AI内部にある大量の調整つまみのようなものです。学習前のAIは、そのつまみをどこに合わせれば自然な文章になるのか、まだわかっていません。
大量の文章を読み込み、出力を何度も調整する中で、モデルは少しずつ「この文脈ではこの言葉が自然だ」と判断しやすい状態になります。その過程で決まった数値が、パラメータです。
私たちがプロンプトを入力すると、AIはこの無数の数値を使って計算し、次に出す言葉を選んでいきます。AIがその場で考えているように見えるのは、学習で得た数値をもとに、もっとも自然そうな組み合わせを出しているからです。
重みとバイアスが判断を支える
パラメータの中身は、「重み(Weight)」と「バイアス(Bias)」という数値で成り立っています。
重みは、ある情報をどれくらい強く見るかを決める数値です。たとえば「空が」という言葉が出たときに、「青い」「暗い」「広い」など、後に続きやすい言葉の関係を計算に反映します。もちろん、単語の対応表をそのまま保存しているわけではありません。あくまで、言葉と言葉の関係を数値として扱っているイメージです。
バイアスは、判断に少し傾きをつけるための数値です。重みとバイアスが複雑に組み合わさることで、AIは単なる単語の並べ替えではなく、文脈に合わせた回答を作れるようになります。
Transformerの中で数値が働く
LLMでは、「Transformer(トランスフォーマー)」という仕組みの中でパラメータが使われます。Transformerは、入力された文章の中で「どの言葉とどの言葉を強く見るか」を計算する仕組みです。
文章はまず、「トークン」と呼ばれる小さな単位に分けられます。そのうえで、各トークン同士の関係を計算しながら、どの情報を重視するかを決めていきます。この計算の中で、学習済みのパラメータが働きます。
ここでは、パラメータが単独で答えを出しているわけではなく、Transformerという構造の中で使われる数値だと押さえておけば十分です。
【深掘り記事|A02-03】LLMの仕組みを図解で理解する|言語モデルが文章を生成する流れ
学習値と設定値は別のもの
AIに関わる数値には、学習で決まるものと、人間が後から設定するものがあります。ここは混同しやすいところです。
パラメータは、AIが学習する中で自動的に調整された数値です。ユーザーがChatGPTなどを使うときに、直接書き換えるものではありません。
一方で、AIの学習方法やモデルの構造を決めるために、人間があらかじめ設定する数値もあります。これを「ハイパーパラメータ」と呼びます。たとえば、学習率や層の数などがこれにあたります。
名前は似ていますが、役割は違います。パラメータは学習の結果として残る数値。ハイパーパラメータは、学習の進め方を決めるための設計上の数値です。
TemperatureやTop-pは推論設定
ChatGPTなどのツールでは、「Temperature」や「Top-p」といった設定項目を見かけることがあります。これらは、AIの回答の揺れ方を調整するための「推論設定」です。
パラメータが「学習で決まった内部の数値」だとすると、TemperatureやTop-pは「その数値を使って、どの候補を選びやすくするか」を調整するものです。
Temperatureを上げると、少し意外な表現が出やすくなることがあります。逆に低くすると、無難でありきたりな回答になりやすくなります。ただし、TemperatureやTop-pを変えても、モデル内部のパラメータそのものが書き換わるわけではありません。変わるのは、出力の選び方です。
| 分類 | 役割 | 設定のタイミング | 具体例 |
|---|---|---|---|
| 学習パラメータ | AIの判断の土台になる数値 | 学習中 | 重み、バイアス |
| 推論設定値 | 回答の揺れ方を調整する数値 | 使うとき | Temperature、Top-p |
| ハイパーパラメータ | 学習方法や構造を決める数値 | 学習前 | 層の数、学習率 |
パラメータは知識そのものではない
最後に押さえておきたいのは、パラメータは百科事典のような知識の倉庫ではない、という点です。
AIは、学習した文章をそのまま丸ごと保存しているわけではありません。パラメータに反映されているのは、言葉の並び方や概念同士の関係、文脈の傾向です。
そのため、学習後に起きた新しい出来事は、モデル内部のパラメータには基本的に入っていません。昨日のニュースや最新の社内規定について答えさせたい場合は、外部の情報を参照させる仕組みが必要になります。
パラメータは、AIが言葉を扱うための基礎です。ただし、それだけで最新情報まで何でも知っているわけではありません。
【2】学習データとパラメータの違い
学習データとパラメータは、どちらもAIの賢さに関わります。ただ、同じものではありません。
学習データは、AIが学ぶために読み込む文章やコードなどの情報です。一方でパラメータは、その学習を通じてAIの内部に残る数値です。人間の勉強にたとえるなら、参考書そのものが学習データで、問題を解く中で身についた考え方や判断パターンがパラメータに近いです。
ここを分けて見ると、「AIはネット上の情報を全部覚えているのか」「なぜ間違ったことを言うのか」といった疑問も理解しやすくなります。
学習データはAIが学ぶ材料
学習データとは、LLMが開発段階で読み込む大量の情報です。Webサイト、書籍、論文、プログラミングコードなど、さまざまな文章が含まれます。
ただし、AIはそれらをそのままファイルのように保存しているわけではありません。大量の文章から、「どんな文脈で、どんな言葉が使われやすいか」「どの情報同士が関係しやすいか」といった傾向を学びます。
学習データは、あくまでAIが学ぶための材料です。学習が終わったあとにモデルの中へ残るのは、元の文章そのものではなく、その結果として調整されたパラメータです。
パラメータは学習後に残る値
パラメータは、学習データを読み込んだ結果として、AIの内部に残る数値の集まりです。
たとえば、たくさんの文章を読んだあとに、「この質問にはこういう流れで答えると自然だ」「この言葉はこの文脈で使われやすい」といった傾向が、数値として反映されます。AIはその数値を使って、次に出す言葉を選んでいきます。
ただ、元の文章を保存していないといっても消えて何も残っていない、というわけでもありません。学習データの中に何度も出てくる表現や、強く反映された情報は、出力に近い形で現れることがあります。文章を丸ごと持っているというより、数値の中に形を変えて残っている、と見ると近いです。
LLMは文章を丸暗記しない
「AIはインターネット上の情報を全部記憶している」と思われることがあります。けれど、LLMは文章を画像やPDFのように、そのまま保存しているわけではありません。
AIが持っているのは、言葉と言葉の関係や、文脈の中での出やすさを反映した数値です。そのため、学習データに含まれていない文章でも新しく作れます。一方で、学習したはずの事実をあいまいに答えてしまうこともあります。
ここが、AIを使うときに少しややこしいところです。AIは「知っているように話す」ことができますが、必ずしも正確な資料をその場で見て答えているとは限りません。
検索やRAGは外部情報を使う
最近のAIは、最新ニュースや社内文書について答えられることがあります。ただし、それはモデル内部のパラメータに最新情報が入っているからとは限りません。
そこで使われるのが、RAG(検索拡張生成)という仕組みです。RAGでは、AIが回答を作る直前に、外部のデータベースや文書を参照します。モデル本体の知識だけで答えるのではなく、必要な資料を横に置いて答えているようなイメージです。
パラメータは、AIがもともと持っている判断の土台です。RAGは、その場で参照する外部資料です。この2つを分けて考えると、「モデルを大きくすれば何でも最新情報に強くなる」というわけではないとわかるかと思います。
違いがわかると誤解が減る
パラメータ数が多いからといって、学習データがすべて詰め込まれているわけではありません。パラメータは情報の保存箱ではなく、学習を通じて調整された数値です。
この違いがわかると、AIの得意不得意も少し見えやすくなります。文章の流れを作ることや、よくある知識をもとに説明することは得意でも、最新情報や細かな事実確認は外部資料がないと不安定になることがあります。
学習データは、AIが何を学んだか。パラメータは、その結果として内部に残った数値。まずはそう思っておくだけで十分です。
【深掘り記事|A02-01】LLMの学習データとは?モデルが世界を理解する方法
【3】70Bや175Bは何を表すのか
AIモデルの名前を見ていると、「8B」「70B」「175B」のような表記が出てきます。はじめて見ると、何かの型番のようにも見えますが、これはモデルが持っているパラメータ数を表す数字です。
たとえば70Bなら、約700億個のパラメータを持つモデルという意味です。数字が大きいほど、AIの内部にある調整値の数が多くなります。
ただし、この数字だけで「賢い」「使いやすい」まで決まるわけではありません。まずは、モデルの規模を見るための目安としておくとよいでしょう。
パラメータ数は調整値の個数
パラメータ数とは、AIの内部にある「重み」や「バイアス」などの調整値が、全部でいくつあるかを示す数字です。
たとえば「Llama 3-8B」のような名前なら、約80億個の調整値を持つモデルという意味になります。70Bなら約700億個です。
パラメータ数が多いほど、より多くの言葉の関係や文脈のパターンを扱える余地が広がります。そのため、一般的には大きなモデルほど、複雑な質問や長めの説明、細かなニュアンスを含む文章を扱いやすくなります。
ただ、ここで言えるのは「扱える余地がある」というところまでです。実際の出力の良さは、学習データや調整のされ方にも左右されます。
70BのBは10億単位を表す
モデル名に出てくる「B」は、英語の「Billion」の頭文字です。Billionは10億を意味します。
7Bなら約70億。
70Bなら約700億。
175Bなら約1,750億です。
かつて大きな話題になったGPT-3は、175Bのモデルとして知られています。そのため、175Bという数字は「かなり大きなモデル」の例としてよく使われます。
一方で最近は、8Bや13Bのような比較的小さなモデルもよく使われています。小さいから使えない、というわけではありません。目的がはっきりしている専用LLMであれば、軽いモデルの方が速くて扱いやすい場面もあります。
モデルサイズを見る目安になる
パラメータ数は、そのモデルをどこで動かせるかを考えるときにも関係します。
たとえば、自分のパソコンでローカルLLMを動かしたい場合、8B程度なら環境によっては試せることがあります。けれど70B級になると、必要なメモリやGPUの負荷が一気に大きくなります。
APIで使うだけなら、裏側の計算環境を自分で用意する必要はありません。その場合、パラメータ数は直接の負担として見えにくくなります。ただ、自分のPCで動かすとなると、この数字はかなり現実的な問題になります。
「このモデルは手元の環境で動くのか」「クラウドで使う前提なのか」を見るとき、パラメータ数はひとつの判断材料になります。
数が大きいほどメモリも必要
AIを動かすとき、モデルのパラメータはコンピュータのメモリに読み込まれます。パラメータ数が増えるほど、必要なメモリも大きくなります。
標準的な精度で動かす場合、1つのパラメータをおおむね2バイトで扱います。そのため、1B、つまり10億パラメータあたり約2GBがひとつの目安です。
8Bなら、モデル本体だけで約16GB。
70Bなら、約140GBです。
ただし、これはあくまでモデル本体を載せるためのざっくりした数字です。実際には、会話の履歴を保持したり、複数の処理を同時に行ったりするための追加メモリも必要になります。
スペック表の数字は、きれいに割り切れるものではありません。実際に動かせるかどうかは、使うソフトや設定、GPUの種類によって変わってきます。
量子化で軽く動かせる場合がある
大きなモデルをそのまま動かすには、多くのメモリが必要です。そこで使われるのが「量子化」という方法です。
量子化とは、パラメータの数値の精度を少し粗くして、モデルを軽くする技術です。細かい数値をそのまま持つのではなく、少し圧縮して扱うイメージです。
たとえば4bit量子化を使うと、必要なメモリをかなり減らせることがあります。これによって、本来なら大きなサーバーが必要なモデルを、高性能な個人用PCで試せる場合もあります。
もちろん、軽くした分だけ出力の質が少し変わることもあります。速さや軽さを取るのか、精度をできるだけ保つのか。ここも使い方次第です。
| モデルサイズ | パラメータ数 | モデル本体の容量目安 | 4bit量子化時の目安 | 主な利用シーン |
|---|---|---|---|---|
| 小型 | 〜8B程度 | 約16GB前後 | 約5〜6GB | スマホ、一般的なPC、特定タスク |
| 中型 | 13B〜30B程度 | 約26〜60GB | 約10〜20GB | 高性能PC、研究、検証 |
| 大型 | 70B〜 | 約140GB〜 | 約40GB〜 | 高度な推論、業務システム、クラウドAPI |
※必要なメモリ量は、実行ソフトや設定、同時処理数によって変わります。
パラメータ数だけでは読めない
パラメータ数が大きいモデルほど、複雑な処理をこなせる余地は広がります。ただ、それだけで回答の正確さや使いやすさが決まるわけではありません。
同じ70Bのモデルでも、学習データの質や、指示に従うための調整が違えば、出力の印象は変わります。片方は日本語が自然で、もう片方は少し硬い。片方はコードに強く、もう片方は文章作成に向いている。そういう差は普通にあります。
パラメータ数は、モデルの大きさを見るための目安の数字です。けれど、実際に使いやすいかどうかは、速度、料金、日本語の自然さ、自分の作業との相性まで含めて見ないとわかりません。
【4】パラメータ数が多いと何が変わるか
パラメータ数が増えると、AIが扱える情報の幅が広がります。ざっくり言えば、言葉のつながりや文脈の違いを、より細かく見分けやすくなります。
たとえば、短い質問に答えるだけなら小さなモデルでも十分なことがあります。けれど、「条件がいくつもある依頼」「前提を踏まえた説明」「微妙なニュアンスを含む文章」になると、大きなモデルの方が安定しやすい場面があります。
ただし、パラメータ数が多いほど何でも良くなる、という話ではありません。出力の質が上がる可能性がある一方で、動作は重くなり、料金や待ち時間も増えやすくなります。
複雑なパターンを扱いやすい
パラメータが多いモデルは、言葉の組み合わせや文脈のパターンをより細かく扱いやすくなります。
たとえば、専門用語が多い文章を要約する場合や、複数の条件を満たす企画案を出す場合です。ただ短くまとめるだけではなく、「初心者にもわかるように」「でも正確さは落とさずに」「少しやわらかい言い方で」といった条件が重なると、AIは一度にいくつもの要素を見ながら答える必要があります。
こうした場面では、大きなモデルの方が余裕を持って対応しやすくなります。もちろん、学習データや調整のされ方によって差はありますが、複雑な依頼ほどパラメータ数の多さが効いてくることがあります。
抽象的な関係を理解しやすくなる
大きなモデルは、文章の中にある関係性を読み取りやすくなります。
たとえば、「A案は費用を抑えられるが時間がかかる」「B案は早いがリスクがある」といった比較では、単に言葉を並べるだけでは不十分です。それぞれの条件を見比べて、どちらが目的に合っているのかを考える必要があります。
パラメータ数が多いモデルほど、こうした複数の条件を同時に扱いやすくなります。文章全体の流れを見ながら、一貫した答えを作りやすくなるためです。
ただし、これは一度に読める文章の長さとは別の話です。長い文章をどこまで保持できるかは、「コンテキスト長」という別の指標に関係します。パラメータ数が大きいからといって、どんな長文でも完璧に覚えていられるわけではありません。
表現や推論の幅が広がりやすい
パラメータ数に余裕があるモデルは、複数の情報を組み合わせて答えを出しやすくなります。
たとえば、数学の文章題を順番に解いたり、プログラムのミスを探したり、文章の論理がつながっているかを確認したりする場面です。答えだけを出すのではなく、途中の考え方を組み立てる必要がある作業では、大きなモデルの方が安定することがあります。
表現の幅も広がりやすくなります。同じ内容でも、ビジネス向けに硬めに書く、初心者向けにやさしく書く、子どもにも伝わるように言い換える、といった調整がしやすくなります。
AIが「こちらの意図をわかってくれた」と感じるときは、こうした表現や推論の力が働いている場合があります。
計算量とコストも増えやすい
一方で、パラメータ数が増えるほど、AIを動かすための計算も増えます。1つの回答を作るために必要な処理が多くなるので、高性能なGPUや大きなメモリが必要になりやすくなります。
その分、料金も上がりやすく、返答までの時間も長くなることがあります。
最新モデルなのに、返事を待つ時間で作業の手が止まる。実際に使っていると、そう感じる場面もあります。最高性能であることと、毎回気持ちよく使えることは、必ずしも同じではありません。
作業によっては、少し軽いモデルを選んだ方がサクサク進められることもあります。
小さいLLMが向く場面もある
小さいLLMにも向いている場面があります。
たとえば、社内FAQへの回答、問い合わせ内容の分類、メールの誤字脱字チェック、定型文の言い換えなどです。やることがはっきりしていて、複雑な推論をあまり必要としない作業なら、小さなモデルでも十分に役立つことがあります。
大規模モデルは、複雑な企画立案、高度な推論、文章の細かな調整などに向いています。
小型モデルは、定型的な回答、文章のチェック、情報の仕分けなどに向いています。
毎回いちばん大きなモデルを使う必要はありません。メール校正なら軽いモデルで足りるかもしれませんし、込み入った企画の壁打ちなら大きなモデルの方が安心かもしれません。
モデルの大きさは、作業の重さに合わせて選ぶものです。
【5】AIの賢さは数字だけで決まらない
パラメータ数が大きいモデルを見ると、それだけで「このAIは賢いはず」と思いたくなります。比較記事でも数字が目立つので、どうしてもそこに目が行きます。
ただ、実際に使ってみると、数字だけでは説明できない差があります。返答は速いけれど内容が浅い。文章は自然だけれど計算は苦手。日本語の細かい言い回しになると、急にぎこちなくなる。こうした違いは、パラメータ数だけでは見えません。
AIの使いやすさは、学習データの量や質、指示への従いやすさ、得意な作業との相性によって変わります。パラメータ数は大事な手がかりですが、それだけで賢さを決める数字ではありません。
学習データ量とのバランスが大切
モデルを大きくするなら、その分だけ多くのデータで学習させる必要があります。パラメータ数だけを増やしても、学習量が足りなければ性能は伸びにくくなります。
たとえば、大きなモデルなのに学習が不十分だと、言葉の扱いが不安定になったり、知識のつながりが弱くなったりします。逆に、比較的小さなモデルでも、十分なデータで丁寧に学習されていれば、特定の作業ではかなり安定して使えることがあります。
数字だけでは判断できない理由のひとつが、ここにあります。大きさと学習量は、セットで見た方がわかりやすいです。
Chinchilla則はサイズとデータの関係を示す
では、どのくらい学習データが必要なのでしょうか。ここで手がかりになるのが、Chinchilla則です。
細かい数式まで覚える必要はありません。押さえておきたいのは、モデルを大きくするなら、学習データも一緒に増やさないと効率が悪くなる、という考え方です。
パラメータ数だけを増やしても、学習データが足りなければ、せっかくの大きさを活かしきれません。反対に、モデルのサイズに合った量のデータで学習できれば、同じ計算コストでも性能を引き出しやすくなります。
大きければ自動的に賢くなる、というより、大きさに見合うだけの学習が必要です。
データの質が出力精度を左右する
学習データは、量だけでなく中身も効いてきます。
誤りの多い文章や重複した情報ばかりを読ませるより、整理された文章、信頼しやすいコード、論文、専門性のある資料などを含めた方が、出力は安定しやすくなります。
AIの回答には、学習したデータのクセが出ます。雑な文章を多く学べば、出力も雑になりやすいし、丁寧に整えられたデータを多く学べば、説明の組み立てや言葉選びも安定しやすくなります。
「パラメータ数は少ないのに、このモデルは意外と使いやすい」と感じるときは、学習データの選び方や整理の仕方が効いている場合があります。
指示チューニングで使い心地が変わる
AIは、学習が終わったあとに「人間の指示に従う練習」をすることがあります。これを指示チューニングと呼びます。
たとえば、「箇条書きでまとめて」「やさしい言葉で説明して」「結論から書いて」と頼んだときに、こちらの意図をうまくくみ取れるかどうか。ここには、指示チューニングの差が出ます。
どれだけ大きなモデルでも、この調整が弱いと使いにくくなります。質問に答えているようで、微妙にズレる。お願いした形式を守らない。余計な説明が増える。そういう使いにくさは、パラメータ数だけでは避けられません。
AIを使っていて「気が利く」と感じるかどうかは、モデルの大きさだけでなく、こうした指示チューニングの影響も大きいです。
日本語で使うなら日本語の学習量も見る
日本語でAIを使うなら、パラメータ数だけでなく、日本語をどれくらい学んでいるかも気にしないといけません。
世界的に有名な大規模モデルでも、学習データが英語中心だと、日本語の敬語や言い回しが少し硬く見えることがあります。意味は通じているのに、文章として読むとどこか不自然。AIを使って文章を作る人なら、そう感じたことがあるかもしれません。
反対に、パラメータ数は控えめでも、日本語の文章を多く学習しているモデルは、日本人にとって読みやすい出力を返すことがあります。
日本語で使うなら、数字の大きさだけではなく、実際の日本語出力を見ることがかなり大事です。
用途との相性で体感は変わる
AIの賢さは、使う場面によって印象が変わります。
たとえば、企画の壁打ちでは頼りになるのに、コード修正になると急に頼りないモデルもあります。反対に、プログラムの修正は得意でも、自然な文章を書くと少し硬くなるモデルもあります。
使う側からすると、「この作業でどれだけ手戻りが減るか」が大きいです。何度も直さないと使えないなら、数字が大きくても便利とは感じにくい。逆に、小さなモデルでも、毎回ほしい形に近い答えを返してくれるなら、その作業では十分に賢いと感じます。
賢さは、モデル単体で決まるというより、作業との相性で見え方が変わります。
パラメータ数以外の要素も組み合わせる
パラメータ数は、スペックの一部です。
70Bだから選んだのに、返答が遅い。日本語の言い回しが微妙に硬い。料金が思ったよりかかる。自分の作業では、そこまで大きなモデルでなくても足りていた。そういうズレは、数字だけを見ていると起こりやすくなります。
モデルを見るときは、パラメータ数と一緒に、次のような点もあわせて確認すると判断しやすくなります。
パラメータ数:複雑なパターンを扱える規模
学習データの量と質:知識や出力の安定感
指示チューニング:お願いした通りに答える力
日本語適性:日本語の自然さや文脈理解
用途との相性:自分の作業で手戻りが減るか
パラメータ数は、AIを見るときの入口になります。ただ、入口だけを見ても、そのモデルが自分に合うかどうかまではわかりません。
【6】パラメータ数をどう見ればいいか
パラメータ数は、AIモデルを見るときのわかりやすい手がかりです。「8B」「70B」「175B」と数字で示されるので、モデルの大きさを比べやすいからです。
ただ、ここまで見てきたように、数字が大きいからといって必ず自分に合うとは限りません。返答の速さ、料金、日本語の自然さ、作業との相性まで含めて見ると、印象が変わることがあります。
最後は、いくつかのモデルを実際に使ってみることです。同じ質問を投げてみる。文章を書かせてみる。要約や校正を試してみる。そうすると、スペック表だけでは見えなかった使いやすさが見えてきます。
モデル比較ではサイズ感を見る
新しいAIモデルを見るとき、パラメータ数を確認すること自体は役に立ちます。
パラメータ数を見ると、そのモデルが小型なのか、中型なのか、大型なのかが大まかにわかります。たとえば8Bなら軽めのモデル、70Bならかなり大きなモデル、175Bならさらに大規模なモデルという見方ができます。
ただし、これは性能の絶対評価ではありません。まずは「このモデルはどのくらいの規模なのか」をつかむための数字として見ておくのが自然です。
速度やコストも一緒に見る
実際にAIを使う場面では、賢さだけでなく、返答の速さや料金も大きく関わります。
どれだけ高性能でも、毎回返事を待つ時間が長いと作業の流れが止まります。料金が高ければ、気軽に何度も試すことも難しくなります。
メールの誤字脱字チェックや短い文章の言い換えなら、最高性能のモデルでなくても足りることがあります。むしろ、軽くて速いモデルの方が使いやすい場面もあります。
作業が軽いなら、モデルも軽くていい。そう考えると、数字の大きさだけに引っ張られにくくなります。
日本語利用では出力の自然さも見る
日本語で使うなら、実際の出力が自然かどうかも見ておきたいところです。
海外製の大規模モデルでも、日本語の文章になると少し硬かったり、敬語が的外れだったりすることがあります。意味は合っているのに、そのまま記事やメールに使うには直しが多い。そういうモデルもあります。
反対に、パラメータ数はそれほど大きくなくても、日本語の言い回しが自然で、修正の手間が少ないモデルもあります。
日本語で使うなら、スペック表だけではなく、実際に出てくる文章を見た方が判断しやすくなります。
非公開情報は推測で読まない
GPT-4、Gemini、Claudeのような主要な商用モデルは、正確なパラメータ数を公表していないことがあります。
ネット上では「1兆パラメータ級ではないか」といった推測を見ることもありますが、公式に出ていない数字はあくまで予想です。そこだけを根拠にモデルを比べると、判断を誤りやすくなります。
非公開モデルを見るときは、推測されたパラメータ数よりも、実際の出力を見た方が現実的です。自分の作業でどれだけ手戻りが減るか。返答は待てる速さか。料金に見合うか。そこまで見た方が、数字だけを追うより判断しやすくなります。
MoEという設計もある
最近のAIモデルには、「MoE(混合専門家)」という設計を使うものもあります。
MoEは、モデルの中に複数の専門家のような部分を持ち、入力に応じて必要な部分だけを動かす仕組みです。全体としては大きなモデルでも、1回の回答で使われるパラメータは一部だけ、ということがあります。
この場合、スペック表に書かれた「総パラメータ数」だけを見ると、実際の重さを読み違えることがあります。
数字を見るときは、それがモデル全体の規模なのか、回答時に実際に動く規模なのかを分けて読む必要があります。
内部の知能と外部情報を分けて見る
AIが最新ニュースや社内規定に正しく答えられるかどうかは、パラメータ数だけでは決まりません。
モデル内部のパラメータは、学習によって身についた判断の基礎です。一方で、最新情報や社内文書のような外部情報は、RAGなどの仕組みで別に参照させる必要があります。
「このAIは最新情報に弱い」と感じたとき、モデルを大きくすれば解決するとは限りません。必要なのは、外部資料を正しく読ませる仕組みかもしれません。
AIの力と、参照している資料の正確さ。この2つは分けて見た方が整理しやすくなります。
最後は実際に使って確かめる
パラメータ数、速度、料金、日本語の自然さ、用途との相性。見るべき点はいくつかありますが、最終的には自分で使ってみないとわからない部分が残ります。
同じプロンプトを、複数のモデルに投げてみる。いつも自分が使う作業で試してみる。文章作成なら、出力後にどれくらい直しが必要かを見る。要約なら、必要な情報が落ちていないかを見る。こうした確認をすると、自分に合うモデルがかなり見えやすくなります。
スペック上は大きなモデルでも、自分の作業には少し重いかもしれません。反対に、小さなモデルでも、毎回ほしい形に近い答えを返してくれるなら、それは十分に使いやすいモデルです。
パラメータ数は、AIモデルを選ぶときの入口です。けれど、最後の判断は、実際に使ったときの感覚にかなり左右されます。数字を見て、出力を見て、自分の作業で試す。その順番で見ていくと、モデル選びはぐっと現実的になります。
【深掘り記事|A01-06】AIモデルとは?パラメータ・学習データから理解する基礎知識
編集後記
新しい技術が出るたびに、まず数字が注目される場面をよく見ます。AIのパラメータ数も、そのひとつだと思います。
でも、パラメータはただの大きな数字ではありません。AIが学習の中で身につけた、判断のクセのようなものです。そう考えると、「70Bだからすごい」とすぐに決める必要はないかなと思います。
数字は便利です。けれど、実際に使うときは、速さや文章の自然さ、自分の作業に合うかどうかも大事になります。パラメータ数を入口にしつつ、最後は使って見て、自分で判断する。そのくらいの距離感で、AIとは付き合っていくのがよいと思います。
参照・参考サイト
IBM・LLMパラメーターとは
https://www.ibm.com/jp-ja/think/topics/llm-parameters
Google Developers・LLM: 大規模言語モデルとは何でしょうか。
https://developers.google.com/machine-learning/crash-course/llm/transformers?hl=ja
Amazon Web Services・推論パラメータでレスポンスの生成に影響を与える
https://docs.aws.amazon.com/ja_jp/bedrock/latest/userguide/inference-parameters.html
Google AI for Developers・Gemma 4 モデルの概要
https://ai.google.dev/gemma/docs/core?hl=ja
RIETI・生成AIの研究開発と今後の方向性
https://www.rieti.go.jp/jp/events/bbl/24090501_hanazawa.pdf
IBM・RAG(検索拡張生成)とは
https://www.ibm.com/jp-ja/think/topics/retrieval-augmented-generation


コメント