AI技術の発展に伴い、近年注目を集めているのが「LLM(大規模言語モデル)」です。代表的なものとしては「BERT」や「GPT-4」などが挙げられます。また、LLMを搭載したサービスとして「ChatGPT」や「Gemini」などが登場しており、これらの技術はすでに聞き馴染みのある方も多いのではないでしょうか。LLMに対する理解は、生成AIへの理解を深めるにあたって必要不可欠なものです。
本記事では、LLMの種類や仕組みについて解説します。また、ビジネスシーンでの活用方法や実際の活用事例などについてもご紹介しますので、AI技術の導入をご検討中の経営者・管理職・技術者の方などは、ぜひ参考にしてください。
LLMとは
LLM(大規模言語モデル)とは、膨大な量のテキストデータにもとづいて学習された、高度な言語理解と生成能力を備えた人工知能モデルです。従来の言語モデルと比べて、圧倒的な処理能力と学習データ量を持つことが特徴であり、より自然で人間らしい文章生成や、複雑な質問への回答が可能となりました。
LLMの登場以前の言語モデルは、比較的規模が小さく、学習データも限定的なものでした。そのため、文章生成や翻訳などのタスクにおいて、精度や自然さに欠けるケースがありました。その一方で、LLMは数千億~数兆個のパラメータを持つ巨大なニューラルネットワークで構成されており、書籍・論文・ニュース記事・Webページなど、膨大な量のテキストデータを学習することで、高度な言語処理能力を獲得しています。
そもそも言語モデルとは、単語や文章の出現確率を統計的に分析し、文章生成や翻訳などのタスクに活用するモデルのことです。従来までの言語モデルでは、N-gramと呼ばれる手法を用いることが一般的でした。N-gramとは、前のN個の単語が出現する確率にもとづいて、次の単語を予測する手法のことです。しかし、N-gramは文脈を考慮することができないため、誤った予測をしてしまうことがあります。そのため、昨今のLLMではTransformerと呼ばれる新しいニューラルネットワークアーキテクチャを用いることで、文脈を理解したうえで、より自然な文章生成や翻訳を実現しています。
LLMと生成AIの違い
生成AIは、画像・音声・文章などのデータを生成する人工知能技術の総称です。一方で、LLMは生成AIのなかでもテキストデータを生成することに特化した技術のことです。
参考までに、その他の生成AI技術としては、画像生成AIに用いられる「GAN(Generative Adversarial Network)」や「VAE(Variational Autoencoder)」などが挙げられます。GANとは、2つのニューラルネットワークを用いて、互いに競い合いながら画像を生成する技術のことです。一方で、VAEは潜在変数を用いてデータを圧縮・復元し、新しいデータを生成する技術のことです。生成AIはこれらの技術を総称した概念であるといえます。
LLMと機械学習の違い
機械学習は、コンピュータに明示的にプログラムすることなく、データから学習をさせて、あるタスクを実行できるようにする技術のことです。
一方で、LLMは機械学習の一種である「教師あり学習」を用いて開発されています。教師あり学習では、入力データと正解データのペアを用いて学習を行います。LLMの場合は、入力したテキストデータと、そのテキストデータの要約や翻訳などの正解データを用いて学習をします。そのため、LLMは機械学習の一種であるといえます。
LLMの仕組み
LLMでは、下記5つのステップで処理を行います。
- トークン化:入力された文章を、単語や記号などの単位に分解
- 文脈理解:単語の順番や文脈に基づいて、文章の意味を理解
- エンコード:文脈を理解したうえで、単語や文章をベクトルに変換
- デコード:ベクトルを単語や文章に変換
- 確率出力:生成された単語や文章の出現確率を出力
トークン化
LLMでは、入力された文章を「単語」や「記号」などの最小単位に分解します。この処理をトークン化といいます。テキストデータのままでは、機械が内容を理解できないため、トークンという数値データに一度変換をします。
文脈理解
つぎに単語の順番や文脈に基づいて、文章の意味を理解します。この処理を文脈理解といいます。文脈理解では、共参照解析や依存関係解析などの技術を用いて、単語間の関係性を分析します。共参照解析とは、文章中の代名詞や指示詞が指す単語を特定する技術のことです。一方で、依存関係解析とは、文章中の単語間の依存関係を分析する技術のことです。
このように、入力された文章(プロンプト)内における各トークンとの関連性を計算して文脈を理解します。
エンコード
文脈を理解したうえで、LLMは単語や文章をベクトルに変換します。この処理をエンコードといいます。エンコードでは、Transformerと呼ばれるニューラルネットワークアーキテクチャを用いて、単語や文章のベクトルを生成します。Transformerでは、単語間の関係性を考慮したベクトルを生成できるため、より精度の高い言語処理が可能となります。
デコード
さらにベクトルを単語や文章に変換します。この処理をデコードといいます。デコーダーでは、エンコーダーで生成されたベクトルをもとに単語や文章を生成します。
確率出力
最後に、生成された単語や文章の出現確率を出力します。この処理を確率出力といいます。確率出力では、生成された単語や文章の出現確率を計算して最も高い確率の単語や文章を出力します。
LLMの種類
代表的なLLMの種類は下記の通りです。
- BERT
- GPT-4
- LaMDA
- Claude
サム・アルトマンが創業したOpenAI社をはじめとして、Google社やMeta社などのITプラットフォーム、他にもシリコンバレーに拠点を置くスタンフォード大学や国内IT企業であるサイバーエージェントなど、近年ではさまざまな組織がLLMの研究開発に取り組んでいます。
これらのLLMはそれぞれ異なる特徴を持つため、ここでは代表的なLLMを中心に特徴や歴史を解説します。
BERT
BERTはGoogle社が開発したLLMです。自然言語理解タスクにおいて高い精度を誇ります。Transformerといわれるニューラルネットワークアーキテクチャを用いて、大量のテキストデータから文脈を理解した単語の意味を学習します。従来までの自然言語処理モデルと異なり、BERTは文章を双方向から処理することができるため、前後の文脈を理解することで、より正確な意味認識が可能です。
また、事前に大量のテキストデータで学習されているため、さまざまな自然言語処理タスクにおいて、すぐに適用することができます。
GPT-4
GPT-4はOpenAI社が開発したLLMです。文章作成や翻訳タスクにおいて高い精度を誇ります。Transformerといわれるニューラルネットワークアーキテクチャを用いて、テキストと画像の両方から情報を学習します。従来までの言語モデルと異なり、画像も理解することができるため、より高度なタスクを実行することができます。
また、事前に学習したデータと類似した新しいタスクを、学習データを与えることなく実行できる「ゼロショット学習」という特徴を持ちます。人間からのフィードバックを通じて、学習内容をさらに改善することも可能です。
LaMDA
LaMDAはGoogle社が開発したLLMです。会話型AIタスクにおいて高い精度を誇ります。Transformerといわれるニューラルネットワークアーキテクチャと、膨大なテキストとコードのデータセットで学習されていることが特徴です。文脈を理解したうえで、人間と自然な会話を行うことができます。
Claude
ClaudeはAnthropic社が開発したLLMです。同社は、ChatGPTを開発したOpenAI社の元社員で結成されたスタートアップ企業です。Google社やAmazon社など、名だたる企業から出資を受けており、現在最も注目を集めている企業のひとつとして挙げられます。
2024年3月には、日本語に対応したLLMである「Claude 3」が発表されました。従来までのLLMと異なり、自然な日本語を出力できる点が特徴です。まだ開発されて間もないLLMですが、2024年に実施された調査では、各種LLMのなかで初めてIQ100以上を獲得しました。知能レベルの高いLLMとして、今後の発展が期待されています。
LLMの活用で実現できること
LLMは、下記のようなさまざまなタスクに活用することができます。
- 質問への回答
- 文章の要約/翻訳
- コンテンツ制作
- プログラミング
質問への回答
LLMは、ユーザーの質問に対して自然な回答をすることができます。これは、LLMが膨大な量のテキストデータを学習しており、文脈を理解したうえでさまざま回答を生成できるためです。たとえば「日本の首都はどこですか?」という質問に対して、多くのLLMは「日本の首都は東京です」と正確に回答することができます。
カスタマーサポートやヘルプデスクの現場では、LLMを活用したチャットボットを導入することで、オペレーターの負担を最小限に抑えることが可能です。
文章の要約/翻訳
LLMは、文章を要約したり、翻訳したりすることができます。これは、LLMが文章の意味を正しく理解したうえで、簡潔で分かりやすい文章を生成することができるためです。たとえば長文のニュース記事を要約したり、外国語の文章を日本語に翻訳したりすることが可能です。
実際に、議事録作成ツールの「AI GIJIROKU」では、Zoom・Skype・Teams・Hangouts・Webexなどのビデオチャットツールと連携をするだけで、商談や会議などの議事録を自動で作成することができます。独自の音声認識エンジンをもとに99.8%の精度を実現。金融・法律・会計・ITなど、各業界の専門用語を認識して、正確な議事録を残すことが可能です。また、大規模言語モデル「LHTM-2」を活用することで、議事録の要約も作成できます。
コンテンツ制作
LLMを活用することで、ブログ記事・広告文・商品説明文などのコンテンツを制作することができます。これはLLMがさまざまな文章フォーマットを学習しており、ユーザーのニーズに合ったコンテンツを生成できるためです。たとえば特定のキーワードに関連するブログ記事を書いたり、商品の魅力を訴求する広告文を作成したりすることができます。
プログラミング
LLMは、プログラミングコードを生成することができます。これは、LLMがプログラミング言語の文法を学習しており、ユーザーの意図を理解したうえでコードを生成できるためです。たとえば特定の機能を実現するプログラムコードを書いたり、既存のコードをデバッグしたりすることができます。
近年、国内ではエンジニアの人手不足が叫ばれています。そのため、AIによるプログラミング技術の自動化・効率化は今後ますます注目を集めることが想定されています。これまでは技術者の不足が課題となり、サービスの開発に乗り遅れていた企業でも、今後はAIを活用することで、低予算・短納期での開発スケジュールを実現できる可能性が見込めます。
LLMを搭載したサービス
LLMを搭載したサービスは、現在さまざまな分野で登場しています。これらのサービスはまだ発展途上の段階ですが、今後さらに進化していくことが期待されています。
代表的なサービスは下記の通りです。
- ChatGPT
- Gemini(旧 Bard)
- Microsoft Copilot(旧 Bing AI)
ChatGPT
ChatGPTは、OpenAI社が提供するチャットサービスです。LLMを用いて、ユーザーとの自然な会話を実現しています。文脈を理解したうえで、質問応答・要約・翻訳・創作・ブレーンストーミングなどが可能です。また、音声・画像認識機能を搭載したマルチモーダルな生成AIのため、テキスト生成以外の分野でも活用ができます。
実際に、大手企業の間ではビジネスシーンでの活用も進んできました。たとえば株式会社サイバーエージェント(※1)では、ChatGPTオペレーション変革室を中心に、広告オペレーションに関する業務効率化を推進しています。また、大和証券株式会社(※2)では全社員約9,000人を対象に利用を開始する予定です。 情報収集や資料作成、プログラミングの素案作成などでの活用を検討されています。
(※1)参照:ChatGPTで広告運用の実行スピードを大幅短縮する「ChatGPTオペレーション変革室」を設立 | 株式会社サイバーエージェント
(※2)参照:大和証券、対話型AIの「ChatGPT」を導入し全社員約9,000人を対象に利用を開始 - 日本経済新聞
ChatGPTは簡単な登録情報でアカウントを作成するだけで、無料で利用を開始できます。質問内容を入力するだけで、すぐに回答が生成されます。PCの場合はブラウザから、スマートフォン(iOS・Android)の場合はブラウザかアプリから利用可能です。また、有料プランである「ChatGPT Plus」に登録をすれば、より高性能・高スピードでの応答を得ることができます。
Gemini(旧 Bard)
GeminiはGoogle社が提供する文章生成サービスです。以前までは「Bard」という名前でサービスが展開されていました。Geminiでは、LLMを用いてさまざまなフォーマットの文章を生成することができます。高度な言語処理が可能なため、さまざまな質問に対して正確かつ詳細な回答を提供したり、文章や音声の内容を要約して重要なポイントを抽出したりすることが可能です。
Geminiは、Googleアカウントを登録してログインするだけで、すぐに利用を開始できます。PCの場合はブラウザから、スマートフォンの場合はブラウザかアプリ(AndroidではGemini アプリ、iOSではGoogleアプリのGeminiタブ)から利用が可能です。
Microsoft Copilot(旧 Bing AI)
Microsoft CopilotはMicrosoft社が提供する生成AIツールです。ビジネス版として「Microsoft Copilot for Microsoft 365」も提供されており、Teams・Word・Excel・PowerPointなどのOfficeツールと連携をして作業効率を高めることができます。
Microsoft Copilotは、個人利用であればMicrosoftアカウントを作成してログインをするだけで、ブラウザ上から無料で利用できます。Windows 11以降では、デスクトップの右側にサイドパネルとしても表示が可能となりました。
企業でのLLM活用事例
LLMは、ITビジネスを主軸とした企業を中心に、日本国内でもさまざまな企業で活用が広まっています。実際に、LLM及びAIサービスを活用した企業事例を紹介します。
株式会社メルカリ
株式会社メルカリでは、LLMを活用して30億以上の大規模商品カテゴリの分類を行いました。もともと同社が運営するフリマアプリ「メルカリ」では、2024年にカテゴリのリニューアルを行い、階層構造の見直しやカテゴリ数の増加を図りました。それに伴い、各構造やカテゴリに紐づくデータを変更する必要が生じたため、LLMの活用を検討。具体的には、ChatGPT 3.5 turboを活用して過去商品の一部の正解カテゴリを予測し、過去商品のカテゴリ予測モデルを作成することに成功しました。
同社では「LLMを用いたプロダクト開発をスピーディーに行うためのガイドライン」を一般公開するなど、LLMの積極的な活用を推進しています。
参照:LLMを活用した大規模商品カテゴリ分類への取り組み | メルカリエンジニアリング
参照:mercari R4DのELSI研究成果、「LLMを用いたプロダクト開発をスピーディーに行うためのガイドライン」を一般公開 | mercari R4D
株式会社リブセンス
株式会社リブセンスは、転職口コミサイト『転職会議』とChatGPTをAPIで連携し、約2600社に及ぶ企業口コミの要約機能を試験的にリリースしました。『転職会議』にある企業口コミ数は360万件以上、なかでも大手企業の口コミ数は数千件にのぼる量があります。そのため、ユーザーがより短時間で的確に企業へのイメージを読み取ることができるように、本サービスはリリースされました。同社では今後、要約文の掲載社数の増加やPC版サイトへの展開をはじめとした、さらなる精度向上に取り組まれるようです。
参照:転職口コミサイト『転職会議』、ChatGPTのAIを活用した企業口コミの要約情報を提供開始 | 株式会社リブセンスのプレスリリース
弁護士ドットコム株式会社
弁護士ドットコム株式会社では、ChatGPTを活用した法律相談チャットサービス「弁護士ドットコム チャット法律相談」を試験的にリリースしました。本サービスは、LLMを用いてユーザーからの法律相談に自動で回答するものです。ユーザーは24時間、無料で法律相談ができます。
今回は、法律相談数の中でも上位を占める「男女問題(離婚、浮気、金銭トラブルなど)」からスタートをしました。ユーザーが気軽に法律相談できる環境の提供を目的に、同社では交通事故・相続・労働問題などのカテゴリを順次追加していく予定のようです。
参照:弁護士ドットコム、世界初の日本語版※、AI法律相談チャットサービス『弁護士ドットコム チャット法律相談(α版)』を5月12日より試験提供開始 | 弁護士ドットコム株式会社のプレスリリース
LLM活用の課題
LLMは、さまざまな可能性を秘めた技術ですが、一方でいくつかの課題も存在します。
- 学習データによる出力の偏りがある
- セキュリティやプライバシーのリスクがある
- 日本語特有の表現の難しさがある
学習データによる出力の偏りがある
LLMは、学習データにもとづいて判断を行うため、学習データの内容に偏りがあると、誤った出力をしてしまう可能性があります。わからない質問に対して「わからない」と答えるのではなく、不正確な情報を出力してしまうのです。これは一般的にハルシネーションと呼ばれます。
とくに主義信条や価値観を問う場合には、偏ったサンプルデータから、倫理的には考えられないような回答をするおそれもあります。このような正解のない分野での回答では、中立的な立場での回答が求められるものです。一般的な利用を前提とした場合、人種差別や性差別などの偏見が含まれていない倫理的な学習データの整備が必要となります。
セキュリティやプライバシーのリスクがある
LLMは、個人情報を含むデータを学習することがあります。そのため、LLMが不正アクセスを受けた場合、個人情報が漏洩するリスクがあります。個人情報や社外秘の情報など、流出のリスクがあるデータについては、そもそも利用者が入力しないようなルールの手配が必要です。
また、一部の生成AIサービスではオプトアウト機能が搭載されているため、社内での導入をご検討中の方は、事前に設定を見直しておくことがおすすめです。
日本語特有の表現の難しさがある
日本語は、漢字・ひらがな・カタカナ・ローマ字など、さまざまな文字が混在しており、敬語・丁寧語・タメ口などの表現方法も多様にあります。これらの複雑な表現は正確に理解をするのが難しい部分もあり、ときにはAIが誤った解釈をしてしまう可能性があります。
最近では、Claude 3やLHTM-2のような日本語に対応したLLMも開発されていますが、その他のAIサービスを利用する際には、標準的な表現で入力をするなど、利用者側の工夫が求められます。
まとめ
LLMとは、高度な言語理解と生成能力を備えた人工知能モデルのことです。従来までの言語モデルと比較して、自然で人間らしい文章生成や複雑な質問への回答が可能です。
ビジネスシーンで活用することで、AIがさまざまなタスクを実行し、人間はより創造的な仕事に集中できるようになります。実際に、ChatGPT・Gemini・Microsoft CopilotなどのLLMを搭載したサービスは、日本国内の大手企業の間でも導入が進んでいます。
しかし、LLMにはいくつかの課題も存在します。たとえば「学習データによる出力の偏りがある」「セキュリティやプライバシーのリスクがある」「日本語特有の表現の難しさがある」などです。これらの課題を克服し、LLMを安全かつ倫理的に活用していくことが各企業には求められています。
LLMやAIサービスの活用を進めていく際には、社内で専用のチームを構築する必要があります。しかし、デジタル人材の不足が叫ばれる昨今において、最先端のAI技術のキャッチアップを図ることは決して容易なことではありません。また、先述したようなリスクや課題があるなかで、適切な方法で導入を行うためには、外部の専門業者に依頼をするのがおすすめです。
株式会社オルツでは、パーソナル人工知能を中心としたAI活用・LLM開発・DX推進を支援しています。直近では、AWS Marketplace上に日本語LLMとして世界初公開となる「LHTM-OPT」を公開するなど、日本国内のAI分野ではトップレベルの技術力を持ちます。
また、とくに音声認識技術の分野では、さまざまな業種業界に特化した音声認識エンジンAPIのご提供もしています。貴社のアプリケーションやシステムとの連動にもご活用いただけるため、少しでもご興味のある方は、下記のお問い合わせフォームよりご連絡ください。ヒアリングからコンサルティング、実証実験、開発、運用まで一気通貫でご支援いたしますので、お気軽にご相談ください。