最終更新日 25/01/10
特集記事

Microsoftが小規模言語モデル「Phi-4」をMITライセンスで公開

AI
Share this post

米Microsoftは2024年1月7日、小規模言語モデル(Small Language Model, SLM)である「Phi-4」をHugging Face上で公開しました。このモデルはMITライセンスで提供されており、商用利用を含め、自由に使用や改変が可能です。

Phi-4は、Microsoftの「Phi」シリーズにおける最新モデルで、軽量ながらも特定分野で優れた性能を発揮します。特に数学的推論において、大規模言語モデル(LLM)を凌ぐ精度を示しており、専門的なタスクでの活用に注目が集まっている状況です。

この記事では、Phi-4の特徴や性能を詳しく解説するとともに、ビジネスにおける具体的な応用可能性についても触れていきます。

Phi-4とは:軽量で高性能な数学特化型AIモデル

アメリカ数学コンペティションの平均点の比較(引用:Microsoft公式HP)

「Phi-4」とは、Microsoftが2024年12月13日にリリースした最新の小規模言語モデルです。回答の精度に影響するパラメータ数は140億であり、現在主流なGPT-4oがおよそ100兆と言われていることを考えると、非常にコンパクトなモデルといえます。

しかし、その性能は高く、特に数学では大規模言語モデル(LLM)を凌駕する性能を発揮しました。具体的には、アメリカ数学コンペティション(AMC)を用いた評価にて、Phi-4はGPT-4oやGemini Pro 1.5といった大規模言語モデルを上回る平均点を記録しています。

実際に、Phi-4に数学の問題を解かせてみると、以下のように解説を交えながら正しい解答を導き出しました。

「同着が最大で1回まで発生する場合、5匹のカタツムリのレース結果のパターンは何通りあるでしょうか?」という問題(引用:Microsoft公式HP)

パラメータサイズを超えた性能を発揮

横軸がパラメーター数、縦軸がベンチマークテスト「MMLU」のスコア(引用:Microsoft公式HP)

Phi-4はパラメータ数が同規模の他言語モデルと比較しても、優れたスコアを記録しています。また、「Llama-3.3-70B-Instruct」や「Qwen2.5-72B-Instruct」など、Phi-4よりも多くのパラメータを持つモデルにも匹敵する性能を発揮しました。

(引用:Phi-4 Technical Report)

実際に、Phi-4は高度な選択式問題であるGPQAでも優れたパフォーマンスを示しています。GPQAは非常に難易度が高く、博士号取得者でも正答率は65%程度にとどまりますが、Phi-4はこれに対して56.1%の正答率を達成しました。これは、比較対象となった他のモデルの中で最も優れた結果です。

また、コード生成能力を測定するHumanEval+では、Phi-4はスコア82.6を達成しました。このスコアは軽量モデルであるにもかかわらず、GPT-4o mini以上の性能を示しています。この結果から、Phi-4が幅広い分野で応用可能な高い能力を持つことが確認できます。

Phi-4の利用方法・ライセンス

(引用:Hugging Face)

Phi-4は、Azure AI FoundryHugging Faceを通じて利用できます。今回、MITライセンスで公開されたことにより、商用利用を含むさまざまな用途で自由に使用できるようになりました。

MITライセンスは、オープンソースライセンスの中でも非常に寛容なもので、以下のような特徴があります。

【MITライセンスの特徴】

  • ソフトウェアの使用や変更、配布が自由で、商用プロジェクトにも制限なく活用できる
  • ライセンスの表示義務(原作者のクレジットを記載する)を満たせば、他に厳しい条件はない

そのため、Phi-4は個人や企業が自分のプロジェクトに簡単に統合できるだけでなく、モデルを改良したり、独自の目的に合わせてカスタマイズすることも可能です。

さらに、Phi-4ではモデルの重み(モデル内部のパラメータ情報)も公開されています。これにより、開発者はPhi-4を基に新しいモデルを構築したり、特定の用途に最適化したりすることができます。Phi-4は研究者から商用開発者まで、幅広いユーザーにとって有用な選択肢となるでしょう。

Phi-4の課題

Phi-4 Technical Reportでは、以下の4つの課題が挙げられていました。

  • ハルシネーションは完全に防ぐことはできない
  • 詳細な指示や特定のフォーマット要件を厳密に守ることが得意ではない
  • 単純な比較や計算でも誤りを生じる場合がある
  • 「思考の連鎖」で学習しているため、単純な問題でも長い質問で答えてしまうことがある

まとめ

Microsoftが公開した小規模言語モデル「Phi-4」は、その軽量性と高度な数学的推論能力により、AI活用の新たな可能性を示しています。特に、専門分野での高い性能とMITライセンスによる自由度の高さは、企業や個人にとって非常に魅力的な要素です。これにより、スタートアップから大企業まで、幅広いユーザーがPhi-4を活用したソリューションを開発できる道が開かれました。

一方で、ハルシネーションやフォーマット要件への対応といった課題も残されており、さらなる改良が求められます。しかし、こうした課題も含めて、Phi-4はAIモデルの進化の方向性を象徴する存在といえるでしょう。

今後、Phi-4はビジネスにおける効率化や新たな価値創出を支えるツールとして活用されることが期待されます。このモデルを基盤にしたアプリケーションやカスタマイズ事例の登場によって、AIの導入がさらに加速し、多様な業界で革新がもたらされるでしょう。Phi-4が提供する柔軟性と精度を最大限に活用し、新たなビジネスチャンスを生み出すことが求められます。

目次に戻る

タイトルとURLをコピーしました