OpenAIは12月17日、「12 Days of OpenAI」というイベントの9日目に、開発者向けに新しいAIモデル o1 の便利な新機能を発表しました。
APIの連携性向上やリアルタイム音声会話のアップデート、さらにカスタマイズ性を高めるPreference Fine-Tuningなど、多岐にわたるアップデート内容をわかりやすく紹介します。
o1に開発者向けの新機能追加
「OpenAI o1」は、複雑な問題やたくさんのタスクを高い正確さで解決するためのAIモデルです。今回、次の機能が追加されました。
主な機能
- 関数呼び出し(Function Calling)
- APIと他のサービス、外部のデータとAPIを接続可能に。
- 構造化出力(Structured Outputs)
- 回答を決まった形式(JSON)にすることが可能で、データ管理や修正が容易に。
- 開発者向けメッセージ(Developer Messages)
- トーンやスタイル、細かな指示を設定して、AIの回答をカスタマイズできます。
- ビジョン機能(Vision Capabilities)
- AIが画像を処理し、コーディングだけでなく、ミスの発見に使えます。例えば、書類のエラーを見つけたり、製造業の欠品チェックにも利用可能。
- 低遅延(Lower Latency)
- これまでのモデルよりも平均して60%少ない計算時間で素早く回答。
- Reasoning Effort
- 「どれくらい考えるか」を設定でき、簡単なタスクには少ない計算力、複雑な問題には多くの計算力を使えます。
OpenAIが公開しているデモ動画では、構造化出力とビジョン機能を見ることができます。構造化出力(5:00あたり)では、JSON形式での応答を活用し、UI統合が容易になっており、ビジョン機能(2:45あたり)では、スキャンした税務フォームのエラーを画像分析で検出しています。
Realtime API(リアルタイムAPI)のアップデート
Realtime APIは、自然な音声会話をリアルタイムで行うために設計されたAPIです。例えば、音声アシスタントやリアルタイム翻訳ツールを構築する際に使えます。
アップデート内容
- WebRTCサポート
- WebRTC(リアルタイム通信技術)に対応し、ブラウザやスマホアプリで簡単に音声や映像のやり取りができます。例えば、安定した音声通話やライブ会話のアプリが作れます。
- 価格の引き下げ
- GPT-4oの音声トークンの価格を60%引き下げ。
- 小型版GPT-4o Miniの価格は従来の10分の1に。
- レスポンスの制御機能
- バックグラウンド処理: AIが裏で別の作業(例: 内容の確認)をしながら、ユーザーとの会話を続けることが可能。
- 入力内容の調整: 会話のうちどの部分をAIに理解させるかを選べます。例えば、直前の発言だけをAIに送って確認することが可能です。
- 応答のタイミング調整: 必要な情報を集めてからAIが返事をするように設定できます。手動で音声応答を開始可能なので、必要のない時に自動で発言に応答するのを防げます。
- セッション時間の延長: これまで15分だった最大時間が30分まで使えるようになりました。
Preference Fine-Tuning(好みに合わせた調整)
Preference Fine-Tuningは、ユーザーや開発者の「好み」に合わせてAIの回答をカスタマイズする新しい方法です。
主な特徴
- AIに「好ましい回答」と「好ましくない回答」を学習させ、希望に合う回答を出しやすくします。
- 特に、トーンや表現のスタイルが重要なタスクに向いています(例: 創作的な文章や要約)。
Preference Fine-TuningとSupervised Fine-Tuningの違い
違い | Supervised Fine-Tuning | Preference Fine-Tuning |
---|---|---|
目的 | 正しい回答を出すことを重視 | 好ましい回答を強化し、合わない回答を減らす |
学習データ | 入力と正解のペア | 好ましい回答と好ましくない回答のペア |
使われる場面 | コード生成や正確さが必要なタスク | 主観的な「良い回答」が求められるタスク |
GoとJavaの新SDK(ソフトウェア開発キット)
OpenAIは新たにGo言語とJava言語用の*SDKを発表しました。これにより、PythonやJavaScriptだけでなく、GoやJavaを使ってもAIを活用しやすくなります。
*SDK(Software Development Kit)とは、特定のシステムに順応したソフトウェアを開発するために必要なプログラムや文書などがパッケージ化されたものです。
今回のアップデートの背景
今回の「ChatGPT search」の一般公開は、「12 Days of OpenAI」イベントの一環として発表されました。このイベントでは次のような新機能も紹介されています。
- 1日目: 新プラン「ChatGPT Pro」と最新モデル「GPT-4o1」の公開
- 2日目: 強化学習ファインチューニングの導入
- 3日目: 動画生成ツール「Sora」の一般公開
- 4日目: ChatGPTの新機能「Canvas」の一般公開
- 5日目: AppleデバイスとChatGPTの統合
- 6日目: 高度な音声モードのアップデート
- 7日目: 新機能「Projects in ChatGPT」の実装
- 8日目: ChatGPT searchを全ユーザーに公開
まとめ
OpenAIが開発者向けに新しいAIモデル「OpenAI o1」や便利なツールを発表しました。今回紹介した、APIの連携性向上やリアルタイム音声会話のアップデート、さらにカスタマイズ性を高めるPreference Fine-Tuningなど、多岐にわたるアップデートによって、開発者の作業が一層効率化される時代が到来するでしょう。