最終更新日 24/12/18
特集記事

OpenAI、高度な音声モードがビデオや画面共有に対応!映像を活用したリアルタイムな会話が可能に

AI
Share this post

OpenAIは2024年12月12日(現地時間)、「12 Days of OpenAI」の6日目として、「Advanced voice with video & Santa mode」を発表しました。この発表では以下の2つの新機能が紹介されています。

<Day6で発表された新機能>

  • ChatGPTの「高度な音声モード」がビデオと画面共有に対応
  • 特別なホリデー機能として「サンタモード」が登場

特に注目されているのは、前者の「高度な音声モード」の進化です。この機能により、音声だけでなく、映像や画面共有を通じたリアルタイムの対話が可能になり、ChatGPTからのより精度の高い回答が期待できます。たとえば、AIとリアルタイムに会話し、「周囲の映像から状況を判断して」などのタスクを依頼することができるでしょう。

この記事では今回の発表の詳細や、本機能の利用方法などについて詳しく紹介します。

発表①:高度な音声モードがビデオと画面共有に対応

(引用:OpenAI公式HP)

OpenAIは「Advanced Voice Mode(高度な音声モード)」が音声だけでなく、ビデオや画面共有にも対応したことを発表しました。

従来の「高度な音声モード」は、音声で質問を入力すると、人間のような自然な音声で回答を得られる機能です。しかし、今回のアップデートにより、音声だけでなくビデオや画面を通じた対話が可能になり、ChatGPTが映像や画面の内容をもとに回答できるようになりました。これにより、さらなる精度と実用性を実現しています。

また、この機能は音声認識と出力を処理するGPT-4Tモデルを基盤としており、感情やトーンを伴う、より自然で深みのある会話が可能です。

さらに、今回の発表では、新たにライブチャットの録画・共有機能が追加されたことも明らかにされました。この機能を使うと、重要な会話や学習セッションを記録し、後から見返したり、SNSで共有したりすることができます。

<本機能の利用スケジュール>

  • 2024年12月13日から最新モバイルアプリで順次展開開始
  • 来週にかけてTeamsユーザーおよび、ほとんどのPlusおよびPro加入者に提供予定
  • 来年初頭にはEnterpriseプランおよび教育プランユーザーにも展開予定

デモ①ビデオを活用したコーヒーの淹れ方レクチャー

(引用:OpenAI公式HP)

OpenAIのCEOであるサム氏は、デモを通じて、ChatGPTがビデオを活用して対話する様子を紹介しました。

まず、音声モードを起動するため、ChatGPTアプリのチャットバー横にある音声アイコンをタップ。「高度な音声モード」を有効にすると、ChatGPTに音声や映像の入力を待機する画面が表示されます。

(引用:OpenAI公式HP)

ここで、左下のカメラボタンをオンにして、サム氏が「目の前に何があるか分かる?」とChatGPTに尋ねると、ChatGPTは「ケトルやドリッパーなどのコーヒーを入れるセットが見えます。コーヒーを入れようとしているのですか?」と即座に回答しました。

(引用:OpenAI公式HP)

その後、サム氏が「コーヒーを入れる手順を教えて」と頼むと、ChatGPTは「もちろん!まずはフィルターをドリッパーにセットします。続いて、熱湯を注いでドリッパーとマグカップを暖めてください。」と回答しました。

(引用:OpenAI公式HP)

その後も引き続き、「挽いたコーヒーをティースプーン2杯分フィルターに入れてください」「「熱湯はそっと注いでください」など、ChatGPTは的確なアドバイスを行い、その性能を示しました。

(引用:OpenAI公式HP)

デモ②画面共有を活用したアドバイス

(引用:OpenAI公式HP)

さらに、ChatGPTの画面共有機能を使ったデモも行われました。再度、ChatGPTを開いてチャットバーの横にある音声アイコンをタップして「高度な音声モード」を起動。

(引用:OpenAI公式HP)

その後、三点リーダー「…」ボタンをタップして、「Share Screen」をタップします。

(引用:OpenAI公式HP)

すると、「Screem Broadcast」画面が表示されるので「Start Broadcast」をタップ。これでChatGPTとの画面共有は完了です。

(引用:OpenAI公式HP)

画面共有が開始された状態で、サム氏がメッセージアプリを開き、「この写真について相手に何と伝えたらいい?」とChatGPTに質問。

すると、ChatGPTは「君のサンタの格好はクリスマスにピッタリだね!ホーホーホー!というサンタの掛け声の練習を続ければ、すぐにショッピングモールでサンタの仕事が舞い込んでくるよ!」とアドバイスをくれました。

発表②:高度な音声モードにサンタモードが追加

OpenAIは、年末限定の特別機能として、「高度な音声モード(Advanced Voice Mode)」にサンタの声で回答が得られる「サンタモード」を追加しことも発表しました

この新機能により、子どもたちの質問に答えたり、クリスマスの楽しい話題で会話を楽しんだりすることができます。陽気で親しみやすいサンタの声を再現したこのモードは、ホリデーシーズンにぴったりのユニークな体験を提供してくれるでしょう。

初めてサンタモードを利用する際には、利用者の「高度な音声モード」の使用制限が一度リセットされるため、すぐにサンタとの対話を開始できます。また、プライバシーに配慮して、サンタモードでの会話内容はチャット履歴に保存されません。OpenAIによると、2024年12月13日以降、サンタモードは高度な音声モードが利用できる全ユーザーに展開される予定です。

デモ:サンタモードでの会話例

(引用:OpenAI公式HP)

OpenAIのデモでは、同社の社員が「クリスマスでお気に入りの伝統行事は何ですか?」と質問。「サンタモード」のChatGPTは「すてきな質問だね!最もお気に入りの行事は、子どもたちが暖炉のそばに靴下を吊るすことだよ!」とまるでサンタクロースのように回答しました。

(引用:OpenAI公式HP)

また、白い髭をつけた社員を映して「この人についてどう思う?」と質問すると、ChatGPTは「とても素晴らしい口ひげだね!」とコメントするなど、サンタらしいユーモアを交えた返答が行われました。

サンタモードの利用方法

(引用:OpenAI公式HP)

サンタモードを利用する手順は以下の通りです。

  1. 雪の結晶アイコンをクリック
    1. ChatGPTのホーム画面に表示される雪の結晶アイコンをクリックします。
  2. 設定ページからサンタモードを選択
    1. 設定ページでサンタモードを選択すると、自動的にサンタの声で会話を楽しめるようになります。

今回のアップデートの背景

高度な音声モードのアップデートは、「12 Days of OpenAI」イベントの一環として発表されました。このイベントでは次のような新機能も紹介されています。

まとめ

「12 Days of OpenAI」のDay 6では、ChatGPTの「高度な音声モード(Advanced Voice Mode)」が大きく進化したことが発表されました。具体的には、新たに追加されたライブビデオおよび画面共有機能により、AIとの対話がさらに直感的で実用的になっています。

また、ホリデーシーズン限定の「サンタモード」が登場し、親しみやすく楽しいインタラクティブな体験が可能になりました。ぜひ、皆さんも「サンタモード」を活用して、楽しいクリスマスを過ごしましょう。

目次に戻る

タイトルとURLをコピーしました