ChatGPTは日々進化しています。特に、2023年10月はChatGPTの大型アップデートがあり、全国ニュースでも取り上げられるほど大きな話題となっています。今回は2023年10月の大型アップデートの内容について紹介いたします。
※今回の大型アップデートの内容は有料版のChatGPTに関する内容です。本ブログの内容を確認されたい方は有料版ChatGPTにご登録ください。また、無料版のChatGPT-3.5をご利用の方は、以前に当サイトで紹介したブログ記事をご覧ください。
今回の大型アップデートで大きく更新されたことは、様々な形態の情報をChatGPTが認識できるようになったことです。右の図は、ChatGPTの情報のインプットとアウトプットを表した図です。ChatGPTなど多くのAIはテキストや画像など様々な形態の情報をインプットし、自身のAI機能で処理してから様々な形態の情報としてアウトプットします。ChatGPT-3.5や4の場合は、紫の囲みのようにテキストをインプットし、LLM(大規模言語モデル:滑らかな言語を生成するための機能)で処理してからテキストでアウトプットしています。
①ChatGPT-4V(赤枠)
ChatGPTはテキストだけでなく、画像も認識できるようになり、それを組み合わせて処理して回答できるようになりました。この機能は、今回のアップデートで「ChatGPTに目がついた」と大きな話題になっています。ChatGPT-4Vを使えば、テキストの条件に合わせて画像を分析してもらうことができ、新たな気付きを与えてくれます。また、職場の写真をアップロードすると作業の効率性を高める改善を提案してもらうことができます。画像認識ができるようになったことでさらに高度な分析やアイデア出しが可能となりました。
②DALL-E3(青枠)
ChatGPTに画像を作成するようにテキスト情報を与えると画像を作成します。パソコン上で画像を作成する場合、特別なスキルが必要になるため、ある程度の時間の余裕をもって外注する必要がありました。つまり、一般の人がデジタル上の画像を作成する場合、時間とコストをかけていました。しかし、DALL-E3を使うと、10秒足らずで画像を作成してくれます。また、外注の必要はなく、慣れれば自社で作成することができます。つまり、時間やコストを大幅に削減することができます。
③Voice conversations(緑枠)
音声をChatGPTにインプットすると音声でアウトプットされます。つまり、ChatGPTと会話することができます。将来的に音楽や会話の抑揚を認識できるようになるとアウトプットの条件をさらに絞ることができ、回答の精度が向上します。
④Web Browsing(黄枠)
ChatGPTがインターネットの情報を参照して回答してくれる機能です。本機能はテキストでインプットし、テキストでしかアウトプットできません。しかし、将来的には画像や音声もインプットできることで検索しやすくなり、画像や音声のアウトプットを得られることで分かりやすくまとめて回答を得ることができます。つまり、検索時間を大幅に短縮できると期待されています。
以上の4つが大型アップデートの内容になります。それぞれの業種で見ると大幅な生産性向上に役立つものもあると思いますが、現状はこれらの機能をビジネスでどのように生かせるのかを全世界の人が考案している状態です。弊社でも新たな生成AI情報が出るたびに情報提供しますが、その情報にすぐに対応できるように日々勉強し、生成AIに慣れておくことが重要になります。
経営コンサルタント
平田 紘基