ChatGPT-4o

2024年5月12日、ChatGPTがバージョンアップされ、4o(o:オムニ)になりました。
ChatGPT-4oの特徴を、本人に聞いてみたのですが、ChatGPT‐4までしか入っていないようでした。

そこで、OpenAIのウェブサイトから、特徴を挙げます。

●GPT-4o:「o」は「omni」の略

より自然な人間とコンピュータのインタラクションに向けた、テキスト、音声、画像、ビデオの任意の組み合わせを入力として受け入れ、テキスト、音声、画像の出力を任意の組み合わせで生成します。

音声入力:最短232ミリ秒で応答でき、平均320ミリ秒で人間の応答時間に近い応答が可能。

●会話:英語のテキストとコードでは GPT-4 Turbo のパフォーマンスに匹敵。英語以外の言語のテキストでは大幅に改善。

API :はるかに高速で 50% 安価です。GPT-4o は、既存のモデルと比較して、視覚と音声の理解に特に優れています。

私もさっそくいろいろ試してみましたが、とにかく、回答速度が速い!!

以下の動画は、OpenAIのデモです。

ChatGPTとの対話が成り立っています。レスポンスものろくて待っているという感じではありません。

この動画では、盲人が、スマホを道路に向け、タクシーを認識した結果がわかり、車に止まってのサインをし、乗るまでのシーンです。

AIがタクシーを認識し、知らせるスピードが速いから実現できることです。

ちなみに、私は、東大の今年の数学の入試問題を解いてもらいましたが、2問解いてもらって、正答率は、五分五分でした。数値計算は強いようですが、グラフ問題は弱いような気がします。

ぜひ、お試しください。

それにしても、この内容が世界同時に使えるようになったというのは、革命的だと感じます。

Google Geminiなど、他のAIとの競争も加速しそうです。その中で、日本は国産AIをしっかり確保していくことが大切ですが、まずは、こういった海外の先端的なAIを使えることがビジネスパーソンにとっても企業にとっても、学生にとっても、大切ではないかと感じました。

上部へスクロール