日進月歩のAI市場。Open AIがGPT-4.5を発表!

ここ最近は、AI関連のコラムが多くなって興味のない方にとっては、??となっているかもしれません。
ただ私たちにとって、いや誰にとってもAI技術の進化を追わないということは、生産性を上げることを拒否することと同意だと思います。

実際に使いこなせなかったとして、「何ができるのか?」は絶対に知っておく必要があります。

さて、表題にも書きましたが本日Open AIから発表になった「GPT-4.5」について考えてみたいと思います。

GPT-4.5は、以前のモデルと比較して、能力と安全性においていくつかの進化が見られます。
以下にその詳細をまとめます。

■能力の進化:
•より自然な対話。GPT-4.5は、より自然な対話が可能になるように設計されており、ユーザーの意図をより良く理解し、感情的な知性が向上しています。

•知識ベースの拡大。GPT-4.5は、より広範な知識ベースを持ち、少ないハルシネーションで、執筆、プログラミング、実用的な問題解決などのタスクに適しています。
*ハルシネーションとは?:事実に基づかない、または現実には存在しない情報を生成すること*

•創造性と美的直感の向上。GPT-4.5は、美的直感と創造性が向上しており、ユーザーの創造的な執筆やデザインを支援するのに優れています。

•多言語パフォーマンスの向上。GPT-4.5は、多言語MMLU評価においてGPT-4oを上回っています。

■安全性の進化:

•安全評価。GPT-4.5は、有害性、 jailbreakに対するロバスト性、ハルシネーション、バイアスに関する安全評価を受けています。

•有害コンテンツの拒否。GPT-4.5は、有害コンテンツの要求に対する拒否において、GPT-4oと同等の性能を示しています。

•Jailbreakに対するロバスト性。GPT-4.5は、既知のJailbreakに対するロバスト性において、GPT-4oに近い性能を示しています。

•命令階層の遵守。GPT-4.5は、プロンプトインジェクションやその他の攻撃がモデルの安全指示を上書きするリスクを軽減するために、命令階層を遵守するように訓練されています。システムメッセージの指示をユーザーメッセージよりも優先するように学習しています.

•レッドチーミング評価。GPT-4.5は、敵対的なJailbreakに対する評価において、GPT-4oよりもわずかに高い性能を示しています。

■リスクの増加:
•全体的なリスク評価。GPT-4.5は、能力と安全性の両面で改善が見られる一方で、特定のリスクも増加させています。
OpenAI Preparedness Frameworkの下で、事前緩和モデルは説得とCBRNにおいて中程度のリスクとして分類されています。
全体として、GPT-4.5は中程度のリスクと評価されており、適切な安全対策が講じられています。

•CBRN(化学・生物・放射性・核兵器)リスク。GPT-4.5は、専門家が既知の生物学的脅威を再現するための運用計画を支援できることが評価で判明し、中程度のリスク閾値を満たしています。

全体として、GPT-4.5は以前のモデルと比較して、能力と安全性の両面で進化していますが、特定のリスクも認識されており、適切な安全対策が講じられています。

と少し難しい箇所もあったかと思いますが、簡単にいうとより人間の感性に近づいた、しかも安全性を担保した上で、誤った回答をする頻度も劇的に改善されたということです。

現状は、月額費用が200ドル(約3万円)の「ChatGPT Pro」の利用者向けのサービスとなっているが、
来週には数万台のGPUを追加する予定で、月額20ドル(約3000円)の「Plus」の利用者向けにもGPT-4.5を利用できるようになると言われています。

1週間で対応してしまうあたりが、AI業界のとてつもないスピード感をユーザーとして体感することができますね。

ChatGPT Proは契約していないので、Plusで利用できる様になったら使用感をまた共有させていただきます!

ほんとめまぐるしい変化の時代ですね。