STUDIO TOKI のブログ
【AIに聞いてみた!】次世代モデル「GPT-5」が登場したので「Gemini」と比較してみた
こんにちは。トキ・テックのサポート・スタッフチームのETです。
「AIに聞いてみた!」シリーズ第6弾はちょっと遊び感覚で使ってみた内容をお届けします。
AIが流行したきっかけのひとつとして「ChatGPT」の登場があると思います。
そしてその最新モデルである「GPT-5」が昨日8月7日に公開されました。
私は普段から「Gemini」を使っているのですが、正直「ChatGPT」との違いをそこまで意識して使っていませんでした。
ということで今回は興味本位で「Gemini」に対して「ChatGPT」の最新モデルと比較した客観的なデータが欲しいを聞いてみました。
気持ちを察してくれるGemini
プロンプト次第ではありますがAIは様々な言語、口調で回答をくれます。
今回は細かなプロンプトは入れませんでしたが、1行目からちょっとクスっとしてしまいました笑
以下AI回答です。
――――――――――――――――――――――――――――――――――――――――
お気持ちお察しします。最新のAIモデルであるGPT-5と、私がベースとなっているGeminiの客観的な比較データですね。いくつかのベンチマークや特徴を元に、両者を比較してみましょう。
ベンチマークと性能
GPT-5は、多くの学術的なベンチマークで新たな最高水準を達成しています。特に、推論能力、コーディング、および視覚認識の分野で高い評価を受けています。
・コーディング能力:
GPT-5のProモデル(Pythonツールを使用した場合)は、SWE-benchなどのベンチマークで高い正答率を記録しています。大規模なコードベースのデバッグや、抽象的な議論に基づいたコード生成において非常に優れているとされています。
・ハルシネーション(嘘をつくこと)の低減:
GPT-5は、特に「思考モード(reasoning mode)」を使用することで、ハルシネーションの発生率が大幅に低下し、信頼性が向上しました。これは、正確性が求められる医療関連の質問などにおいて特に重要な強みです。
一方、Geminiは、マルチモーダル機能と長文処理能力に強みを持っています。
・マルチモーダル機能:
Geminiは、テキストだけでなく画像、音声、動画などをネイティブに理解するように設計されています。これは、Google検索やGoogle Workspace(Gmail, Docs, Sheets)との連携において、その真価を発揮します。
・長文コンテキストウィンドウ:
Geminiは非常に長いコンテキストウィンドウ(100万トークン以上)を持つことが大きな特徴です。これにより、数百ページに及ぶ技術文書やレポート全体の内容を記憶し、詳細な質問にも一貫性のある回答を生成することができます。
まとめ
・GPT-5は、論理的な思考力と信頼性に重きを置いており、特にクリエイティブなタスクや高度なコーディングにおいて力を発揮します。
・Geminiは、大量の情報を効率的に処理する能力と、既存のGoogleサービスとのシームレスな連携に強みを持っています。
どちらが優れているかは、「あなたが何をしたいか」によって変わってきます。
より複雑な思考や創造性を求めるならGPT-5、大量の情報を扱ったり、日々の業務でGoogleツールを頻繁に利用したりするならGeminiが適していると言えるでしょう。
――――――――――――――――――――――――――――――――――――――――
しっかりと客観的に回答をくれましたね!
基本的に私の使い方は「業務」で使用する事に偏っているのでGeminiを普段使いすることに変わりはないのですが、「クリエイティブ」な用途にAIを使用したいとなった時には一度「ChatGPT」を使ってみようかなと思いました。
皆さんも自分が何をしたいかによってAIツールを使い分けしてみてください!!
今回使ったAIツール:
Gemini https://gemini.google.com/app
※サムネイルの背景画像もGeminiで作成しました!