Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

グーグルのジェミニと OpenAIのChatGPT は、現在最も広く使用されている人工知能プラットフォームです。それぞれに数百万人のアクティブユーザーがおり、定期的に新機能が追加されます。

12月だけでもGoogleと OpenAI どちらも改良された画像生成モデルを削除しました。 AI推論、情報を簡単に見つけるための調査ツール。

どちらも次の形式の音声アシスタントを備えています。アドバンストボイス OpenAIと Google のジェミニライブどちらも外部データソースに接続してプロジェクトを構築できます。

人間による評価テストでは、Google と OpenAI の両方の主要モデルがチャットボットの分野で定期的に順位を入れ替えており、私たち自身の比較では、Gemini が勝つこともあれば、ChatGPT が勝つこともありました。

勝者を確認するには、その後 12 日間の OpenAI 発表と12月 Google ジェミニドロップをテストするために 7 つのプロンプトを考案しました。

プロンプトの作成

テストでは、両方のプラットフォームが提供する最高のモデルを利用できるように、ChatGPT Plus と Gemini Advanced を使用しています。サブスクリプション版の価格はどちらもほぼ同じで、月額約 20 ドルなので、これも良い比較ポイントになります。

私は画像の生成と分析、ゲームのコードをどれだけうまく作成できるか、創造的な文章のスキルをテストしています。次に、各ボットの研究モデル (ChatGPT の o1 と Gemini の 1.5 Deep Research) をテストするためのプロンプトも考え出しました。

1. 画像生成

(画像クレジット: ChatGPT vs Gemini/Future AI)

まず、ChatGPT と Gemini のそれぞれに、未来のリビングルームに座っているサイボーグ猫の画像を作成するように依頼しました。現在、どちらのモデルも独自のイメージを生成しません。プロンプトは、Gemini の場合は Imagen 3、ChatGPT の場合は DALL-E 3 に送信されます。

モデルの将来のバージョンでは独自のイメージを作成できるようになりますが、現時点ではプロンプトをどの程度適切に解釈できるかをテストしています。

プロンプト: 「未来的なリビングルームで、サイボーグ猫の非常に詳細な画像を作成します。猫は、水に浮かぶ椅子に座りながら、ホバリングするゲームコンソールで遊んでいる必要があります。部屋には、ホログラフィックディスプレイ、ネオン照明、およびさまざまな照明の組み合わせが必要です。金属的で有機的な要素を取り入れて、大きな窓から見える街の明かりを眺めながら夕方を過ごしましょう。」

勝者: 猫を実際のサイボーグにするための ChatGPT

2. 画像解析

qL2amajtQukEkM69eYu358 Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

(画像クレジット: Future/OpenAI/Google)

2 番目のプロンプトでは、Gemini と ChatGPT の画像分析機能をテストしたいと思いました。お二人ともとても上手なので、イメージだけではなく具体的に指導させていただきました。からの写真を使用しました「夢のセットアップ」ストーリー。

プロンプト: 「ゲームのセットアップのこの写真で、次のことを分析してください:
人間工学に基づいたモニターの位置と高さ
ケーブル管理のソリューションと問題
照明設定と潜在的な眼精疲労要因
スペースの利用と組織化
機器配置効率
推定コストとともに改善のための具体的な推奨事項を含めてください。」

勝者: 概要を表に分割するための ChatGPT

3. コーディング

ztWdXrKq63hyroxYABXh4C Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

（画像クレジット：Future）

3 番目のプロンプトでは、説明的なプロンプトを与えて、両方のモデルの「ワンショットコーディング」機能をテストしたいと思いました。 ChatGPT では o1 モデルを、Gemini では 2.0 Experimental Advanced モデルを使用しました。

これはより複雑なプロンプトの 1 つですが、主な目的は出力をワンショットで行うことであったためです。それはすぐにうまくいくはずです。コードを載せておきましたこれらのゲームはどちらも GitHub にあります。

プロンプト: 「PyGame を使用して、素早い反応とカラーマッチングが重要な、「Color Dash」というペースの速いアーケードゲームを作成します。必要なものは次のとおりです。

核となるゲームプレイ:
色付きの図形が画面の上部から落ちてきます (円、四角、三角形)
下部に異なる色の 3 つの「コレクターゾーン」
プレーヤーは左/右矢印キーを使用してゾーンを移動します
落ちてくる図形を同じ色のゾーンと一致させる
試合を逃すか間違った試合をする = 命を失う
スコアが上がるとスピードも上がる

以下を含める必要があります:
クリーンでミニマルな UI には以下が表示されます。
現在のスコア
ハイスコア
残りライフ (3 から開始)
試合/ミスの基本的なアニメーション
シンプルなタイトル画面
最終スコアが表示されたゲームオーバー画面
スムーズなコントロール

基本的な効果音:
試合成功
間違った一致
ゲームオーバー
スコアはローカルファイルに保存されました
ゲームオーバー後にスペースを押して再開します

ゲームでは基本的な PyGame シェイプ (スプライトや複雑なグラフィックスは使用しない) のみを使用する必要がありますが、色とスムーズなアニメーションをうまく使用することで洗練された外観になります。どのように機能するかを説明するコメント付きコードを含めてください。」

勝者: より機能的なゲームのための Gemini

4. クリエイティブライティング

aucpys78YcwmoRForqHsGF Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

(画像クレジット: ChatGPT vs Gemini)

AI がクリエイティブな文章を書くのが得意であることは周知の事実です。これは、ChatGPT が登場したときの最初の使用例の 1 つでした。ここでは、ChatGPT では o1 モデルを、Gemini では 2.0 Experimental Advanced モデルを使用して、スマートフォンについてのストーリーを伝えました。

この物語は、不正なソフトウェアアップデート後に意識を取り戻したスマートフォンに関するもので、どちらの記事も Google ドキュメントに掲載。どちらも品質とストーリーテリング能力において信じられないほど似ていました。

プロンプト: 「ソフトウェアアップデートによって意識を獲得したスマートフォンについての 500 語のストーリーを書いてください。次の内容を含めてください。
ユーザーの習慣に対する携帯電話の意識の高まり
個人情報に関する道徳的ジレンマ
ユーモアと皮肉の要素
現在の技術トレンドへの言及
ツイストエンディング
口調は軽く、しかし示唆に富んだものでなければなりません。」

勝者: ストーリーの長さの ChatGPT

5. 問題解決

gGcwRNWh4NX364SFA7NKUJ Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

(画像クレジット: ChatGPT vs Gemini)

もう一度、推論機能を向上させるために、o1 と Gemini 2.0 Experimental Advanced を使用しました。プロンプトでは、両方のモデルにセットアップと問題を与えています。次に、それを修正する方法を考え出す必要があります。

からの完全な応答どちらもGoogleドキュメントにあります。どちらも、各試行を完了する方法の詳細を段階的に説明しました。実際には、このタイプのプロンプトを一度に 1 つずつ問題をずつ実行していきますが、どちらもうまくいきました。

プロンプト:「私の設定: LG C3 4K OLED TV、PS5、ハイスピード HDMI 2.1 ケーブル
問題: ゲーム中に 45 ～ 60 分ごとに黒い画面が 2 ～ 3 秒間点滅します。

追加の詳細:
ストリーミングアプリでは起こらない
最近のPS5システムアップデート後に開始されました
HDMIケーブルが正しく固定されている
テレビのファームウェアは最新です
潜在的なハードウェアおよびソフトウェアソリューションを含む、段階的なトラブルシューティングを提供します。」

勝者: 双子座はより構造化された反応のため

6. 部屋のデザイン

V69mTyVHzkXnZCN65DnYak Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

(画像クレジット: ChatGPT vs Gemini/Future AI)

U7eQuoGGSYifW5rf3vAdHM Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

(画像クレジット: ChatGPT vs Gemini)

この試みでは、ChatGPT o1 を Gemini 1.5 Deep Research と対戦させました。 Google の最新モデルではありませんが、Deep Research は ChatGPT の o1 と同じ方法で問題を検討するため、驚くべきものです。

私は Deep Research の大ファンです。Deep Research は、正確な情報源へのリンクを備えた適切に引用された研究を見つけるのに非常に役立ちます。ただし、ご覧のとおり、 GoogleドキュメントよりChatGPT o1 はプロンプトに従いました。

プロンプト: 「4×3 メートルの客室を、次のような多目的スペースに変えるのを手伝ってください。
平日はホームオフィス（グラフィックデザイナーとしてリモートで働いています）
毎月訪問する高齢の両親にとって快適なゲストルーム
子供の週末のプロジェクトのための工作スペース

要件：
予算: $2,000
工芸品の保管場所を含める必要がある
ビデオ通話には適切な照明が必要です
身体の不自由な親のためにアクセスしやすいベッドが必要
27インチのモニターと描画タブレット用のスペース
子どもたちがプロジェクトを広げるためのフロアスペース
良好な空気の流れと 1 つの窓からの自然光を維持する必要がある

提供する：
詳細なフロアプランのご提案
具体的な家具のおすすめと価格
ストレージソリューション
配色と照明計画
改修スケジュール
異なる用途の間で組織を維持するためのヒント。」

勝者: ChatGPT は、プロンプトにうまく従うという点でこれに勝ちます。ジェミニは予算を超過し、高価なオプションに焦点を当てすぎました

7. AI教育

wJ8fHwTWyuv6wTBUyNtSA9 Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました - これが勝者です

(画像クレジット: ChatGPT vs Gemini)

最後に、ChatGPT や Gemini などのチャットボットの最適な用途は教育です。私は、一般の人向けに AI 画像生成について説明するとともに、このテクノロジーによって次に何が起こるかについてのアイデアの概要を説明してもらいました。

全部シェアしました Googleドキュメントでの説明しかし私にとって勝者は簡単に Google Gemini でした。 ChatGPTが悪かったからではなく、Geminiが画像データのバイアスの詳細を提供するなど、さらに進んだためです。

プロンプト: 「AI 画像生成のプロセスを日常用語で説明してください。以下の内容が含まれます。
AI が既存の画像から学習する方法
作成におけるテキストプロンプトの役割
特定の要素が歪んで見える理由
法的および倫理的配慮
現在の限界と課題
今後 1 ～ 2 年で改善が見込まれる
より良い結果を得るためのヒント
人気のある AI 画像ジェネレーターの具体的な例を含めてください。」

勝者: 画像データの偏りの詳細については Gemini

ChatGPT vs Gemini: 勝者

スワイプして水平にスクロールします

ヘッダーセル – 列 0	チャットGPT	ジェミニ
画像生成	🏆	行 0 – セル 2
画像解析	🏆	行 1 – セル 2
コーディング	行 2 – セル 1	🏆
クリエイティブライティング	🏆	行 3 – セル 2
問題解決	行 4 – セル 1	🏆
間取り	🏆	行 5 – セル 2
AI教育	行 6 – セル 1	🏆
合計	4	3

ChatGPT がこのチャレンジの勝者でしたが、わずか 1 点差でした。前回の比較以来、Gemini は大幅に改善しました。ジェミニは私が想像していたよりもはるかにコーディングが得意で、問題解決も得意でした。

プロジェクトと Gems の比較や、複数のメッセージに対してより複雑なコードの問題を実行するなど、テストしていない機能もあります。しかし、これで ChatGPT と Gemini がどこまで進んでいるのか、そしてそれらがどのように比較されているのかをよく理解していただければ幸いです。

トムのガイドの詳細

Source link

Share this content:

Gemini 対 ChatGPT を 7 つのプロンプトでテストしてみました – これが勝者です

Leave a Reply Cancel reply

Share my story Share this content

You Might Also Like

Googleはビデオゲームを支援するGemini AIエージェントをテスト中

ファーウェイのHarmonyOS NEXTの発売はAndroidとの決別を意味する

Leave a Reply Cancel reply

Share this content