Alibabaは、その新しいAIモデルがDeepseek&Chatgptを上回ると主張しています

急速に成長している人工知能(AI)業界で競争する大胆な動きで、中国の技術会社Alibabaは水曜日にAIモデルの新しいバージョンであるQwen 2.5-Maxを立ち上げ、DeepseekのAIのような有名なモデルのパフォーマンスを上回ったと主張しました。 、OpenaiのGPT-4Oとメタのラマ。

多くの中国人が伝統的に仕事をして家族と過ごす時間である月の新年の初日にQwen 2.5-Maxのリリースは、過去3週間のプレッシャーディープセックの流星の上昇を戦略的に強調しています。 Tencent Holdings Ltd.やBaidu Inc.など、海外のライバルだけでなく、国内の競合他社のみも

同社の新しいモデルは、20兆以上のトークンで開発されており、キュレーションされた監視付き微調整(SFT)と人間のフィードバック(RLHF)の方法論からの強化学習でさらに訓練を受けたと伝えられています。

「Qwen 2.5-Maxは、ほぼ全面的にGPT-4o、Deepseek-V3、Llama-3.1-405bを上回っています」とAlibabaのクラウドユニットは、OpenaiやMetaのような国際的な巨人を参照する公式WeChatアカウントに投稿された発表で述べています。

Alibabaは、QWEN2.5-MAXがArena-Hard、LiveBench、LiveCodebench、GPQA-Diamondなどの複数のベンチマークでDeepSeek V3を上回ることを発表しました。

また、MMLU-Proを含む他の評価で印象的な結果を示しました。

同社の基本モデルは、大部分のベンチマークにわたって大幅な改善を示しており、トレーニング後の方法の進歩により、QWEN2.5-MAXの次のバージョンがパフォーマンスのレベルをさらに高めると確信しています。

「ベースモデルを比較すると、GPT-4OやClaude-3.5-Sonnetなどの独自モデルにアクセスできません。したがって、主要なオープンウェイトMOEモデルであるDeepSeek V3、Llama-3.1-405B、最大のオープンウェイト密度モデル、およびQWEN2.5-72Bに対してQWEN2.5-MAXを評価します。同社はaで述べたブログ

さらに、AlibabaのQwen氏は次のように付け加えました。

これはすべて、2023年にアリババの故郷の杭州で設立された中国の新興企業であるDeepseekによるものです。

DeepSeek-V3およびR1モデルのリリースにより、Deepseekは米国のAIの風景全体に衝撃波を送りました。

また、投資家が米国を拠点とする企業からの費用のかかるAIプロジェクトの実行可能性に疑問を呈しているため、大幅な低コストとコンピューティングパワーのためにすぐに世界的に注目されています。

中国での新興企業の成功は、国のハイテク大手間の激しい競争を引き起こしました。

たとえば、DeepseekがR1モデルを開始してからわずか2日後、Tiktokの親会社のバイテダンスは、フラッグシップAIモデルの更新で応答し、AIのOpenaiのO1をAIEのOperformmartテストで、複雑な指示の理解と実行におけるAIのパフォーマンスを評価し、実行する重要なベンチマークテストで応答しました。 。

しかし、Deepseekはすでに独自の大胆な主張を行っており、R1モデルが複数のパフォーマンスベンチマークでOpenaiのO1に匹敵するか、上回ることができると主張しています。