GPT-4oやDeepSeek-V3よりも高性能なAIモデル「Qwen2.5-Max」を中国IT大手のAlibabaがリリース｜GIGAZINE

IT / Hack

2025/01/31

« 強い。「20兆トークン以上の学習データを用いて事前トレーニングしたベースモデルに対して教師ありファインチューニング（SFT）やRLHFを施して作成されたMoEモデル」。