音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル（LLM）「AnyGPT」が登場 – GIGAZINE

IT / Hack

2024/02/26

音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル（LLM）「AnyGPT」が登場 – GIGAZINE

音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル（LLM）「AnyGPT」が登場 - GIGAZINE

« 初手からマルチモーダル。「AnyGPTはマルチモーダルLLMであるため、音声・テキスト・画像・音楽からさまざまな形式のデータを出力することができます」。