音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場 - GIGAZINE
«  初手からマルチモーダル。「AnyGPTはマルチモーダルLLMであるため、音声・テキスト・画像・音楽からさまざまな形式のデータを出力することができます」。
    

■ この記事を見た人はこんな記事も見ています