Googleが「大規模言語モデルに視覚を与える仕組み」について解説、メルカリと協力して作成したデモも公開 - GIGAZINE
«  すごい。「画像とテキストを共有埋め込み空間に配置」「この空間を利用すると、テキストから画像を検索したり画像からテキストを検索したりすることが可能」。
    

■ この記事を見た人はこんな記事も見ています