#kamuicode

#kamuicode のメディアギャラリーアプリをビジョンモデルのqwen2-vl-7b-instructで解析して、画像の内容で検索できるようにカスタマイズしてみた✨ 街並み、女性などイメージで探せるのとローカルLLMで完結するのでフリーでいくらでもいける 解析(HTML > JS > py > API LMStudio)で caption/tags を生成 ├→ MySQL (メタデータ保存) ├→ Meilisearch (全文検索 / フィルタ) └→ Qdrantでベクトル化 してセマンティック検索 添付は画像解析して 全文検索、セマンティック検索それぞれで検索しているところ ベクトル化は日本語が得意というPreferred NetworksのPLaMo-Embedding-1Bを使ってみた AIが一般化されるまではPFNの製品に触れることなどまずないだろうと思っていたので感慨深い... 最初Ollamaでやったらいまいち安定せず、LMStudioにしたらサクサク行けた Meilisearchはめっちゃ速くて相性が良き
kk@study33,932 次观看 • 9 个月前
没有更多内容可加载

