Загрузка видео...

Не удалось загрузить видео

На главную

New Moondream 2B release! ✨ New features: - Long-form captioning - Open vocab tagging - Better counting, object detection, text understanding - Faster HF transformers inference

51,735 просмотров • 1 год назад •via X (Twitter)

Комментарии: 12

Фото профиля vik
vik1 год назад

Release notes Demo

Фото профиля AssemblyAI
AssemblyAI1 год назад

Announcing: Our most advanced speech-to-text model goes beyond accuracy to capture the real-world complexity of human conversation and deliver reliable, source-of-truth audio data. Explore Universal-2 updates 👇

Фото профиля Shannon Sands
Shannon Sands1 год назад

wen bolting on a diffusion model to an output head and generating ghibli

Фото профиля vik
vik1 год назад

investigating

Фото профиля snow
snow1 год назад

this is a really awesome release video btw, i love this format, pretty clean. gonna fit all the new features into moondream-zig :)

Фото профиля vik
vik1 год назад

possible to integrate xnnpack with zig code? they have good quant matmuls

Фото профиля bellicose_bestie
bellicose_bestie1 год назад

MLX???

Фото профиля vik
vik1 год назад

soon!

Фото профиля Solsticio
Solsticio1 год назад

How good is this for OCR?

Фото профиля vik
vik1 год назад

It was a big focus for this release, but we're only 10% of the way through OCR pretraining. I'd say it's decent but expect a ton more improvement coming soon!

Фото профиля Pratyush 🖇️ life/acc
Pratyush 🖇️ life/acc1 год назад

But can it ghiblify images? 😜

Фото профиля vik
vik1 год назад

watch this space

Похожие видео