Video yükleniyor...

Video Yüklenemedi

Ana Sayfaya Dön

Gemma 3n (E4B) extracting key details from a train ticket directly on CPU, on-device

13,466 görüntüleme • 1 yıl önce •via X (Twitter)

10 Yorum

Google AI Developers profil fotoğrafı
Google AI Developers1 yıl önce

Our latest Gemma 3n model pushes the boundaries of multimodal AI, natively understanding and processing information from images, audio, and more. See Gemma 3n in action 🧵↓

Google AI Developers profil fotoğrafı
Google AI Developers1 yıl önce

Using Gemma 3n’s advanced image understanding to parse a receipt to extract structured JSON data

Google AI Developers profil fotoğrafı
Google AI Developers1 yıl önce

Gemma 3n listening to a train announcement in German and instantly translating it into clear English text. Perfect for real-time multilingual applications, when you need them most!

Google AI Developers profil fotoğrafı
Google AI Developers1 yıl önce

Start building with Gemma 3n:

Mike Copeland profil fotoğrafı
Mike Copeland11 ay önce

That’s a very practiced example. But looking forward to trying it out

macroiq profil fotoğrafı
macroiq11 ay önce

Add a few biometrics and an olfactory array and you have a tricorder Building this shit

The Dude profil fotoğrafı
The Dude11 ay önce

How to load it in the edge apk?

Stephen Harris profil fotoğrafı
Stephen Harris11 ay önce

Uhhuh

SunsetSyntax profil fotoğrafı
SunsetSyntax11 ay önce

That’s awesome

Hackscorpio profil fotoğrafı
Hackscorpio11 ay önce

It is very good model I can run and finetune in my 16gb gpu. I tried it and it solved the problem for my specific use case. Other small models get lost.

Benzer Videolar