Introducing VL-JEPA: Vision-Language Joint Embedding Predictive Architecture for streaming,... show more

Pascale Fung
90,033 görüntüleme • 5 ay önce
Our vision is for AI that uses world models... show more

AI at Meta
309,704 görüntüleme • 1 yıl önce
Today we’re releasing V-JEPA, a method for teaching machines... show more

AI at Meta
703,412 görüntüleme • 2 yıl önce
3D-LLM: Injecting the 3D World into Large Language Models... show more

AK
249,494 görüntüleme • 2 yıl önce
Introducing Jan-v2-VL, a multimodal agent built for long-horizon tasks.... show more

👋 Jan
130,228 görüntüleme • 6 ay önce
LFM2-VL support with GGUF and llama.cpp 🥳 You can... show more

Maxime Labonne
19,947 görüntüleme • 9 ay önce
We release Action100M, the hero behind VL-JEPA. It is... show more

Delong Chen (陈德龙)
103,384 görüntüleme • 4 ay önce
Here's my conversation with Yann LeCun (Yann LeCun) about... show more

Lex Fridman
1,021,936 görüntüleme • 2 yıl önce
Jan-v2-VL-Max-Instruct is out on 💛 Our newest 30B vision-language... show more

👋 Jan
23,063 görüntüleme • 5 ay önce
MotionGPT: Human Motion as a Foreign Language paper page:... show more

AK
125,311 görüntüleme • 2 yıl önce
Pretraining is essential for good performance on a wide... show more

RoboPapers
23,883 görüntüleme • 3 ay önce
Google presents AudioPaLM: A Large Language Model That Can... show more

AK
290,517 görüntüleme • 3 yıl önce
We trained a foundation model on 18 million heart... show more

Alif Munim (d/acc)
590,179 görüntüleme • 4 ay önce
VLA-JEPA just dropped in LeRobot 🤖 What makes this... show more

LeRobot
280,985 görüntüleme • 4 gün önce
Start building with Gemini Embedding 2, our most capable... show more

Google AI Developers
30,483,382 görüntüleme • 3 ay önce
We raised $1.5m to launch the world’s first LLM... show more

Yoeven
93,403 görüntüleme • 8 ay önce
Today, every Nomic-Embed-Text embedding becomes multimodal. Introducing Nomic-Embed-Vision: -... show more

CalCo
103,204 görüntüleme • 2 yıl önce
Check out our #ICRA2024 paper "Actor-Critic Model Predictive Control."... show more

Davide Scaramuzza
34,874 görüntüleme • 2 yıl önce
Introducing DINOv3: a state-of-the-art computer vision model trained with... show more

AI at Meta
899,338 görüntüleme • 10 ay önce
Yay, finally! Introducing Vision Banana🍌 from Google DeepMind, our... show more

Songyou Peng
282,710 görüntüleme • 1 ay önce
📣 Microsoft Research releases Florence-VL, a new family of... show more

Gradio
14,371 görüntüleme • 1 yıl önce