Microsoft just a 1-bit LLM with 2B parameters that... show more

Shubham Saboo
260,049 просмотров • 1 год назад
You are not prepared for this, 250+ tokens/sec, 1B... show more

anton
372,371 просмотров • 2 лет назад
LightVAE + ComfyUI node: High-performance video VAE; runs 2–3x... show more

Wildminder
38,092 просмотров • 8 месяцев назад
LM Studio 0.3.4 ships with Apple MLX 🚢🍎 Run... show more

LM Studio
171,777 просмотров • 1 год назад
Llama 3.2 1B in 4-bit runs at ~60 toks/sec... show more

Awni Hannun
492,413 просмотров • 1 год назад
GPT-4o level multimodal LLM running on your phone. MiniCPM-V... show more

Shubham Saboo
18,112 просмотров • 10 месяцев назад
How much faster is the new MacBook Pro for... show more

Alex Cheema
529,673 просмотров • 1 год назад
Latest mlx-lm has faster and lower memory prompt processing!... show more

Awni Hannun
22,156 просмотров • 1 год назад
`transformers` + `torchao` quantization + `torch.compile` for faster inference... show more

Marc Sun
24,515 просмотров • 1 год назад
Today Meta released "Code Llama", a large language model... show more

Marcel Pociot 🧪
50,094 просмотров • 2 лет назад
RAG is not Memory for AI Agents. 5 AI... show more

Unwind AI
85,045 просмотров • 10 месяцев назад
Llama 3.2 is the latest open-source AI model from... show more

Akash Network
37,087 просмотров • 1 год назад
Microsoft is testing a new feature in Windows 11... show more

Pirat_Nation 🔴
145,459 просмотров • 1 месяц назад
You can run and monitor Claude Code from literally... show more

Unwind AI
15,573 просмотров • 10 месяцев назад
Meta released LongVU: a new video LM that can... show more

merve
49,546 просмотров • 1 год назад
RAG engine that just works for complex real-world documents.... show more

Shubham Saboo
45,212 просмотров • 1 год назад
Indian man finds romance with Fido while his H-1B processes

LXXPBUH*
4,830,005 просмотров • 1 год назад
Perplexity's Sonar—built on Llama 3.3 70b—outperforms GPT-4o-mini and Claude... show more

Perplexity
565,953 просмотров • 1 год назад
I just created my own LaTeX-OCR app using Llama... show more

Avi Chawla
15,610 просмотров • 1 год назад
RAG is not Memory. AI agents need long-term memory... show more

Unwind AI
293,513 просмотров • 1 год назад