`transformers` + `torchao` quantization + `torch.compile` for faster inference... show more

Marc Sun
24,515 Aufrufe • vor 1 Jahr
Mac Studio M2 Ultra is best Apple Silicon ever... show more

Ivan Fioravanti ᯅ
11,041 Aufrufe • vor 1 Jahr
Wild. Llama 4 Maverick just went Beast Mode 🔥... show more

Charly Wargnier
36,463 Aufrufe • vor 1 Jahr
smolagents is now available in ai-gradio pip install ai-gradio[smolagents]==0.2.1... show more

AK
18,539 Aufrufe • vor 1 Jahr
We are thrilled to be a launch partner for... show more

Together AI
88,229 Aufrufe • vor 2 Jahren
Introducing DeepThought-8B: Transparent reasoning model built on LLaMA-3.1 with... show more

Ruliad
219,315 Aufrufe • vor 1 Jahr
Llama 3.3 70B is live on AkashChat. The latest... show more

Akash Network
16,463 Aufrufe • vor 1 Jahr
pip install spectralquant ✂️ Up to 6.62x KV cache... show more

ani
16,583 Aufrufe • vor 23 Tagen
Meta just announced that Code Llama was now free... show more

Lior Alexander
196,384 Aufrufe • vor 2 Jahren
.ollama is playing with AI at Meta Llama 4... show more

ollama
113,514 Aufrufe • vor 1 Jahr
Llama 3.2 is the latest open-source AI model from... show more

Akash Network
37,087 Aufrufe • vor 1 Jahr
Microsoft just a 1-bit LLM with 2B parameters that... show more

Shubham Saboo
260,049 Aufrufe • vor 1 Jahr
How much faster is the new MacBook Pro for... show more

Alex Cheema - e/acc
527,894 Aufrufe • vor 1 Jahr
Multimodal Meta AI is rolling out widely on Ray-Ban... show more

Ahmad Al-Dahle
176,223 Aufrufe • vor 2 Jahren
AGI at home Running DeepSeek R1 across my 7... show more

Alex Cheema
1,934,687 Aufrufe • vor 1 Jahr
The Meta Llama 3 Hackathon is this weekend in... show more

AI at Meta
50,762 Aufrufe • vor 2 Jahren
AI agents have arrived on Bittensor. Be the first... show more

Eternal AI
36,552 Aufrufe • vor 1 Jahr
The first natively trained 1-bit model: BitNet 2B. Trained... show more

Md Ismail Šojal 🕷️
43,647 Aufrufe • vor 3 Monaten
You can now run inference directly on the Llama... show more

Together AI
21,489 Aufrufe • vor 1 Jahr
The easiest way to use this new model is... show more

Paul Couvert
81,620 Aufrufe • vor 1 Jahr
MLX Swift LLM example works with: - Mistral /... show more

Awni Hannun
30,441 Aufrufe • vor 2 Jahren