Загрузка видео...
Не удалось загрузить видео
🔥Apple MLX first 6bit model is on Hugging Face!🔥 Qwen2.5-Coder-32B-Instruct-6bit! 3bit conversion and test in progress! Video 8x below on M4 Max 40GPU: - Prompt: 38 tokens, 61.731 tokens-per-sec - Generation: 1181 tokens, 16.939 tokens-per-sec - Peak memory: 25.122 GB
46,494 просмотров • 1 год назад •via X (Twitter)
Комментарии: 0
Нет доступных комментариев
Здесь появятся комментарии из оригинального поста
Похожие видео
0:15
Sensitive content
Don't miss out on HOTTEST AIRDROP! 🔥 First 10M $WHALE Tokens - Limited time available! Use Refer-a-friend program and get $WHALE Tokens, while you sleep! #crypto #airdrop #whaletoken
Whale
10,775 просмотров • 1 год назад
