Загрузка видео...
Не удалось загрузить видео
the FP8 values in your model after 50 layers of quantize/dequantize operations
102,533 просмотров • 1 год назад •via X (Twitter)
Комментарии: 10

tenderizzation1 год назад
ty @Norapom04 for finding the clip

adheep1 год назад
Wait WTF it ended right

Viv1 год назад
the hidden residual stream came through in the end

adheep1 год назад
That third kid fucked it up

gslaller1 год назад
Is this an illustration of the U-Net architecture?

mobicham1 год назад
Waiting for the FP4 meme version 👀

c1 год назад
lmfao

Lost(e/employed)1 год назад
Isn’t quantization aware training adapted when they release a quantised model?

secemp1 год назад
do 1bit next

Satyansh1 год назад
chinese to japanese transition was smooth in the middle lmao
