Загрузка видео...

Не удалось загрузить видео

На главную

the FP8 values in your model after 50 layers of quantize/dequantize operations

102,533 просмотров • 1 год назад •via X (Twitter)

Комментарии: 10

Фото профиля tenderizzation
tenderizzation1 год назад

ty @Norapom04 for finding the clip

Фото профиля adheep
adheep1 год назад

Wait WTF it ended right

Фото профиля Viv
Viv1 год назад

the hidden residual stream came through in the end

Фото профиля adheep
adheep1 год назад

That third kid fucked it up

Фото профиля gslaller
gslaller1 год назад

Is this an illustration of the U-Net architecture?

Фото профиля mobicham
mobicham1 год назад

Waiting for the FP4 meme version 👀

Фото профиля c
c1 год назад

lmfao

Фото профиля Lost(e/employed)
Lost(e/employed)1 год назад

Isn’t quantization aware training adapted when they release a quantised model?

Фото профиля secemp
secemp1 год назад

do 1bit next

Фото профиля Satyansh
Satyansh1 год назад

chinese to japanese transition was smooth in the middle lmao

Похожие видео