Video wird geladen...

Video konnte nicht geladen werden

Beim Laden dieses Videos ist ein Problem aufgetreten. Dies könnte an einem vorübergehenden Netzwerkproblem liegen oder das Video ist möglicherweise nicht verfügbar.

MiMo-V2.5-Pro UltraSpeed的速度快得有点太过分了，代码写的太快就像龙卷风…… 和其他厂商不一样，小米这是Pro模型直接出来1000token/s，不是flash模型。恐怕在世界范围内也是第一次吧。从来没见过这么快的速度。网页版在这里有API

刘小排

28,788 subscribers

88,142 Aufrufe • vor 1 Monat •via X (Twitter)

Wissenschaft & Technologie

Anya Rossi• Live Now

Private livecam show

0 Kommentare

Keine Kommentare verfügbar

Kommentare vom Original-Post werden hier angezeigt

Ähnliche Videos

30 秒，21 个 $SOL 我盯盘三年，没见过这种手速。看来现在的战场，拼的就是快进快出。问题是，我快进快出是亏钱，人家快进快出是印钱。同样的操作，不一样的结果。币圈从不缺天才，缺的是我这种给他当燃料的。

30 秒，21 个 $SOL 我盯盘三年，没见过这种手速。看来现在的战场，拼的就是快进快出。问题是，我快进快出是亏钱，人家快进快出是印钱。同样的操作，不一样的结果。币圈从不缺天才，缺的是我这种给他当燃料的。

MeMe研习社

44,177 Aufrufe • vor 3 Monaten

那个啥，，，，我看不出来和老的模型有什么区别啊。。。。，除了合成的时候速度快了一点。。

那个啥，，，，我看不出来和老的模型有什么区别啊。。。。，除了合成的时候速度快了一点。。

Station Cat

16,770 Aufrufe • vor 1 Monat

Kimi K3生成的效果，第一次生成的有明显缺陷，这是修复了一轮后的效果。快进快退实际还是有问题的。整体不错，但是速度太太太慢了，这么个前端任务跑了1个小时，Fable我记得也就20分钟。在线体验： Github：

Kimi K3生成的效果，第一次生成的有明显缺陷，这是修复了一轮后的效果。快进快退实际还是有问题的。整体不错，但是速度太太太慢了，这么个前端任务跑了1个小时，Fable我记得也就20分钟。在线体验： Github：

Gorden Sun

37,525 Aufrufe • vor 17 Tagen

战斗机一样！太快了！两天前，谷歌开源了应该是世界最小的AI模型【Gemma-3-270M】，很小，连500MB都不到，刚刚我下载玩了以后！太快了！速度！中文能力很差，但是英文不错，尤其是写代码。

战斗机一样！太快了！两天前，谷歌开源了应该是世界最小的AI模型【Gemma-3-270M】，很小，连500MB都不到，刚刚我下载玩了以后！太快了！速度！中文能力很差，但是英文不错，尤其是写代码。

Inty News

61,753 Aufrufe • vor 11 Monaten

这是中国内地的一家大型养猪场，这里的猪从没见过太阳，没淋过雨，没吹过风，没见过蓝天白云，一辈子走的路不到一米。

这是中国内地的一家大型养猪场，这里的猪从没见过太阳，没淋过雨，没吹过风，没见过蓝天白云，一辈子走的路不到一米。

作家崔成浩

251,546 Aufrufe • vor 4 Monaten

视频车主在事发前偶遇这辆小米SU7，过弯道时还甩尾了，一起等红绿灯时听到小米车里有人在大吼大叫… 网友：小米车的四轮扭矩配平肯定有问题！这个缓弯，车速也不太快，加速度也不算太快，怎么就能甩起来呢？

视频车主在事发前偶遇这辆小米SU7，过弯道时还甩尾了，一起等红绿灯时听到小米车里有人在大吼大叫… 网友：小米车的四轮扭矩配平肯定有问题！这个缓弯，车速也不太快，加速度也不算太快，怎么就能甩起来呢？

希望之聲 - 中國時局

28,570 Aufrufe • vor 9 Monaten

单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusion 大模型的同学科普一下, 传统大模型都是一个字一个字吐出来的, 而 Diffusion 大模型则是如同刮奖一样, 是一片一片出来的, 速度高是 Diffusion 大模型的优点. 有得必有失, 缺点当然就是输出质量没有传统大模型好了. 不过这次的 Diffusion Gemma 还是比之前的 Diffusion 文本大模型好不少, AIME 2026(数学能力测试) 能达到 Gemma4-26B-A4B 的94%的水平, 最差的是tau2 bench(考验Agent能力的测试), 也能达到82%. 这个模型大小 4bit 量化版本 16G 显存就能运行了, 另外, 我突发奇想, 这个模型能不能作为 gemma4 dense 模型的草稿模型用来投机解码? 感兴趣的同学可以试试! #diffusiongemma #gemma #gemma4 #google

单卡 700TPS! Diffusion Gemma 来了! Google 刚刚发布了 Gemma 小模型的 Diffusion 版本! 大小26B, 激活参数量4B, 最重要的是, 这次还跟 NVIDIA 合作针对4090和5090优化了一波, 5090每秒能生成700+token! 给不知道什么是 Diffusion 大模型的同学科普一下, 传统大模型都是一个字一个字吐出来的, 而 Diffusion 大模型则是如同刮奖一样, 是一片一片出来的, 速度高是 Diffusion 大模型的优点. 有得必有失, 缺点当然就是输出质量没有传统大模型好了. 不过这次的 Diffusion Gemma 还是比之前的 Diffusion 文本大模型好不少, AIME 2026(数学能力测试) 能达到 Gemma4-26B-A4B 的94%的水平, 最差的是tau2 bench(考验Agent能力的测试), 也能达到82%. 这个模型大小 4bit 量化版本 16G 显存就能运行了, 另外, 我突发奇想, 这个模型能不能作为 gemma4 dense 模型的草稿模型用来投机解码? 感兴趣的同学可以试试! #diffusiongemma #gemma #gemma4 #google

karminski-牙医

12,374 Aufrufe • vor 1 Monat

刚找到时间录个视频，现在用的是小米官方 mimo 的模型哈，免费的，但是，还是挺快的！这个视频我没有加速一会儿发 0.5.4 哈，发现小米模型 tool message 格式还是要适配一下，0.5.3 会有概率出错~

刚找到时间录个视频，现在用的是小米官方 mimo 的模型哈，免费的，但是，还是挺快的！这个视频我没有加速一会儿发 0.5.4 哈，发现小米模型 tool message 格式还是要适配一下，0.5.3 会有概率出错~

Wey Gu 古思为

10,271 Aufrufe • vor 7 Monaten

第一站是来到了他们第一次约会的地方，博物馆，本来想让他出镜的但是他过于害羞就没有拍到他，我也是第一次来博物馆，也没有想到这里的人居然这么多，并且这里还十分亮堂，还是挺担心被看出来的，不过mask本身就不够那么逼真，只要稍微看仔细点都可以看出来问题的，不过那又如何？

第一站是来到了他们第一次约会的地方，博物馆，本来想让他出镜的但是他过于害羞就没有拍到他，我也是第一次来博物馆，也没有想到这里的人居然这么多，并且这里还十分亮堂，还是挺担心被看出来的，不过mask本身就不够那么逼真，只要稍微看仔细点都可以看出来问题的，不过那又如何？

盐也#

51,404 Aufrufe • vor 1 Jahr

这个3D模型是我见过目前最屌的模型了，一盘竟然全部把整个结构打出来，带这个轴体它都是全部一次打出来的，太牛逼了

这个3D模型是我见过目前最屌的模型了，一盘竟然全部把整个结构打出来，带这个轴体它都是全部一次打出来的，太牛逼了

Andy Stewart

14,559 Aufrufe • vor 2 Monaten

昨天发了一个视频，看到评论里有人问：你都在用 Claude Code 了，为什么还要用国内的 Coding Plan？对我来说，这不是一个二选一的问题，而是一个补充题。大家都知道御三家的硬实力更强，这点没什么好争议的。但很多日常场景里，国产模型其实已经能在速度、质量、成本之间取得一个不错的平衡。比如文本处理、资料整理、基础 coding、简单 agent 任务，这类占日常 80% 的工作，很多时候并不一定非要上最贵的模型。对大多数中国用户来说，国产模型更顺手，速度也够，价格还低不少。还有一个经常被忽略的点，其实是处理速度。我自己实测下来，国内这些模型在一些简单任务上，接口响应和首字速度都很快。像翻译、语音输入后的文本修正、基础润色、简单改写这类高频小任务，用起来其实很舒服。你并不需要每一次都把最贵、最强的模型拉出来跑一遍。另外我觉得，现在国内头部几家 AI 厂商，已经不是“能不能做”的问题了。无论是阿里还是字节，一方面有足够的算力和基础设施，另一方面本身也有持续做模型研发和产品迭代的能力。所以在很多高频、日常、成本敏感的场景里，把国产模型纳入自己的工具链，本来就是很自然的事。所以我现在的看法一直都不是“国产替代”或者“二选一”，而是按场景分工：复杂、高价值任务交给最强模型；大量日常、重复、成本敏感的任务，用国产模型做补充，我觉得这反而是更现实、也更科学的用法。

昨天发了一个视频，看到评论里有人问：你都在用 Claude Code 了，为什么还要用国内的 Coding Plan？对我来说，这不是一个二选一的问题，而是一个补充题。大家都知道御三家的硬实力更强，这点没什么好争议的。但很多日常场景里，国产模型其实已经能在速度、质量、成本之间取得一个不错的平衡。比如文本处理、资料整理、基础 coding、简单 agent 任务，这类占日常 80% 的工作，很多时候并不一定非要上最贵的模型。对大多数中国用户来说，国产模型更顺手，速度也够，价格还低不少。还有一个经常被忽略的点，其实是处理速度。我自己实测下来，国内这些模型在一些简单任务上，接口响应和首字速度都很快。像翻译、语音输入后的文本修正、基础润色、简单改写这类高频小任务，用起来其实很舒服。你并不需要每一次都把最贵、最强的模型拉出来跑一遍。另外我觉得，现在国内头部几家 AI 厂商，已经不是“能不能做”的问题了。无论是阿里还是字节，一方面有足够的算力和基础设施，另一方面本身也有持续做模型研发和产品迭代的能力。所以在很多高频、日常、成本敏感的场景里，把国产模型纳入自己的工具链，本来就是很自然的事。所以我现在的看法一直都不是“国产替代”或者“二选一”，而是按场景分工：复杂、高价值任务交给最强模型；大量日常、重复、成本敏感的任务，用国产模型做补充，我觉得这反而是更现实、也更科学的用法。

luolei

32,566 Aufrufe • vor 4 Monaten

更新一下：众所不周知这个炮机是有20种模式的，我当时玩到一半突然想试一下，就按了模式1，从很慢很慢的速度突然高速爆炒，真的爆炒，我完全没反应过来，就这样纯抽插高潮了，这次不是因为我秒，太夸张了。结束之后小腹痛……第一次感觉到这就是打桩机啊（可是好爽 #女喘 #手冲实录

更新一下：众所不周知这个炮机是有20种模式的，我当时玩到一半突然想试一下，就按了模式1，从很慢很慢的速度突然高速爆炒，真的爆炒，我完全没反应过来，就这样纯抽插高潮了，这次不是因为我秒，太夸张了。结束之后小腹痛……第一次感觉到这就是打桩机啊（可是好爽 #女喘 #手冲实录

涩涩废物

32,268 Aufrufe • vor 1 Jahr

刚刚，在本地下载了一个阿里巴巴的AI 开源模型 Qwen3，速度非常快，但是这个模型被练就成了中央党校的3好学生。😀

刚刚，在本地下载了一个阿里巴巴的AI 开源模型 Qwen3，速度非常快，但是这个模型被练就成了中央党校的3好学生。😀

Inty News

34,872 Aufrufe • vor 11 Monaten

Gemini-3.5-flash发布! 价格直接翻三倍? Google I/O 开始啦! 今天上来就是模型发布, Gemini-3.5-flash 直接全量上线了. 价格直接从 gemini-3-flash 的每百万 Token 输入/输出 $0.50 / $3 涨到了 $1.5 / $9, 那么性能有提示吗? 我简单测了几个例子, 目前来看体感处于 Genini-3.0-pro 和 Gemini-3.1-Pro 之间 (测试用的是 Thinking level: high) 不过稳定性就差很多了, 3D 渲染的 shader 它怎么都写不对, 我只能手动修了一下才能运行视频中这个火山喷发演示. 从目前 Gemini 系列模型迭代来看, Google 可能更想学 Anthropic, 搞三个档次. flash-lite 会取代之前 flash 的位置. 而 flash 更可能是主打一百万上下文内不设置阶梯定价, 承接 pro 这部分溢出的用户. 而本身编程性能上距离 pro 还有点差距. Pro 自然就是旗舰级别模型了. 不过现在这个定价来看, 可能这次 flash 更多是为了跟这次一起发布的 Antigravity CLI 一起搭配用的. 做 claude code 中 sonnet 模型的生态位置. #geminiflash35 #geminiflash #googleio

Gemini-3.5-flash发布! 价格直接翻三倍? Google I/O 开始啦! 今天上来就是模型发布, Gemini-3.5-flash 直接全量上线了. 价格直接从 gemini-3-flash 的每百万 Token 输入/输出 $0.50 / $3 涨到了 $1.5 / $9, 那么性能有提示吗? 我简单测了几个例子, 目前来看体感处于 Genini-3.0-pro 和 Gemini-3.1-Pro 之间 (测试用的是 Thinking level: high) 不过稳定性就差很多了, 3D 渲染的 shader 它怎么都写不对, 我只能手动修了一下才能运行视频中这个火山喷发演示. 从目前 Gemini 系列模型迭代来看, Google 可能更想学 Anthropic, 搞三个档次. flash-lite 会取代之前 flash 的位置. 而 flash 更可能是主打一百万上下文内不设置阶梯定价, 承接 pro 这部分溢出的用户. 而本身编程性能上距离 pro 还有点差距. Pro 自然就是旗舰级别模型了. 不过现在这个定价来看, 可能这次 flash 更多是为了跟这次一起发布的 Antigravity CLI 一起搭配用的. 做 claude code 中 sonnet 模型的生态位置. #geminiflash35 #geminiflash #googleio

karminski-牙医

23,013 Aufrufe • vor 2 Monaten

Qwen3-Next-80B-A3B 实测! 能跟头部模型对打吗? 直接说结论, 能完成我这个大象牙膏测试的一部分, 已经很厉害了, Python 杯子倒水那个测试表现也可圈可点. 来看测试中暴露出来的问题: 首先这个模型生成的样式特别多变, 可以看测试中生成的前端页面的样式和布局, 几乎每次都不一样. 所以实际使用中, 可能会存在稳定性的问题, 建议 prompt 中多做约束, 避免模型过度发挥. 不过这并不全是坏处, 如果拿这个大模型写文, 反而可能会超常发挥, 每次写出来的东西都不一样, 不会呆板. 另外目前发现最大的问题是, 给到模型一大堆数据, 让模型整理一个网页, 结果模型偷懒了, 直接把代码和数据省略掉了, 这个应该还是 GPT-4 时代的问题 (24年上半年) 出现了. 这里猜测可能是高稀疏性专家混合模型或者多词元预测造成的问题, 这两个都会在生成中选择最经济的生成模式, 因此可能会倾向于生成"此处代码省略"这样的代码来替代原本要生成一大堆代码的场景. 召回倒是没太大问题, 鞭炮连锁爆炸那个测试, 虽然模型没有成功写出来, 但是最长的一次还是生成了1100行代码, 我仔细看了下, 基本都考虑到了我 prompt 中要求的逻辑, 只不过实现的代码有 bug 跑不起来而已. 综合来讲, 我觉得这应该是 100B 以内的模型无敌手了, 考虑到定位可能是个新的技术试验模型, 所以期待千问推出更大规模 (例如400B-A15B) 的模型, 带来更好的性能. 测试 prompt: #Qwen3Next #大模型竞技场 #Qwen3

Qwen3-Next-80B-A3B 实测! 能跟头部模型对打吗? 直接说结论, 能完成我这个大象牙膏测试的一部分, 已经很厉害了, Python 杯子倒水那个测试表现也可圈可点. 来看测试中暴露出来的问题: 首先这个模型生成的样式特别多变, 可以看测试中生成的前端页面的样式和布局, 几乎每次都不一样. 所以实际使用中, 可能会存在稳定性的问题, 建议 prompt 中多做约束, 避免模型过度发挥. 不过这并不全是坏处, 如果拿这个大模型写文, 反而可能会超常发挥, 每次写出来的东西都不一样, 不会呆板. 另外目前发现最大的问题是, 给到模型一大堆数据, 让模型整理一个网页, 结果模型偷懒了, 直接把代码和数据省略掉了, 这个应该还是 GPT-4 时代的问题 (24年上半年) 出现了. 这里猜测可能是高稀疏性专家混合模型或者多词元预测造成的问题, 这两个都会在生成中选择最经济的生成模式, 因此可能会倾向于生成"此处代码省略"这样的代码来替代原本要生成一大堆代码的场景. 召回倒是没太大问题, 鞭炮连锁爆炸那个测试, 虽然模型没有成功写出来, 但是最长的一次还是生成了1100行代码, 我仔细看了下, 基本都考虑到了我 prompt 中要求的逻辑, 只不过实现的代码有 bug 跑不起来而已. 综合来讲, 我觉得这应该是 100B 以内的模型无敌手了, 考虑到定位可能是个新的技术试验模型, 所以期待千问推出更大规模 (例如400B-A15B) 的模型, 带来更好的性能. 测试 prompt: #Qwen3Next #大模型竞技场 #Qwen3

karminski-牙医

30,709 Aufrufe • vor 10 Monaten

这种发型是叫短卷翘么？现在好像看不见了，是过时了还是驾驭不了？视频中有不认识的截图问我，上次50一位，结果没开张。这次降价酬宾，49美元一位💵

这种发型是叫短卷翘么？现在好像看不见了，是过时了还是驾驭不了？视频中有不认识的截图问我，上次50一位，结果没开张。这次降价酬宾，49美元一位💵

老多

65,501 Aufrufe • vor 1 Jahr

大模型写代码比说话还快是什么体验? 智谱刚出了一个 GLM-5.1-highspeed 版本, 赶紧要了个内测给大家做点有趣的 APP. 我测了一下这个模型反应速度用来写代码的话, 人类打字甚至都跟不上它, 于是我干脆接了个语音转文本的服务直接让我言出法随操作它写代码. 大家能看到基本是我说完3s左右它就修改完毕了, 这之间发生了语音转文本(第三方服务), 模型判断是否任务可以并发, 模型 prefill, 模型使用 tool call 修改代码段. iframe 重新渲染. 这些全都发生在 3s 这么短的时间内. 直接体验拉满. 这个模型直接量变引起了质变, 一些之前不敢想象的交互体验现在都可以做了. 所以如果你想使用这个模型构建一些极具竞争力的项目, 不妨去申请试试, 目前这个模型正在向部分企业用户提供中. #GLM #GLM51highspeed #智谱AI

大模型写代码比说话还快是什么体验? 智谱刚出了一个 GLM-5.1-highspeed 版本, 赶紧要了个内测给大家做点有趣的 APP. 我测了一下这个模型反应速度用来写代码的话, 人类打字甚至都跟不上它, 于是我干脆接了个语音转文本的服务直接让我言出法随操作它写代码. 大家能看到基本是我说完3s左右它就修改完毕了, 这之间发生了语音转文本(第三方服务), 模型判断是否任务可以并发, 模型 prefill, 模型使用 tool call 修改代码段. iframe 重新渲染. 这些全都发生在 3s 这么短的时间内. 直接体验拉满. 这个模型直接量变引起了质变, 一些之前不敢想象的交互体验现在都可以做了. 所以如果你想使用这个模型构建一些极具竞争力的项目, 不妨去申请试试, 目前这个模型正在向部分企业用户提供中. #GLM #GLM51highspeed #智谱AI

karminski-牙医

11,765 Aufrufe • vor 2 Monaten

开源分解图层大模型这么快就来了? 给大家带来阿里刚刚发布的 Qwen-Image-Layered 模型实测, 这是一个可以把图片分成不同图层的大模型, 模型是基于 Qwen-Image 微调的. 本次我的测试覆盖这个模型的擅长场景(海报), 指令遵循测试(指定抽取目标), 边缘处理(头发), 极限测试(全是贴纸, 一个贴纸一个图层的话可以抽取50多个图层). 直接说结论, 首先还是模型太大了, 因为这个模型基于 Qwen-Image 所以是个20B的模型, 我是用HuggingFace Zero GPU 测试, 每次运行大概2分钟左右, 模型的确可以做到分离图层, 而且边缘处理很不错, 不过稳定性有待优化, 在我测试中4个图层可以输出, 但是8个或者10个图层就炸了, 怀疑可能是超过了Zero GPU超时或者bug (GPU是H200, 不太可能爆显存), 输出尺寸只有 544*736, 官方也推荐640分辨力, 这点也需要提升, 以及模型还是太大了, 20B, 希望能优化下尺寸.

开源分解图层大模型这么快就来了? 给大家带来阿里刚刚发布的 Qwen-Image-Layered 模型实测, 这是一个可以把图片分成不同图层的大模型, 模型是基于 Qwen-Image 微调的. 本次我的测试覆盖这个模型的擅长场景(海报), 指令遵循测试(指定抽取目标), 边缘处理(头发), 极限测试(全是贴纸, 一个贴纸一个图层的话可以抽取50多个图层). 直接说结论, 首先还是模型太大了, 因为这个模型基于 Qwen-Image 所以是个20B的模型, 我是用HuggingFace Zero GPU 测试, 每次运行大概2分钟左右, 模型的确可以做到分离图层, 而且边缘处理很不错, 不过稳定性有待优化, 在我测试中4个图层可以输出, 但是8个或者10个图层就炸了, 怀疑可能是超过了Zero GPU超时或者bug (GPU是H200, 不太可能爆显存), 输出尺寸只有 544*736, 官方也推荐640分辨力, 这点也需要提升, 以及模型还是太大了, 20B, 希望能优化下尺寸.

karminski-牙医

14,175 Aufrufe • vor 7 Monaten