Video wird geladen...

Video konnte nicht geladen werden

Beim Laden dieses Videos ist ein Problem aufgetreten. Dies könnte an einem vorübergehenden Netzwerkproblem liegen oder das Video ist möglicherweise nicht verfügbar.

KTransformers 运行 DeepSeek 性能又提升啦！ KTransformers v0.2.4 16小时前刚刚发布！这个版本整合了SGLang一些特性，并且支持并发请求了！通过提高并发性，总输出吞吐量从 17 token/s 增加到了 40 token/s。并且观察到性能瓶颈已经从 CPU 内存转移到了显卡，即，换显卡就能有更大的提升！（官方是用 Xeon6 + MRDIMM-8800 +4090D 测试的）更新说明和运行教程：

karminski-牙医

17,766 subscribers

13,832 Aufrufe • vor 1 Jahr •via X (Twitter)

Wissenschaft & Technologie Bildung

Anya Rossi• Live Now

Private livecam show

3 Kommentare

Profilbild von Qian

Qianvor 1 Jahr

KTransformers 只优化DeepSeek么？

Profilbild von Defi App 🎩

Defi App 🎩vor 1 Jahr

🚨BREAKING: Defi App beta is live Crypto's first all-in-one SuperApp is here: - Instantly buy any token on any chain - 10x long memes & majors - No gas, no bridges, no KYC - AI Trading Agents - Self-custody Sign-up on First 1,000 users heavily rewarded

Profilbild von refight

refightvor 1 Jahr

better list the total cost in CNY

Ähnliche Videos

GitHub 上 Codeflash 开源项目专门为我们优化 Python 代码，一键优化整个 Python 代码库，提升代码性能。通过使用大模型生成多种优化方案，自动测试正确性并进行性能基准测试，然后创建包含最佳优化的拉取请求供我们审核。 GitHub：只需一行命令安装运行，适合想通过 AI 提高 Python 代码性能的开发者和团队尝试。

GitHub 上 Codeflash 开源项目专门为我们优化 Python 代码，一键优化整个 Python 代码库，提升代码性能。通过使用大模型生成多种优化方案，自动测试正确性并进行性能基准测试，然后创建包含最佳优化的拉取请求供我们审核。 GitHub：只需一行命令安装运行，适合想通过 AI 提高 Python 代码性能的开发者和团队尝试。

GitHubDaily

13,203 Aufrufe • vor 1 Jahr

从国产SOTA走向世界SOTA? GLM-5.1 实测! 给大家带来 GLM-5.1 编程能力实测! 本次测试涵盖了前端, 后端, Agent 能力, 前端主要面向空间建模, 场景, 材质, 粒子效果等, 后端能力主要面向数据结构与算法, 体系结构, 性能优化, 内存和并发管理, 性能热点分析与调优, 面向编辑器方向的Agent能力(因为AI要自己改代码). 直接说结论, 本次测试前端方面粒子效果和光影鲜果略有提升, 剩下空间理解(甚至感觉下降了)和前端美学上没看到有什么提升, 只能说是提升了一点点. 但是后端性能上有巨大的提升, GLM-5.1 在我的 vector-db-bench 中直接秀了一手量化, 把原本32bit精度的数据量化到了8bit, 然后使用SIMD实现了一个指令周期内计算32个向量, 在我测试的其他模型中(包括Claude-opus-4.6, GPT-5.4-Pro(xhigh)) 都没有实现, 直接来到了榜首. 另外Agent能力上也有不小的提升, 同样是我写的让大模型模拟送外卖的硅基骑手测试, 其他大模型的优化还停留在看一个店能不能取两单上, GLM-5.1 已经优化到了我送餐的顺路还能再接一单, 并且仅用了大概GLM-5 1/4的 token 用量就超越了 GLM-5 的测试总分. 当然本次测试过程也很坎坷, 首先是我周末抢了2天都没抢到 coding plan (目前只有coding plan 能用这个模型), 我最后找智谱的同学给我开了个权限. 以及测试中发现白天API不是很稳定, 偶尔输出速度会掉到10tps, 以及会出现乱码文字(我的规避方法是让它输出英文, 然后再找个便宜模型翻译过来). 总结, 各位前端同学估计会失望, 因为无论是从工程还是页面效果上都看不到提升, 甚至可能会有点倒退, 但果写后端代码或者复杂Agent应用可以试试这个新模型, 会有很大的提升. #GLM51 #智谱 #GLM #AIAgent #大模型编程

从国产SOTA走向世界SOTA? GLM-5.1 实测! 给大家带来 GLM-5.1 编程能力实测! 本次测试涵盖了前端, 后端, Agent 能力, 前端主要面向空间建模, 场景, 材质, 粒子效果等, 后端能力主要面向数据结构与算法, 体系结构, 性能优化, 内存和并发管理, 性能热点分析与调优, 面向编辑器方向的Agent能力(因为AI要自己改代码). 直接说结论, 本次测试前端方面粒子效果和光影鲜果略有提升, 剩下空间理解(甚至感觉下降了)和前端美学上没看到有什么提升, 只能说是提升了一点点. 但是后端性能上有巨大的提升, GLM-5.1 在我的 vector-db-bench 中直接秀了一手量化, 把原本32bit精度的数据量化到了8bit, 然后使用SIMD实现了一个指令周期内计算32个向量, 在我测试的其他模型中(包括Claude-opus-4.6, GPT-5.4-Pro(xhigh)) 都没有实现, 直接来到了榜首. 另外Agent能力上也有不小的提升, 同样是我写的让大模型模拟送外卖的硅基骑手测试, 其他大模型的优化还停留在看一个店能不能取两单上, GLM-5.1 已经优化到了我送餐的顺路还能再接一单, 并且仅用了大概GLM-5 1/4的 token 用量就超越了 GLM-5 的测试总分. 当然本次测试过程也很坎坷, 首先是我周末抢了2天都没抢到 coding plan (目前只有coding plan 能用这个模型), 我最后找智谱的同学给我开了个权限. 以及测试中发现白天API不是很稳定, 偶尔输出速度会掉到10tps, 以及会出现乱码文字(我的规避方法是让它输出英文, 然后再找个便宜模型翻译过来). 总结, 各位前端同学估计会失望, 因为无论是从工程还是页面效果上都看不到提升, 甚至可能会有点倒退, 但果写后端代码或者复杂Agent应用可以试试这个新模型, 会有很大的提升. #GLM51 #智谱 #GLM #AIAgent #大模型编程

karminski-牙医

19,594 Aufrufe • vor 2 Monaten

拿到了 GPTEngineer 的内测权限测试了下确实很牛P GPTEngineer：AI 开发工程师几秒钟内创建一个网站并可一键部署发布你只需输入简单的文本提示，应用程序便能在几秒钟内生成网页应用的原型。支持与 GitHub 的双向同步。并且支持一键将程序部署到生产环境中。可以在开发过程中即时修改和调整代码。AI 会自动检测并修正开发中的错误。详细介绍：

拿到了 GPTEngineer 的内测权限测试了下确实很牛P GPTEngineer：AI 开发工程师几秒钟内创建一个网站并可一键部署发布你只需输入简单的文本提示，应用程序便能在几秒钟内生成网页应用的原型。支持与 GitHub 的双向同步。并且支持一键将程序部署到生产环境中。可以在开发过程中即时修改和调整代码。AI 会自动检测并修正开发中的错误。详细介绍：

小互

39,771 Aufrufe • vor 1 Jahr

最新轻量级TTS模型，OuteAI的升级版：OuteTTS-0.2-500M，提示跟随和输出连贯性比前一版更好，声音效果非常流畅自然，支持多语言和声音克隆基于Qwen 2.5 0.5B开发，这次还提高了声音克隆能力，多样性和准确性有提升增加了对多语言的支持，增加了中文、韩语、日语非常适合在资源受限的设备上部署 #TTS #OuteTTS

最新轻量级TTS模型，OuteAI的升级版：OuteTTS-0.2-500M，提示跟随和输出连贯性比前一版更好，声音效果非常流畅自然，支持多语言和声音克隆基于Qwen 2.5 0.5B开发，这次还提高了声音克隆能力，多样性和准确性有提升增加了对多语言的支持，增加了中文、韩语、日语非常适合在资源受限的设备上部署 #TTS #OuteTTS

AIGCLINK

21,353 Aufrufe • vor 1 Jahr

🇺🇸🇷🇺突发：俄罗斯提“永久和平”要求，停战迎重大突破川普总统特使史蒂夫刚刚与普京进行了 5 个小时的会谈，并表示俄罗斯已准备好实现“永久和平”，并提出了自己的要求。

🇺🇸🇷🇺突发：俄罗斯提“永久和平”要求，停战迎重大突破川普总统特使史蒂夫刚刚与普京进行了 5 个小时的会谈，并表示俄罗斯已准备好实现“永久和平”，并提出了自己的要求。

希望之聲灣區廣播電台

129,377 Aufrufe • vor 1 Jahr

这三个小朋友，大概率和你儿子身边的朋友认识，可能是从你儿子的朋友口中听说你儿子有很多烟卡，并且提前计划好了，顺藤摸瓜到你家

这三个小朋友，大概率和你儿子身边的朋友认识，可能是从你儿子的朋友口中听说你儿子有很多烟卡，并且提前计划好了，顺藤摸瓜到你家

瞎玩菌

123,642 Aufrufe • vor 1 Jahr

Yazi 终端文件管理器 v0.2.0 发布！这个版本新增了对自定义预览器、自定义预加载器的支持，并且已经完成了并发插件系统的大部分工作。此外，它包括许多性能优化，比如重写整个文件系统、重构整个UI渲染架构、增强任务调度系统，并为频繁更新的组件实现了部分渲染……

Yazi 终端文件管理器 v0.2.0 发布！这个版本新增了对自定义预览器、自定义预加载器的支持，并且已经完成了并发插件系统的大部分工作。此外，它包括许多性能优化，比如重写整个文件系统、重构整个UI渲染架构、增强任务调度系统，并为频繁更新的组件实现了部分渲染……

三咲雅 misaki masa 🍓

56,500 Aufrufe • vor 2 Jahren

感觉没有哪个卡片创作爱好者，能拒绝这种无限画布！之前总在某书刷到做小众卡牌（比如塔罗牌）去变现，一直想怎么用 AI 提效，刚试着用 Flowith 做一套哈利波特卡牌，发现已经可以灵活裁剪和拼接输出成新的 Context 进行精准控制，支持并发抽卡生图和图片精修编辑 🎨

感觉没有哪个卡片创作爱好者，能拒绝这种无限画布！之前总在某书刷到做小众卡牌（比如塔罗牌）去变现，一直想怎么用 AI 提效，刚试着用 Flowith 做一套哈利波特卡牌，发现已经可以灵活裁剪和拼接输出成新的 Context 进行精准控制，支持并发抽卡生图和图片精修编辑 🎨

Cell 细胞

26,186 Aufrufe • vor 8 Monaten

很早前，我们就可以利用 AI 快速抓取网站内容进行提问和理解，但颇为繁琐且技术小白难以上手。现在有了开源工具 sitemcp 后，这一应用场景将变得非常简单。它能一键抓取整个网站内容并将其转化为 MCP 服务器，再搭配 Claude 等 MCP 客户端，就能直接对网站内容进行对话提问。 GitHub：主要功能： - 支持一次性抓取整个网站，并缓存到本地 - 可设置并发数提高抓取速度 - 支持多种工具命名策略，便于 AI 客户端调用 - 提供路径匹配功能，可选择性抓取特定页面 - 支持内容选择器，确保提取页面中最有价值的内容可通过命令行一键安装使用，并无缝集成到各种 MCP 客户端。

很早前，我们就可以利用 AI 快速抓取网站内容进行提问和理解，但颇为繁琐且技术小白难以上手。现在有了开源工具 sitemcp 后，这一应用场景将变得非常简单。它能一键抓取整个网站内容并将其转化为 MCP 服务器，再搭配 Claude 等 MCP 客户端，就能直接对网站内容进行对话提问。 GitHub：主要功能： - 支持一次性抓取整个网站，并缓存到本地 - 可设置并发数提高抓取速度 - 支持多种工具命名策略，便于 AI 客户端调用 - 提供路径匹配功能，可选择性抓取特定页面 - 支持内容选择器，确保提取页面中最有价值的内容可通过命令行一键安装使用，并无缝集成到各种 MCP 客户端。

GitHubDaily

27,123 Aufrufe • vor 1 Jahr

嘴炮PS，不能打字，必须要用嘴的。我让Sonnet 3.7写了一个网页应用，语音输入，调用Gemini API编辑图片，效果优秀。 Sonnet 3.7太强了，一次性写的几百行代码就能运行，极少有程序员能做到这样吧，而且提示词很简单，大多内容是贴的官方文档，完整提示词见评论链接。

嘴炮PS，不能打字，必须要用嘴的。我让Sonnet 3.7写了一个网页应用，语音输入，调用Gemini API编辑图片，效果优秀。 Sonnet 3.7太强了，一次性写的几百行代码就能运行，极少有程序员能做到这样吧，而且提示词很简单，大多内容是贴的官方文档，完整提示词见评论链接。

Gorden Sun

54,788 Aufrufe • vor 1 Jahr

NVIDIA 发布 Jetson Orin Nano 超级开发者套件售价只有249美金相比上一代的499美元大幅下降性能比上一代提升1.7倍，每秒70万亿次运算具有67 INT8 TOPS的推理性能，内存带宽提高了50%，达到102GB/s Jetson Orin Nano Super 支持生成式AI应用，可用于小型的AI计算机，机器人或者工作站。 Jetson Orin Nano搭载了 NVIDIA Ampere架构的GPU 和 6核Arm CPU，能够提供更强大的计算支持，尤其适用于并行计算和图形处理任务。 Jetson Orin Nano Super 完全兼容 NVIDIA CUDA、cuDNN 和 TensorRT 等软件库，使得开发者可以高效利用 GPU 加速进行深度学习和推理任务。

NVIDIA 发布 Jetson Orin Nano 超级开发者套件售价只有249美金相比上一代的499美元大幅下降性能比上一代提升1.7倍，每秒70万亿次运算具有67 INT8 TOPS的推理性能，内存带宽提高了50%，达到102GB/s Jetson Orin Nano Super 支持生成式AI应用，可用于小型的AI计算机，机器人或者工作站。 Jetson Orin Nano搭载了 NVIDIA Ampere架构的GPU 和 6核Arm CPU，能够提供更强大的计算支持，尤其适用于并行计算和图形处理任务。 Jetson Orin Nano Super 完全兼容 NVIDIA CUDA、cuDNN 和 TensorRT 等软件库，使得开发者可以高效利用 GPU 加速进行深度学习和推理任务。

小互

75,948 Aufrufe • vor 1 Jahr

新一代GPU架构“花港”来了！摩尔线程发布新卡了，算力密度提升50%，能效提升10倍，只是觉得“花港”这个代号怪怪的。

新一代GPU架构“花港”来了！摩尔线程发布新卡了，算力密度提升50%，能效提升10倍，只是觉得“花港”这个代号怪怪的。

高飞

32,550 Aufrufe • vor 5 Monaten

养牛 Eclipse 最近更新了界面并开始封禁脚本，其更新也在说明草的数量决定了未来的空投所以我调整更新了脚本，并录制了教学视频给小白功能更新： 1、新增随机点击时间和暂停一段时间， 2、将点击范围缩小到5% 养牛教程：新脚本我放Github了，大家自取：大家有建议，欢迎提，并且欢迎将邀请码放在评论区 #eclipase #svm #layer2 #Airdrop

养牛 Eclipse 最近更新了界面并开始封禁脚本，其更新也在说明草的数量决定了未来的空投所以我调整更新了脚本，并录制了教学视频给小白功能更新： 1、新增随机点击时间和暂停一段时间， 2、将点击范围缩小到5% 养牛教程：新脚本我放Github了，大家自取：大家有建议，欢迎提，并且欢迎将邀请码放在评论区 #eclipase #svm #layer2 #Airdrop

作业借你抄

65,066 Aufrufe • vor 1 Jahr

OpenAI 正式发布 GPT-4.1 系列：百万 Token 长文本、更强编码、价格更优！ OpenAI 隆重推出专为开发者打造的全新模型系列——GPT-4.1！该系列包含三个强大的新成员：旗舰级的 GPT-4.1、高速的 GPT-4.1 Mini，以及有史以来最小、最快、最经济的 GPT-4.1 Nano。这些模型在编码能力、复杂指令遵循、长文本处理（首次支持高达一百万 Token 上下文，且无额外费用）以及多模态理解方面均实现了显著提升，性能全面超越 GPT-4o，并在关键指标上比肩甚至超越 GPT-4.5。视频中，OpenAI 团队成员详细介绍了这些模型的性能优势、基准测试结果，并通过精彩的实时演示（如现场编写功能完善的前端应用、处理超长日志文件）展现了它们的实际能力。同时，他们还分享了更优惠的定价策略，并宣布了 GPT-4.5 的后续计划。快来了解这些为开发者量身定制、现已在 API 中可用的新一代 AI 模型吧！

OpenAI 正式发布 GPT-4.1 系列：百万 Token 长文本、更强编码、价格更优！ OpenAI 隆重推出专为开发者打造的全新模型系列——GPT-4.1！该系列包含三个强大的新成员：旗舰级的 GPT-4.1、高速的 GPT-4.1 Mini，以及有史以来最小、最快、最经济的 GPT-4.1 Nano。这些模型在编码能力、复杂指令遵循、长文本处理（首次支持高达一百万 Token 上下文，且无额外费用）以及多模态理解方面均实现了显著提升，性能全面超越 GPT-4o，并在关键指标上比肩甚至超越 GPT-4.5。视频中，OpenAI 团队成员详细介绍了这些模型的性能优势、基准测试结果，并通过精彩的实时演示（如现场编写功能完善的前端应用、处理超长日志文件）展现了它们的实际能力。同时，他们还分享了更优惠的定价策略，并宣布了 GPT-4.5 的后续计划。快来了解这些为开发者量身定制、现已在 API 中可用的新一代 AI 模型吧！

宝玉

31,162 Aufrufe • vor 1 Jahr

1080TI 神卡，黄仁勋拿到这张显卡的时候突然愣了一下，无数回忆涌上心头。当时的 1080TI 太惊艳，刀法严重失误，导致性能提升太强，个人学生时期的梦想显卡。

1080TI 神卡，黄仁勋拿到这张显卡的时候突然愣了一下，无数回忆涌上心头。当时的 1080TI 太惊艳，刀法严重失误，导致性能提升太强，个人学生时期的梦想显卡。

iGeekbb

593,445 Aufrufe • vor 11 Tagen

微软刚刚发布了OmniParser V2，这改变了一切。这个AI可以看到你的屏幕，理解它，并采取行动，就像一个人一样。 100%免费且开源！

微软刚刚发布了OmniParser V2，这改变了一切。这个AI可以看到你的屏幕，理解它，并采取行动，就像一个人一样。 100%免费且开源！

AI Will

112,272 Aufrufe • vor 1 Jahr

抱歉我们只有超大杯! GLM-4.7实测! 本次测试覆盖了GLM-4.7的编程能力, Agent/ToolCall能力, 长上下文召回能力, 给大家带来刚发布的 GLM 4.7 的测试结果: 考验Agent能力的硅基骑手测试, 简单讲是让大模型使用工具模拟骑手取外卖送餐. GLM 4.7 在24小时总计300回合的极限送餐中收益达到了 571.91 元, 执行了总计 354 次 tool call, 测试使用了大约 50% 的上下文空间, 直到超过100K后才停止工作. Agent 测试这次是创了新高, 执行效率特别高, 得益于模型可以在一次会话中发起多个 tool call, 节省了时间并能选择收益最大的方案. 然后是考验长上下文召回能力的霍格沃茨测试, 简单来讲就是在长上下文中, 能否记住上下文并准确的回答问题. GLM 4.7 在192K以内召回水平在91%到100%区间, 而200K也有95%, 召回效果同样也很不错. 最后再来看编程能力测试上最大的感受是粒子, 建模, 光影效果都有提升, 尤其是空间能力有了巨大的提升. 当然性能问题仍然存在, 希望下个版本着重优化下生成代码的性能问题. 总结, 这次GLM 4.7 在各个方面都有明显的提升, 作为主力编程模型不是问题, LMArena 和 SWE-bench 等编程测试中都取得了开源大模型 SOTA 的水平. 不过还是要说一句, 测试中我发现API速度时快时慢, 是不是因为大家都在用新版本导致的? 希望官方赶紧加机器. #GLM47 #智谱AI #智谱GLM #AIAgent #ai编程 #大模型 #开源 #KCORES大模型竞技场

抱歉我们只有超大杯! GLM-4.7实测! 本次测试覆盖了GLM-4.7的编程能力, Agent/ToolCall能力, 长上下文召回能力, 给大家带来刚发布的 GLM 4.7 的测试结果: 考验Agent能力的硅基骑手测试, 简单讲是让大模型使用工具模拟骑手取外卖送餐. GLM 4.7 在24小时总计300回合的极限送餐中收益达到了 571.91 元, 执行了总计 354 次 tool call, 测试使用了大约 50% 的上下文空间, 直到超过100K后才停止工作. Agent 测试这次是创了新高, 执行效率特别高, 得益于模型可以在一次会话中发起多个 tool call, 节省了时间并能选择收益最大的方案. 然后是考验长上下文召回能力的霍格沃茨测试, 简单来讲就是在长上下文中, 能否记住上下文并准确的回答问题. GLM 4.7 在192K以内召回水平在91%到100%区间, 而200K也有95%, 召回效果同样也很不错. 最后再来看编程能力测试上最大的感受是粒子, 建模, 光影效果都有提升, 尤其是空间能力有了巨大的提升. 当然性能问题仍然存在, 希望下个版本着重优化下生成代码的性能问题. 总结, 这次GLM 4.7 在各个方面都有明显的提升, 作为主力编程模型不是问题, LMArena 和 SWE-bench 等编程测试中都取得了开源大模型 SOTA 的水平. 不过还是要说一句, 测试中我发现API速度时快时慢, 是不是因为大家都在用新版本导致的? 希望官方赶紧加机器. #GLM47 #智谱AI #智谱GLM #AIAgent #ai编程 #大模型 #开源 #KCORES大模型竞技场

karminski-牙医

19,592 Aufrufe • vor 5 Monaten

「性能力提升、改善阳痿早泄」对于没有时间进行身材管理以及没有精力进行运动健身并且存在性能力偏弱问题的男性朋友们高哥建议、每天睡前抽出20分钟做视频中的运动内容、长期坚持、保持自律、会有一定效果 #阳痿 #早泄 #性能力 #阳痿早泄 #男性健康 #性高潮 #性技巧 #早泄男

Sensitive content

「性能力提升、改善阳痿早泄」对于没有时间进行身材管理以及没有精力进行运动健身并且存在性能力偏弱问题的男性朋友们高哥建议、每天睡前抽出20分钟做视频中的运动内容、长期坚持、保持自律、会有一定效果 #阳痿 #早泄 #性能力 #阳痿早泄 #男性健康 #性高潮 #性技巧 #早泄男

高哥聊性「性健康咨询师」

30,895 Aufrufe • vor 3 Jahren