nash_su - e/acc's banner
nash_su - e/acc's profile picture

nash_su - e/acc

@nash_su19,961 subscribers

e/acc - AI创业者,大部分INTJ,偶尔ENTJ。Founder of https://t.co/oumvmXCmCJ & https://t.co/Laxarievr1,Author of llm_wiki,前 IterCast/LinuxCast 创始人。马拉松爱好者(PB官方255)

Shorts

Qwen 推理性能最高提升8倍! 这个 DFlash 前几天看到了,感觉就是以前的speculative decoding,结果今天看到有人加了 DDTree 技术。 实际就是把 speculative decoding 的单链 draft 变成树状draft + Tree Attention 一次验证 + 最长匹配 prefix commit。 目的是不让 draft 模型在 branching point 的预测被浪费, DFlash 每个 position 只留一个预测,DDTree 则保留多个,再让 target 模型一次看完挑哪个对。 直接让 Qwen3-30B-MoE 在 HumanEvalT 实现了 8.22 倍速度提升!

Qwen 推理性能最高提升8倍! 这个 DFlash 前几天看到了,感觉就是以前的speculative decoding,结果今天看到有人加了 DDTree 技术。 实际就是把 speculative decoding 的单链 draft 变成树状draft + Tree Attention 一次验证 + 最长匹配 prefix commit。 目的是不让 draft 模型在 branching point 的预测被浪费, DFlash 每个 position 只留一个预测,DDTree 则保留多个,再让 target 模型一次看完挑哪个对。 直接让 Qwen3-30B-MoE 在 HumanEvalT 实现了 8.22 倍速度提升!

38,628 görüntüleme

太牛逼了! Heygen 发布了HyperFrames,一个基于HTML自动做视频的工具,有点类似 remotion,但是感觉做的更加完善。 这个视频生成只用了一句指令: /website-to-hyperframes 项目链接:

太牛逼了! Heygen 发布了HyperFrames,一个基于HTML自动做视频的工具,有点类似 remotion,但是感觉做的更加完善。 这个视频生成只用了一句指令: /website-to-hyperframes 项目链接:

32,150 görüntüleme

🦞📲 手机上的 OpenClaw 运行起来了! 很简单,装个 Termux 就行了,运行前 chroot 下,除了运行慢点 😆,我是用 Pixel6

🦞📲 手机上的 OpenClaw 运行起来了! 很简单,装个 Termux 就行了,运行前 chroot 下,除了运行慢点 😆,我是用 Pixel6

33,261 görüntüleme

整活,在ESP32上运行OpenClaw今年最后一折腾,在我的 ESP32-S3 上跑起来了 OpenClaw 的另一个实现,MimiClaw,竟然比我在手机上的 OpenClaw速度还快我的ESP32是8M Flash,官方代码是16M的,果断打开OpenCode让他帮我自动修改好,一次编译通过, 连接的是我本地笔记本跑的 Qwen4B配置是:CPU 240 MHz,8MB RAM,8MB Flash,2.4G Wi-Fi,蓝牙,完了; 今年最后一折腾,在我的 ESP32-S3 上跑起来了 OpenClaw 的另一个实现,MimiClaw,竟然比我在手机上的 OpenClaw速度还快 我的ESP32是8M Flash,官方代码是16M的,果断打开OpenCode让他帮我自动修改好,一次编译通过, 连接的是我本地笔记本跑的 Qwen4B 配置是:CPU 240 MHz,8MB RAM,8MB Flash,2.4G Wi-Fi,蓝牙

整活,在ESP32上运行OpenClaw今年最后一折腾,在我的 ESP32-S3 上跑起来了 OpenClaw 的另一个实现,MimiClaw,竟然比我在手机上的 OpenClaw速度还快我的ESP32是8M Flash,官方代码是16M的,果断打开OpenCode让他帮我自动修改好,一次编译通过, 连接的是我本地笔记本跑的 Qwen4B配置是:CPU 240 MHz,8MB RAM,8MB Flash,2.4G Wi-Fi,蓝牙,完了; 今年最后一折腾,在我的 ESP32-S3 上跑起来了 OpenClaw 的另一个实现,MimiClaw,竟然比我在手机上的 OpenClaw速度还快 我的ESP32是8M Flash,官方代码是16M的,果断打开OpenCode让他帮我自动修改好,一次编译通过, 连接的是我本地笔记本跑的 Qwen4B 配置是:CPU 240 MHz,8MB RAM,8MB Flash,2.4G Wi-Fi,蓝牙

27,899 görüntüleme

AI 半小时复制 typeless! 我花了半小时时间,用 OpenCode 全自动开发了一款实现typeless 核心功能的 Mac 原生 App,花费11美金。 这两天 Typeless 异常火爆,但是30美金/月的订阅费和需要联网使用的隐私问题,让我一直想找到替代方案,今天灵机一动,为啥不 vibe coding 一个? 于是就有了这个AI帮我开发的平替,通过 Mac MLX 本地运行 VibeVoice-ASR-4bit 作为推理服务,可自定义快捷键,程序全部由 AI 编写,使用的是 opus-4.5,花费11美金。 当然跟 typeless 还是有很多差距的,不过已经实现了核心功能,重点是断网本地运行! 后面会逐渐完善功能,完善后会放出来,敬请期待! 效果如视频:

AI 半小时复制 typeless! 我花了半小时时间,用 OpenCode 全自动开发了一款实现typeless 核心功能的 Mac 原生 App,花费11美金。 这两天 Typeless 异常火爆,但是30美金/月的订阅费和需要联网使用的隐私问题,让我一直想找到替代方案,今天灵机一动,为啥不 vibe coding 一个? 于是就有了这个AI帮我开发的平替,通过 Mac MLX 本地运行 VibeVoice-ASR-4bit 作为推理服务,可自定义快捷键,程序全部由 AI 编写,使用的是 opus-4.5,花费11美金。 当然跟 typeless 还是有很多差距的,不过已经实现了核心功能,重点是断网本地运行! 后面会逐渐完善功能,完善后会放出来,敬请期待! 效果如视频:

29,372 görüntüleme

GPT-4 自动写代码 刚刚发布的 Cursor 编辑器集成了 GPT-4 接口,我测试了下他生成代码的能力,叹为观止,我尝试了从前端到后段,从纯软到软硬结合,从UE到Unity,各种语言甚至汇编或HSL,都能正确写出几乎能直接运行的代码 开发效率大提升!目前为止还是免费,大家可以试试:

GPT-4 自动写代码 刚刚发布的 Cursor 编辑器集成了 GPT-4 接口,我测试了下他生成代码的能力,叹为观止,我尝试了从前端到后段,从纯软到软硬结合,从UE到Unity,各种语言甚至汇编或HSL,都能正确写出几乎能直接运行的代码 开发效率大提升!目前为止还是免费,大家可以试试:

108,763 görüntüleme

Videos

nash_su's profile picture

开源啦🎉🎉🎉 基于 Andrej Karpathy 的 llm-wiki 方法论,我将其从抽象设计模式实现为完整的跨平台桌面应用,兼容 Obsidian,同时还基于原版做了很多优化增强。 🔧 两步思维链 Ingest:拆分为分析+生成两次 LLM 调用,保存到知识库的文件使用 LLM 进行深入分析,拆解内容生成知识图谱。 🧠 知识图谱:将知识库内的内容构建成图谱。 🔍 查询检索:四阶段管线,CJK 二元组分词搜索→图谱扩展→预算控制(4K-1M 可配,60/20/5/15 分配)→带引用编号的上下文组装。 💬 多对话聊天:独立会话持久化,引用面板标注使用了哪些 Wiki 页面,结果还可以保存到 Wiki 同时 Ingest。 我还做了如下改进: 🧠 知识图谱中,加入了不同实体之间的关系强度的加权计算算法,通过关系强度决定 LLM Chat 的时候引用资料的优先级。 🔬 深度研究:对特定话题联网查询资料并进行深度研究,使用 Tavily API 多查询检索,综合后自动 Ingest 回 Wiki,支持并发任务队列。 📎 Chrome 扩展:开发了chrome插件,一键将有价值的网页内容插入知识库。 📄 多格式支持:PDF/DOCX/PPTX/XLSX 结构化提取,保留标题、列表、表格语义,非纯文本转换。 🗑️ 智能级联删除:删资料自动清 Wiki 摘要、索引、死链接,共享实体仅移除引用不删页面。 🖥️ 跨平台工程:Tauri v2 + React 19,全平台兼容。 开源地址: 欢迎 Star🌟

nash_su - e/acc

64,764 görüntüleme • 1 ay önce