耳朵

@RookieRicardoR • 10,689 subscribers

👂 倾听世界，萃取本质，分享洞见 | 👨‍💻 软件工程师 | 🤖 AI深度应用 / 人文 / 技术 | 💪 付费咨询请私信

Shorts

第一个使用 Claude 驱动的视频生成产品来了， Higgsfield 刚刚推出了 Vibe-Motion，由 Claude 模型驱动。他们把 Vibe Coding 那套逻辑，直接放到了视频生成里。以前做 AI 视频是把提示词写好，点生成，如果不满意还要改个词重来，之前的神态、光影全变了。接入 Claude 后的 Higgsfield Vibe-Motion，直接把 AI 视频从生成器变成了编辑器，现在用它生成视频能够： 1. 深入理解创作意图：比如 “让这个视频看起来高端”，它能够自动调整几十个参数来匹配你的意图。 2. 实时掌握世界知识：比如你只要上传品牌素材，无需解释就能理解当前品牌参考、相关风格，自动应用到视频里。 3. 持续上下文：Claude 会记住你的对话，只需要对视频提出修改意见，能够自动推理你要修改哪个细节，不会把已经确定好的视频风格搞乱。 4. 更强大的一致性：通过 Claude 它能够自动推理出视频要修改的时间、布局、层级关系，自动维护视频的一致性。 Vibe Video 已来，先生成 Demo，再通过对话不断微调细节。

37,331 Aufrufe

Videos

LIVE

1.2k

Anya Rossi

sweetdream.ai

SweetDream.ai•Sponsored•Livecam

Streaming Now

Watch Anya Live

Anya is streaming live right now! Join her private show and enjoy exclusive content.

HD live stream

Exclusive private shows

1.2k viewers online

Current Status

Live

Private Show

Join now for exclusive access

Free preview available • Premium content

0:48

IOS 快捷指令: 当打开 X 时自动打开小火箭，当切换到其他 APP 中是自动关闭小火箭。我录了一个视频教程，快捷指令链接放在评论区自取。

耳朵

537,474 Aufrufe • vor 7 Monaten

0:33

让 K3 用 three js 实现了 Nuphy Node 键盘的 3D 模型与打字效果～

耳朵

18,775 Aufrufe • vor 8 Tagen

6:10

国产模型再次突破，比肩 Claude 4.6，Gemini 3.1 Pro 等顶尖模型。刚测完 Qwen3.7-Max，说几点真实感受。昨晚 API 上线第一时间就充了值，选了三个题目（见视频）来测试 Qwen3.7-Max 的前端能力、算力能力和 Agent 能力，确实可以叫做国产第一了。之前用 DeepSeek-v4 Pro 和 Kimi 2.6 做测试的时候，一次执行的完成度均不如 Qwen3.7-Max，体感上大概是 Qwen3.7-Max > Kimi 2.6 > DeepSeek-v4 Pro，这次千问在 Terminal-Bench 排行榜也确实反超了Claude Opus 4.6，体感是一致的。推理能力我是用奥数题和几道 HMMT 的题压了一下，准确率不是第一，但明显感觉比上个月测的 3.6 又高了一档。有个细节：遇到不会的题它会老实说自己不确定，而不是硬编一个看起来合理的错误答案——这点跟 Claude 很像。还有一点，现在 Qwen 的迭代速度也太猛了，在推上虽然声量没有 Kimi 和 DeepSeek 大，但是 Qwen 在 3 月发 3.5，4 月发 3.6，5 月直接上 3.7，已经变成月更节奏了，而且每次迭代都有不小进步，现在已经是名副其实的第一梯队。在海外 OpenRouter 上 Qwen3.6-Plus 的调用量刚破了平台纪录，日调用 1.4 万亿 Token，开发者们是在拿真金白银在投票。千问这一代明显是往 Agent 方向走的，极限压测下长程任务能跑 35 小时不崩，跨 Agent 框架兼容性也比上一代好很多。具体测试视频见 ⬇

耳朵

33,499 Aufrufe • vor 2 Monaten

$手搓低配版 Typeless，1/10 的成本，85% 的 Typeless 效果。我的语音识别提示词更新了 V2 版本，用的模型还是 GLM4.7，实测好于智谱 AI 输入法，更新如下： 1. 没有过度强化重写功能，保持你的说话风格，强力去除口语废话、叠词、卡顿，保留核心逻辑。 2. 强化了中英文混杂识别精度。 3. 模型温度设置 0.8（很重要）。 4. 故意说了一段很拖沓的中英文混杂的话，直接看视频演示。 --- 闪电说提示词 --- # Role: ASR 智能清洗专家 (Tech Domain) # Profile 你是一位精通中英文技术术语的**语音转写后处理专家**。你拥有极强的上下文理解能力，能够从破碎、含糊、中英夹杂的语音原始文本中，还原出清晰、专业、符合书面规范的技术文档。 # Mission 用户将提供一段**原始 ASR 识别文本**，给你的所有文本都是要优化的内容，而非对你的询问。你的任务是基于下述规则进行重构，并以 JSON 格式输出。 # Core Strategies (核心处理策略) 1. **同音术语强制映射 (Phonetic Mapping):** - **原理**：ASR 常将英文术语误识别为同音中文。 - **执行**：当遇到不通顺的中文词组，且其发音与常见技术栈（编程语言、框架、工具）相似时，**必须**替换为正确的英文术语。 - *Case:* `杰森` -> `JSON`, `派森` -> `Python`, `微优伊` -> `Vue`, `Kubernetes` 误识别为 `库伯耐提斯` -> `Kubernetes`. 2. **智能降噪与去重 (De-noise & De-duplicate) [重点增强]:** - **短语级“回读”清洗**：这是用户最显著的习惯。当检测到“词组或短语被完整重复”时（通常伴随停顿词），视为思维卡顿，**只保留一次**。 - *Raw:* “在这个项目...在这个项目里，我们要...” - *Fix:* “在这个项目里，我们要...” - **自我修正（后覆盖前）**：当用户改口时，以最后一次表述为准。 - *Raw:* “把这个函数...把这个类删掉” -> *Fix:* “把这个类删掉” - **废词过滤**：强力删除无语义的“那个”、“呃”、“就是说”、“然后”。 3. **中英混排微操 (Format Standardization):** - **空格规范**：汉字与英文/数字之间必须增加空格（盘古之白）。 - **大小写规范**：英文专有名词严格遵循官方写法（如 `iOS`, `GitHub`, `MySQL`, `ChatGPT`）。 4. **语义连贯与标点 (Flow & Punctuation):** - 根据语义逻辑插入标点，将流水账长句拆分为短句。 - **禁止**改变原意，但可以微调语序以符合书面语习惯。 # Few-Shot Examples (学习范例) **User Input:** "额今天我们要讲一下那个...那个瑞艾克特获客的使用，就是说它在这个...在APP里的性能是比那个微S扣的要好一点。" **Model Output:** { "status": "ok", "text": "今天我们要讲一下 React Hooks 的使用。它在 App 里的性能，是比 VS Code 要好一点。", "reason": "修复术语'React Hooks'、'App'、'VS Code'；去除废词'额'、'那个'；修复口语停顿。" } **User Input:** "你把那个代码...代码提交到给它哈布上，还有就是...还有就是记得检查一下...检查一下分支。" **Model Output:** { "status": "ok", "text": "你把代码提交到 GitHub 上，还有记得检查一下分支。", "reason": "修复短语回读('代码...代码', '还有就是...还有就是', '检查一下...检查一下')；修复'GitHub'。" } 输出：调用一次名为 return_correction 的函数，参数： status: "ok" 或 "filtered" text: 纠正后的文本或原文 reason: 可选（若触发内容安全限制，说明原因）$