
小互
@xiaohu • 108,085 subscribers
带你了解全球最前沿科技、AI动态... 学AI找小互,找小互,上 https://t.co/4PVaHEr5r3 ... 小互AI日报 社群:https://t.co/LIEXfWUHv1
Shorts
Videos

OpenAI Voice Hack Night 上一个团队的现场 demo 为手机做的 "agentic 操作系统" 这个应该是我们大家都向往的AI助理形态,而且也是会颠覆手机商业模式的一种全新形态 因为演示的所有界面都是「即时生成」的,无需调用任何APP界面,也就是苹果的App Store商业模式要完蛋了... 核心思路是是「UI 即系统」:手机没有传统 app,界面由端侧本地模型实时生成(on the fly),重推理甩给云端 GPT。 开发者全程用语音指挥它订机票、删日历日程、查 AI 新闻、发邮件、列待办。中途还翻了车(发邮件因"登录没配置"失败)...
小互48,982 views • 2 days ago

Google Translate 耳机实时翻译正式登陆 iOS 任意耳机可用 支持 70+ 语言 不需要买特定耳机,不需要额外下载 App,任何一副带麦克风的有线或无线耳机都能用。 打开 Google Translate,连上耳机,点「Live translate」,别人说外语,你耳机里直接听到翻译后的语音。 同时,这个功能从之前的 3 个国家扩展到了 12 个国家,iOS 和 Android 同步支持。 ① 不挑耳机,门槛为零: 之前 Google 自己的 Pixel Buds 才能用实时翻译,现在取消了硬件限制。 ② 翻译保留语调,不是机器人读稿: 底层用的是 Gemini AI,不是传统的逐字翻译。它能根据上下文理解语义,遇到俚语、习语不会硬翻。 ③ 70+ 语言,12 个国家可用 支持超过 70 种语言,包括南非荷兰语、阿拉伯语、日语、西班牙语、旁遮普语等。
小互421,441 views • 2 months ago

Koji:一个拒绝给答案的 AI 家教... 由来自麻省理工学院和哈佛大学的顶尖学习专家训练而成 号称全球第一个「图形化私教」 你给孩子一个答案,他就少思考一次;少思考一次,这个能力就少长一点。 Koji 反着来,不给答案,而是逼你自己想 它能看到你看到的,甚至能高亮、批注屏幕内容,实时指导你... 几个特点: 1、它不像 ChatGPT 那样只甩给我一串步骤清单,剥夺了学习机会还养出对AI依赖。Koji 反过来,问你、引导你,逼你自己把这步想出来。 2、它能看见你的屏幕你不用把题目描述给它。Koji 本来就趴在你旁边,看着你做题,知道你哪一步拖错了、在哪儿停了三秒。 它清楚你为什么卡住,因为它看得见。 3、「图形化」是关键普通 AI 只能跟你打字聊。Koji 能直接伸手改你的题:高亮一块区域、给图加批注、临时塞一道小题给你。 学导数时,它就在你那条切线上跟你一起画,而不是在另一个窗口回你一段文字。 4、它先开口,老师在你求助之前先开口,会大大降低你张嘴提问的门槛。所以每进一页 Koji 都先说一句:这题和上一道有什么不一样,动手前该注意什么。 视频里两个场景: 几何题:孩子在画布上挪圆挪错了。Koji 没说"该往哪边挪",而是画了几个测试点反问"哪些符合圆的方程?" 逼孩子自己推出 y=0 时 x=6。 Python 课:Koji 直接不教 Hello World 那套,因为"代码现在都是 AI 写的",孩子要学的是看懂代码 + 抓 AI 的错。卡死循环?它不告诉答案,只提醒"你在死循环里",剩下你自己找。
小互23,569 views • 4 days ago

兄弟们,Hyper3D 又放大招了 这次是真的猛... Rodin Gen-2.5发布: 最强 3D 生成模型 4 秒生成百万面模型 全球首个千万面级3D生成 在模型细节上,连毛孔、皮肤微结构这种级别的细节都能还原... 原生贴图纹理,严格对齐几何,涉及到衣物质感和缝线等微小纹理正确,细节和对齐做到正确平衡。 思考模式从低到高,最快 4 秒出稿 - 极低模式 - 4 秒出稿 - 快速制作简易资产、批量测试实验 - 低模式 - 9 秒出稿 - 简约风模型,小型硬表面道具制作 - 中模式 - 20 秒出稿 - 结构与细节表现均衡 - 高模式 - 40 秒出稿 - 高品质资产,结构层次丰富,表面平滑 - 极高模式 - 80 秒出稿 - 微观细节专业资产 一张参考图就能出贴图模型 原生 3D 贴图算法,直接在三维空间里生成纹理,360° 无死角覆盖,转到背面底部都不会糊,支持 PBR 材质,光影一键预处理。用过之前那些贴图拼接糊成一坨的工具的兄弟,应该知道这个差距有多大。 Faithful 模式严格贴合参考素材,Creative 模式自动优化结构,比如轮胎给你修成完美圆形。最高精度档下还能切 Micro 和 Clean: Micro 给你毛孔级细节,Clean 给你干净平滑的几何,做风格化或者后续上动画都好用。而且支持同时并行跑 10 个模型,批量探索创意方向直接起飞。 背后团队是影眸科技,国人团队,2016 年就开始做 3D 生成。 整个行业走"2D 升维 3D"捷径的时候,他们死磕原生 3D 模型,更难,但破面、拓扑混乱这些致命问题,只有这条路能治。 今年论文拿了 SIGGRAPH 2025 最佳论文奖,同期获奖的商业公司只有 Google 和 Meta。
小互41,853 views • 9 days ago

看看 Gemini Omni的实力 一句话就是:视频版的香蕉🍌 当然远不至于视频的编辑能力,它应该是世界模型的雏形... 通用AGI的初始形态...
小互54,020 views • 14 days ago

昨天很火的桌面小人开源了 装上会有两个小人在你 MacOS Dock 上方,来回走动 点击任意一个弹出 Claude 终端窗口,直接和 Claude Code 对话... 我正在改造看看能不能增加更多有意思的功能
小互192,027 views • 2 months ago

波士顿动力的 Atlas 最新展示 这动作有点牛P 平衡性、灵活性和柔韧度达到了前所未有的高度 不得不感叹这种设计确实是很超前,超越了所有的传统人形机器人...
小互80,017 views • 28 days ago

手把手教你让 Claude Code 更好的爬取内容: 抓取任意网站数据 学完这篇教程,你可以让 Claude Code 直接搜索网页、抓取数据,甚至自己造一个爬虫部署到云端,全程不写一行代码。
小互235,517 views • 2 months ago

卧槽 Claude 动手抄 OpenAI 老家了 一键把你在 ChatGPT 攒的记忆全搬走 Anthropic 上线了一个记忆迁移工具(Memory Import),让你把 ChatGPT、Gemini 等 AI 助手里积累的个人偏好和上下文,一键导入到 Claude 的记忆系统里。 众所周知 ChatGPT 的一大核心竞争力就是其 记忆系统 很完善... 你用的越久,GPT越懂你,你越离不开。 Claude这个工具简直是釜底抽薪... Claude 官方这个工具的最大优势是:直接写入 Claude 记忆系统,不需要绕路,不需要装插件,三步完成。
小互233,854 views • 3 months ago

顺藤摸瓜找到这个视频的作者了 问了下 一对一教学是3000元 丢个视频你自己学是588元 可以使用训练好的模型,也可以自己用SD生成定制自己独有的虚拟人模型 一个模型一张脸,做好无法更换! 显卡3060起步
小互1,194,201 views • 2 years ago

MIT教授连续 40 年最火的一堂课 不教编程,教你怎么说话 我觉得这可能是AI时代最需要学习的能力:如何演讲和表达... 当 AI 取代大部分工作时候,表达可能是人类需要强化的能力,帮助你讲述你的工作和成就... Patrick Winston 是 MIT 人工智能实验室的前任主任,他在 MIT 开了一门课叫"How to Speak",每年一月开讲,连续讲了40多年。 没有学分,不算选修,但每次教室都挤满了人。 2019年是最后一堂。同年他去世了,有人把这最后一次录了下来放到 YouTube,到今天播放量超过2200万。 这堂课只讲一件事:怎么把话说好。 Winston 认为,一个人在职业生涯中能走多远,主要取决于三样东西:说的能力、写的能力、想法的质量。注意顺序,说排第一。 而说话的质量由一个公式决定:f(K, P, T)。K 是知识,P 是练习,T 是天赋。关键是,T 很小。真正决定你能不能讲好的,是你知道多少技巧,以及你用这些技巧练了多少次。 他举了个例子。有一年在 Sun Valley 滑雪,正好碰上名人周末,奥运体操冠军 Mary Lou Retton 也在。Winston 发现自己滑得比这位奥运冠军好得多,原因很简单:他有 K 和 P,她只有 T。天赋顶不过知识加练习。 这堂课的核心逻辑就在这里:演讲是可以学的,而且有明确的方法论。
小互103,547 views • 2 months ago