
howie.serious
@howie_serious • 42,795 subscribers
purity of thought. be exactly who you are : just a serious man. 思想纯净,做好自己:严肃对待自己的兴趣,不要浮皮潦草。 公众号:howie和小能熊 youtube:https://t.co/J1aSMKnUFo
Shorts
Videos
Sensitive content
This media may contain sensitive content.

为什么一定要带孩子去看《flow》(猫猫的奇幻漂流)? 不是因为它拿了 oscar 最佳动画,也不是因为它是用免费开源的 blender 软件做的, 而是要让 ta 亲眼看到:除了 15 秒娱乐至死的算法短视频,还有 90 分钟全程无对话的视频🤣 消费这样的内容,是需要一定的注意力模式,一定的专注力,一定的审美水平的。 大脑分辨率太低?那只能继续看短视频了 相信我,让孩子在电影院看一部 90 分钟全程无对白的电影,机会不多。这次错过,可能 50 年内都不一定有了。 院线正在上映,基本没人看,票价很便宜。如果你感谢我的推荐,不如点赞转发加评论一下?哈哈
howie.serious440,374 просмотров • 1 год назад

刷推停不下来?给 iPhone 开启 e-ink 模式 📖 2026 年,因为 agent,世界发生了一些变化:code is cheap,代码不值钱了;content is cheap,内容不值钱了;认知劳动中的很多都不值钱了…… 这些都变廉价了,那什么变昂贵了呢? 首当其冲的,是注意力,attention。 分享一个不耗费意志力、帮你轻松保护 attention 的机制:开启 iPhone 的 e-ink 模式。 我录了一个视频,先看看效果。 (*安卓也一样,但具体设置的位置需要自己找) ===来龙去脉=== 10岁小学生把我的手机设置成了黑白模式(屏幕显示为灰阶而非彩色)。我说你怎么知道怎么设置的(我 10 年前就玩过),小学生说自己在apple watch 的设置里看过。 然后我给小学生发出一个挑战:怎么把 iphone 屏幕设置成e-ink 效果? 小学生拿过手机,开始捣鼓,还念念有词:光黑白灰阶不够,还得加强对比度,调一调亮度…… 思路是对的,但现在我们有 chatgpt 啦,完全可以整一个更完整、更清晰的eink 模式设置方案。小学生设置完成后,效果虽然不错,但我让 claude 和 gpt 都出了一个方案,二者几乎完全一致。 我按照 claude 的方案设置了一轮,发现确实比我 10 年前、比小学生捣鼓的方案都更细致,更全面: - 一键切换:在 e-ink 模式和正常模式之前一秒切换; - pro 级别的 e-ink 设置:出了灰阶和对比度,还有白点值设置、透明度、亮度、night shift 等(这些设置很多人都不知道) - 动画效果设置:更细致模拟 e-ink 效果;按需吧,主要是给强迫症患者的🤣。 我用 codex 把整个方案写到了 notion 里,让 notion ai 优化+美化了一下页面,还顺手录制了一个效果视频,分享给大家。 查收 SOP级别的 iPhone e-ink 模式教程
howie.serious42,016 просмотров • 1 месяц назад

gemini + youtube + chrome = 价值百万的英语学习资料库! youtube 本身是宝库:它是地球上最大的视频资料库,毫无疑问也是质量最好的,地球上最优秀的人在上面无私分享自己的热爱和专业,制作的视频远超大部分电视媒体机构。不论你喜欢什么,哪怕是一个数学概念,在 youtube 上都可以直达几乎最好的解释。 可惜大部分人从中得到的有限。其实真正用起来,youtube 价值巨大:我家小学生 8 岁FCE,词汇量过万,除了海量英文阅读之外,就是海量高质量 youtube 知识视频的输入。 开了 youtube 会员,每天早晚饭都会看 youtube 知识视频,从小就是无字幕视频,从简单的 ted-ed、动物纪录片、kurzgesagt 看起,现在看 veritasium、以及科学视频。 现在,youtube + gemini in chrome,就解锁了youtube 宝藏的封印。很多长视频、高质量视频、主题和内容有难度的视频,用传统的一次性线性浏览的方法看完,几乎走马观花,不会留下什么。 现在,我把youtube 和 gemini、readwise reader、notebooklm 等工具打通,youtube 视频就原地变身所有人的英语学习、世界知识学习宝库! 当然,掌握英语后,任何科目的学习都会受益,包括数学、coding 方面遇到难理解的概念,我都会给我家小学生去 youtube 上找视频来看。后续还准备给她介绍 3B1B 这些博主,哈哈 开启gemini in chrome 的方法在quote 的推文里,有兴趣的可以实际体验一下。
howie.serious96,050 просмотров • 4 месяцев назад

Google Gemini 的 Deep Research :为了帮你做一个研究任务,gemini 阅读了 151 个英文网站,帮你写了一份研究报告,还附带16 个英文参考文献🤣 你算算这都能帮你节约几百个小时?? 单独在“主题研究”这件事上做到极致,就是一个能帮用户实实在在提高生产力、节约时间的神器! 以视频(录屏,无声音)中案例来讲,Deep Research 帮我阅读了151 个网站,然后生成了详细的报告。 报告可以直接在 google docs 中打开,每个要点都附带了参考文献。这些都是英文的、真实的、高质量的参考文献。想象一下,读完这些参考文献,你得花多少小时?deep research 这样的工具,能帮你节约多少时间? 【小技巧】中文写 prompt,最后加一句:research in english, respond in chinese.(万能 prompt,AI 搜索场景比用,适合所有 LLM。加了这一句,会在 google 上搜索英文高质量材料,然后综合加工后生成中文报告。一级棒!)
howie.serious234,885 просмотров • 1 год назад

chatgpt最新咒语:quizgpt 🪄 除了study mode,chatgpt 还偷偷上线了(天然内置ai所以秒杀传统闪卡的) flashcard 功能! 使用这条咒语,你可以立刻 quiz 一切: > quiz me with QuizGPT:{主题,或任何prompt} 例如,quiz LLM基本概念,quiz 《春江花月夜》……一切知识,一切内容。 甚至,你可以quiz你和chatgpt刚讨论过的话。或者在prompt下面复制粘贴你要quiz的文本。考虑到gpt-5巨大的context window,使用场景巨大。 quizgpt 是openai对这个功能的代号,使用quizgpt这个关键词就可以激活。偶尔失败的话,可以直接指明工具名称,像这样: > quiz me with QuizGPT(ecosystem_demo.flashcards) 每次测试,chatgpt会自动生成难度从低到高的多套flashcard,先是基础,然后是进阶,然后是大师,然后是宗师…… chatgpt flashcard(quizgpt),因为内置于最顶级的llm,和之前的flashcard工具在本质上是完全不同的。我玩了好久,感觉可以成为一个日常使用频率很高的利器。大家赶紧测试起来~~
howie.serious122,629 просмотров • 9 месяцев назад

chatgpt 悄悄更新了视频输入功能😱 更新 ios app 到最新版;app 内无法上传视频,需要把视频从 photos app 拖动到 chatgpt app(新技能 get✅)。 llm 多模态的最后一块板补齐了:文本语音视频,输入输出。
howie.serious102,612 просмотров • 8 месяцев назад

2026,大脑需要 agent 杠杆,也需要放空,发呆,无所事事 所以,新增一个每日 routine:对着屏保发呆 🧘♂️ 安装这个 chrome 插件,一键开启大脑的 zen mode 👇
howie.serious20,424 просмотров • 1 месяц назад

【Google 学习神器 Learn About 】中国教育系统在理念和工具上已经很落后了,在 AGI 时代会加速掉队吗? 体验了一下 Learn About,感叹google 对学习这件事的认识竟然如此深刻,态度竟然如此真诚(对比国内巨头做的学习就是大力教育🤣,就是 AI 智能学习机🤣): Learn About 的学习过程设计,非常符合学习原理(以我对学习科学的理解来看): 1 以 concepts 为中心:一轮一轮对话,都是基于 concepts 来构建的;概念层层分解,通过互动列表和学习者的对话; 2 以 bok(知识体系) 为基础:sidebar里面的 suggested topics for xx 主题,就是知识体系的基本框架; 3 丰富模式:点击`get images`,展示丰富图文;每一轮选择/对话,都展示海量的优质信息:来自Wikipedia、youtube、互联网的各种学习材料; 针对分解后的任何主题,都能提供结构化的、丰富模式的学习材料,相当不错。后面准备让家里的 9 岁小学生深度体验。 再次感叹,学习科学诞生于 1970 年代,但是,50 年后,国人还在为应试教培、教育内卷而苦苦挣扎,孩子们还因为学习而抑郁甚至自杀,巨头们做教育做成了割韭菜…… 教育是决定民族未来的事情。这种差距,会越来越大吗?
howie.serious157,306 просмотров • 1 год назад

ai已经解决了家庭作业辅导(要么不会,要么没时间没精力的)困境。用 gemini 帮父母批改孩子试卷,6 页试卷2分钟轻松搞定,辅导作业完全不用“鸡飞狗跳”,可以继续“母慈子孝”了🤣 (technology makes dad great again~~ ) mom找了一套数学试题,先让孩子做完,后让dad批改。试卷没答案,虽然不难,但是有 6 页。dad 能怎么办?自己吭哧吭哧一题一题重做一遍?🤣 方案1 chatgpt live video 模式:打开摄像头,让 gpt 对着试卷,你、娃、gpt 三人现场一题一题批改;应该很有意思;根据我之前和 gpt 用 live video 一起做字谜的经验,我觉得完全可以做到; 方案2 拍照,让gpt 或 gemini 一页一页批改:因为文字输出的批改结果便于慢慢看,仔细审阅 AI 批改结果,所以我选择了这个方案。 测试了 gemini 2.0 exp 版本,6 张卷子,轻松搞定。这个任务其实不简单,小学试题里面有图形题,有竖式计算,以及其他奇奇怪怪的试题形式。但是,gemini 对 95% 的题目进行了正确批改。 Gemini 批改为正确的,孩子做的一定正确;gemini 批改为错误的,大人就人工审阅一下。在这件事上,AI 节约了我不少时间,因为我不需要重做 6 页试卷,而只需要看几道题目即可。🤣 --- 启示:LLM 多模态功能在2024 年的进步有多大?这是一个例子。LLM 在多模态这件事上,已经做到完全可以处理现实世界较复杂任务的水平了! 很多人可能平时用试过多模态功能,没有平时和 chatgpt 用 advanced voice mode 聊天过,没有用过 live video,但现在,llm 的视觉识别已经非常成熟了。有空可以试一试。 (technology makes dad great again ✊
howie.serious131,663 просмотров • 1 год назад

if 你和 chatgpt 聊过某个话题,then 继续聊之前,先“回忆”一下,直达历史对话,“继续”对话 (得益于 chatgpt 刚刚的 memory 功能大升级!) --- 刚刚,openai 对chatgpt 记忆功能进行大升级!把所有历史对话作为资料索引,点击直接跳转! 在我的测试中,chatgpt 甚至索引到了我使用 chatgpt 第一周时的对话。那可是 3 年多前啊,还是 2022 年 12 月初的时候! 这次的 memory 升级非常有用:我们可能已经或未来必然积累数万个对话, 我们一定有回到某个历史对话,继续对话的需求 自己去搜索,找到以前(尤其是数年前)的某次对话,还是有点麻烦,有点操作门槛的 现在,openai 用技术迭代,解决了人类操作的问题。 非常喜欢这次的 memory 升级!以后可能会每天用。凡是遇到之前聊过的话题,就先“回忆”一下!
howie.serious42,920 просмотров • 4 месяцев назад

一图胜千言,动图胜万言。 claude interactive diagrams 功能在教育和演示场景,这个功能应该非常趁手。 案例:以“context engineering ”为主题。链接:
howie.serious28,046 просмотров • 3 месяцев назад

如何向 8 岁小学生解释ChatGPT 的运行原理?【3B1B:LLM的本质是单词预测器】 LLM的本质是一个复杂的数学函数,它只做一件事:针对给出的任何文本,预测下一个单词。 要构建一个聊天机器人,你需要先给出一些文本,描述用户与假想的AI助手之间互动。用户的输入是这次互动的开始,然后,你让模型反复预测AI助手会“说出”的下一个单词,这就是用户得到的输出结果。 但是,LLM 并非以确定方式预测下一个单词,而是为所有可能的下一个单词分别分配一个概率。这样的话,如果你允许LLM以更随机方式,选择可能性更低的下一个单词,输出结果会看起来更自然。 因此,这意味着,对于一个固定的提示词,LLM 每次给出的答案通常是不同的。
howie.serious121,792 просмотров • 1 год назад

让 o1 变身 o1 pro的“狂暴模式 prompt”,是真的有效,还只是人类用户的又一个幻觉?真的有免费馅饼?真的能薅到 openai 的羊毛? 听起来不可思议。毕竟,“思考时间延长 511%,回答质量大幅提升,约等于立省 180,美金,每月”,好像不太可能真的有这样的好事🤣 但证据是充分的,验证是严密的,效果是显著的,原理是清晰可理解的。我连续做了十几次测试,o1 的额度快要用完了,但是屡试不爽;把 o1 的输出结果读上 5678遍,但是上狂暴模式 prompt 和无 prompt 的结果真的差异显著。 o1 作为推理模型,其关键是test-time compute的增加, 体现在用户输入问题后 o1 思考时间的长短、CoT 的精细程度。虽然 openai 官方都用数学、编程、物理化学问题作为宣传点,但是,我发现,对于复杂且深刻的“文科”问题,o1用上 prompt 的结果提升巨大。我觉得有 2-3 倍的质量提升。 这是我目前的测试案例: - 案例0 精致利己主义者:基于中国大陆的大环境,受过教育的人,是不是更容易成为 精致的利己主义者? - 案例1 信息熵是专注力的敌人。而信息熵的本质是信息的无序和复杂。 所以,我们需要知识管理,来对抗信息的无序;我们需要ChatGPT,来对抗信息的复杂。 整体的方向,是降低大脑的认知负荷(即使你的脑力爆表,也需要节省,因为认知过载会损害你的思考和专注); - 案例2 内容 prompt vs meta prompt:meta prompt 被人当灵丹妙药而推崇追求推销推广,但是,内容 prompt 更关键(内容是思想本身)。meta prompt 作用是锦上添花,如果内容 prompt 本身是思想垃圾,那就是💩上添🌸了。 - 案例3 算法信息流与社会影响:算法信息流,是第一种大规模的“错误对齐”的 AI。 尤其是算法短视频,没有正确对齐(价值观、目标),给人类造成的影响(坏脑症,娱乐至死,价值观扭曲,过度消费软色情、情绪按摩等感官信息),可能一代人以后才会充分展现出来。 案例4 批判性思维挑战与形式逻辑教育:中国人大多没有经历过形式逻辑的训练。因为中国教育不教逻辑,而以辩证哲学取代。这是因为教育、文化、语言、思想、政治体制、历史等多重因素导致的。这导致了批判性思维在中国很难得到发展。 案例5 假如沉入贝加尔湖:假如一个人溺水,沉入了贝尔加湖底。会怎样? 案例6 知识管理简史 案例7 王朝周期律的根本原因:中华文明虽然历史悠久,文化璀璨,但是每个朝代持续时间都不超过三百年,逃不出王朝兴衰更替的宿命。根本原因是什么? 一共 8 个测试全部 prompt 有效,测试相互随机独立,相当于连续抛8 次硬币都是正面。所以,我基本确定这件近乎不可能的“好事”是真实成立的。 全部案例和对照组的对话原始链接,都在视频的 video notes 里面。欢迎大家验证。
howie.serious101,632 просмотров • 1 год назад

基于纪录片内容,使用 nano banana pro 做一套PPT。 基本没 bug。而且可可爱爱。 PDF 完整版下载:
howie.serious44,153 просмотров • 6 месяцев назад

一图胜千言。那么,学习知识时有这样的可交互图片(interactive images),就是“一图数千言”! 今天,gemini 3.0 pro 的可交互图片推送了。demo 见视频。 在学习一些学术概念时,例如细胞结构,神经元运作方式,这样的可交互图片就非常有价值。 说明:之前误解了。interactive images 并不算 nano banana pro 的生图能力,而是 gemini 3.0 pro 的动态网页功能。 使用方式:没有直接开关。就是选择 gemini 3.0 pro,特定的问题会触发可交互图片。我测试了多个 prompt,包括但不限于明确指定使用 interactive images,但是都没用。所以,目前还不太稳定。后续有经验会及时分享出来。 启示: ai 最容易也最应该落地的一个场景就是学习和教育。gemini 3.0 pro 的这个功能,如果能持续迭代,应该会非常强大。希望它早点整合到 notebooklm 中🤣
howie.serious38,930 просмотров • 6 месяцев назад

chatgpt 的deep research,和google notebooklm竟然是绝配。🤣 - 把 chatgpt 的 deep research 报告扔进 notebooklm; - 使用内置的PPT 功能,会调用 nano banana pro 自动生成一整套完整的 ppt; 人的学习也需要多模态,图文并茂,不但有效,而且有利于理解和内容。PPT 的视觉呈现,是对文字版 deep research 报告的有效补充。 nano banana pro 是原生多模型模型,对文字的处理方式和以前的扩散模型是完全不同的,在文字渲染上已经相当不错了。 但是,目前中文渲染仍然偶尔会有问题。 其实这很好解决。毕竟,当前的 ai 早就可以分割图片里的一切元素了。只需要产品层面改进,就可以实现文字可编辑。期待 google 的产品更新。 我觉得这个 use case 非常有价值。需要大力实践。
howie.serious38,642 просмотров • 6 месяцев назад

chatgpt 今天刚发布的pulse,本质上是一个内容策展/curation agent。 pulse,作为 curation agent,解决一个基本但关键的需求:人的日常信息获取。 人的大脑每天都要获取信息,就像人的胃每天都要吃饭。但算法驱动的社交媒体和信息流,在很多时候,在某种意义上某种程度上像在给人喂粪水。(尤其是简中垄断平台搞的恶心算法) pulse的价值:为你每天私人定制信息流,与你有关的,有用的,重要的;让信息为你服务,为你的目标服务。 运行过程: pulse 会基于chatgpt对你的了解(全部历史对话、memory、已连接工具如google calendar中的个人信息),每天晚上异步执行研究任务,然后定制出一份“晨报”/个性化信息流,呈现给你。 每天只有一次,看完就没了。chatgpt认为这个功能的作用是帮助你,给你提供更相关、更有用、更重要的信息。而不是让你一直scrolling,一直划手机。 你的反馈,对pulse的优化非常重要:好的内容点赞,不好的内容点踩。想了解什么?想深入研究什么?想持续关注什么?直接对pulse说。说的好坏不那么重要(你的表达再含糊,对chatgpt都不是问题),关键在于多反馈。 sam altman认为,pulse的一小步,是ai应用范式转换的一大步:从被动的回答问题,转向主动研究——计划——行动的agent。pulse是这一范式转换的最简单形态。目前还属于实验阶段,后续会逐步优化。 我录了一个视频,对着手机给你demo一下,一方面获得第一手的直观体验,另一方面聊一聊我对这个agent的理解和思考。
howie.serious46,018 просмотров • 8 месяцев назад