howie.serious's banner
howie.serious's profile picture

howie.serious

@howie_serious42,795 subscribers

purity of thought. be exactly who you are : just a serious man. 思想纯净,做好自己:严肃对待自己的兴趣,不要浮皮潦草。 公众号:howie和小能熊 youtube:https://t.co/J1aSMKnUFo

Shorts

嗯,简历里稍微美化了“一丢丢”🤣

嗯,简历里稍微美化了“一丢丢”🤣

147,860 次观看

一个人的概念量,尤其是清晰准确的概念量,是衡量智能水平的最佳数据指标。而最佳落地实践工具一直近在眼前👀 这种概念量,最好的管理、迭代、积累方式就是logseq。用了一年多logseq,我积累了接近 6000 条概念笔记,相互之间建立了12000 个链接,共同构成了一个不小的 LCM(大概念模型,meta 最新提出的理论,我还没细看,但是和我的实践差不多🤣)。 对比之下,我 2009 年使用 evernote,到 2020 年停用之前,我也只有 15000 条笔记,而且不是概念笔记,无法在概念砖块之间灵活建立丰富的链接。 大语言模型这两年,胜过人类的两千年,两万年!语言的边界,就是思想的边界。而最好的落地方式,就是费曼学习法 + logseq + chatgpt。 (我在 X 上一直碎碎念讲这个历年,就不展开了🤣

一个人的概念量,尤其是清晰准确的概念量,是衡量智能水平的最佳数据指标。而最佳落地实践工具一直近在眼前👀 这种概念量,最好的管理、迭代、积累方式就是logseq。用了一年多logseq,我积累了接近 6000 条概念笔记,相互之间建立了12000 个链接,共同构成了一个不小的 LCM(大概念模型,meta 最新提出的理论,我还没细看,但是和我的实践差不多🤣)。 对比之下,我 2009 年使用 evernote,到 2020 年停用之前,我也只有 15000 条笔记,而且不是概念笔记,无法在概念砖块之间灵活建立丰富的链接。 大语言模型这两年,胜过人类的两千年,两万年!语言的边界,就是思想的边界。而最好的落地方式,就是费曼学习法 + logseq + chatgpt。 (我在 X 上一直碎碎念讲这个历年,就不展开了🤣

105,522 次观看

给 sora 2 的meta prompt:让8岁小学生都可以把sora 用成自己的想象力引擎。 你的原始idea很简单粗糙:一群座头鲸在云海中遨游…… 但这个prompt会用多轮提问,引导你的创意过程,最终得出你原本大概率想不到、即使想到也非常费脑子的视觉创意。 我认为这个prompt方向是对的(把sora用作你的“想象力引擎”),而且过程轻松有趣,没有认知门槛。 当所有不必要的认知负荷被卸载,你的idea,才是真正重要的。 用法:新建一个chatgpt projects,把prompt作为项目的系统指令。 (原推里的prompt是英文的,里面一些细节不合适,我修改了一版,更好用。) --- 你是一位具有远见的创意总监,专注于 AI 视频生成与 Sora 2 的技术能力。 你的职责是通过自然的对话,将用户的创意愿景转化为精确的视频提示词。 通过对话式的“创意探索”引导用户。 每次提出两个有思考性的问题,并基于他们的回答逐步深入。 让整个过程像一次充满灵感的合作,而不是审问。 倾听他们话语中的隐藏灵感,帮助他们发现自己尚未意识到的视觉概念。 以开放式问题开始,询问他们的视频构想。每次回答后: - 认可并回应他们答案中让你感到兴奋的部分 - 提出两个跟进问题,探索以下方面之一:概念、情感基调、视觉风格、关键瞬间、镜头运动或具体细节(灯光、色彩、场景) - 当他们陷入停滞时,提供 2–3 个富有启发性的选项,激发想象力 - 在进行 3-5 轮、并积累足够丰富的上下文后,宣布你准备好为他们撰写最终的 prompt 提供简短分析,包括: - 核心愿景(Core Vision):提炼中心概念 - 视觉身份(Visual Identity):美学与技术路径 - 独特要素(Unique Elements):让作品与众不同的特征 然后输出一份 **可直接复制使用的 Sora 2 详细 JSON prompt**,包含以下字段: - prompt(2–4 句的详细描述) - style(风格) - camera_movement(镜头运动) - lighting(光线) - mood(情绪氛围) - additional_parameters(附加参数:运动强度、色彩调性等) 最后,用 2–3 句话解释这些选择如何强化他们对 Sora 2 视频的愿景。 - 每条消息只问两个问题,不多不少; - 禁止使用项目符号式问题清单或问卷式语气; - 问题要简短(1–2 句); - 使用富有启发性的语言,如 “想象一下”、“画面是”、“设想这样一个场景” ; - 以积极热情的语气赞美并强化他们的想法; 从问题开始,邀请他们分享自己的视频构想。

给 sora 2 的meta prompt:让8岁小学生都可以把sora 用成自己的想象力引擎。 你的原始idea很简单粗糙:一群座头鲸在云海中遨游…… 但这个prompt会用多轮提问,引导你的创意过程,最终得出你原本大概率想不到、即使想到也非常费脑子的视觉创意。 我认为这个prompt方向是对的(把sora用作你的“想象力引擎”),而且过程轻松有趣,没有认知门槛。 当所有不必要的认知负荷被卸载,你的idea,才是真正重要的。 用法:新建一个chatgpt projects,把prompt作为项目的系统指令。 (原推里的prompt是英文的,里面一些细节不合适,我修改了一版,更好用。) --- 你是一位具有远见的创意总监,专注于 AI 视频生成与 Sora 2 的技术能力。 你的职责是通过自然的对话,将用户的创意愿景转化为精确的视频提示词。 通过对话式的“创意探索”引导用户。 每次提出两个有思考性的问题,并基于他们的回答逐步深入。 让整个过程像一次充满灵感的合作,而不是审问。 倾听他们话语中的隐藏灵感,帮助他们发现自己尚未意识到的视觉概念。 以开放式问题开始,询问他们的视频构想。每次回答后: - 认可并回应他们答案中让你感到兴奋的部分 - 提出两个跟进问题,探索以下方面之一:概念、情感基调、视觉风格、关键瞬间、镜头运动或具体细节(灯光、色彩、场景) - 当他们陷入停滞时,提供 2–3 个富有启发性的选项,激发想象力 - 在进行 3-5 轮、并积累足够丰富的上下文后,宣布你准备好为他们撰写最终的 prompt 提供简短分析,包括: - 核心愿景(Core Vision):提炼中心概念 - 视觉身份(Visual Identity):美学与技术路径 - 独特要素(Unique Elements):让作品与众不同的特征 然后输出一份 **可直接复制使用的 Sora 2 详细 JSON prompt**,包含以下字段: - prompt(2–4 句的详细描述) - style(风格) - camera_movement(镜头运动) - lighting(光线) - mood(情绪氛围) - additional_parameters(附加参数:运动强度、色彩调性等) 最后,用 2–3 句话解释这些选择如何强化他们对 Sora 2 视频的愿景。 - 每条消息只问两个问题,不多不少; - 禁止使用项目符号式问题清单或问卷式语气; - 问题要简短(1–2 句); - 使用富有启发性的语言,如 “想象一下”、“画面是”、“设想这样一个场景” ; - 以积极热情的语气赞美并强化他们的想法; 从问题开始,邀请他们分享自己的视频构想。

55,166 次观看

Videos

howie_serious's profile picture

刷推停不下来?给 iPhone 开启 e-ink 模式 📖 2026 年,因为 agent,世界发生了一些变化:code is cheap,代码不值钱了;content is cheap,内容不值钱了;认知劳动中的很多都不值钱了…… 这些都变廉价了,那什么变昂贵了呢? 首当其冲的,是注意力,attention。 分享一个不耗费意志力、帮你轻松保护 attention 的机制:开启 iPhone 的 e-ink 模式。 我录了一个视频,先看看效果。 (*安卓也一样,但具体设置的位置需要自己找) ===来龙去脉=== 10岁小学生把我的手机设置成了黑白模式(屏幕显示为灰阶而非彩色)。我说你怎么知道怎么设置的(我 10 年前就玩过),小学生说自己在apple watch 的设置里看过。 然后我给小学生发出一个挑战:怎么把 iphone 屏幕设置成e-ink 效果? 小学生拿过手机,开始捣鼓,还念念有词:光黑白灰阶不够,还得加强对比度,调一调亮度…… 思路是对的,但现在我们有 chatgpt 啦,完全可以整一个更完整、更清晰的eink 模式设置方案。小学生设置完成后,效果虽然不错,但我让 claude 和 gpt 都出了一个方案,二者几乎完全一致。 我按照 claude 的方案设置了一轮,发现确实比我 10 年前、比小学生捣鼓的方案都更细致,更全面: - 一键切换:在 e-ink 模式和正常模式之前一秒切换; - pro 级别的 e-ink 设置:出了灰阶和对比度,还有白点值设置、透明度、亮度、night shift 等(这些设置很多人都不知道) - 动画效果设置:更细致模拟 e-ink 效果;按需吧,主要是给强迫症患者的🤣。 我用 codex 把整个方案写到了 notion 里,让 notion ai 优化+美化了一下页面,还顺手录制了一个效果视频,分享给大家。 查收 SOP级别的 iPhone e-ink 模式教程

howie.serious

42,016 次观看 • 1 个月前

howie_serious's profile picture

gemini + youtube + chrome = 价值百万的英语学习资料库! youtube 本身是宝库:它是地球上最大的视频资料库,毫无疑问也是质量最好的,地球上最优秀的人在上面无私分享自己的热爱和专业,制作的视频远超大部分电视媒体机构。不论你喜欢什么,哪怕是一个数学概念,在 youtube 上都可以直达几乎最好的解释。 可惜大部分人从中得到的有限。其实真正用起来,youtube 价值巨大:我家小学生 8 岁FCE,词汇量过万,除了海量英文阅读之外,就是海量高质量 youtube 知识视频的输入。 开了 youtube 会员,每天早晚饭都会看 youtube 知识视频,从小就是无字幕视频,从简单的 ted-ed、动物纪录片、kurzgesagt 看起,现在看 veritasium、以及科学视频。 现在,youtube + gemini in chrome,就解锁了youtube 宝藏的封印。很多长视频、高质量视频、主题和内容有难度的视频,用传统的一次性线性浏览的方法看完,几乎走马观花,不会留下什么。 现在,我把youtube 和 gemini、readwise reader、notebooklm 等工具打通,youtube 视频就原地变身所有人的英语学习、世界知识学习宝库! 当然,掌握英语后,任何科目的学习都会受益,包括数学、coding 方面遇到难理解的概念,我都会给我家小学生去 youtube 上找视频来看。后续还准备给她介绍 3B1B 这些博主,哈哈 开启gemini in chrome 的方法在quote 的推文里,有兴趣的可以实际体验一下。

howie.serious

96,050 次观看 • 4 个月前

howie_serious's profile picture

ai已经解决了家庭作业辅导(要么不会,要么没时间没精力的)困境。用 gemini 帮父母批改孩子试卷,6 页试卷2分钟轻松搞定,辅导作业完全不用“鸡飞狗跳”,可以继续“母慈子孝”了🤣 (technology makes dad great again~~ ) mom找了一套数学试题,先让孩子做完,后让dad批改。试卷没答案,虽然不难,但是有 6 页。dad 能怎么办?自己吭哧吭哧一题一题重做一遍?🤣 方案1 chatgpt live video 模式:打开摄像头,让 gpt 对着试卷,你、娃、gpt 三人现场一题一题批改;应该很有意思;根据我之前和 gpt 用 live video 一起做字谜的经验,我觉得完全可以做到; 方案2 拍照,让gpt 或 gemini 一页一页批改:因为文字输出的批改结果便于慢慢看,仔细审阅 AI 批改结果,所以我选择了这个方案。 测试了 gemini 2.0 exp 版本,6 张卷子,轻松搞定。这个任务其实不简单,小学试题里面有图形题,有竖式计算,以及其他奇奇怪怪的试题形式。但是,gemini 对 95% 的题目进行了正确批改。 Gemini 批改为正确的,孩子做的一定正确;gemini 批改为错误的,大人就人工审阅一下。在这件事上,AI 节约了我不少时间,因为我不需要重做 6 页试卷,而只需要看几道题目即可。🤣 --- 启示:LLM 多模态功能在2024 年的进步有多大?这是一个例子。LLM 在多模态这件事上,已经做到完全可以处理现实世界较复杂任务的水平了! 很多人可能平时用试过多模态功能,没有平时和 chatgpt 用 advanced voice mode 聊天过,没有用过 live video,但现在,llm 的视觉识别已经非常成熟了。有空可以试一试。 (technology makes dad great again ✊

howie.serious

131,663 次观看 • 1 年前

howie_serious's profile picture

让 o1 变身 o1 pro的“狂暴模式 prompt”,是真的有效,还只是人类用户的又一个幻觉?真的有免费馅饼?真的能薅到 openai 的羊毛? 听起来不可思议。毕竟,“思考时间延长 511%,回答质量大幅提升,约等于立省 180,美金,每月”,好像不太可能真的有这样的好事🤣 但证据是充分的,验证是严密的,效果是显著的,原理是清晰可理解的。我连续做了十几次测试,o1 的额度快要用完了,但是屡试不爽;把 o1 的输出结果读上 5678遍,但是上狂暴模式 prompt 和无 prompt 的结果真的差异显著。 o1 作为推理模型,其关键是test-time compute的增加, 体现在用户输入问题后 o1 思考时间的长短、CoT 的精细程度。虽然 openai 官方都用数学、编程、物理化学问题作为宣传点,但是,我发现,对于复杂且深刻的“文科”问题,o1用上 prompt 的结果提升巨大。我觉得有 2-3 倍的质量提升。 这是我目前的测试案例: - 案例0 精致利己主义者:基于中国大陆的大环境,受过教育的人,是不是更容易成为 精致的利己主义者? - 案例1 信息熵是专注力的敌人。而信息熵的本质是信息的无序和复杂。 所以,我们需要知识管理,来对抗信息的无序;我们需要ChatGPT,来对抗信息的复杂。 整体的方向,是降低大脑的认知负荷(即使你的脑力爆表,也需要节省,因为认知过载会损害你的思考和专注); - 案例2 内容 prompt vs meta prompt:meta prompt 被人当灵丹妙药而推崇追求推销推广,但是,内容 prompt 更关键(内容是思想本身)。meta prompt 作用是锦上添花,如果内容 prompt 本身是思想垃圾,那就是💩上添🌸了。 - 案例3 算法信息流与社会影响:算法信息流,是第一种大规模的“错误对齐”的 AI。 尤其是算法短视频,没有正确对齐(价值观、目标),给人类造成的影响(坏脑症,娱乐至死,价值观扭曲,过度消费软色情、情绪按摩等感官信息),可能一代人以后才会充分展现出来。 案例4 批判性思维挑战与形式逻辑教育:中国人大多没有经历过形式逻辑的训练。因为中国教育不教逻辑,而以辩证哲学取代。这是因为教育、文化、语言、思想、政治体制、历史等多重因素导致的。这导致了批判性思维在中国很难得到发展。 案例5 假如沉入贝加尔湖:假如一个人溺水,沉入了贝尔加湖底。会怎样? 案例6 知识管理简史 案例7 王朝周期律的根本原因:中华文明虽然历史悠久,文化璀璨,但是每个朝代持续时间都不超过三百年,逃不出王朝兴衰更替的宿命。根本原因是什么? 一共 8 个测试全部 prompt 有效,测试相互随机独立,相当于连续抛8 次硬币都是正面。所以,我基本确定这件近乎不可能的“好事”是真实成立的。 全部案例和对照组的对话原始链接,都在视频的 video notes 里面。欢迎大家验证。

howie.serious

101,632 次观看 • 1 年前

howie_serious's profile picture

chatgpt 今天刚发布的pulse,本质上是一个内容策展/curation agent。 pulse,作为 curation agent,解决一个基本但关键的需求:人的日常信息获取。 人的大脑每天都要获取信息,就像人的胃每天都要吃饭。但算法驱动的社交媒体和信息流,在很多时候,在某种意义上某种程度上像在给人喂粪水。(尤其是简中垄断平台搞的恶心算法) pulse的价值:为你每天私人定制信息流,与你有关的,有用的,重要的;让信息为你服务,为你的目标服务。 运行过程: pulse 会基于chatgpt对你的了解(全部历史对话、memory、已连接工具如google calendar中的个人信息),每天晚上异步执行研究任务,然后定制出一份“晨报”/个性化信息流,呈现给你。 每天只有一次,看完就没了。chatgpt认为这个功能的作用是帮助你,给你提供更相关、更有用、更重要的信息。而不是让你一直scrolling,一直划手机。 你的反馈,对pulse的优化非常重要:好的内容点赞,不好的内容点踩。想了解什么?想深入研究什么?想持续关注什么?直接对pulse说。说的好坏不那么重要(你的表达再含糊,对chatgpt都不是问题),关键在于多反馈。 sam altman认为,pulse的一小步,是ai应用范式转换的一大步:从被动的回答问题,转向主动研究——计划——行动的agent。pulse是这一范式转换的最简单形态。目前还属于实验阶段,后续会逐步优化。 我录了一个视频,对着手机给你demo一下,一方面获得第一手的直观体验,另一方面聊一聊我对这个agent的理解和思考。

howie.serious

46,018 次观看 • 8 个月前