做RAG的朋友一定要看看 Google 这个新论文——MUVERA:让多向量检索与单向量搜索一样快 大家在RAG的检索内容过程都会遇到这种情况,如果用传统搜索(例如ElasticSearch),文档 = 1 个向量 → 快速但不准确。如果用向量数据库,现代多向量搜索:文档...

karminski-牙医's profile picture

karminski-牙医

30,043 просмотров • 11 месяцев назад

在 GitHub 上发现一个开源项目:Memvid,颠覆传统的向量数据库处理方式,直接将文本数据编码成视频文件。 通过将数百万文本块压缩到单个 MP4 文件中,不仅实现了 10 倍的存储压缩率,还能在亚秒级时间内完成语义搜索,完全无需数据库服务器。 GitHub:...

GitHubDaily's profile picture

GitHubDaily

57,587 просмотров • 1 год назад

Distil-Whisper:让语音识别的速度提高 5.8 倍,参数减少 51%,准确度保持在 99%。 Whisper 在语音识别方面表现卓著,但是它有一个明显的缺点:训练出来的小模型支持的语言比较少,而大模型推理速度又很慢。如果你有海量的数据需要处理,或者对实时性要求略高,那使用 Whisper 可能会让你比较头疼。...

Barret李靖's profile picture

Barret李靖

124,227 просмотров • 2 лет назад

.Irys (✧ᴗ✧) 主网的脚步越来越近,叙事正在悄然转变。 别再只当它是存储协议。 它的新身份:数据执行层。 目标从来不只是存储。 而是让数据真正活起来——结构化、可验证、可交互。 过去需要多层架构才能实现的功能,Irys 用一个统一接口全部搞定,将存储、索引、权限控制和可编程读写融为一体。...

阿毛's profile picture

阿毛

13,685 просмотров • 8 месяцев назад

暴力,Google直接把31GB向量干到4GB, 压缩率92%! 本地跑大模型RAG,以前要服务器,现在笔记本+RTX4090直接猛干! 意味着: 以后手机、笔记本就能跑百万token长上下文(million-token long context),隐私数据全本地搞,再也不用给大厂喂数据! 开源利器 turbovec给力了:...

HankAI's profile picture

HankAI

266,531 просмотров • 18 дней назад

Qrs 二维码传输文件的小工具有了重大更新:传输速度大幅提升! 用了 Luby Transform 编码。它是喷泉码(Fountain Codes)的一种。基本原理是将原始数据分成多个小块,然后通过编码生成无限数量的编码块。接收方只需收到足够多的编码块(通常比原始块稍多)就可以重建原始数据。

绚香音 Rizumu's profile picture

绚香音 Rizumu

168,648 просмотров • 1 год назад

今天出差路上,突然意识到命运这东西确实存在。不然怎么解释,有人日夜奔波勉强温饱,有人却云淡风轻就拥有了一切? 那些不争不抢却拥有一切的人,绝大多数并不是天生好命,而是在某个关键节点,做了一个当时看起来不起眼、事后被证明无比正确的选择。可能是十年前咬牙买下的一套房子,可能是五年前毅然转行的一个决定,也可能是三年前认准了一个新兴平台开始深耕。 记住:你的选择决定了你会遇见谁,经历什么,成为怎样的人。在重要的十字路口,谨慎选择但不要逃避选择。因为不去选择,本身就是一种选择——你选择了让命运替你决定人生。 很多人一辈子都在埋头苦干,却从没抬头看路。他们相信勤劳致富,却不知道选择致富比勤劳致富快十倍。当新趋势来临的时候,他们的第一反应是怀疑、否定、嘲笑,等到别人已经靠这个趋势赚得盆满钵满时,他们才后知后觉地想要入场,却发现最好的时机已经过去。 选择的价值在于它是指数级的。一个正确的选择带来的不是线性增长,而是阶跃式的飞跃。就像滚雪球,最重要的不是初始的雪量,而是找到那条足够长的坡道。你的每一个选择,都是在为这个雪球选择滚动的方向。 这个时代的残酷在于,它不会因为你的努力而给予回报。真正的回报只给那些在正确方向上努力的人。在传统行业拼死拼活,可能不如一个新赛道上的简单尝试。这不是命运不公,而是认知的差距。 所以,别一味相信命运的安排。要相信选择的力量。人生的分水岭,不在起点,不在终点,而在那些关键的选择点上。选择比努力重要,方向比速度重要。你的每一个选择,都在悄悄改变你人生的轨迹。 命运或许更像是一副牌局。有人天生拿了一手好牌,这不可否认。但真正决定结局的,往往不是牌的好坏,而是出牌的选择。一个好的选择,其力量足以扭转整局游戏的走向。

东京。晚霞。东京大学教授说,日本是非移民国家,但对中国和韩国的移民不排斥。所以,印度人很难占领日本?他说是的。印度的持续人口扩张,不只限于它国内,而是向全球扩张。在与印度关系“更近”的西方国家,尤其是同为英语母语的国家,印度裔人口的规模更是有过之无不及。在英国,印度裔不仅数量惊人,甚至还出了个大英首相,大有“反向殖民”之势。那么,印裔如何在十年间成为加拿大的“主人”?

亚洲金融 Asia Finance's profile picture

亚洲金融 Asia Finance

338,721 просмотров • 1 год назад

以时速80公里把自己从时速80公里的卡车上发射出去。 会发生什么? 答案是:原地落下。 教科书上的物理学,有人用身体去验证了。 向前的速度,正好被向后的发射速度抵消。 相对于地面,速度为零。 这背后是一个关于能量效率的简单道理。 就像动画《高达》里,为什么战舰不从后方弹射机体出击? 因为那是巨大的能量浪费。...

战斗室's profile picture

战斗室

572,169 просмотров • 4 месяцев назад

重构 Meme 资产的链上使用方式是 MemeMax 的本质。 大多数人理解 Meme,停留在两个层面。 一个是价格波动。 一个是情绪传播。...

草帽 boy's profile picture

草帽 boy

86,536 просмотров • 5 месяцев назад

一个人的概念量,尤其是清晰准确的概念量,是衡量智能水平的最佳数据指标。而最佳落地实践工具一直近在眼前👀 这种概念量,最好的管理、迭代、积累方式就是logseq。用了一年多logseq,我积累了接近 6000 条概念笔记,相互之间建立了12000 个链接,共同构成了一个不小的 LCM(大概念模型,meta 最新提出的理论,我还没细看,但是和我的实践差不多🤣)。 对比之下,我 2009...

howie.serious's profile picture

howie.serious

105,522 просмотров • 1 год назад

LongWriter 是一个由清华大学数据挖掘研究小组(THUDM)开发的开源项目 旨在让LLMs生成超长文本 LongWriter解决了LLMs生成内容的时候容易出现上下文不连贯或信息重复的情况 同时能在不到一分钟内,生成超过 10000 字,甚至20000 字连贯性、结构合理且逻辑清晰、条理分明的超长内容。 LongWriter是通过一种基于代理的“计划-写作”方法,将复杂的长文本生成任务分解为多个子任务,每个子任务只需生成一段文本。...

小互's profile picture

小互

19,742 просмотров • 1 год назад

在抖音越来越多的人采用这种方式了,据说要评论 她才能拿到钱,评论区里都是“万一只差一个逗号呢”之类的留言,所以这类视频的流量通常都很不错。

iGeekbb's profile picture

iGeekbb

1,043,997 просмотров • 6 месяцев назад

我竟然看懂这篇文章了😂 类似于Karparthy知识库的逻辑,个人知识库可以有更多延伸的方式的。这个知识库分了5层,把博主以往发出的所有内容进行归档拆分,在继续创作的时候,可以用skill调取相关节点的内容进行重组。 🆚对比自己的知识库,训练的意义在于重塑所有信息之间的联系,让理解方式融会贯通

LISA's profile picture

LISA

15,309 просмотров • 23 дней назад

一晚上没睡 翻看了这几年的相册感慨很多 这两年我一直专注自己 我远离所有低能量的人去激活自己的高能量 喝酒只是想喝酒 不再是负能量的发泄 准确的来说我没有负能量 可能能量效应的原因我也在越来越好 我永远记得穷途末路时心里那种天差地别的滋味...

Rinoa's profile picture

Rinoa

65,428 просмотров • 8 месяцев назад

把 iPhone 17 PM 放到狗狗的不锈钢饭盆里传数据,真的快了好多… 我老婆手机数据量只有500多G,我有1T多,但我最终用时比她的少了2h! 这一代用起来没啥变化,我唯一感到舒服的就是信号貌似变好了? 总之不建议换…我是为了给老婆换机子才顺带换的,这下至少又能用3年…🤣

Crypto_Painter's profile picture

Crypto_Painter

25,483 просмотров • 8 месяцев назад

很多人在研究 StandX 的时候,习惯性地会把它归类为又一个永续合约交易所,然后就开始机械地对比手续费或者奖励政策。 说实话,如果你的视角只停留在这些表面参数上,那大概率会错过它真正想做的那次底层取舍。 它真正动刀子的地方,其实不在于交易撮合有多快,也不在于界面做得多华丽,而是在于清算这件事本身。 如果你在币圈待得够久,你就会发现,链上衍生品发展到今天,最大的系统性风险从来不是成交深度够不够,而是清算过程中的那种失序感。 别只盯着深度看,清算才是协议的死穴 现在的链上衍生品市场,看起来挺热闹,但其实逻辑挺脆弱的。 一旦行情出现那种极端的剧烈波动,清算价格往往会被预言机牵着鼻子走,导致大量的仓位在短时间内集中爆掉。...

草帽 boy's profile picture

草帽 boy

12,435 просмотров • 5 месяцев назад

谷歌也发布了一个根据输入图片和音频就能生成对应人物讲话视频的项目VLOGGER。看起来没有阿里那个自然。 项目简介: 它可以根据一张人物图像,生成由文本和音频驱动的说话人视频。该方法建立在最近生成式扩散模型取得成功的基础之上。 VLOGGER 包含两个关键组件: 1) 一个随机的人体到 3D 运动的扩散模型;...

歸藏(guizang.ai)'s profile picture

歸藏(guizang.ai)

31,171 просмотров • 2 лет назад

全自动科学论文工厂,它真的来了。 你该看看这个新仓库。 之前那个中国大学生搞了个MiroFish,做实时社会模拟;字节跳动那边出了OpenViking,把记忆结构化;还有Percepta,把数学计算直接嵌进大模型的权重里;吴恩达那边也推了个Context Hub,相当于给代理加了一层自己标注的文档系统。 👉 Polymarket 官方入口: 现在,AutoResearchClaw 刚在...

区块链行情研究's profile picture

区块链行情研究

62,073 просмотров • 3 месяцев назад

MiMo推出1000 Token/s超高速模型|体验测评 MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本,能够实现每秒输出超过...

歸藏(guizang.ai)'s profile picture

歸藏(guizang.ai)

26,223 просмотров • 17 дней назад

Google推出了一种在 StableDiffusion 图像生成中保证内容特征一致性的方式。 这个其实是现在图像生成中一个非常重要的问题,故事可视化、游戏开发资产设计、广告等都需要在生成的时候具备角色或者内容的一致性。 从演示来看效果非常好人物角色和其他内容的特征都保持的非常好,他们有一个示例是一个男人的一生十几张不同年龄段的图片都很像能看出来是一个人。 而且这个项目还可以跟 SD 已有的控制方式结合,比如局部重绘和 Controlnet...

歸藏(guizang.ai)'s profile picture

歸藏(guizang.ai)

125,770 просмотров • 2 лет назад