lucas's banner
lucas's profile picture

lucas

@lucas_flatwhite14,316 subscribers

ai x software engineer / art enthusiast / capitalism x investment / cat in pic https://t.co/N61jJXagbK

Shorts

잊고 있다가 3개월만에 기억남 ㅋㅋ 포트폴리오 GitHub repo 여기요! Blender + Three.js + Krita ✨

잊고 있다가 3개월만에 기억남 ㅋㅋ 포트폴리오 GitHub repo 여기요! Blender + Three.js + Krita ✨

53,169 Aufrufe

나노바나나 인포그래픽 패턴집 개발자 등판 ㄷㄷ 슬쩍 크롬 확장 프로그램 던져주고 가시는데.. 설치해보니 편하네요. 왜냐면 NotebookLM 에서 프롬프트 패턴집과 연동할 수 있어요. 그래서 자주 사용하는 인포그래픽 프롬프트 패턴을 저장해놓고 바로바로 쓸 수 있습니다! 여기에 실시간 프리뷰, 커스텀 스타일 저장, 한국어 지원.. 👍🏻 특히 NotebookLM을 자주 쓰시고, 그래픽 활용 하시는 분들에게 좋겠네요~~

나노바나나 인포그래픽 패턴집 개발자 등판 ㄷㄷ 슬쩍 크롬 확장 프로그램 던져주고 가시는데.. 설치해보니 편하네요. 왜냐면 NotebookLM 에서 프롬프트 패턴집과 연동할 수 있어요. 그래서 자주 사용하는 인포그래픽 프롬프트 패턴을 저장해놓고 바로바로 쓸 수 있습니다! 여기에 실시간 프리뷰, 커스텀 스타일 저장, 한국어 지원.. 👍🏻 특히 NotebookLM을 자주 쓰시고, 그래픽 활용 하시는 분들에게 좋겠네요~~

138,623 Aufrufe

URL 하나로 DESIGN.md 얻으세요! 🛠 Design Extractor 아이디어 자체는 단순한데, 실용성이 꽤 높아요. 마음에 드는 사이트의 디자인 언어를 그대로 냅다 뽑아서 내 프로젝트에 심는 것. 에이전트한테 "Linear 느낌으로 만들어줘욧!"라고 설명하는 대신, Linear를 직접 분석한 DESIGN.md를 던져주는 방식입니다. 사이트는 계속 개선 중이라서 북마크 해두면 좋아요. 기존 디자인 파일을 참고해도 매우 도움이 되지요! ↓ 📄 생성되는 DESIGN.md에 포함된 것들 1. Color Palette > primary, secondary, accent, background 전체 색상 체계 2. Typography > 폰트 패밀리, 굵기, 사이즈, 줄 높이까지 3. Spacing & Shape > 패딩, 반경, 레이아웃 값 4. CSS Variables > 실제 코드에서 바로 쓸 수 있는 커스텀 속성 매핑 5. Theme Tags > 전체 분위기와 디자인 키워드 요약 갤러리만 참고해도 좋아요. 북마크!!!

URL 하나로 DESIGN.md 얻으세요! 🛠 Design Extractor 아이디어 자체는 단순한데, 실용성이 꽤 높아요. 마음에 드는 사이트의 디자인 언어를 그대로 냅다 뽑아서 내 프로젝트에 심는 것. 에이전트한테 "Linear 느낌으로 만들어줘욧!"라고 설명하는 대신, Linear를 직접 분석한 DESIGN.md를 던져주는 방식입니다. 사이트는 계속 개선 중이라서 북마크 해두면 좋아요. 기존 디자인 파일을 참고해도 매우 도움이 되지요! ↓ 📄 생성되는 DESIGN.md에 포함된 것들 1. Color Palette > primary, secondary, accent, background 전체 색상 체계 2. Typography > 폰트 패밀리, 굵기, 사이즈, 줄 높이까지 3. Spacing & Shape > 패딩, 반경, 레이아웃 값 4. CSS Variables > 실제 코드에서 바로 쓸 수 있는 커스텀 속성 매핑 5. Theme Tags > 전체 분위기와 디자인 키워드 요약 갤러리만 참고해도 좋아요. 북마크!!!

35,733 Aufrufe

Videos

lucas_flatwhite's profile picture

🎨 웹사이트 디자인을 DESIGN.md로 뽑아주는 크롬 확장 프로그램 > DesignMD Style Extractor 마음에 드는 웹사이트 스타일, 그냥 냅다 뽑아버리세욧! Claude Code.. 어디든 디자인 맥락 잡을 때 이렇게 편하게 시작할 수 있네요! 바로 설치해서 써보니 너무.. 편함.. 폰트가 뭔지, 색상 코드가 뭔지, 간격이 어떻게 되는지 확인할 필요 없어요. 버튼 하나로 지금 보고 있는 사이트의 디자인 시스템을 자동으로 분석해서 DESIGN.md 파일로 뽑아줍니다. 그리고 SKILL.md 이것도 바로 옆에서 뽑아주네요?? Claude Code, Codex, Google Stitch 같은 AI 에이전트에 바로 던져주면 그 사이트 느낌 그대로 UI를 만들 수 있죠. 뭘 추출하냐면: - 타이포그래피 > 폰트 패밀리, 사이즈, 자간, 행간 - 컬러 > 주요 색상, 배경, 텍스트, 포인트 컬러 - 간격 & 레이아웃 > 패딩, 마진, 그리드 시스템 - 모서리 반경 > 버튼이나 카드가 얼마나 둥근지 - 그림자 & 모션 > 호버 효과, 트랜지션 느낌 그리고 이걸 그냥 수치만 나열하는 게 아니라, AI가 읽기 좋은 구조로 정리해줘요. 미션, 브랜드 무드, 디자인 원칙, Do/Don't 가이드까지 포함된 마크다운 문서가 나옵니다. 아까도 얘기했듯이 SKILL.md 형식도 지원해서 Claude Code 스킬 파일로도 바로 쓸 수 있어요. 레퍼런스 사이트 찾아서,, 이 느낌으로 만들어줘요~~ 하는 워크플로우 생각하시는 분들에게는.. 이거 하나면 디자인 컨텍스트 세팅이 훨씬 빠르게 될 듯?!

lucas

138,077 Aufrufe • vor 1 Monat

lucas_flatwhite's profile picture

"Claude가 혼자 6시간 동안 풀스택 앱을 만들었어요" = 비밀은 Claude 하나가 아니라, Claude 셋이 서로를 감시하는 구조에 있었습니닷! AI에게 웹사이트 하나 만들어줘요~~~~라고 하면, 꽤 그럴듯한 결과물이 나오죠. 하지만 레트로 게임 메이커를 만들어줘요!! 라고 하면? 20분 만에 뭔가 나오긴 하지만, 게임이 실제로 작동하진 않죠. 버튼은 있는데 눌러도 아무 일도 안 일어나요. Anthropic Labs에서는 이 문제의 근본 원인을 두 가지로 짚었어요. ↓ 문제 1: 컨텍스트 불안감 긴 작업을 시키면 Claude의 컨텍스트 윈도우가 점점 채워져요. 그러면 흥미로운 현상이 벌어지죠. 모델이 공간이 부족해지고 있다고 느끼기 시작하면서, 작업을 서둘러 끝내려고 해요. 디테일을 빼먹고, 기능을 건너뛰고, ㅇㅇ 이 정도면 됨! 그리고 마무리하는 거예요. 사람이 마감에 쫓길 때와 비슷하죠. 급한 마음에 품질이 떨어지는 거예요. + 문제 2: 자기평가의 함정 이거 잘 만들었어요? 라고 Claude에게 물어보면, 높은 확률로 넵굳!! 이렇게 대답해요... 자기 작품에 대한 편향이 있는 거예요. 코드가 작동하는지, 디자인이 좋은지 같은 주관적 판단에서 특히 심해요. ↓ 해결책: GAN에서 영감을 받은 "만드는 Claude"와 "심사하는 Claude" Anthropic이 택한 접근법이 정말 흥미롭습니다! 딥러닝의 GAN = Generative Adversarial Network 에서 아이디어를 가져왔어요. GAN에서 생성기와 판별기가 서로 경쟁하면서 품질이 올라가는 것처럼, Claude 에이전트들도 역할을 나눈 거예요. - 생성기: 실제 코드를 쓰고, UI를 만들고, 기능을 구현하는 Claude - 평가기: 만들어진 결과물을 직접 써보고, 구석구석 테스트하고, 냉정하게 피드백하는 Claude 평가기는 Playwright MCP를 사용해서 실제로 브라우저를 열고, 버튼을 클릭하고, 페이지를 돌아다녀요. 눈으로 보면서 버튼이 안 눌리는지, 색상 조합을 읽기 힘든지.. 꽤 구체적으로 지적하죠. ↓ 프론트엔드 디자인: 주관적인 "예쁜지"를 측정 가능하게 디자인이 좋은지 나쁜지는 주관적이잖아요. Anthropic은 이걸 네 가지 기준으로 구조화했어요. 1. 설계 품질 > 색상, 타이포그래피, 레이아웃이 하나의 일관된 전체를 형성하는지 2. 독창성 > 템플릿 같은 뻔한 레이아웃이 아니라 맞춤형 결정의 흔적이 있는지 3. 기술성 > 타이포그래피 위계, 간격 일관성, 색상 조화가 세밀한지 4. 기능성 > 사용자가 실제로 인터페이스를 이해하고 작업을 완료할 수 있는지 미술관 웹사이트를 만들라고 했을 때, 처음에는 평범한 어두운 테마 사이트가 나왔어요. 하지만 평가기가 계속 피드백을 주면서 10번째 반복에서는 CSS 원근법으로 렌더링된 3D 공간에 미술작품이 떠 있는 경험으로 완전히 변신했다고 합니다! ↓ 풀스택으로 확장: 세 에이전트 체제 프론트엔드를 넘어 풀스택 애플리케이션을 만들 때는 에이전트가 셋으로 늘었어요. 1. 플래너 > 짧은 프롬프트를 전체 제품 사양으로 확장하고, AI 기능 통합 기회를 찾아요 2. 생성기 > React + Vite + FastAPI + SQLite 스택으로 기능별 구현 3. 평가기 > Playwright로 실행 중인 앱을 직접 클릭하면서 테스트 여기서 숫자가 인상적이에요. 단일 에이전트로 레트로 게임 메이커를 만들면? 20분, $9 기능적이지만 게임이 작동하지 않아요. 전체 하네스로 만들면? 6시간, $200 완전히 작동하는 게임, UI 폴리시, 엔티티 제어까지 갖춘 결과물이 나와요. 20배 비용이 들지만, 작동하지 않는 것과 완성품의 차이...! ↓ Opus 4.6의 등장, 여기에 하네스의 진화 흥미로운 건 모델이 좋아지면서 하네스도 변했다는 거예요. Claude Opus 4.6가 나오자, 기존에 필요했던 "스프린트 구조"와 "컨텍스트 리셋"을 제거할 수 있었어요. 모델이 더 긴 컨텍스트를 안정적으로 유지할 수 있게 됐으니까요. 업데이트된 하네스로 디지털 오디오 워크스테이션을 만든 결과를 보면.. - 플래너: 4.7분, $0.46 - 빌드: 3시간 10분, $113.85 - QA: 25.2분, $10.39 - 전체: 3시간 50분, $124.70 평가기는 클립 드래그, 악기 UI 패널, 이펙트 시각화 같은 세밀한 결함까지 잡아냈어요. ↓ 우리는 여기서 3가지를 얻을 수 있어요. 1. 모델을 실험하라 현실적인 문제에 모델을 직접 던져보고, 추적 로그를 읽어야 해요. 벤치마크 점수가 아니라, 실제 작업에서 어디서 무너지는지를 관찰하는 거예요. 2. 작업을 분해하라 복잡한 작업에서는 하나의 에이전트가 모든 걸 하는 것보다, 각 측면에 전문화된 에이전트를 배치하는 게 효과적이에요. 3. 복잡성은 이동한다 이게 가장 통찰력 있는 포인트예요. 새 모델이 나오면 하네스를 다시 검토해서 더 이상 필요 없는 구성 요소를 제거해야 해요. 모델이 좋아지면 하네스가 단순해지는 게 아니라, 하네스가 할 수 있는 일의 영역이 이동하는 거예요. 💭 "흥미로운 하네스 조합의 공간이 줄어들지 않고, 이동한다!" 모델 성능이 올라갈수록 에이전트 오케스트레이션이 불필요해질 거라고 생각할 수 있어요. 하지만 Anthropic의 경험은 반대를 말하고 있죠. 예전에는 "컨텍스트를 잃지 않게 하기"에 하네스의 복잡성을 쏟았다면, 이제는 "더 야심찬 작업을 더 높은 품질로 완성하기"에 복잡성을 쏟을 수 있게 된 거예요. 천장이 올라갔을 뿐, 사라지지 않았죠. 결국 AI 엔지니어링의 핵심은 모델의 능력 경계를 계속 따라가면서, 그 경계 위에서 새로운 조합을 찾는 일이지 않을까 생각해봅니다.. 단일 에이전트로 충분한 영역은 단순하게. 여러 에이전트가 필요한 영역은 구조적으로. 그 경계를 읽는 눈을 기르는게 좋은 AI 엔지니어와 그렇지 않은 엔지니어의 차이가 되고 있어요.

lucas

69,839 Aufrufe • vor 2 Monaten

lucas_flatwhite's profile picture

와.. 이제 AI 에이전트가 Figma 캔버스 위에서 직접 디자인 하는 시대!! Figma가 놀라운 발표를 했네요. Claude Code로 바로요! use_figma 라는 새로운 MCP 도구와 에이전트를 가르치는 스킬을 함께 공개했어요. 오픈 베타가 오늘부터 시작됩니다. "오늘 Figma MCP 업데이트로, 제가 본 Claude Code 연동 중에서도 가장 강력한 통합 중 하나가 되었습니다. 이제 Claude Code를 사용해, 디자인 시스템의 전체 맥락을 이해한 상태로 Figma에서 디자인할 수 있습니다." - Thariq, Claude Code ↓ 무엇이 달라졌나!! 기존 Figma MCP 서버는 주로 디자인을 코드로 변환하는 방향에 초점이 맞춰져 있었어요. Figma에서 프레임을 선택하고, 그 디자인 컨텍스트를 AI 에이전트에게 전달해서 React, Vue, SwiftUI 같은 코드로 생성하는 흐름... 이번 업데이트의 핵심은 반대 방향이 열렸다는 것예요! AI 에이전트가 Figma 캔버스에 직접 쓸 수 있게 되었습니다... use_figma 도구는 Figma의 범용 쓰기 도구예요. 이걸로 할 수 있는 일! - 페이지, 프레임, 컴포넌트 생성 및 편집 - 변수와 스타일 생성 및 수정 - 텍스트, 이미지 배치 - 오토 레이아웃 설정 - Variants 구성 - Figma 파일 내 모든 오브젝트의 검사, 삭제, 수정 한마디로.. 디자이너가 Figma 위에서 하는 거의 모든 작업을 에이전트가 할 수 있게 된거라구요!!! ↓ Claude Code 에서 활용하는 법 > claude mcp add --transport http figma 플러그인이 좋다구요? > claude plugin install figma@claude-plugins-official 플러그인을 설치하면 MCP 서버 설정뿐 아니라, 디자인 구현, Code Connect 설정, 디자인 시스템 규칙 생성 같은 일반적인 워크플로우를 위한 에이전트 스킬도 함께 번들됩니다! 그냥 아예 미쳤네요..

lucas

50,735 Aufrufe • vor 2 Monaten

lucas_flatwhite's profile picture

Anthropic이 Claude Cowork에 새로운 기능을 리서치 프리뷰로 공개했네요. > 그 이름은 Dispatch !!! 한줄 요약 = 핸드폰으로 메시지를 보내면, 내 컴퓨터에서 Claude가 알아서 일을 처리해줌! Dispatch가 기존 AI 어시스턴트와 다른 점은, 하나의 영속적인 대화 스레드에서 모든 작업이 이루어진다는 점이에요. 탭을 닫고, 자리를 떠났다가, 다시 돌아와도,, Claude는 그 자리에서 계속 일하고 있습니다. 출근 전 지하철에서 "오늘 대시보드 데이터로 리포트 만들어줘"라고 보내면, 오피스 도착 전에 완성된 파일이 기다리고 있는 것.. ↓ 보안 설계도 인상적이네요. Claude는 내 컴퓨터의 샌드박스 안에서만 실행되고, 파일은 로컬을 떠나지 않아요. Claude가 무언가를 건드리기 전엔 내가 먼저 승인해야 하죠. 클라우드 어딘가에 올라간다는 불안 없이, 진짜 내 데이터를 가지고 일을 시킬 수 있어요. 워키토키 비유가 정확함.. 핸드폰은 리모컨이 되고, 컴퓨터에서는 Claude가 그 명령을 받아 실행하는 구조. 파일 정리, 슬랙 검색, 이메일 확인, 프레젠테이션 작성... Claude가 컴퓨터에서 할 수 있는 모든 것들이 이제 폰 하나로 트리거됩니다. ↓ OpenClaw가 AI 에이전트의 실행 인프라를 열었다면, Dispatch는 그 실행을 '어디서든 지시할 수 있는 인터페이스'를 완성한게 아닌가 싶네요. 사용해보려면 Claude Desktop을 다운로드한 후 폰과 페어링! 데스크탑은 반드시 실행 중이어야 하구요. Cowork 자체와 마찬가지로 초기 버전으로 출시했기 때문에 앞으로 며칠에서 몇 주 안에 더 많은 업데이트가 있을 예정이라고 합니다. 지금 Max 구독자를 대상으로 롤아웃 중.. Pro는 며칠 내로 지원 예정!

lucas

54,287 Aufrufe • vor 2 Monaten

lucas_flatwhite's profile picture

📑 Claude Code로 만든 AI 구직 에이전트 > Career-Ops 이건 단순한 이력서 자동 생성기가 아니네요. 구직을 감이 아니라 시스템으로 운영할 수 있다는 것.. 트윗에서 느껴졌던 임팩트도 바로 그 지점이구요. - 실제로 700개가 넘는 지원 프로세스를 운영해봤고, - 그 과정에서 만든 시스템을 오픈소스로 공개했고, - 공고 수집, 적합도 평가, CV 재작성, 지원 추적, 폼 작성까지 하나의 흐름으로 연결해둠! 이 시스템으로 740개 이상의 job offers를 평가했고, 100개 이상의 맞춤형 CV를 만듬... Head of Applied AI !! 이론상 가능한 자동화가 아니라 이미 한 번 실전에서 끝까지 굴러간 운영체계라는게 재미있네요. Anthropic, OpenAI, ElevenLabs 같은 45개 이상의 회사들을 포함해 여러 포털을 기본 설정으로 스캔 가능 ㄷㄷ ↓ 구직을 단발성 액션이 아니라 파이프라인으로 본다는 점! 채용 공고 URL이나 JD를 붙여넣으면 → 먼저 역할 archetype을 분류하고 → A-F 점수 체계로 fit을 평가하고 → 그 결과를 리포트, PDF, tracker로 분기합니다. 마구 많이 넣는 용도가 아니라, 점수화와 리서치로 정말 맞는 공고에만 집중하라는 철학이 들어가 있네요. 14개의 skill/mode, Go 기반 터미널 대시보드, Playwright 기반 PDF 생성... 이렇게 디테일하게 만들었네요? 구직 전체를 운영하는 에이전트형 워크스페이스.. ↓ 누가 보면 좋을지 생각해봤습니다. - 매 지원마다 CV와 스토리텔링을 다시 짜는 비용이 큰 사람 - 구직을 스프레드시트 몇 장이 아니라 재현 가능한 시스템으로 관리하고 싶은 사람 반대로 무작정 많은 회사에 빠르게 넣는 방식과는 결이 다르네요. 그리고 개발 관점에서도 구직이라는 반복 업무 전체를 에이전트 파이프라인으로 재구성했고, Claude Code를 실전용 vertical agent로 바꾸는 방식을 참고할 수도 있다고 봐요.

lucas

37,031 Aufrufe • vor 2 Monaten

lucas_flatwhite's profile picture

Hallmark 오픈소스 디자인 스킬이 나왔네요..🎨 AI-generated처럼 보이는 것을 거부하는 디자인 스킬 Claude Code, Cursor, Codex에서 AI가 만든 티가 나는 UI를 덜 만들게 해준다니! 설치도 간단해요. > npx skills add nutlope/hallmark AI 코딩 에이전트로 랜딩 페이지나 UI를 만들면 속도는 정말 빠른데, 결과물이 어딘가 비슷비슷해지는 문제가 있죠. 큰 그라데이션, 과한 glow, 뻔한 카드 레이아웃, 의미 없는 badge, 어디서 본 듯한 hero section.. Hallmark는 이걸 정면으로 겨냥한 프로젝트 같아요. ↓ Hallmark에는 4가지 명령이 있어요. 1. Build 간단한 질문 3개를 던진 뒤, 그 답을 바탕으로 사이트를 만들어줘요. 2. Study 스크린샷이나 사이트를 넣으면 디자인의 DNA를 추출해요. 단순히 복제하는 게 아니라, 구조/타이포/컬러/분위기 같은 특징을 읽어내는 방식. 3. Redesign 기존 카피와 브랜드는 유지하되, 사이트를 완전히 다른 인상으로 다시 만들어줍니다. 4. Audit 현재 UI에 어떤 AI 티가 나는지 보고서 형태로 점검해줍니다. 이 중에서 특히 Study가 좋아 보이네요? 왜냐면 단순히 "Stripe 느낌으로 해줘요" 같은 프롬프트보다 한 단계 더 구체적으로, 사용자가 좋아하는 디자인의 구조적 특징을 분석해서 다른 작업에 적용할 수 있게 해주는 접근이거든요. ↓ GitHub를 또 살펴보니 typography, colour, layout, motion, microinteraction, structural variety 같은 요소를 하나의 룰셋으로도 묶어놨네요. 그리고 21개 macrostructure, 22개 theme, 60개가 넘는 slop-test gate, pre-emit self-critique 같은 장치들이 들어가 있습니다. 뭐가 되게 많음! 이런 구성이 재미있는건 이제 AI 디자인 품질이 단순히 더 좋은 모델을 쓰면 해결되는 문제만은 아니라는 점을 보여주는 것 같아요. 좋은 UI는 결국 취향, 제약, 금지 규칙, 체크리스트, 반복적인 비평에서 나오는게 아닐까 싶기도 하구요. Hallmark는 그 과정을 하나의 skill로 패키징한 느낌!

lucas

11,858 Aufrufe • vor 17 Tagen

lucas_flatwhite's profile picture

구글 A2UI: Agent-to-User Interface AI 에이전트가 텍스트만 생성하던 시대에서 또 달라지고 있음. 이제 에이전트는 사용자 인터페이스 자체를 만들어냄. 구글이 이번에 공개한 A2UI는 에이전트가 UI를 "말할 수 있게" 만드는 오픈소스 프로젝트. 에이전트가 JSON 형식으로 UI 청사진을 보내면, 클라이언트 앱이 자신의 네이티브 컴포넌트로 이를 렌더링함. 코드가 아니라 데이터로 UI를 전송하기 때문에 보안이 강력하고, 동시에 표현력도 코드만큼 풍부함. 현재의 방식에서 무겁고, 앱의 네이티브 스타일링과 맞지 않으며, 보안 경계 관리가 복잡한 상황을 해결하려함. 데이터처럼 안전하면서 코드처럼 표현력 있는 UI 전송 방법이 필요. ↓ 메시지 시퀀스로서의 UI 스펙 A2UI는 에이전트가 즉석에서 구조화된 출력으로 생성하거나 템플릿으로 사용해 값을 채울 수 있는 표준 포맷을 제공함. 이 JSON 페이로드는 A2A, AG UI 등을 통해 클라이언트로 전송됨. 클라이언트는 자신의 네이티브 UI 컴포넌트로 렌더링. 클라이언트가 스타일링과 보안을 완전히 제어하므로 에이전트 출력이 항상 앱에 네이티브하게 느껴짐. 예를들어 사용자가 사진을 업로드하면, 원격 에이전트가 Gemini로 사진을 이해하고 조경 고객의 특정 니즈에 맞춘 맞춤형 폼을 만듬. 혹은 에이전트가 인터랙티브 차트와 Google Maps가 포함된 커스텀 컴포넌트로 응답할 수도 있음. ↓ A2UI를 이해하는 가장 좋은 방법은 직접 실행해보는 것. Google은 생태계와 협력해 포맷을 개선하고, 다양한 클라이언트 라이브러리에 A2UI를 연결하고, 더 강력한 도구를 만들고, 개발자 온보딩과 샘플을 제공하려 함. 무섭..

lucas

14,882 Aufrufe • vor 5 Monaten

lucas_flatwhite's profile picture

벡터 DB 없는 RAG? PageIndex가 보여주는 추론 검색의 가능성 벡터 DB도, 임베딩도, 청킹도 없는 새로운 RAG 접근 방식이 나왔네요. 그런데 금융 벤치마크에서 98.7% 정확도.. SOTA를 찍었네요? 이건 좀 봐야할 듯 합니다. 📦 GitHub - VectifyAI/PageIndex 기존 RAG의 고질적인 문제는 '유사도가 곧 관련성은 아니다'라는 점이죠. 질문이랑 비슷해 보이는 텍스트를 가져오지만, 진짜 정답은 전혀 다른 맥락에 숨어있을 때가 많으니까요. ↓ VectifyAI의 PageIndex는 이 문제를 완전히 다르게 풉니다. 문서를 Chunking 이렇게 잘게 쪼개서 벡터 공간에 뿌리는 대신, 문서 전체를 '지능형 목차' 같은 계층적 트리 구조로 만듭니다. 그리고 LLM이 이 트리를 '추론'하며 탐색하게 하죠. "이 질문이랑 비슷한 텍스트가 어디 있지?"라고 묻는 게 아니라, "이 문서의 구조상, 전문가라면 어디를 먼저 찾아볼까?"라고 추론하는 겁니다. ↓ 이 방식의 장점은 명확합니다. 1. 문맥을 끊어먹는 청킹이 없음. 2. 유지보수하기 귀찮은 벡터 DB 인프라가 필요 없음. 3. 왜 이 답변을 가져왔는지 'Table 5.3 참조'처럼 인간적으로 추적 가능함. 마치 책을 볼 때 키워드 검색으로 찾는 것과, 목차와 문맥을 이해하고 찾는 것의 차이라고 볼 수 있겠네요. ↓ 특히 금융 보고서나 기술 매뉴얼처럼 구조가 복잡하고 논리적인 흐름이 중요한 문서에서 빛을 발한다고 합니다. 실제로 FinanceBench에서 기존 벡터 기반 RAG들을 압도했습니다. 단순 검색은 여전히 벡터가 빠르고 좋겠지만, 깊이 있는 전문 지식을 다뤄야 한다면 이런 Reasoning-first '추론 중심' 접근이 답이 될 수도요..?! 오픈소스로 공개되어 있으니, RAG의 한계를 느끼셨던 분들은 한번 테스트해보셔도!!

lucas

11,432 Aufrufe • vor 4 Monaten

Keine weiteren Inhalte verfügbar