2026-04-26 AI 學習日誌
今日最有感的事
今天做的三件事如果連起來看,是同一個母題:讓 AI 不只查公開知識,也會查我自己的私人記憶;不只產內容,還要產到列印級;不只認得乾淨教科書,還要啃下排版破碎的 Kindle reflow。每一條都是 RAG 的「身體」往外長一塊。
第一條:個人文獻 RAG day 0。 過去做的 er-textbook-search 是「公共知識的 RAG」——Tintinalli、Rosen's、ATLS 這些書任何急診醫師都查得到。但每天看完一篇 paper 在 Zotero 寫的精讀、在 Roam 留的眉批,那些只屬於我自己的「讀書記憶」過去 RAG 都查不到。今天把 Zotero 736 + Roam 1,109 共 1,212 篇 PDF 全部抽出 fulltext,BGE-M3 切成 73,271 chunks(286 MB)。這個轉變很微妙——以前問 AI 一個臨床問題,它最多能引「教科書怎麼說」;現在它可以引「Bear 你自己半年前讀過、做過 note 的那篇 paper 怎麼說」。這不是再多一本書,是讓 AI 第一次能讀到「我自己」。
第二條:列印級的代價是 22 秒。 /codex-image 從 ecg-daily-image 抽成獨立 skill,但真正關鍵是整合 Real-ESRGAN——Codex $imagegen 出的原圖固定 1536×1024,過去拿來當 Roam 配圖剛好,但要印教學講義就解析度不夠。Real-ESRGAN 4× 放大 22 秒就把它變成 6144×4096,等於從「螢幕級」變「印刷級」。Vulkan/Metal 硬體加速讓這件事在 MBPR 本機跑得起來,不用上雲。三模式可選(純原圖 / 原圖+放大 / 只要放大版)的設計也是被現實逼出來的——不同情境需要不同檔案大小。
第三條:reflow 格式不再是死路。 Kindle 教科書有兩種:固定版面(fixed layout)跟 reflow(流動排版)。過去 /kindle-extract skill 自己標註「reflow 不支援」就放棄。今天 capture v2 把 9 本失敗書分兩類:4 本是「DOM 上有 #kr-renderer 但 innerText 拿不到」型,改用 page.screenshot + Tesseract OCR 硬走 reflow;5 本是 App Required 沒解。最後通了 4 本 reflow + 補 Barold 一本,er-textbook-search 從 30 本擴到 35 本 / 129,534 chunks。重點不是多 5 本書,是過去 skill 自己標的「不支援」被推翻一次。
把今天連起來:
- Zotero RAG = 讓 AI 會查「我」
- Real-ESRGAN = 讓圖能印
- Kindle reflow = 把過去放棄的書救回來
這三件事都不是新功能,是幫已有的 AI 工作流補缺口。RAG、產圖、Kindle 擷取本來都能跑,但都有一塊「不夠」——查不到自己讀過的、印不出能用的、吃不下排版破碎的。今天三條缺口同時補上,是基礎設施的一次大幅擴張。明天起做臨床查詢時可以同時下三條軸線:教科書 + 個人文獻 + 部落格,這個組合過去從來沒有過。
今日收集的資源
/zotero-cite skill
- 連結:本機
~/.claude/skills/zotero-cite/SKILL.md - 一句說明:BGE-M3 個人文獻 RAG,1,212 篇 PDF / 73,271 chunks,跟 /er-textbook-search、/ecg-search 並列為第三條軸線。
- 連結:本機
/codex-image skill + Real-ESRGAN
- 連結:本機
~/.claude/skills/codex-image/SKILL.md - 一句說明:Codex
$imagegen通用產圖,三模式可選(原圖 / 原圖+4× / 只要列印級),22 秒從 1536×1024 放大成 6144×4096。
- 連結:本機
batch_pdf_to_md_from_roam.py
- 連結:本機 zotero-cite repo
- 一句說明:Roam Firebase 上 1,109 篇 PDF 用同一個腳本批轉 fulltext markdown,98.4% 成功率,補上 /zotero-cite 半邊江山(另一半是 Zotero imported_file 拿到的 736 篇)。
Kindle reflow capture v2(page.screenshot + Tesseract)
- 連結:本機 /kindle-extract skill 流程
- 一句說明:對 reflow 格式 Kindle 書,DOM
innerText拿不到時改走截圖 + 本機 OCR,4 本 reflow 通了,er-textbook-search 擴到 35 本 / 129,534 chunks。