2026-04-26 AI 學習日誌

今日最有感的事

今天做的三件事如果連起來看，是同一個母題：讓 AI 不只查公開知識，也會查我自己的私人記憶；不只產內容，還要產到列印級；不只認得乾淨教科書，還要啃下排版破碎的 Kindle reflow。每一條都是 RAG 的「身體」往外長一塊。

第一條：個人文獻 RAG day 0。 過去做的 er-textbook-search 是「公共知識的 RAG」——Tintinalli、Rosen's、ATLS 這些書任何急診醫師都查得到。但每天看完一篇 paper 在 Zotero 寫的精讀、在 Roam 留的眉批，那些只屬於我自己的「讀書記憶」過去 RAG 都查不到。今天把 Zotero 736 + Roam 1,109 共 1,212 篇 PDF 全部抽出 fulltext，BGE-M3 切成 73,271 chunks（286 MB）。這個轉變很微妙——以前問 AI 一個臨床問題，它最多能引「教科書怎麼說」；現在它可以引「Bear 你自己半年前讀過、做過 note 的那篇 paper 怎麼說」。這不是再多一本書，是讓 AI 第一次能讀到「我自己」。

第二條：列印級的代價是 22 秒。 /codex-image 從 ecg-daily-image 抽成獨立 skill，但真正關鍵是整合 Real-ESRGAN——Codex $imagegen 出的原圖固定 1536×1024，過去拿來當 Roam 配圖剛好，但要印教學講義就解析度不夠。Real-ESRGAN 4× 放大 22 秒就把它變成 6144×4096，等於從「螢幕級」變「印刷級」。Vulkan/Metal 硬體加速讓這件事在 MBPR 本機跑得起來，不用上雲。三模式可選（純原圖 / 原圖+放大 / 只要放大版）的設計也是被現實逼出來的——不同情境需要不同檔案大小。

第三條：reflow 格式不再是死路。 Kindle 教科書有兩種：固定版面（fixed layout）跟 reflow（流動排版）。過去 /kindle-extract skill 自己標註「reflow 不支援」就放棄。今天 capture v2 把 9 本失敗書分兩類：4 本是「DOM 上有 #kr-renderer 但 innerText 拿不到」型，改用 page.screenshot + Tesseract OCR 硬走 reflow；5 本是 App Required 沒解。最後通了 4 本 reflow + 補 Barold 一本，er-textbook-search 從 30 本擴到 35 本 / 129,534 chunks。重點不是多 5 本書，是過去 skill 自己標的「不支援」被推翻一次。

把今天連起來：

Zotero RAG = 讓 AI 會查「我」
Real-ESRGAN = 讓圖能印
Kindle reflow = 把過去放棄的書救回來

這三件事都不是新功能，是幫已有的 AI 工作流補缺口。RAG、產圖、Kindle 擷取本來都能跑，但都有一塊「不夠」——查不到自己讀過的、印不出能用的、吃不下排版破碎的。今天三條缺口同時補上，是基礎設施的一次大幅擴張。明天起做臨床查詢時可以同時下三條軸線：教科書 + 個人文獻 + 部落格，這個組合過去從來沒有過。

今日收集的資源

/zotero-cite skill
- 連結：本機 ~/.claude/skills/zotero-cite/SKILL.md
- 一句說明：BGE-M3 個人文獻 RAG，1,212 篇 PDF / 73,271 chunks，跟 /er-textbook-search、/ecg-search 並列為第三條軸線。
/codex-image skill + Real-ESRGAN
- 連結：本機 ~/.claude/skills/codex-image/SKILL.md
- 一句說明：Codex $imagegen 通用產圖，三模式可選（原圖 / 原圖+4× / 只要列印級），22 秒從 1536×1024 放大成 6144×4096。
batch_pdf_to_md_from_roam.py
- 連結：本機 zotero-cite repo
- 一句說明：Roam Firebase 上 1,109 篇 PDF 用同一個腳本批轉 fulltext markdown，98.4% 成功率，補上 /zotero-cite 半邊江山（另一半是 Zotero imported_file 拿到的 736 篇）。
Kindle reflow capture v2（page.screenshot + Tesseract）
- 連結：本機 /kindle-extract skill 流程
- 一句說明：對 reflow 格式 Kindle 書，DOM innerText 拿不到時改走截圖 + 本機 OCR，4 本 reflow 通了，er-textbook-search 擴到 35 本 / 129,534 chunks。

◆ ◆ ◆

今日最有感的事

今日收集的資源

每兩週收到一份急診現場的整理筆記