今日最有感的事

林協霆醫師那篇 FB 講「為什麼 AI 沒辦法讓醫生獨立思考」表面在罵醫學教育,最後的勾子其實丟在 OpenEvidence 上——他說 OE 在他每天的 20 道問題裡形塑結論的邏輯確實對齊人類查資料的思路,它會犯錯,但價值在於我們敢罵它。罵錯一次大師、主管、KOL 要付政治道德壓力,罵 AI 不用,所以 AI 第一次給了我們一個「成本極低、可以反覆練習指出錯誤」的對象。這個觀察很尖銳:AI 真正稀缺的價值,不是它的答對率,而是它讓我們敢於指出錯誤本身。

巧的是,今天就被推到一個情境直接驗證這條觀念——Threads 上有人推薦 h4ckf0r0day/obscura 這個「Rust 寫的 stealth headless browser」,13 天 6,400 star、宣稱嵌入 V8 + 30 MB RAM、5 分鐘 from source 編譯 V8。底下留言已經有人質疑 V8 自己就 80–150 MB、CDP 不可能 17 commits 寫完、license 文件不一致,這套質疑站得住腳。但更值得記下來的是這個工具的目標使用情境——它要去取代日常的 Playwright + Chrome 登入態,那個 Chrome profile 裡放的是 Discord、Roam、Zotero、Hugo、Vercel、Supabase 一整把 OAuth token。換成不明 binary,等同把這把鑰匙交給陌生人。所以今天做的判斷不是「這個工具還不錯改天裝」,是「這是教科書級的供應鏈攻擊 honeypot pattern,直接寫進 memory 做反射性勸退」。

這就回到林協霆那條觀念——OE 讓我們敢罵 AI,但更稀缺的能力是「敢罵那些被推爆的工具」。Threads / Twitter 推薦演算法天然偏好「新、酷、爆紅」,所以工具雜訊只會越來越多。那種「來源正派但現階段不急」的判斷力,今天也練了一次:zilliztech/claude-context 是 Milvus 團隊維護、9.7k star、180+ commits 的 Code search MCP,spec 上寫得漂亮,但仔細想自己現在 Claude Code 內建的 Explore agent 對中型 repo 已夠用,再裝就是再多一個 vector backend infra 要顧。「正派工具」和「該裝的工具」不是同一件事

最後 PDF→Markdown 那塊,今天剛好遇到 datalab-to/chandra 跟自己現用的 opendataloader-pdf 比較。常見的衝動是「新的更猛就全換」,但細看才發現兩者根本不在同一個賽道:opendataloader 是 Java 本地解析器,CPU 60+ 頁/秒,跑 1,212 篇期刊 PDF 半小時搞定,但複雜表格 / 公式 / 雙欄會脫版;Chandra 是 GPU 模型,每頁都要丟 transformer,1.44 頁/秒慢但結構保留好。最佳解不是換,是補打——主流程繼續用 opendataloader,加品質檢查抓出脫版的少數,再用 Chandra 第二棒救援。這個判斷的關鍵是不被「benchmark 分數高 = 全面取代」這個直覺帶著走。

把今天串起來看,AI 工具洪流裡真正稀缺的不是看懂 spec、不是裝得快,而是「敢說這個不要碰」「不用全換」「現階段不急」三種判斷力。林協霆那句話可以換個方式講:能罵 AI,是練習;能罵被推爆的工具,是進階;能在自己被推坑時還停得下來,是真正可以拉開差距的地方。

今日收集的資源

◆ ◆ ◆