#AI學習 #醫學驗證 #OpenEvidence
今日最有感的事
晚上滑 FB 看到一篇高血糖 IV insulin push 的醫師貼文,主張幾條重點:DKA 走 weight-based continuous IV 0.1 U/kg/hr、HHS 要 fluid first 加 insulin 0.05 U/kg/hr、嚴重高血糖但非 DKA/HHS 應該 scheduled SC basal + correction、不建議 fixed-dose IV bolus RI。
這幾條看起來都很「教科書」,但 HHS 0.05 U/kg/hr 我自己讀的英文教科書多半是 0.1,所以想立刻驗證。今天讓我最有感的不是答案本身,是驗證的層級結構——把一條社群貼文,三層往上追到 RCT 級源頭,30 分鐘內走完。
第一層:跨 5 本教科書比對
用 /search 一條指令同時打 5 個 corpus(textbook / ecg / zotero / personal-books / transcripts),結果:DKA 0.1 完全一致、HHS fluid first 也一致、但 HHS insulin dose 在 EM Secrets、Avoiding Common Errors、Clinical EM (Lange)、Tintinalli 9e 全寫 0.1,不是 0.05。
教科書層級就出現分歧,這代表 0.05 不是隨便寫的、但要再往上追指引層級才看得到全貌。對非工程師讀者補背景:/search 是我自己包的一個統一搜尋入口,背後把 5 個獨立的醫學知識 corpus(教科書、ECG 教學、論文 Zotero、個人藏書、聽過的 podcast 逐字稿)平行打過去再用 reranker 排序,等於一次問題就同時翻 5 本書。
第二層:用 OpenEvidence 查最新指引
丟 oe_ask 問 2022–2024 ADA consensus、HHS 0.05 vs 0.1 是否有證據支持較低 dose。結果直接釐清派系:
| 指引 | HHS 初始 insulin | 派系 |
|---|---|---|
| 2024 ADA/EASD/AACE/JBDS 聯合 consensus(最新) | 0.1 U/kg/hr | 主流 |
| 2026 ADA Standards of Care | 沿用 2024 | 主流 |
| Diabetes Canada | 0.1 U/kg/hr | 主流 |
| JBDS(英國) | 0.05 U/kg/hr | 英式較低 dose 派 |
所以那條貼文的 0.05 不是錯,是英國 JBDS 派系。真正值得看的是:沒有任何 HHS 特異性 RCT 比較不同 insulin dose,2026 Lin et al. systematic review 把這點寫明白了,所有指引都是 expert consensus。教科書版本之所以歧異,是因為它們各自挑了不同國家的指引當主要來源。
第三層:用 /audit-oe 把 OE 的 citation 一條條驗回 PubMed
這層是今天我覺得最關鍵的步驟——不直接信 OE 的回答,平行開 7 個 Haiku agent 把 OE 抓回來的 7 條 citation 各自獨立打回 PubMed / bioRxiv / ClinicalTrials 反查。結果出現分層證據強度:6 條走 pubmed_abstracts(provenance LOW)、1 條 ADA 2026 走 guidelines_fulltext_usa_manual(MEDIUM)。其中 Lin 2026 SR 那條 composite 0.84、6 條 claim 對得上、1 條 nurse-driven min 1 U/hr 在 abstract 找不到,需要 transitive 追到 ADA Standards 原文才看到。
更直白地說:OE 不是黑盒子終點站,是一個可以驗回 ground source 的中介。 把它的回答拆成 atomic citation、每條獨立驗、看到 provenance level、再找出 transitive citation 的漏接點——這套流程把「LLM 回答的可信度」具體化成 composite score,比單純把 OE 當答題機可靠得多。
這代表急診現場「網路上看到一條醫療新主張、我要不要照做」的決策,現在可以在 30 分鐘內走完三層驗證、得出一個帶 provenance 標籤的結論,比讀十篇 review 還快。
今日收集的資源
FB 醫師貼文(DKA / HHS insulin 處置)
- 連結: https://www.facebook.com/share/p/18GjaB4Yph/?mibextid=wwXIfr
- 一句說明: 今天驗證流程的起點貼文,DKA 0.1、HHS 0.05、非 DKA/HHS 嚴重高血糖走 SC basal + correction 三條主張,後兩條最值得跨指引拉開來驗證。