PDF 讀不完?AI 幫你建流水線 + YouTube 自動存影片
今日最有感的事
王介立醫師說「資料庫不放 PDF」這句話,是整個工作流的核心。
急診有個概念叫 "clear the queue"——別讓病人在走廊上積著,要把每個人分流到對的地方。PDF 也是一樣,它是「原始資料」,不是「可查詢知識」。進庫前要先轉換:MinerU 是分診台,Claude 是主治醫師,Zotero 是病歷室。PDF 在這個流水線裡只是暫時停留的原料,不是終點。
這個思路讓我想到今天自己動手做的事:把 IG reel 自動存到 YouTube。看起來是兩件不相關的事,但背後邏輯一樣——把「零散散落在網路各處的內容」轉成「我的知識庫可以管理的格式」。IG reel 是原料,YouTube 不公開收藏是倉庫,之後再加上 AI 摘要就完整了。
OAuth 踩了幾個坑:PKCE mismatch(gws client_secret 預設帶 code_challenge,但手動 server 接不住)、帳號選錯(誤選品牌帳號熊簡單之家而非主帳號曹建雄)。但一旦跑通就是全自動——下次只要說「存到 YouTube」,skill 就知道怎麼做了。
今日收集的資源
MinerU(王介立醫師推薦)
- 連結: https://github.com/opendatalab/MinerU
- PDF 圖文分離工具,可自動把 PDF 轉成 MD,圖表單獨切出,適合餵給 AI 閱讀
ig-to-youtube skill(自建)
- 連結: ~/.openclaw/workspace/skills/ig-to-youtube/SKILL.md
- yt-dlp 下載任意社群媒體影片 + YouTube Data API v3 上傳,含完整 OAuth 流程與踩坑記錄
comments powered by Disqus