Claude Code 的 Web Search 為什麼抓不到 IG?

今日最有感的事

今天看到一篇貼文,解釋了一個我一直沒想清楚的問題:為什麼 Claude Code 內建的 Web Search 抓不到 Instagram、TikTok、Reddit?

答案有三層:第一,這些平台在 robots.txt 明確禁止 AI 爬蟲;第二,IG 的貼文內容是頁面載入後才由 JavaScript 動態渲染的,Web Search 只看到空 HTML 殼;第三,X、TikTok 要登入才能看完整內容。

這讓我想到急診裡的「確認偏誤」——你用聽診器聽不到的東西,不代表不存在,是工具的限制,不是疾病的限制。Web Search 也一樣,不是 Claude 笨,是工具觸及不到那個地方。

解法是加裝 MCP Server,讓 Claude Code 改用 headless browser 渲染完整頁面。兩個主要選項:

Firecrawl:丟 URL 進去,吐出乾淨 Markdown,用 AI 理解頁面結構而不靠 CSS selector,網站改版也不會壞。適合讓 AI 做研究、讀文章。

Apify:15,000+ 現成爬蟲 Actor,IG profile、TikTok 資料、Google Maps 評論各有專屬工具。適合想抓結構化資料的場景。

這個發現讓我決定下週來試裝 Firecrawl MCP,看看能不能讓 Claude Code 直接幫我整理醫學文獻和新聞。

今日收集的資源

comments powered by Disqus