網路爬蟲 Crawler Tutorial - (1) 簡介

知識科普

先不多做解釋直接看看,Wiki 怎麼說: 網路爬蟲

是一種「自動化瀏覽網路」的程式,或者說是一種網路機器人。被用於自動採集頁面內容,以供做進一步處理(分析整理下載的頁面),讓使用者能更快取得需要的資訊。

The Social Network 場景 @www.blu-ray.com

正文

為什麼首圖要放 The Social Network 中的場景呢?看過這部電影的不妨試著回想一下,片中 Mark Zuckerberg 在宿舍做了什麼事?

(Media from Amazon)

Mark: 我在抓學校網站上所有女生的圖片啊!
網站一次只給看一張,手動抓累死我了
Mark: 沒關係,Hacker 有自己的玩法,let me show you!

Mark: 讓你瞧瞧我的 Perl Script

所以爬蟲要幹嘛?當然是抓圖啊 抓任何關注的資料!

當然說到爬蟲,不能不提以此壯大自己事業的 Google

Google 的機器人,天天爬不眠不休的爬全年無休,這麼好用的工具人上哪找?

所以本系列教學文就是教你如何學會跟Mark一樣很會抓圖養隻會在網路上跑的爬蟲!