何處是資料終端

  • 0
不知道你有沒有剪報的習慣,在過去大家要將資料蒐集起來的最好方式就是紙本收藏。教導資料處理方法的書籍通常會介紹一種方式,就是將筆記、書籍、報章雜誌的資料利用影印機將資料縮小到A4大小,然後用本資料夾分門別類地蒐藏完成。這個方法的用意在於,將所有資料最後通通儲存到一個資料的匯集點,用同種方式就可以檢閱各式資料,以利使用者未來查詢便利。

電腦的出現帶起的一個新觀念就是減少紙張的耗用,你想想看一年當中如果每天最少有一個另你感興趣的消息,那麼你至少要花上三、四百張的紙來複印資料,而這些紙張要用資料夾歸檔才算完成,那麼需要耗費到多少的成本呢?於是人們開始以電子檔案來管理資料,除了本身就是利用電腦完成的檔案外,像是照片、雜誌頁面等都可以利用掃瞄機儲存成電子檔,利用一個一個的資料夾將檔案分類完成。這種作法有個好處,想想看某個匯集眾人數十年的知識結晶,像是大英百科全書之類的匯集品,你要如何在最短的時間去找到呢?就算使用索引,大概查詢到第五個條目之後就舉白旗放棄,手都快翻到酸了。而透過電腦搜尋,不到幾秒鐘的時間就可以為你找出跟關鍵字相符的檔案,大大減少搜尋成本進而提高工作效率。

資料蒐整的方式伴隨技術進步而改變了形式,但基本上都還是遵照處理原則,就是分門別類歸納資料,提供適當的索引來做為事後查詢的輔助。然而也是最重要的大原則,也是影響資料歸納成功與否的關鍵,就是切記要使用同一個儲存的管道來彙整資料,一旦將資料分散處理的話,將會大大減少資料搜尋的完整性。如果我們用電腦用詞,那麼過去那一本本的資料所代表的就是資料庫,而資料庫的分散就將會增加搜尋時間。特別是在現在這個時代,網路上提供了數千數百種的服務利於我們處理眼前所見到的資料,幾乎每一種事物、想法都會有其專屬化的歸納方式。過去資料會依各類學術知識領域區分,有經濟、歷史、行銷、科學等學門,如今還可以根據素材的類型是Word檔、PDF檔還是圖片檔,甚至有音樂、影片等非靜態資料出現。

拜雲端技術的出現,無論是資料或者程式服務都可以在網路尋找到,你不用擔心不在自己的電腦上就無法編輯等會兒開會要用的剪報,因為你可以利用Google的線上文件來處理,甚至你是在Windows、Mac或是Linux上作業都一樣,只要有網路就足以應付一切。過去為了要達到異地重建工作環境需要利用3.5磁碟片或者隨身碟裝著吃飯傢伙,現在你只需要有網路就可以辦得到了。這時該考慮的是另外一個事情,就是這麼多的資料要如何利用一個終端管理呢?放在電腦裡永遠是一個方式,但是到了異地工作時該如何拿到自己的資料;如果資料拿不到手,那麼苦苦蒐集又有什麼意義呢?

以我目前的資料獲得方式,我可以粗分為傳統類的報章媒體、直接閱讀型的網頁資料(Web、Blog)、訂閱即時新聞摘要(RSS)、社群類媒體(Twitter、Facebook)與我相當喜愛的電子公布欄(BBS)。感謝眾多媒體都將自己的新聞報導上線,因此紙本資料也可以在網路上找到,透過書籤類的服務加以用標籤來分類。然而BBS是比較麻煩,資料多半屬於即時性且不具備網址服務,要管理這類資料就只能將文章畫面擷取(ASCII圖)或者利用站內服務寄出到Email當中後續製作成獨立檔案。因此部落格的文章資料多半最後是以轉載的方式出現,甚少能找到原始出處。儘管蒐整的方法很多,但最後都盡量蒐整到最少數量的資料庫,但似乎也成為最難以合併的,分別是硬碟/網路兩個資料庫,要合併在一起真是難上加難。

看過多種網路工具,到目前為止我所能期盼的處理方式,可能不存在於未來,而是過去使用的一項服務,就是電子郵件。將所有的資料通通扔到電子郵件當中去,讓足夠強大的網路搜尋去從中尋找。一講到這個就讓人聯想到Gmail,沒錯,舉目所及讓我聯想到的就是Google的大容量(實體硬碟的優點)與方便性(網路空間的優點),另外是搜尋能力也是同樣中的佼佼者,這讓Gmail擁有許多資料匯集的優勢。再研究一會兒吧,或許在未來我可以找到更好的處理方式,讓我可以自由自在地大口吞下所有想學的知識,讓學習與創作的限制大量減少,這是我想做到的事情。

No comments: