2008-01-16

社會組科技須知 - 檔案格式 2 (文字檔)

“文書處理就是Word“ - 你會不會也這樣說?那,請問,你對Word的了解多深?一個很基本的問題:你會不會把你寫的文章當RTF檔存?如果你知道,而且也知道RTF是什麼,你不用繼續看。不知道?Hmm... 你會不會說你”會Word“?下次存檔的時候要不要先看一下你的Word可以存哪一些格式?


這是Word2007的存檔視窗。(一個朋友幫我做,我自己沒有Windows)其它版本的選項可能有點不一樣,但是平常每一個文書處理的軟體(有蠻多個,不只有Word)可以存幾種格式,而且一定會包含RTF。

如果你沒有知道這件事,可以啟動Word,按F1,然後慢慢逛。那是華語的說明,所以你應該看得懂。如果你看不懂,你原則上也不懂Word…… 但是我們想談檔案格式,所以我們看一下一些比較重要的格式:

TXT - 最單純的格式,只能記錄字,無法記錄字的格式或圖片。檔案小,相當文章大小。編碼可能造成麻煩,因為最單純的TXT檔不會包含編碼資訊,但是有編碼TXT檔。

RTF - Rich Text Format,符合文書處理主要的需求,所以會記錄字型、大小等,可以包含表格等。大小相當文章大小,但是比TXT大。奇怪的是,微軟自己大概1987年為了交換文章設計這個格式,但是現在好像不太喜歡它。

PDF - Portable Document Format,由Adobe為了交換文件設計的格式。檔案裡面用Postscript,一個印表機語言。所以,一個軟體做出的PDF檔應該跟那個軟體列印的樣子一樣。而且,PDF檔不是要修改的格式,它是最後要輸出的樣子。所以這個格式很適合顯示跟列印。許多平台支援這個格式,為了顯示或制造有不少免費軟體可以使用。

DOC - 這個格式有點麻煩。微軟為了Word已經從DOS版本開始使用這個格式,但是其實不只有一個格式。例如,Word97-2003的格式跟Word6的不一樣,Word2又不一樣,而DOS版本…… 微軟沒有開放這個格式的規格,所以如果微軟不會再支援一個版本,可能沒有人會合法地開這個版本的檔案。所以最近越來越多政府或組織使用ODF。(剛今天微軟公告要開放DOC規格,但是我看到才相信。)

DOC是Word的專屬格式,所以會支援它所有的功能。檔案是這些格式中最大的。這種檔案可以編輯,但是有問題:除了Windows跟OS X沒有平台有Word,而在OS X的Word,文章的排版可能變成跟Windows版不一樣。在Windows版排版的顯示也會跟標凖的印表機有關,所以同樣的Word版本在不同電腦可能顯示不同樣子。(對,不一定是你的錯……)

而且,最糟糕的做法是把DOC檔改成EXE檔。為什麼???如果有人覺得DOC檔太大,那為什麼還要用這個格式呢?而且,如果太大,那就簡單地壓縮一下,例如ZIP檔很流行。但是,只因為有人認為這樣比較“方便”(會嗎?)就把一個文件改成一個只在某些平台可啟動的執行檔 - 這個我真的不了解。

還好網路上沒有病毒或其它的“怪軟體”。還好那些軟體不可能是Windows的執行檔(exe, com, scr, pif等),所以還好沒有組織可能為了安全把那些檔案當掉…… 我在我們計中工作的時候把Windows所有可執行的檔案在proxy當掉 - 馬上幾乎沒有人還會中毒。不過…… 教育部雖然要求所有學校必須注意資通安全,但是學務處跟人事室還是一直抱怨,因為他們必須下載政府單位提供的文件 - 而那些文件常常是EXE檔。厲害……

ODF - Open Document Format是原來OpenOffice的專屬格式,現在是國際標凖(ISO26300),所以越來越多軟體支援它。在所有主要平台可以使用這個格式。檔案會比較小,因為ODF檔是一個ZIP檔,包含幾個XML檔跟另外需要的(例如JPG圖片)檔案。我不需要專用的文書處理軟體就可以修改ODF檔的內容。

DOCX - OOXML,微軟為了攻擊ODF設計的格式。它是MSO2007的專屬格式,目前造成很大的爭論。我建議不要使用這個格式,因為很多人沒有辦法開這種檔案。(你有Word2007?存檔時選別的格式會那麼困難嗎?)而且,連微軟本身好像不完全了解他們自己的6000(!)頁的規格……

那,這些現在要告訴我們什麼?如果我根本只要對方看或者列印我的文件,PDF最好。為什麼我要允許別人亂改我的文件,如果他只要乖乖地印,然後用筆寫?如果他要編輯文件,給他RTF比較好 - 除非我只要給一個人,而我知道他用什麼軟體。而如果我要長期保留文章,可能用TXT或ODF比較適合。

那DOC呢?Hmm... 如果對方也用Word,你當然可以試試用DOC。但是,請問,你跟別人交換DOC檔都沒有遇過麻煩?如果有,也許要考慮一下為什麼。我自己這方面影響最深刻的經驗是Word2000不願意開另一個Word2000幾分鍾前存的檔案……

2008-02-18更新:微軟剛今天開放他們主要的檔案格式的規格。這措施主要的希望好像是讓自己的OOXML終於成功變成ISO標凖。

No comments: