2008-01-28

社會組科技須知 - 檔案格式 3 (圖片)

你電腦上應該有圖片。很多圖片,對不對?都是照片,還是也有別的圖片?你是不是有時候在文件也需要用一些圖片,像流程圖或類似的?但是不好看?或者,有沒有收過很大的e-mail,然後裡面只有一兩張照片?有沒有看過十幾MB的簡報?那我們看一下為什麼會有問題……

圖片檔案會有很多種格式。太多。所以我只要談一些主要的格式跟一些基礎。第一,我們可以把電腦圖片分成兩種:點陣向量。區別呢?在點陣圖,檔案必須包含每一個點的資訊,亮度(黑白)或色彩(彩色)。你要更大的圖片?那你要更多“點”,所以要更多資訊 - 所以檔案更大。在這裡,檔案大小跟圖片大小有關。

向量圖不一樣。這裡你的電腦必須計算一下,因為這種圖片例如記得從什麼位子開始要畫一條什麼厚度跟色彩的線到哪一個位子。向量圖的檔案大小有關圖片內容。如果圖片幾乎是空的,檔案很小。如果有很多東西,檔案較大。但是,跟圖片大小沒有關系!

為什麼?你數學課應該有學過向量?那你應該知道可以做各種計算,例如把一些向量改成兩倍大。電腦對你的圖片也可以這樣做。向量圖雖然不太適合為了照片,但是特別是“線材”跟字的話這種格式非常適合。對,你當然也可以把點陣圖放大,但是發生什麼事?


了解嗎?左邊是點陣圖放大的結果,右邊是向量圖。如果你在文件需要圖片顯示一個流程、句子部分的關系或類似的,用到字跟線的圖片,用向量圖會讓你放大或縮小之後還是有一個漂亮的結果。

有沒有聽過CorelDRAW這個名字?你有它的盜版,是不是?CorelDRAW獨特的格式(CDR)是向量格式,這個軟體原來有名的地方就是向量圖的制造。你用它修改照片?Tsss...

但是為什麼付錢或用盜版?OpenOffice允許你畫向量圖。或者,如果你想畫很高級的圖:Inkscape。而如果你像用一個開放,而且很流行的格式,你最好要存SVG

不過,照片之類的圖片就可能需要用點陣圖。而這裡我們可能要分壓縮跟未壓縮的格式。未壓縮的格式會為了每一個“點”存一個(黑白)或三到四個(彩色)byte。你有沒有收過BMP格式的screenshot?Windows本身會輸出未壓縮的點陣圖,所以如果一個Windows使用者沒有用額外的screenshot軟體或之後存別的格式(“這樣不是就可以嗎?”),你會收到一個比較大的檔案。

我們算一下:1024x768x3?快2.5MB!那如果用比較現代化的銀幕?1680x1050x3?超過5MB!突然你也了解為什麼上個禮拜的簡報有那麼大,對不對?那怎麼辦?當然要壓縮!不過,我們最好不要把BMP檔壓所成ZIP檔,我們要用一個壓縮圖片格式。

而這裡我們又必須選:你能不能接受失落?我有沒有聽到一個“不行”?確定?我有點懷疑,但是…… 如果你想要小一點的檔案,但是不要有失落,PNG是最好的選擇。你可以選色彩深度,甚至有支援透明。

我還是懷疑你是不是真的不能接受失落。請問,你用你的數位相機拍照的時候存RAW還是JPG檔?沒聽過RAW?了解…… JPG現在那麼流行的原因包含它雖然是失落的壓縮圖片格式,但是我可以自己決定為了每一張圖片對我比較重要的是畫質還是檔案大小。

存JPG檔的時候也要決定圖片的畫質。(甚至你的數位相機也要知道這件事,要不要再參考一下手冊?)畫質越好,檔案越大,這麼簡單。當然,壓縮的時候,圖片內容的“復雜度”也會影響壓縮效果。你應該有發現過你相機的照片有大概一樣的檔案大小,但是不會完全一樣大?

還有…… 每一個點陣圖有它的大小。圖片越大,點或畫素越多,檔案越大。我雖然可以壓縮,但是如果我根本只用XGA(1024x768)的投影機放我的簡報,為什麼裡面要用1600x1200或更大的圖片?一點都沒有意義…… 考慮一下需要的到底是什麼。只因為我們會做一件事,這還不是說我們也必須這樣做或這樣做很聰明。聽說人跟動物的一個主要的區別是人有思考能力。Hmm...

如果你現在剛好思考要用什麼軟體輸出那些格式:放心,你不需要盜版的Photoshop或盜版的ACDSee,免費的GimpPaint.net(Windows,對不對?)或Irfanview就好了。

2008-01-16

社會組科技須知 - 檔案格式 2 (文字檔)

“文書處理就是Word“ - 你會不會也這樣說?那,請問,你對Word的了解多深?一個很基本的問題:你會不會把你寫的文章當RTF檔存?如果你知道,而且也知道RTF是什麼,你不用繼續看。不知道?Hmm... 你會不會說你”會Word“?下次存檔的時候要不要先看一下你的Word可以存哪一些格式?


這是Word2007的存檔視窗。(一個朋友幫我做,我自己沒有Windows)其它版本的選項可能有點不一樣,但是平常每一個文書處理的軟體(有蠻多個,不只有Word)可以存幾種格式,而且一定會包含RTF。

如果你沒有知道這件事,可以啟動Word,按F1,然後慢慢逛。那是華語的說明,所以你應該看得懂。如果你看不懂,你原則上也不懂Word…… 但是我們想談檔案格式,所以我們看一下一些比較重要的格式:

TXT - 最單純的格式,只能記錄字,無法記錄字的格式或圖片。檔案小,相當文章大小。編碼可能造成麻煩,因為最單純的TXT檔不會包含編碼資訊,但是有編碼TXT檔。

RTF - Rich Text Format,符合文書處理主要的需求,所以會記錄字型、大小等,可以包含表格等。大小相當文章大小,但是比TXT大。奇怪的是,微軟自己大概1987年為了交換文章設計這個格式,但是現在好像不太喜歡它。

PDF - Portable Document Format,由Adobe為了交換文件設計的格式。檔案裡面用Postscript,一個印表機語言。所以,一個軟體做出的PDF檔應該跟那個軟體列印的樣子一樣。而且,PDF檔不是要修改的格式,它是最後要輸出的樣子。所以這個格式很適合顯示跟列印。許多平台支援這個格式,為了顯示或制造有不少免費軟體可以使用。

DOC - 這個格式有點麻煩。微軟為了Word已經從DOS版本開始使用這個格式,但是其實不只有一個格式。例如,Word97-2003的格式跟Word6的不一樣,Word2又不一樣,而DOS版本…… 微軟沒有開放這個格式的規格,所以如果微軟不會再支援一個版本,可能沒有人會合法地開這個版本的檔案。所以最近越來越多政府或組織使用ODF。(剛今天微軟公告要開放DOC規格,但是我看到才相信。)

DOC是Word的專屬格式,所以會支援它所有的功能。檔案是這些格式中最大的。這種檔案可以編輯,但是有問題:除了Windows跟OS X沒有平台有Word,而在OS X的Word,文章的排版可能變成跟Windows版不一樣。在Windows版排版的顯示也會跟標凖的印表機有關,所以同樣的Word版本在不同電腦可能顯示不同樣子。(對,不一定是你的錯……)

而且,最糟糕的做法是把DOC檔改成EXE檔。為什麼???如果有人覺得DOC檔太大,那為什麼還要用這個格式呢?而且,如果太大,那就簡單地壓縮一下,例如ZIP檔很流行。但是,只因為有人認為這樣比較“方便”(會嗎?)就把一個文件改成一個只在某些平台可啟動的執行檔 - 這個我真的不了解。

還好網路上沒有病毒或其它的“怪軟體”。還好那些軟體不可能是Windows的執行檔(exe, com, scr, pif等),所以還好沒有組織可能為了安全把那些檔案當掉…… 我在我們計中工作的時候把Windows所有可執行的檔案在proxy當掉 - 馬上幾乎沒有人還會中毒。不過…… 教育部雖然要求所有學校必須注意資通安全,但是學務處跟人事室還是一直抱怨,因為他們必須下載政府單位提供的文件 - 而那些文件常常是EXE檔。厲害……

ODF - Open Document Format是原來OpenOffice的專屬格式,現在是國際標凖(ISO26300),所以越來越多軟體支援它。在所有主要平台可以使用這個格式。檔案會比較小,因為ODF檔是一個ZIP檔,包含幾個XML檔跟另外需要的(例如JPG圖片)檔案。我不需要專用的文書處理軟體就可以修改ODF檔的內容。

DOCX - OOXML,微軟為了攻擊ODF設計的格式。它是MSO2007的專屬格式,目前造成很大的爭論。我建議不要使用這個格式,因為很多人沒有辦法開這種檔案。(你有Word2007?存檔時選別的格式會那麼困難嗎?)而且,連微軟本身好像不完全了解他們自己的6000(!)頁的規格……

那,這些現在要告訴我們什麼?如果我根本只要對方看或者列印我的文件,PDF最好。為什麼我要允許別人亂改我的文件,如果他只要乖乖地印,然後用筆寫?如果他要編輯文件,給他RTF比較好 - 除非我只要給一個人,而我知道他用什麼軟體。而如果我要長期保留文章,可能用TXT或ODF比較適合。

那DOC呢?Hmm... 如果對方也用Word,你當然可以試試用DOC。但是,請問,你跟別人交換DOC檔都沒有遇過麻煩?如果有,也許要考慮一下為什麼。我自己這方面影響最深刻的經驗是Word2000不願意開另一個Word2000幾分鍾前存的檔案……

2008-02-18更新:微軟剛今天開放他們主要的檔案格式的規格。這措施主要的希望好像是讓自己的OOXML終於成功變成ISO標凖。

2008-01-15

社會組科技須知 - 檔案格式 1

抱歉,較久沒有寫。其實有寫,但是不太滿意結果,所以要重寫……

檔案格式 - 為什麼是這麼麻煩的題目?因為需要了解一些基礎,但是這裡很少人願意了解那些基礎。我問你:你的應用軟體(不管哪一個)跳出一個視窗,你會不會不用看就知道它裡面所寫什麼?不知道,是不是?那,你會不會看它裡面所寫什麼?好像也不會……

這樣就比較“方便”,不用“浪費時間”看那些。而且,你也不需要,對不對?到現在一直不用知道,為什麼現在會有人說要看?“反正,電腦顯示的那些訊息,我根本都看不懂。而且,我也不要懂。太麻煩。我其實不太會電腦。”

那,我可不可以請你把電腦關掉,交給別人用?因為,看起來,你對電腦這個工具一點興趣都沒有。如果你不會了解一個工具,也不願意了解這個工具,你是不是最好不要用這個工具?常識會建議我們這麼做……

“但是我一定要有電腦!我的同事都有電腦!而且,沒有電腦,不是比較低級的工作嗎?”

Hmm... 如果電腦的使用包含在你工作範圍內,你是不是最好要了解一下?你是不是需要知道你要怎麼做你的工作?可能還是要學一下…… 如果你願意學,我會跟你談檔案格式的問題。

平常,每一個軟體會有辦法處理幾種格式的檔案,不管是跟文件、影片、音樂或圖片有關的軟體。沒有這種彈性的軟體平常活不下去很久。

我們用不同格式因為每一個格式有它的特色,有它的用途。我當然可以用一台Porsche搬家,但是會有點麻煩,因為這不是這台車的用途。我也可以開大卡車去逛夜市。不是不可能的,但是也不是很聰明的選擇。檔案格式一樣都有它們的用途。

所以,存檔的時候,我可以簡單地點那個磁片的圖像(存檔圖案),寫個檔案名,按Enter就好了 - 或者我可以考慮我的目的到底是什麼,我這個檔案的用途會是什麼,要用我這個檔案的人到底有沒有辦法順利地使用它?

我可能要考慮檔案大小重不重要,還是畫質或音質更重要?我是不是要保留這個檔案比較久?我知不知道對方使用的作業系統跟應用軟體?

你現在可能還不了解為什麼這些問題的答案可能比較重要。所以我們最好分開看五種檔案的格式:
文字檔
圖片
聲音檔
影片
壓縮檔

2008-01-02

Conference fun (CJCU)

So I got it confirmed again: Foreigners can speak their native language, but that's about it. Well, that at least was my impression when I attended this conference last weekend. I should probably mention that this conference was about interpreting and translation. So, naturally, one would expect the people there to have the one or other relation to either interpreting or translation - or both, if you want. And since this conference took place in Taiwan, one might assume that people attending there will understand Chinese. At least my logic tells me so.

When I arrived however, I was asked by someone from the organising department (translation and interpreting) where I came from. Next question:

"So you teach English there?"
"No, Interpreting."

And that was just the beginning. Right in the first session, the moderator opened by commenting (in English) that there are foreigners present and that those foreigners surely don't quite understand Chinese, so he would moderate in English. He didn't even ask if those foreigners perhaps might understand Chinese.

I could only spot two white faces (including mine) at that time, I didn't check if one of the two Japanese attending was present. But I'm pretty sure the moderator did not mean them when he spoke of "foreigners". I had seriously thought about leaving the room, mentioning in Chinese on my way out that I better don't want to cause too much inconvenience.

Btw, what sense does it make for someone who does not understand the local language and has no relation to interpreting or translation at all to come to such a conference where every presentation will be related to translating to or from Chinese? I don't see any.

During the last session of that conference, a student then asked me if I needed "this" - which was a receiver, probably UHF, with a single earphone. I declined politely (and with a grin), but later still took one to check what was happening on the airwaves.

There were (graduate?) students sitting in the back of the room, not separated from the other audience, without earphones, trying to simultaneously translate what they heard coming from the front in Chinese into English. The result was not overwhelming, but as you can see from the description, all the conditions were not quite in their favour. And some of the presenters did not help those students much with their style.

Personally, I found the last two presentations to be the most interesting. Unfortunately, most people not from CJCU had already left, probably because the presenters were "only" postgraduate students. But they were well prepared, finished on the mark, and what they spoke about was interesting too.

There was some software mentioned during this conference, and the geek in me couldn't rest before he knew a bit more about them:

- Paraconc is payware and calls itself "a bilingual or multilingual concordancer". However, you will need equivalent texts in source and target language, if you want to work with this one. And something tells me that this can be done with OSS.

- MIT OpenCourseWare is a collection of free course materials available on-line. Need something to feed you? Here you go...

- Translog is a keylogger that seems to be pretty popular in linguistic circles. Despite this fact I couldn't find a homepage for this. But you could basically use any other keylogger, they should all do the job.

Oh, one more thing: Thank you for the music! It was not punk rock, but a nice ensemble of 70's songs. (not 50's, as someone claimed) So I'm looking forward to the conferences next semester...