2007-12-12

社會組科技須知 - 軟體本地化: gettext (2)

我已經說過gettext為本地化的好處。那時候我提過幾次po檔專用的編輯軟體多好用。那,我們看一下有什麼軟體。最有名的應該是poedit。不管你用的是WindowsOS XLinux,到處都可以用poedit。我自己沒有Windows主機,所以我能放的是OS XLinux的畫面。先OS X:


而這個是Linux版:


兩個版本有讀的po檔不一樣,一個是Drupal的語言檔(華語),另一個是Postnuke(日語)。我們看一下有哪一些比較重要的部分:


我已經說過,源語言的內容沒有辦法改,軟體只會顯示那些視窗。翻譯可以改的是下面的目標語言視窗。在左邊我會寫翻譯,在右邊可以留下說明、意見等。

在狀態列(最下面)軟體會告訴我們總共有多少個記錄,多少個還要翻,多少個模糊。如果有未翻的記錄,poedit會先放那些給我們看。不過,我們的本地化可以開始之前我們一定先要輸入一些設定:


我們一定要告訴poedit誰想使用它,因為poedit讀pot檔(樣本)的時候會自動地把這些資訊放進去。如果你打算較長期做這種本地化的工作,你最好先找一個比較“穩定”的信箱,像GMail或類似的地方。不要換工作或學校就沒有辦法聯絡你,有人可能需要你……

在上面的設定也可以看到一個Translation Memory選項。我希望你知道這種翻譯記憶是多好用的東西…… 所以,高興吧,poedit也提供這個功能。


我們也可能要選語言方面的設定。我希望你知道編碼是什麼東西…… 上面的設定是屬於另外一個軟體,gtranslator。它只有Linux版,而且是為了Gnome做的。


Gtranslator也有TM(翻譯記憶),所以它一段時間有學你的翻譯之後也可以自己提供目標語言版本。這個版本不會完美,但是你用越久,它的版本越準。不對的地方當然可以修改。所以,如果你沒有能力或懶得做翻譯,電腦沒有辦法替你工作,但是它可以讓你的工作輕鬆多了。

這是gtranslator:


而這裡有為了KDE做的軟體,KBabel


你會發現,雖然有三個不同的軟體,兩個作業系統的版本,但是它們在很多方面一樣:它們都會給我們看一個記錄裡面的資訊,讓我們方便地翻,允許我們把狀態改成模糊等。Windows的poedit也一樣,所以不用怕。

你只要先輸入基本資料,包含目標語言跟編碼,下載一個pot檔,讀進去,然後就可以開始翻。翻完後軟體會自己“另存”一個檔案,然後你只需要把那個檔案寄給負責你做本地化的那個軟體的人。這麼簡單……

OK,技術方面的部分其實會這麼簡單。如果你真的是語言方面的專家,我想你應該自己知道在翻譯的過程中要注意什麼。我這裡只想讓你不會怕技術……

以上介紹的其實都是個人使用的軟體。不過,軟體開發有合作的話就更好做,對不對?翻譯也一樣。所以,我在上面談的同樣的功能現在也可以在網路上使用。

一個不錯的軟體是Pootle。你可以用它自己設一個本地化網站。而如果你想看到一個真漂亮的開發(包含本地化)的環境,你一定要逛launchpad。這是Canonical為了Ubuntu開發建的網站。這個網站真棒……

2007-12-11

Conference fun (NKFUST)

Last week I attended a conference in Gaoxiong. While the topic ("Transcending Borders: Innovations in Language Learning and Use" - a little bit too "Web2.0"ish for my taste) was not that exciting, it was still "fun" - from a certain point of view.

First of all, while most presentations revolved around the use of technology (mostly in the form of computers) in language teaching, most of the presenters encountered technical difficulties using a computer to present their findings. Irony, anyone?

It was fun to see the use of PHP and MySQL (pronounced as "my S Q L" during the presentation) declared to be the "optimal choice" for a machine translation web interface. That's like saying the 8051 is the ultimate choice for all controller needs. Let's say it was the only thing the guy who wrote the code could come up with...

The same interface still lacks user authentication and permission control. I would have suggested to become familiar with the API of a popular CMS and then make the code into a module for that CMS, but at that time I think nobody would have understood what I was talking about. I'll better try to contact the poor guy who has to write the code directly... (Though he would not like my suggestion, as it means work for him...)

Captain Obvious was also attending. He found out that "students prefer the use of technology in language teaching" over the pure use of textbooks. Surprise, surprise, who would have thought that?

I had asked whether the "technology" in that study would also include cassette tapes, since (depending on the point of view) that is a technology that has been around for about 70 years now. Yes, tapes were included in that "technology". Unfortunately I forgot to ask how students like the tapes (and CDs these days) attached to textbooks. Now that would have been interesting... (Or not, from my experience, as Captain Obvious already knows the answer...)

A few publishing houses presented some of their offers outside. I looked through a few books on "simultaneous interpretation". Quite interesting to see people claiming that there is only one way to properly translate a given example sentence and at the same time calling the own profession "interpretation". The title in Chinese was not much better: 同步翻譯...

There was also a book with the title 專業翻譯. However, contrary to most courses with that title, this book deserved it, as it dealt with many aspects of working as a translator. The publishing company is Bookman (書林).

But the real "fun" came later, in the afternoon. As an interpreter, I am naturally concerned about communication (in whatever ways, as you may have noticed), mutual understanding - and misunderstanding, of course. Although there were some "funny" moments spread over the day, this was not one of those "cheap" conferences only held for a few people to be able to say they presented their research on a conference.

People discussed things at that conference that I will probably never hear even mentioned at other (cough, cough...) schools. But even those supposedly highly qualified experts found it absolutely normal that one can not write Chinese without a "special" keyboard, meaning that people moving to the US have to write in English to their friends in Taiwan.

In another presentation regarding the use of both Chinese and English ("code switching") on a BBS in Taiwan it was not even considered that some of the "English" written there could actually be romanised Chinese. (I admit this is not something I would expect to see on a BBS in Taiwan, but nevertheless it should be correctly identified if it shows up.)

In my opinion this is a pretty sad state, but even for those language experts romanisation is not an issue, it seems not to exist at all. Zhuyin is a phonetic system to write Chinese as is Hanyu Pinyin or even Tongyong, just with a different script. But while people here are quite familiar with Zhuyin, nobody regards a word written in Latin script anything else than "English". And this is sad indeed, as it shows a serious misconception regarding writing systems and even language in general.

Well, I'm looking forward to the next conference at another school, this one a little bit more related to my official field of expertise. Though... IIRC, they too spoke of "interpretation" - and they are asking for "English names", something NKFUST (Thanks!) did not do...

2007-12-10

社會組科技須知 - 軟體本地化: gettext (1)

我蠻確定你沒有聽過gettext這個名稱。那它到底是什麼呢,而為什麼語言方面的人要知道或甚至了解它?

首先,如果你打算自己寫程式,你可能要花一點時間自己看gettext相關的資料。我沒看過華語的手冊,但是你應該有習慣這一件事。不過,如果你是筆譯或另外語言相關的人,我想在這裡解釋你關於gettext可能要知道的部分。

Gettext是一個library,一種功能庫。它不是“某一種”功能庫,它的用途是軟體國際化跟本地化(i18n/l10n)。所以,gettext能夠幫助寫程式的人做出多一些語言的版本。

它也會幫助翻譯人員,因為它會把軟體的語言檔提供在一個特殊的格式。那種檔案叫"po"或"pot"檔。"pot"表示它是范本檔,這兩個的區別跟一般文書處理的檔案一樣。

這些檔案對翻譯那麼有用是因為它們非常適合處理各種各樣的語言,因為它們可以包含許多跟翻譯過程有關的資訊,因為它們專用的編輯軟體保證連電腦使用方面較弱的人(社會組……)不會“破掉”東西。那我們看一下每一點。

能夠處理各種各樣的語言:你不只能選你要用什麼編碼,你也可以設定你的目標語言使用幾種(以數量定的)復數。華語沒有復數,但是英語有一種,俄語有兩種,而一些語言甚至有三種復數。

Gettext的手冊也強調軟體輸出詞句的準備,說明怎樣的string才比較適合順利地翻成其它語言。這些是軟體設計的人員或“語言顧問”需要注意的。沒有做到的話,可能沒有辦法翻到一些語言或至少會遇到困難。

可以包含許多跟翻譯過程有關的資訊:po檔開頭已經提供不少資訊,包含翻譯人員相關資訊,像名字,信箱等。Open Source Software在華語雖然被稱呼“自由軟體”,但是它還是會尊敬每一個人的貢獻,所以也會記錄誰有翻哪一個部分。

不過,更有趣的是檔案內容。我先“偷”一下手冊相關的部分

# translator-comments
#. extracted-comments
#: reference...
#, flag...
msgctxt context
msgid untranslated-string
msgid_plural untranslated-string-plural
msgstr translated-string
msgstr[0] translated-string-case-0
...
msgstr[N] translated-string-case-n

一個記錄可以包含這些部分。那我們看一下一個一個有什麼作用:

# 這樣開始的行包含翻譯的意見或說明。

#. 這裡有設計軟體的人在程式碼或在這個檔案留下給翻譯的一些建議或說明。

#: 在這裡,軟體會記錄這一句從哪一個(哪一些)檔案的哪一(些)行來,因為翻完後也要把結果再放回去。人一般看不到這一行的內容,軟體才用得到。

#, 狀態。唯一跟翻譯有關(而翻譯可以改)的狀態是"fuzzy",模糊。如果有人覺得原文跟結果不太相當(因為原文有變,翻譯人不完全了解原文的意思等),他可以把這個記錄的狀態改成“模糊”,所以其他人會知道哪裡還要再看。

msgctxt 如果源語言為了表示不同意思使用同樣的詞,同樣的表現方式,我們可以有幾個同樣內容的msgid,但是經過msgctxt的說明告訴翻譯人員這一句要用在什麼環境,在什麼情況下,所以在目標語言可以選相當而不同的版本。

msgid 這裡終於有源語言的詞句。

msgid_plural 如果也想顯示源語言的復數格式,就會放到這裡。

msgstr 翻出來的,目標語言的版本會在這裡。

msgstr[0] 如果目標語言支援或需要復數,這個復數版本會在這裡。如果一個語言有幾種復數,我們另外也可以看到其它msgstr[n]的行。不過,因為華語沒有復數,我們一般用不到。

現在會怕,對不對?好復雜…… 別怕!不要忘記:專用的編輯軟體保證連電腦使用方面較弱的人(社會組……)不會“破掉”東西!人平常看不到每一行,專用的編輯軟體會處理,會給翻譯人員他們需要的,而不會讓他們弄壞東西。

例如,翻譯雖然(必須)看到源語言的詞句,但是完全沒有辦法改。可以改的只是目標語言的部分。這裡你不可能不小心刪掉源語言的句子,放心!談到亂改,你唯一能夠“亂改”的地方是目標語言,但是因為源語言一直還在,每個人能發現有問題,而能把狀態改成“fuzzy”,所以下一個懂目標語言的人知道他還要看哪裡。

你也不用擔心沒有(不會)翻完。專用的編輯軟體會馬上知道這個檔案包含多少個記錄,其中多少個已經翻好,多少個比較模糊等。所以,如果你想幫忙做一個軟體的本地化,但是沒有很多空或部分不太熟,你也可以翻你有辦法翻的部分,然後把檔案寄回去,讓下一個人繼續翻。(這裡有好一點的方法,改天會談。)

今天我先想談理論。我希望你會大概了解gettext可以為你(翻譯)做什麼。如果你真想了解,你就可能要用po檔做本地化。而如果你之前有做過其它非應用gettext軟體(Firefox擴充套件等)的本地化,你也會了解gettext對軟體國際化與本地化提供多大的貢獻。

gettext (2)的文章我會介紹專用的軟體,讓你了解什麼是“方便”……

2007-12-05

口譯的數字麻煩

口譯遇到數字的時候很容易會有一些麻煩。我們在溝通的過程中如果使用具體的數字,我們平常有必要用。假如我去買飲料,下面的會話有可能嗎?

“老板,我要一些真奶。“
”好。“
”老板,這樣多少?“
”很便宜,給我一些些錢就好。“

我想我應該沒有機會遇到這種情況…… 所以,如果我們講話用到數字,我們平常不會隨便做。所以,口譯也必須把那些數字傳到目標語言。數字不一定很好記,所以我平常會建議我的學生把它們記錄一下。為了這種筆記,口譯最好要在身上帶小筆記本。比較強的人還會有另外的方法:他們平常不需要做筆記,所以真需要的時候(電話號碼或其它數字)直接寫在手上。

有時候有人問口譯跟筆譯除了一個講話一個寫字之外還會有什麼區別。這裡有一個:口譯平常(請注意這個“平常“)不需要換算。意思是,如果源語言跟目標語言用的單位不同,口譯平常不需要把數值換算到其它單位。如果美國人說"With a full tank, this car can run 220 miles",口譯可以翻“加滿油,這台車可以跑220英里“,但是筆譯可能要寫"加滿油,這台車可以跑354公里"。

也許,目標語言的人會問口譯“那,220英里是大概多少公里”。那時候可以試試大概予計,但是因為口譯是人而不是電腦,平常沒有人會期待這種換算。不過,在台灣有一種換算一定要做:年份。

沒有離開過台灣這個小島的人可能還沒有發現,但是“外面"的世界不知道現在是民國哪一年,他們大部分根本不知道有人會要用這種算法。所以,如果一個台灣的總經理說“我們民國90年已經跟A公司合并”,我們可能在英語(或原則上任何一個其它的語言)要說“We merged with A company as early as 2001"。在台灣雖然有不少人很喜歡談“全球化”,“ISO”等,但是這個古董還在。

不過,真麻煩的是較大的數字。到千還沒有任何問題,但是如果到萬或更大的數字,口譯可能也要辛苦一點 ── 如果一個語言是華語、韓語或日語而另外的語言不是。原因是華人、韓國人跟日本人用一個(從西方人立場來看)比較“奇怪”的數法,每四位換一個名稱。

其它語言平常會每三位換一次,所以數字越大,口譯好像越辛苦。不過,情況也不一定那麼糟糕。我們先看一下兩邊怎麼數,用華語跟英語為例。在華語,最右邊(而最後聽到)的數字代表一,代表多少次有包含“一”這個數值。下一個代表十,然後百,然後千。

之後,我們會開始談到“萬” - 在第五、第六、第七跟第八位。不過,除了用“萬”,那些數字還會代表什麼?跟前四位一樣代表“一”、“十”、“百”跟“千”,只是現在它們代表“一萬”、“十萬”、“百萬”跟“千萬”。所以,在這裡我想把那些“一”、“十”、“百”跟“千”叫數字的“名”,而把“萬”、“億“、”兆“等當數字的”姓“。

這樣看,我們有一些家庭,姓”萬“、億”、“兆”(加上一個無姓的家)等,而每一個家有一樣的人:“一”、“十”、“百”、“千”。這樣看,一個數字不管多大,它變大其實一直會按照同樣的制度:超過一家的四個人的人數,就要開始談到另外一家,而每次再談到同樣的人,只是屬於不同家庭。

那,英語呢?首先,英語用的一些名稱其實不是來自英語。西方人用的大數字名稱好像要“怪”法國人。在1485年,Nikolas Chuquet想出這個制度:

103 = thousand
106 = Million
109 = thousand million
1012 = Billion
1015 = thousand billion

你可能覺得這種數法也比較奇怪,因為你沒有看過。其實,沒有人在用這個制度,因為後來Jaques Peletier du Mans有修改它:

103 = thousand
106 = Million
109 = Milliard
1012 = Billion
1015 = Billiard

你也沒有聽過"milliard"或"billiard"?那你除了英語可能沒有學過其它西方語言。以上的制度現在叫"long scale"。從語言數量的角度來看,它可能是這個行球上最流行的制度。英語以前也有用過這個制度,但是例如英國1974年換成"short scale",一個你應該有遇過的制度:

103 = thousand
106 = million
109 = billion
1012 = trillion
1015 = quadrillion

如果繼續用“家庭”的想法,上面的"thousand"、"million"、"billion"等是英語裡數字用的“姓”。不過,這裡每一家只有三個成員:"one"、"ten"、"hundred"。

理論先到這裡,我們開始應用吧。作口譯碰到數字的時候最好要把它們寫下,這我們已經談過。我們要寫的是單純的每一位的數值,不要任何“千”、"million"等。如果中間或後面”缺“一些零,我們也要寫。

像在英語要把5000念"five thousand"。五之後的數字不用念出,因為全部都是零。所以,我們必須知道"thousand"的後面還有三位,所以聽到"thousand"之後沒有聽到其它數字,我們就可能要加三個零。

一個比較麻煩的地方是華語跟英語針對零的不同處理方法。在上面的“5000”的例子,兩個語言一樣,但是如果數字是“5500”,在華語很多人習慣把它念“五千五”,沒有“百”。而且,在英語不用念中間的零。像“5005”變成"five thousand five"。如果我們比較華語的“五千五”跟英語的"five thousand five",我們發現它們詞方面一某一樣,但是它們代表的數字並不是。小心……

那,這樣談,我們如果寫下較大的數字好像要寫一個很長的數字。這樣之後要怎麼知道怎麼念?有方法。在西方語言根本已經有習慣在較大的數字中間加符號“分組”。我們那時候要分的是我上面提到的“家庭”。所以,文件裡面我們平常看到的是123,456,789而不是123456789。在英語,標準符號是逗號,其它語言可能用別的符號。

那些符號的位子剛好在我們念數字的時候會念一家數字的“姓”。在上面的例子,第一個符號代表“million”,第二個代表“thousand”。華語好像沒有這種習慣。不過,我們最好也要分組。因為英語的符號已經在下面,華語的符號最好要寫上面,而且那個符號也要放在我們念“姓”的地方。所以,上面的數字在華語聽到寫下會變成1'2345'6789。這裡,第一個符號代表“億”,第二個代表“萬”。

現在我們終於要動手:不管我們聽到哪一種語言,我們寫下數字,然後在那個語言會念數字的”姓“的地方加符號 - 西方語言的話加在下面,聽到東方語言的時候加在上面。然後,寫完數字之後,我們會再加上目標語言的符號。所以,不管我們從什麼語言翻到什麼語言,如果是東方語言跟西方語言之間,上面當例子的數字會變成這樣:

1'23,45'6,789

現在我們可以用目標語言,較容易把數字念出來 - 過關了!

2007-12-04

It always comes as a surprise

I can't be cool, or nonchalant
Call me an impulsive fool, you're all I want
You may be right, it's too much too soon
To talk of love all night in your bedroom

I don't know why it always comes as a surprise
To find I'm here with you
You smile, and I am rubbing my eyes
At a dream come true

I won't play games or waste your time
But I won't feel ashamed to speak my mind
So just relax, don't question why
For calculated facts will not apply

I don't know why it always comes as a surprise
To find I'm here with you
You smile, and I am rubbing my eyes
At a dream come true

In my life, there've been few
Who affected me the way you do (you do)
You do (you do)

I'll tell no lies, I won't pretend
But if you've got a broken heart, I'll help it mend

I don't know why it always comes as a surprise
To find I'm here with you
You smile, and I am rubbing my eyes
At a dream come true
Smile, and I am rubbing my eyes
At a dream come true

2007-11-26

話 ── 沒意思而已?

我真愛在我周邊常常聽到的(空)話。真愛死……

像“這是一個趨勢”,我聽到這一句就想趕快跑掉,因為那個人會跟我解釋他在電視或報紙上看到人家說一個東西現在流行,所以他認為他也要(做),而且我最好也要。這有點像你問一個人他休閒活動是什麼,然後他回答“看現在流行什麼”。話反過來說變成“我不知道我想要或喜歡什麼,我需要別人告訴我。他們說什麼我就做什麼。” Nice...

現在很多人瘋狂"Web2.0"。這也是一個“趨勢”。不過,"Web2.0"是什麼?好像沒有人真的有辦法說。為什麼?因為這只是一個"marketing buzzword"。原則上,Web2.0的意思是我們把所有的角改成圓形的,然後我可以賣你免費給我的內容,而且感謝你給我你所有的個人資料,因為我也可以好好利用它們。如果你不喜歡這個說明,User Friendly有一些有道理的。

在學校也無法不遇到這種空話。"E-learning"... 其實,如果要做到e-learning,不需要花很多錢。我在計中工作的時候也有遇到一些想要賣這方面“完整的solution”。(他們真的會說“solution”,好像沒有比較好的華語的說法……)不過,他們的軟體平常蠻有限制。而且,他們只會提到硬體方面的需求,不會談到另外一種“軟體” ── 人。

為什麼一些人真的認為如果我把一個課程放到網路上,所有的學生馬上會上線上課?如果他們不會來到我能看到他們的教室,他們怎麼會準時自己上線到一個我只能看到IP跟帳號,但是看不到人的地方?夢想……

我幾年前(哇,好像真的已經快三年了)有用免費的Open Source軟體裝一個e-learning的網站要給我們系所用。結果:沒有人要用。不管是老師們或學生。為什麼?麻煩。老師們如果要用的話還要自己輸入教學內容,要做一些設定 ── 而且不是紙上寫的,都要在電腦上做。而學生…… 我不想再聽到那句“現在的年輕人網路都很厲害。”亂講。一些會,但是很少。大部分的人只能模仿別人“教”他們的一些動作。

你有沒有發現現在有很多課程、系所、甚至學校名稱裡包含“應用”?看起來現在很流行“應用”。不過,應用什麼?怎麼應用?我教的系所也是其中一個會“應用”的語言相關的系。所以,我們應該要應用語言。不過,如果真的要應用語言,可能也要有另外一些能力、技巧、知識。至少我教口譯的時候會給學生這種額外的能力。

不過,單純教口譯或筆譯也還沒有很多用。畢業之後,學生要翻什麼?文學?Harry Potter弟123個中文版?(為什麼沒有人要翻Douglas Adams?太難,對不對?)還有一些嘻嘻哈哈的聊天?然後呢?我在別的學校有教過“科技翻譯”。問題是,那些學生都是社會組,他們對“科技”(請問,什麼是“科技”呢?這包含蠻多東西……)的了解會多深?如果我要翻一片文章或一個會話,我必須了解內容,不然我只在玩游戲。

在那所學校還有另外的問題:研究所的學生當然蠻強,所以比較容易克服一些問題,但是四年級…… 我一直覺得他們翻出來的版本不太“漂亮”,不太順。問他們之後才發現他們根本沒有上過“普通”的筆譯課!如果他們還沒有了解基礎,他們要怎麼做進階一點的翻譯?

不過,跟口譯或筆譯不太有關的人對這種問題好像不太在乎。我在我們系原來不想教同步口譯,因為我認為我們的學生還沒有達到相當的水準。或者,如果真的要開這種課,真的要給他們多一點機會準備,所以至少要有兩年的逐步口譯。不過,其他人認為只需要一年(四個學分)的逐步口譯,然後就可以上同步口譯。如果已經有上過其中一種的口譯,那就應該要上另外的,對不對?

不過,這樣可以做到什麼“同步口譯”?自己想…… 我發現比我原來期待的還有多一些課(在各學校)會這樣:有一個很漂亮,很偉大的課程名稱,但是…… 像“專業翻譯”:台灣人很喜歡“專業”這個詞。但是,如果只有一個“專業”的翻譯課,其它翻譯課應該“沒有專業”,對不對?

或者看“模擬”,像“模擬口譯”。意思是不是只要假裝做口譯,所以只要假裝上課?原則上,所有的口譯或筆譯課都在“模擬”實在的工作。還是哪裡有學生上口譯課還可以賺錢?我沒看過……

“高級”應該也要加入這個俱樂部。我有教過“高級英語會話”。我不想再想到那門課。為什麼不能簡單地用“基礎”跟“進階”?(我有教過這樣兩種的筆譯課,學生跟我都還活著)答案好像很簡單:因為不好聽。主要的不是內容,主要的是包裝、空話。

所以,那些話 ── 沒意思而已……

2007-11-22

摩托車很危險……

有沒有聽過這一句?我有,好幾次。不過,我不太喜歡聽到這一句。

為什麼?第一,從語法立場來看這個句子,摩托車好像是主詞。後面有一個形容詞描寫那個主詞。所以,聽到這個句子,我會認為摩托車對周邊的人造成危險。Hmm...

現在我終於知道為什麼我要從斜後面安靜地靠近我的摩托車。如果我從前面來,它早就看到我,然後…… 我不敢想。也許,我到現在騎的摩托車都特別乖,從來沒有對我做壞事。也許是因為摩托車怕我……

還是那一句的意思是騎摩托車的人造成危險?那你最好要把我關在一個安全的地方,因為我也騎摩托車。不過…… 我雖然知道一些人不在乎他們周邊,也不在乎自己的安全,但是剛好在我們學校附近我常看到騎摩托車的學生轉彎前開方向燈。

我們學校(跟許多其它討厭摩托車但是愛汽車的學校一樣)四年前禁止摩托車到校園。那時候給的理由是“摩托車很危險”。好像有聽過,對不對?奇怪的是,我在校園也有看過汽車飆,但是沒有人說“汽車很危險”……

因為我自己騎摩托車,我也多一點在乎我的學生怎麼騎車。學校(學務處)雖然會公布車禍統計,但是那只是一些,學生向學務處報到的車禍,而且學務處不會注意車禍原因。

可惜,如果我發現一個學生好像有車禍,然後問是怎麼發生的,大部分是同一個答案:被汽車撞到。剛一個禮拜前才有學生體驗這種事,因為汽車司機沒有看後鏡,而且已經轉彎的時候才開方向燈……

我真不了解為什麼那麼多人認為坐四輪車的人比坐二輪車的人厲害、周到等。我在台灣的路上遇過不少坐四輪車的瘋子。我也有看過足夠的機車專家,沒有錯。所以我也沒有辦法只說“汽車很危險,摩托車不會”。

如果要說一個總判斷,可能只有“中華民國的駕照考試無法保證通過的人真的會開或騎車。”如果有懷疑,你可以買滷味跟珍奶,然後去最近的監理所看他們考試……

如果真的要談到危險,可能要說“機車騎士較容易受危險。”摩托車沒有airbag(現在已經不太對,而且有衣服),沒有另外一些汽車會提供的保護。而且,在台灣沒有多少人會買比較安全的安全帽,更少人會穿機車專用外套等。所以,撞到的時候會輸的是摩托車……

我一個人雖然不會造成很大的變化,但是我可以煩人,讓他們再煩別人。而且,我現在自己做一種“統計”……

2007-11-21

注音輸入法?不用,漢語拼音比較好。

幾乎每次我要在一台Windows電腦因為要寫華語提到漢語拼音輸入法,對方平常會跟我說”我們台灣用注音輸入法,你應該也要學才對。“不過,我還沒有真了解為什麼注音輸入法要那麼好。

第一,我不太相信這個”我們台灣用注音輸入法“的部分。雖然,在繁體中文的Windows有內建的注音輸入法,但是好像另外還有一些(內建的)輸入法。而且,在我們學校電算中心做行政工作的幾年內我有看到不少報修要求”我需要自然輸入法。“或”請幫忙安裝無蝦米,我只會這個。“如果台灣人已經可以那麼挑,為什麼外國人不行?

而且,好像不少台灣人忘記把眼睛展開一點:我不是台灣人,所以我的情況可能有點不一樣。寫我母語(跟許多其它語言一樣)的標準字是羅馬字。因為在台的教育(從幼稚園到大學,包含語言相關的系所)這方面不在乎,台灣人會把它們叫”英文字“。

所以,許多台灣人不會了解我可以用那些字寫華語。Dui tamen lai shuo, wo xianzai xie "yingwen". 不過,真的可以用羅馬字寫下華語的音。對一個”西方人“來說,如果可以用因為母語關系很熟的字,然後只需要學怎麼拼一些字代表某一種音還蠻方便。羅馬字有這個彈性。

如果一個西方人要學注音才能寫下華語,那就除了分配字到音還要學那些字本身,而且是一套對西方人相當”奇怪“的字。對台灣人來說,學注音有道理:如果比較大部分漢字的復雜度跟注音符號,當然注音簡單多了。(雖然,台灣人也可以考慮學羅馬字跟漢語拼音……)不過,如果要在電腦上使用,其實有更重要的理由為什麼漢語拼音會比注音好。

當一個台灣人,你應該知道注音符號包含多少個字。不知道?唉…… 37個。英語需要多少個字?26個。德語?30個。如果兩個語言都用羅馬字,為什麼字的數量不一樣?因為兩個語言用的音不一樣。漢語拼音用一個字沒有包含在英語用的字 ── 因為沒有相當的音。德語、匈牙利等有這個音,所以也有這個字:ü。雖然,在英語類的鍵盤上沒有這個字,但是可以用"v"取代,因為漢語拼音不在用它。

雖然1958年的漢語拼音跟1913年的注音一樣不是專門為了電腦輸入設計的拼法,但是早期的電腦大部分只需要支援英語,而我們現在用的鍵盤原則上是從那些鍵盤發展出來的,所以按鍵的數量幾乎都一樣。專門為了華語設計的鍵盤可能相當不一樣。不過,台灣現在用什麼樣的鍵盤格式?美國的。而美國的英語只需要26個字……

我想你應該已經知道我現在想說什麼,不過你可能還不知道這一件事情多麻煩 ── 因為你習慣了。其實,注音不只會占領37個按鍵,聲調需要多四個按鍵,所以總共有41個。你應該自己有發現,注音的符號不只會粘在文字按鍵上,它們也流浪到數字跟句號的空間。

請問,你用注音輸入法的時候如果需要寫數字,你會用哪裡的按鍵?功能建下的那一排?還是右邊的?右邊的,對不對?為什麼?因為輸入注音的時候你也需要一般的數字按鍵輸入注音的符號。

你有沒有想過這樣是不是有一點麻煩?如果要順利地,快速地輸入字,手最好不要動太多。動作越大越麻煩。你看,你的右手必須離開寫字的地方到旁邊,然後再回來。你不會想用打字的時候已經在你手下的數字按鍵?

不過,這個其實還不算什麼。我覺得真誇張的才是句號。西方人真不會想象右手需要離開鍵盤放到滑鼠上,然後要用滑鼠點桌面上一個工具列的某一個地方,之後我的句子才會有句點!這是怎麼回事!

我很久沒有了解為什麼OpenOffice有繁體中文版之後很多台灣人一直問什麼”工具列“的事情。當然:他們習慣Word提供的工具列,他們從來沒有看過別的情況。但是換一個立場,在外國人的眼睛裡這樣寫文章真是一件不可思議的事。

如果我一定需要這個工具列才有辦法用到句號,而且這個工具列不是作業系統(輸入法)提供,是掛在某一個應用程式的,請問,我在其它應用軟體裡要怎麼寫正常的文章?好像沒辦法……

看起來,注音不太適合使用在普通鍵盤上,因為它會干擾鍵盤的正常使用。這方面,漢語拼音沒有問題:數字、句號,都還用得到。而且,還有:只需要有羅馬字,我原則上可以用任何鍵盤輸入漢語拼音。為了注音,我需要特別的鍵盤。很多住國外的台灣人會在台灣買鍵盤過去。他們沒有學過漢語拼音(或任何一個用羅馬字的拼法,學校只會教注音),而為了他們學過的輸入法他們需要一個包含那些特殊字的鍵盤。

所以,漢語拼音輸入法是不是可以考慮學?在Windows雖然有時候有一點麻煩把漢語拼音設成可以寫繁體漢字,但是Linux跟OS X沒有問題。Linux有scimsmart pinyin,OS X除了內建的漢語拼音(不太好用)還有Fun Input Toy。這一片文章就是用Fun Input Toy寫的。如果你想知道一個方便的輸入法多好用,你最好要試FIT一下……

2007-11-19

Zhuyin or Hanyu Pinyin IME?

"This is Taiwan, we use Zhuyin input. So you should learn it too." This is something I have heard numerous times, but so far it was not very convincing. Why?

Well, first of all, the "we use Zhuyin" part is not quite correct. In the years I had been working at our school's computer centre I saw plenty of requests to get this or that IME installed, because "I can only use this one." If Taiwanese may be "picky", why not me?

Another reason against Zhuyin and for Hanyu Pinyin is of course the fact that I can get along with Latin script very well. My native language is using it, and also many others I encountered. So, for Hanyu Pinyin, one only needs to learn which letters are assigned to which sounds.

For Zhuyin, I would also need to learn the characters themselves. For a Taiwanese, Zhuyin makes sense because the characters are much simpler than most Hanzi. But for someone used to alphabets in Roman letters, this is an entirely new set to learn.

But when it comes to computer input methods, there are more important arguments. Zhuyin consists of 37 characters. When this script was created in 1913, people could hardly imagine computers. And when computers were created, people did not think of Zhuyin when they designed the first keyboard layouts.

The result? Zhuyin occupies not just 37 keys, there are four more for tone marks, so altogether 41 keys. The keyboard layout common in Taiwan is based on the standard English US layout. English operates with just 26 letters. That means, some more, usually differently assigned keys will be needed to input Zhuyin.

Did you ever notice that most Taiwanese will switch to the number keypad on the right when they have to key in numbers? There are numbers in the top row of the main key block, but... Those numbers are also used for Zhuyin characters. You want to key in Zhuyin? No numbers from there...

This is still a somehow acceptable workaround. Strange, but understandable. Much "funnier" are sentence marks. Just look at the layout: You need a period, a comma, a semicolon? Forget it! Did you ever notice how people write texts with Zhuyin? They write on the keyboard, sending the right hand to the keypad from time to time, and when they need a sentence mark, they will grab the mouse and click on a toolbar.

Without that special toolbar, the only other way available seems to be to call up a program displaying a character map, and to click on the sentence mark in question on that map. Microsoft has added such a toolbar to their office products, and the lack of such toolbar was an important reason why people in Taiwan did not want to use OpenOffice in the beginning. (problem solved some time ago)

Imagine this: You need a special toolbar, assigned to a certain application, to be able to finish a sentence with a period. That also means, you can not write correct Chinese sentences in a mail (at least not without trouble) if the mail program does not sport a sentence mark toolbar!

All these problems are hard to understand for someone used to Hanyu Pinyin input. Hanyu Pinyin is based on regular Latin script. It uses just one letter for a sound that is not in use in the English language: ü. This one has been replaced by "v" on English keyboard layouts.

But I really only need the letter keys to input language. The number keys are still giving me numbers when I press them, and the same original functionality applies to sentence marks. I can input ,。、 right from the keyboard, as long as I use the Hanyu Pinyin IME.

All these are pretty good arguments in favour of Hanyu Pinyin. And there is one more: You can use it basically everywhere on this planet, with almost any keyboard layout. Did you notice that quite a few Taiwanese living abroad bring a keyboard from Taiwan, so they can look up the keys they need for Zhuyin?

So, you want me to learn Zhuyin so I can use that IME? No... The Hanyu Pinyin IME may not always be easily set up on Windows, but it is very easy to use on Linux thanks to scim and Smart Pinyin, and it is very convenient on OS X now thanks to Fun Input Toy. If you ever wanted to know how an IME should behave, try FIT and enjoy...

2007-11-18

110V 的缺點

台灣,跟美國一樣,用110V的單相電。意思是,一般家電(燈、電視機、微波爐等)需要110V的供應電壓。所以,家裡大部分的電器用品需要110V。不一定每一個國家會這麼做。日本只有100V,歐洲用230V。

選一個國家的標準電壓不是一個簡單的決定,但這不是說這個決定一定是對的。我們環境在改變,所以也許影響這種決定的因素也會改變。

台灣人已經一段時間討論是不是真的需要第四個核子發電所。有人當然說是,供電不足。但是多少電被浪費掉?我不知道數字(而我懷疑有人知道),但是只要展開眼睛,天天就可以看到浪費電的現象。我想提到一個不太明確的。


有修過物理學的人應該還記得這種回路:一個電源,一個電阻。電阻代表一個用電裝置。上課的時候,老師可能給電壓跟電流,然後要問電阻。或者。進一步,他會給電壓跟功率,然後問電阻。修過物理學的人應該還記得R=U/I跟P=U*I。


不過,你有沒有看過這個回路?突然有另一個電阻。它有什麼作用呢?它代表電源跟R1之間的電線。每一條電線,每一個連接器有它的阻值。這個阻值雖然會很小,但是它在。你只要試用一下幾條不同電線當喇叭線,你就會發現不同線可能導致不同聲音大小 ── 因為有不同阻值。

所以,如果我們要聽音樂,我們最好要準備好一點的喇叭線。但是這跟110V有什麼關系呢?而且,跟浪費電也有什麼關系?抱歉,我們可能要計算一點。這是比較簡單的計算,為了了解原理。

我們想象一下四個電器:55W的燈泡、110W的烙鐵、1100W的烤箱跟2200W的冷氣器。我們先看一下在110V它們吃的電流會多高:

電器 功率 電流
燈泡 55W 0.5A
烙鐵 110W 1A
烤箱 1100W 10A
冷氣 2200W 20A

區別相當大,但是功率也是我們只要吧P=U*I改成I=P/U,很快就算得出來。那如果這些電器都用220V呢?

電器 功率 電流
燈泡 55W 0.25A
烙鐵 110W 0.5A
烤箱 1100W 5A
冷氣 2200W 10A

電壓變成兩倍,電流變成一半,很正常。不過,我們還有那一顆R2的電阻。它會有什麼影響呢?如果電流過一個電阻電壓會有落差。但是電壓會落多少呢?這裡我們要看阻值跟電流:R=U/I -> U=R*I。但是什麼電流?我們電器(R1)吃的電流……

1Ω聽起來不是一個很高的阻值,但是我們的電線跟連接器的阻值最好不要達到1Ω。我們看一下,在110V,如果我們用1Ω阻值的電線,那個電線造成什麼落差:

電器 功率 電流 落差
燈泡 55W 0.5A 0.5V
烙鐵 110W 1A 1V
烤箱 1100W 10A 10V
冷氣 2200W 20A 20V

正常,對不對?如果U=R*I,而阻值是1Ω,那電壓落差跟電流一樣。好吧,那如果我們真的有拿到一條2Ω阻值的電線,落差也變成兩倍:

電器 功率 電流 落差
燈泡 55W 0.5A 1V
烙鐵 110W 1A 2V
烤箱 1100W 10A 20V
冷氣 2200W 20A 40V

不過,為什麼我們要談這種電壓落差。有落差又會怎樣呢?這裡發生兩件事:第一,我們的電器(R1)現在缺一點電壓,所以它已經沒有辦法提供完整的功率。如果我們用1Ω的電線,實在的功率變成這樣:

電器 理論功率 電流 落差 實際功率
燈泡 55W 0.5A 0.5V 54.75W
烙鐵 110W 1A 1V 109W
烤箱 1100W 10A 10V 1000W
冷氣 2200W 20A 20V 1800W

而如果用2Ω的電線,我們得到這些功率:

電器 理論功率 電流 落差 實際功率
燈泡 55W 0.5A 1V 54.5W
烙鐵 110W 1A 2V 108W
烤箱 1100W 10A 20V 900W
冷氣 2200W 20A 40V 1400W

這已經有點恐怖,是不是?為什麼烤箱跟冷氣的數值會差那麼多?很簡單:我們有用U=R*I算落差。我們用P=U*I算功率。我們可以用第一個方程取代第二個方程的電壓:P=R*I*I=R*I^2。功率跟阻值沒有線性的關系,我們這裡得到平方數!

這表示,對功率越高的電器影響越大。不過,不只是我們的電器缺功率。它缺的部分不會“不見”,這個缺少變成溫暖,在R2(我們電線)的地方。為什麼一條延長線如果接電燈沒有變化,但是接烤箱或電磁爐它就會變“溫暖”?(還是溫暖已經變成燙?)原因就在這裡。

那,考慮一下,如果這個功率現在不是在一條延長線的長度變成溫暖,而只在一個點要燒一整個功率?你有沒有聽過電器造成火災?不一定都是電器的“錯”,很可能是電線 ── 或者連接器的問題。

在台灣常可以聽到一個建議:功率較高的電器如果不使用,最好要拔掉電線。如果你喜歡火災,你就要按照這個建議。如果我的烤箱沒有開,它不會吃任何電。但是,如果我常拔掉電線,插座裡面的彈片會慢慢變弱,變鬆。接觸會越來越不好,而接觸不良的話,阻值會變高。恭喜……

那麼,為什麼我會說這些是110V的缺點?220V會好一點嗎?我們看看1Ω的阻值:

電器 理論功率 電流 落差 實際功率
燈泡 55W 0.25A 0.25V 54.93W
烙鐵 110W 0.5A 0.5V 109.75W
烤箱 1100W 5A 5V 1075W
冷氣 2200W 10A 10V 2100W

而如果用2Ω的電線:

電器 理論功率 電流 落差 實際功率
燈泡 55W 0.25A 0.5V 54.875W
烙鐵 110W 0.5A 1V 109.5W
烤箱 1100W 5A 10V 1050W
冷氣 2200W 10A 20V 2000W

我們當然還是有同樣的問題,但是它影響小多了。為什麼?因為在220V,跟110V比起來我們只需要一半的電流。而落差功率是P=R*I^2…… 所以,如果從110V升級到220V,可以減少一些問題。

現在應該有人說“但是,我們的冷氣平常用220V!”沒錯,台灣供應給居民的三相電是220V,跟歐洲的單相電壓一樣。(OK, 歐洲用230V。)歐洲的三相電是400V……

一般居民沒有辦法自己改電壓,國家才行。所以,一般居民可以做什麼呢?如果要賣電力較高的電器,最好要找可用220V的。在電力較高的電器一定要用相當好的線材跟連接器。而且,最好不要把供電線常拔掉。另外也可以煩政府,叫他門把標準電壓從110V升級到220V……

2007-11-15

讓LLC8000的老師麥克風睡眠

我教同步口譯的教室可惜有裝LLC8000。(我好像已經提過我不太喜歡這個系統。)教室雖然也有兩個口譯停,但是考試的時候我不喜歡使用它們。原因很簡單:時間不夠。如果一個學生只有五分鍾的時間,你不會叫他先去口譯停,關門,坐下。

如果我叫學生用老師位子的耳機,我雖然只會省幾秒而已,但是學生有多幾秒也不會反對。只有一個問題:用老師的耳機麥克風讓學生聽的時候,老師的麥克風有開,而且有連接到老師耳機。所以,學生如果開始講話就會干擾自己。但是這個問題很容易解決。(放心,這次不用烙鐵,不需要任何工具)


老師耳機麥克風的接頭其實是兩個3.5mm頭在一個“包裝”。單聲的接頭是麥克風,立體聲的頭是耳機用的。


我們只需要一條立體聲耳機延長線。(兩邊3.5mm的頭,一邊公,一邊母)


我們把延長線接到耳機座跟耳機頭。這樣在耳機還可以聽到聲音,但是麥克風沒有接。


另外一個好處是長一點的線,所以學生可以坐在老師桌旁邊,但是我還可以操作所有的設備。而如果你懷疑我怎麼還能聽到學生聽的原語:控制台內建的Monitor喇叭跟老師耳機平行。它這樣會較大聲,所以我還會在上面放一本小詞典蓋著它 ── 剛好……

2007-11-14

電腦專家:公文線上簽章系統

認識我的人應該知道:我對某些人用”專家“這個稱呼,因為我不想用一些比較不好聽的詞。這樣,我有機會遇到很多”專業人才“。我是口譯。我沒有很多張紙說我會或是什麼,但是這個有。我雖然也有另外一些能力,但是我沒有台灣人很重視的那張紙說我真的會。所以,我應該不太懂或會,而那些有那一張紙的人應該很厲害,對不對?沒關系,我還是在現在教書的這所學校四年半在電算中心有做行政工作。

那時候,我的工作範圍包含校園網路,宿網,伺服器,行政電腦,電腦教室電腦。我在那時段內發現,好像在不少學校的電算中心,成員主要“規劃、設計、管理”(其實,不只有計中會這樣),但是沒有人實在“工作”。當然也有不一樣地方。在中正計中可以找到一些知道他們在做什麼的人。嘉義縣網中心沒有多少資源,所以根本只能做他們自己會做的。或看台南縣網中心做多少事。不過,如果你想”玩一玩“,可以到Google,輸入一下”設計 管理 規劃“。你會看到很多台灣的學校...

有一次(大概一年前)我跟另一個計中的同事去高雄一所國立大學,要參加一個“公文線上簽章系統開發成功發表會”。(他們真的這麼說)當一個外國人(至少在這裡),我討厭公文。我不了解,為什麼21世紀的時候還要用一個皇帝公務員為了表現自己的重要性幾百年前想出的做法。所以,我原來很高興聽到有人至少想改善這個%#&@%的東西。夢想...

一家公司有開發這個系統,所以在場有他們公司幾個人,包含一位經理,還有那所學校計中的組長。(我那時候在我們學校也被叫“組長”,不過那也只是一個稱呼而已)他們計中主任較忙,只能歡迎我們,然後就走了。之後都是公司的人介紹。在場,除了我們兩個計中的人,其他都是各學校總務處或秘書室的人。所以,他們不太了解技術,但是比我們兩個了解公文處理程序。

那個系統有接到那所學校的“Single Sign-On“方式。"Single Sign-On“的意思是你只需要一對帳號跟密碼,然後可以用(學校或公司)所有的資源。Google也這麼做:你只要有GMail帳號就可以用Google Docs, Analytics, Picasaweb, Blogger等。不過,在學校(或者公司),這種SSO平常比較麻煩,因為平常有各種各樣平台的主機,而Windows不太喜歡用Unix世界流行的LDAP。微軟有把它改裝,自己加上多一些東西,然後叫它Active Directory。而且,密碼的哈希演算法不一樣,所以如果有Windows跟Unix (Linux, BSD, Solaris等)的主機,SSO會蠻麻煩。

我們也想做到SSO,所以我們當然很想知道那個系統用什麼認證方式。那位經理回答“不好意思,學校原來已經有那個SSO,這不是我們公司做的。”這好像不是我問的。我想知道他們自己的系統用什麼認證方式。“請問,貴公司是用LDAP,AD還是一個資料庫?” “不好意思,這個我現在不太清楚。”你“不太清楚”?你不知道你自己的系統用什麼認證方式?厲害... 計中組長坐在那位經理的旁邊,但是整個時候沒有說任何話。看起來,他也“不太清楚”自己的網路... (不過,他們兩個應該有幾張紙”證明“他們電腦方面多厲害)

我已經說過我對公文程序不熟 - 但是在場的秘書等很熟。這個系統要允許學校省紙,因為可以直接在線上簽公文。但是... “請問,我沒有看到關於附加檔處理的資料。可不可以麻煩解釋一下?“ ”不好意思,附加檔可能要印,我們系統目前還沒有辦法線上處理附件。“連不了解技術的文書人員那時候都(禮貌地)笑...

教育部為了這個系統的開發出捕助款。我沒有問多少,但是一定超過我的月薪。教育部理論上應該不想排除人。因為我一直聽到"Windows, Word等“,我問他們Linux或OS X的電腦能不能使用那個系統。“不好意思,我們目前只會支援微軟的系統。“很好... 我雖然在台灣算是外國人,但是我住在這裡,所以他們浪費的也包含我的稅。

這是2006年發生的事。介紹的過程中,公司的人談到支援的時候,不只有說"Word, IE等“,他們具體地說"Windows 2000, IE5.0-6, Word 2000"。Hmm... 那時候IE7快要出來,Windows Vista跟MSO2007隔年也要上市。那,那些新版本呢?“不好意思,我們目前還沒有機會測試。我們支援的就是這些。”

結論:他們跟教育部拿錢開發一個一定要買微軟產品才能使用的系統。他們希望學校會給他們更多錢跟他們買這個系統。但是連使用Windows的人可能隔一,兩年就無法再(正常)使用那個系統。雖然可以在線上簽公文,但是已經當電子檔的附件還是要列印。而且,他們公司的人好像也不太了解自己的產品。厲害,真厲害...

2007-11-12

“我會Word。” “我會合氣道。要不要比?”

“我會Word。” ── 我真愛這句話。每次聽到人家說這一句,我會看周邊,看附近會不會有比較硬的牆壁可以撞我的頭。單純語言方面,這句話已經很好笑:“Word”是一個應用軟體,所以可以算是一個“東西”。

它不是一個程序、一個技術或技巧,它是一個東西。我們當然可以用這個東西當一個工具做 ── 文書處理。不過,這裡有另外一句我較常聽到的話:“文書處理就是Word。”了解……

我們換一下舞台。我們把文書處理這個技術換成開車。開車也需要工具才有辦法做:汽車。不過,不是隨便任何一台汽車就可以。Word不是唯一的文書處理軟體。(完了,我剛不小心公開一個很多台灣人不知道的秘密!)所以,對汽車來說,我們應該要選某一個牌子。Toyota可以嗎?(放心,他們沒有給我錢。)所以,如果我們這方面要用一樣的方法,我們應該要說“我會Toyota。”

請問,有沒有聽過?而且,你聽到這一句,你會不會願意坐那個人的Toyota?還是…… 你會不會擔心他會不會開車?我會。(擔心)不過,會更好:一些人還會特別強調“不過,我只會Word2000。“再換成開車舞台,好像變成”不好意思,我只會Toyota Camry。而且,只會2002年的Toyota Camry。而且,其實,我只會黑色的。那台白色的不行。“厲害……

我們當然也可以換成其它舞台:”我只會大同的電鍋,但是一定要是綠色的。“或者”我只會LG的電視機,但是只有液晶的。“當一個跟語言有一點點關系的人我真可憐那些人,因為他們沒有辦法買一個真正的動詞,只能用(二手的?)助動詞。

好吧,語言先玩到這裡,想象那些人”會使用Word“。會”使用“…… 這個”使用“包含哪一些操作呢?如果是”會Word“的人,這平常是啟動程式、打字、用滑鼠選字、點一些圖像讓字變大一點或換字型、點磁片圖像、輸入檔案名、點OK、點印表機圖像列印。That's about it.

很好玩的是,這些都是Windows應用程式很基本的操作。所以,說”我會Word“的人原則上也可以說”我也會Quicken, AutoCAD, Lightwave, Cubase等其它5729個軟體。“

不過,我們回到原點一下:程序,技術 ── 文書處理。那些人會不會文書處理?他們會不會知道怎麼正確地寫一個段落?知不知道怎麼用段落樣式?知不知道什麼是樣本?他們會自己寫頁數還是讓軟體自動更新?其實,”會Word“的人大部分不知道我剛在講什麼……

原則上,如果有人真的”會文書處理“(不過,我個人比較喜歡說”了解文書處理“),他可以用任何文書處理的軟體。當然,如果他對某一個軟體不熟,他操作會慢一點,而且操作可能不方便 ── 但是他還是
有辦法做,因為所有的文書處理軟體有很多共同的地方。(當然也有區別,這個改天再說)

看起來,我好像一直在批評。好像是。為什麼?因為我天天遇到”會Word“的人。我試過跟他門解釋。試過不少次。但是…… 其實……

算了……

2007-11-11

Lebkuchen

Weihnachten rückt immer näher, also wird fleißig gebacken - gezwungenermaßen, denn hier in Taiwan bekommt man nicht sehr viel weihnachtliches Gebäck. Wenn es aber am Endprodukt mangelt, dann auch oft an den Ausgangsstoffen, und man muß sich etwas einfallen lassen.


Supermärkte in Taiwan kann man in dieser Hinsicht so ziemlich vergessen, da bekommt man gerade einmal Mehl, Zucker, Salz, Honig, Eier und mit viel Glück ungesalzene Butter. Das war es dann aber auch. Für "richtige" Lebkuchen benutze ich folgendes Rezept:
500g Honig
250g Zucker
250g Butter
1kg Mehl
50g Kakao
2 Eier
Lebkuchengewürz
10g Pottasche
eventuell extra Zimt und Nelken

Kakao bekommt man vielleicht noch in besseren Supermärkten, ansonsten muss man einen Laden für "Lebensmittelstoffe" (食品材料行) aufsuchen. Da bekommt man allerdings selten (oder besser gar nicht) Pottasche und die nötigen Gewürze.

Pottasche hat glücklicherweise einen chemischen Fachnamen: Kaliumkarbonat, K2CO3. Und das findet man im Chemiefachhandel. Taiwanesen werden zwar etwas skeptisch, wenn sie die Flasche mit dem Aufkleber sehen, aber ich könnte natürlich auch fragen, ob ich nicht noch etwas Natriumchlorid in ihr Essen geben soll - anstatt Kochsalz...

Bei den Gewürzen wird es "lustig": In Taiwan gibt es außer den "westlichen" Apotheken auch noch traditionelle chinesische. Und die liefern fast alles, was man in der Küche zum Würzen braucht. (selbst ungemahlenen schwarzen Pfeffer) Hier gibt es nicht nur Zimt und Nelken, sondern auch alles, was man braucht, um sich selbst Lebkuchengewürz zurechtzumischen: Piment, Zimt, Nelken, Kardamom, Ingwer, Muskatnuß, Koriander. Ich hole meine Zutaten also aus dem Supermarkt, der Apotheke und dem Chemiefachhandel...

Man kann alles in gleichen Teilen mischen, oder Zimt und Nelken etwas bevorzugen - oder so mischen, wie man es selbst mag. Alle "Pulver" (einschließlich Mehl und Kakao) werden miteinander vermischt und auch die Eier dazugegeben. In einem Topf erwärmt man inzwischen Honig, Butter und Zucker, so daß sich der Zucker auflöst. Etwas abkühlen lassen und mit allen Pülverchen gut vermischen.

Ich verarbeite den Teig meist abends und lasse ihn über Nacht stehen. Am nächsten Tag kann man dann backen: 10 bis 20 Minuten bei 180 bis 200 Grad, je nach Dicke und Größe der Stücke. Und so können dann acht Kilogramm Lebkuchen aussehen:


Diese Lebkuchen habe ich übrigens schon bis zu einem Jahr in "normalen" Behältnissen (Keksdose, Steingefäß) und bis zu zwei Jahren in luftdicht schließenden Gefäßen aufbewahrt. Man sollte allerdings mindestens einen Monat vor Weihnachten backen, da die Lebkuchen nach dem Backen erst einmal hart sind und erst im Laufe der Zeit weich werden!

2007-11-03

社會組科技須知 - 軟體本地化: 火狐狸擴充套件

現在幾乎每一個人有至少一台電腦。雖然很多人不知道怎麼正確地使用那一台電腦,但是每一個人還是很快樂地使用。雖然幾乎沒有人願意看一個軟體的使用手冊或它內建的說明,但是大家(特別在台灣)一定要他們自己母語的版本。不過,不一定每一個軟體是在台灣寫的,所以可能需要有人把一個英文版翻成中文。而這種事有時候不會很困難。

Mozilla Firefox是一個真不錯的瀏覽器,比你的IE好一些。你最好安裝,用一下。(而且順便也安裝Opera)Firefox一個較特別的地方是它的擴充套件。Firefox本身會提供基本的瀏覽器的功能,但經過擴充套件我可以做個人化,可以讓它變成我要的樣子。

那些擴充套件也是軟體。如果它們有使用者介面,可能要有人做“本地化”,把使用者介面翻成中文。寫一個擴充套件的人不見得懂中文,而你 - “不懂電腦”,對不對?好,那我簡單地說明一下:

這種擴充套件是一個"XPI"檔。意思是,檔案的“大名”是"name.xpi"。我們想象一下我們的套件叫"foxytunes",所以我們下載一個檔案叫"foxytunes.xpi"。不過,它其實是普通的ZIP壓縮檔。所以,我們可以把"xpi"改成"zip",然後就可以解壓縮。

我們現在看到一些目錄跟檔案。對我們有趣的是"chrome"目錄,其它我們可以不管。裡面我們會發現至少一個檔案:"foxytunes.jar"。(檔案名就是套件的名字)如果還有其它檔案,它們可能比較難過 - 因為我們不理它們。

"JAR"代表Java ARchive,所以我們又碰到一個壓縮檔。如果你的Windows XP或Vista沒有辦法解壓縮,你可以試試用ExtractNow。(或者你可以試試換一個比較方便的作業系統)解壓縮之後,我們應該有一些目錄。我們要的目錄叫"locale"。

如果你看不到這個目錄,這表示寫套件的人還沒有考慮到多語言化。那時候,換別的套件吧。不過,我們套件有這個目錄,所以我們進去。我們應該看到至少一個目錄。它的名字可能是"en-US"、 "en-UK"或也許有"de-DE"。

前面是語言,後面是國家。所以,"en"代表英文,"de"德文等。"en-US"是美國的英文版,"en-UK"是英國的。我們先在某一個地方建立一個"zh-TW"目錄,然後把"en-US"或"en-UK"(只有其中一個!)裡面所有的檔案拷貝到到"zh-TW"。現在我們要看檔案。

我們應該可以看到至少一個DTD檔。裡面會有一些tag,有點像HTML或XML。我們看一下具體的例子:

《!--ENTITY foxytunes.tools.label "Tools"--》
《!--ENTITY foxytunes.tools.key "T"--》

一個"Entity"是一個實體,一個元素,是這個套件使用的一個訊息。之後的"foxytunes.tools.label"是這個實體的名稱,而引號之間的部分才是真的要輸出的訊息,這裡是"Tools"。第二行很像,但是有點不同:這個實體定一個按鈕,"T"。(按"T"就可以叫出工具選項)

這裡的工作很簡單:我們只需要把兩個引號之間的部分翻成中文,但是不要動"key"實體!所以,把以上的例子翻成中文的話會變成這樣:

《!--ENTITY foxytunes.tools.label "工具"--》
《!--ENTITY foxytunes.tools.key "T"--》
簡單,對不對?下一步。我們可能看到一個"about.dtd"檔,裡面有(沒有想到吧)關於套件的資訊。不過,可能不只有這些。寫套件的人如果有做好的話,應該有地方你要改一個數值(看裡面的說明!),而且有地方你可以留你的資料:名字、e-mail等。如果你有翻這個套件,你也有貢獻,所以當然也要列你的名字。

比較害羞或在乎隱私的人可以用暱稱,但是e-mail最好要是比較可靠(長期可聯絡到)的。如果再用foxytunes的具體例子,這三行

《!ENTITY about.is.translated "0"》
《!ENTITY about.translatedby.name ""》
《!ENTITY about.translatedby.url ""》

要變成

《!ENTITY about.is.translated "1"》
《!ENTITY about.translatedby.name "Fang Sheyu"》
《!ENTITY about.translatedby.url "kosh@vorlon.org"》

原則上你的名字也可以用漢字寫,但是我會建議用羅馬字,因為這樣大家有辦法讀或寫你的名字。不過,可能還有其它檔案。裡面可能有這種內容:
enable=Enable
disable=Disable
unknown=Unknown
這些也很簡單:不要動"="之前的部分,但是要翻之後的。像這樣:
enable=啟動
disable=停止
unknown=未知
而且,我們可能遇到這種“奇怪”的句子:
theCurrentTimeIs=The current time is: %S
裡面的"%S"很重要,它是程式的輸出。這裡是時間,但是也可能是一個檔案名,帳號名稱,溫度,任何數值。我們先要了解它在原文的句子有什麼作用。這裡是受詞,而且我們可以較容易了解它代表時間。有時候我們在目標語言可能要把它放在句子裡不同的位子,所以先要確認。這次沒有什麼問題:
theCurrentTimeIs=目前時間是: %S
我們可能碰到的檔案(目前)只有這些。如果要做這種套件的本地化,我們最好先把"en-US"或"en-UK"的檔案拷貝到我們"zh-TW"目錄,然後修改內容。不過……

我們存檔一定要用UTF-8編碼!而且,我們其實可以用一個方便一點的editor,不需要用Windows的notepad(記事本)。只要找一下"windows free xml editor unicode"或"windows editor unicode",就會有一些選擇。抱歉,我已經幾年不在用Windows,所以自己不在使用那些editor。也許別人可以提出一些建議?在OS X 我用TextWrangler,在Linux大部分是BluefishScreem

翻完了?一切都正確?最後確認一下,然後把一整個"zh-TW"目錄壓縮(例如ZIP檔),然後寄給擴充套件的創作人。他會把你的翻譯加進去,然後線上更新套件。

恭喜!你剛把一個軟體改成多一些人可以用!

2007-11-02

社會組科技須知 - 升級卡帶

你還在用錄音帶教語言?你真討厭你的學生,是不是?也許別人不會像我這麼”敏感“,但我從來(從11歲時學俄語開始)討厭在語言課聽錄音帶。老師講的沒有問題,但是帶子?Rrrrrrr...

不是因為我太習慣老師的發音,是因為放錄音帶音質很差。只有一些學日語的時候聽過的錄音帶還不錯,其它…… 那,如果我那麼不喜歡聽錄音帶,我那時候怎麼還會用錄音帶聽音樂?很簡單:我有照顧帶子跟錄音機。

錄音帶算是屬於”類比“的媒體。這表示,我寫的跟讀的資料不見得一樣。我可以努力接近100%,但是我永遠達不到100%,只能接近。而且,如果我要接近,我必須用好一點的設備(錄音機,帶子),必須照顧(保養等)設備,有時候甚至可能要調整一下。在學校有可能嗎?誰想做?誰會做?

只要錄音磁頭對播放磁頭一點點歪掉,高低音就走了。只要磁頭沒有100%幹淨,S/N(訊號對雜訊的比率)就很差。而且,學校平常為了“方便”會用(很便宜的)卡帶。如果你沒有聽過reel-to-reel的錄音機,你不知道卡帶多爛。

你覺得reel-to-reel較麻煩?可能。但是卡帶也是。你有沒有發現在CD可以很簡單地從第二首跳到第八首歌?卡帶呢?你要等,等,等…… 卡帶還是“怕”灰塵、高溫讀、高濕度、磁場…… 所以我們最好要從卡帶升級,對不對?

我猜你應該有聽過“MP3”這個名稱?放心,MP3本身不是非法的東西。(談到“非法”:唱片公司自己不見得會尊敬(別人的)智慧財產。)它是一個專門針對聲音資訊用的壓縮格式。正確的名稱是"MPEG-1 Audio Layer 3",但是這不太重要。你喜歡聽音樂?但是還沒有MP3 player?買一台!擔心買錯?跟你的學生借用一下!我猜在這方面,他們會很高興得幫助……

選MP3播放器的時候要注意一件事:上課也要用的話,你可能常常需要把一個檔案裡面的一個部分重復播放。你最好確認一下這方面的操作方不方便,按鈕(或相當的東西)會不會比較耐用。而且,一定要試聽!那種播放器還是包含類比的擴音器,而比較“便宜“(有人也可能想說”爛“)的公司可能不知道怎麼設計較好的擴音器。

我在這所學校剛開始的時候用一台T-650(Sony的PDA)。它的播放軟體允許我定A跟B點,然後可以一直重復播A跟B之間的部分。觸摸式銀幕,還蠻好用。不過,播放MP3較耗電。後來(到現在)我用一台512MB的Creative MuVo。它雖然不會讓我定AB點,但是操作很方便。如果我再換的話,我應該要找一台flash記憶體、至少16GB容量、而且音樂管理較好的播放器,因為我上課時較常會用到我的音樂。(目前已超過13GB,約2500首)

下一步:內容。我們有播放器,當然需要東西可以播。每一家出版社現在如果提供“媒體”,一定會有CD。也許他們也還有錄音帶,但是也一定有CD。所以:跟他們要!有時候(一些雜志附上的CD)已經會有MP3檔案,但是大部分會是普通的Audio CD。所以,我們要轉換。

我猜你在用Windows,所以可以考慮安裝iTunes(如果要方便,也要管理音樂)或(只是例子,還有其它免費的軟體)CDex。(放心,有中文介面)OS X已經包含iTunes,而Linux上有好幾個軟體可以用。

不管你用哪一個軟體,首先可能要設定轉換的bitrate。音樂的話,較多人現在用192kb/s。上課要用的大部分應該是講話的聲音,所以可以用低一點的音質(不過,192kb/s也很好),但是最好不要低於160kb/s(立體聲)或80kb/s(單聲),不然可以再用卡帶……

大部分的播放器也可以當隨身碟,所以可以把MP3檔很簡單地從電腦復制到播放器。不過,在教室要怎麼播放?如果你願意花幾百塊(在台灣好像較少人願意做),可以買電腦用的“多媒體”喇叭。(“單媒體喇叭”也可以,但是台灣不在賣)那種喇叭包含擴音器,可以直接接上MP3播放器。

但是,如果已經有語言教室,有很多設備,但是老師桌上只有LLC8000的控制台呢?也有辦法。像LLC8000在左邊有額外的麥克風輸入端(6.3mm)。最簡單的是買一條轉換線,3.5到6.3mm。不過,這樣還會有兩個問題:第一,那個麥克風是單聲的,所以它只會接到左邊的聲道。第二,麥克風輸入端會期待很低的訊號電壓,但是耳機輸出端會提供較高的訊號電壓。所以,在播放器調整大聲一點點,聲音就變成不好聽

如果要很正確地調整電壓跟阻抗,我們可能需要五,六顆電阻,但是在這個情況,兩顆電阻就會夠:在6.3mm的接頭裡,我們不要把紅色(左聲)跟白色(右聲)直接悍到接頭的端子,兩邊先要接各一顆1kΩ的電阻,然後把那兩顆電阻接到接頭的左聲端。這樣就不會有問題。如果你擔心自己會拿錯烙鐵(它一邊有時候會變溫暖一點),應該也可以找到一個知道如何拿烙鐵的學生。

我不喜歡LLC8000

你不知道LLC8000是什麼?幸福……
LLC8000是Sony為了語言教學設計的廣播系統。我沒有找到它是什麼時候設計的,但是應該有幾年了。當時,它應該是不錯的系統,但現在是2007年……

看它的功能,聽起來不錯。但是…… 第一,我還沒看過人會用它一半的功能。第二,它其實缺一些”功能“。第三,它現有的功能也不見得那麼好。

那,它缺什麼功能?對我來說一個很大的麻煩是它同時只能處理一個訊號來源。聽起來很正常,但是你有沒有上過同步口譯的課?老師要播一個媒體讓大家聽,但是同時也要讓大家聽到其中一個學生的聲音。在LLC8000不可能。到去年我用一些接到另外一台擴音機的無線麥克風,現在終於可以用有線(桌上)麥克風。麥克風不能接到LLC8000,不然就沒有意義。

接到LLC8000的訊號來源全部都可以直接經過喇叭聽到。但是只有老師的錄音機跟麥克風也可以直接在學生耳機聽到,其它來源(接到AUX1-4)需要分配到一個群組,這樣那個群組才有辦法在耳機聽到那個聲音。為什麼?這沒有道理。不過,Sony的人怎麼說?”你只要分配到一個群組就可以。“但是到底為什麼我首先還要分配呢?

而且,把一個訊號分配到一個群組的時候還有一個問題:反饋。只要有一個學生把耳機放下或在一個位子沒有學生但是耳機有開,就有可能學生麥克風收到學生耳機的聲音,然後大家可以欣賞很煩的反饋。為什麼那時候學生的麥克風要有開?別問我,我不知道……


LLC8000真是前一代的廣播系統,它主要的媒體還是錄音帶。如果想用先進一點的媒體(CD等),要把CD player接到AUX輸入,然後要把輸入分配到學生群組才有辦法在耳機聽到。

Sony沒有打算零時接訊號來源,所以如果一個老師想把他MP3 player接上去,只能用左邊的額外麥克風(1x6.3mm)或老師耳機麥克風(2x3.5mm)的插座。但是,因為那些輸入端是麥克風專用,阻抗跟輸入電壓不符合一個耳機輸出的阻抗跟電壓,所以需要自己做一個減弱器(三顆電阻就夠)。

可惜,大部分教語言的老師們因為自己當學生的時候有用同樣的設備(而且,自己對用電的東西也不太了解),所以就不會考慮到想要別的系統……

2007-11-01

我雖然是外國人,但我不是外星人,也不是觀光客!

本地人應該知道,如果要在某個地方報名或注冊,一定要提供身份證字號。雖然,有時候政府好像會兩次發同樣的字號,但是平常它是一個獨一無二的號碼。但是,如果外國人來的話……

如果我要去銀行開戶,行員雖然會看我的居留證(相當本地人身份證),但是好像只是為了確認我會不會住在台灣。之後他們還是會要"passporto"。看起來,中華民國的證件不太可靠,沒有價值。

要處理外國人的資料,根本就要用護照號碼,對不對?還是……?我們學校有薪資查詢系統。聽起來很偉大,但是它只是一個小web介面,會從資料庫讀一些資料。原來,資料來源不是校務系統的資料庫,而是一個Excel工作表。而且,另一些服務也有獨立的資料來源。

這也是說,使用者名稱跟密碼都是獨立定的。名稱還好,但是密碼…… 外國人?Hmm,那我用他居留證號碼,但是拿掉最後的數字。外國人?他的居留證為什麼開頭兩個文字?我們台灣人只有一個,那我把第一個拿掉。外國人?當然要用護照號碼!不過,他的號碼較長,我拿掉後面兩個數字。外國人?當然要用護照號碼!但是他的字號怎麼都是數字?我們的護照不會那樣!那,我應該要加一個文字……

當時,我非常“高興”地用學校的線上資源。(用?我根本沒有辦法用!)不過,有一天我也已經沒耐心了。而且,我在電算中心做行政工作,管理所有的網路資源,包含e-mail主機。我有跟各辦公室說過幾次,請他們用我的居留證號碼,而特別請他們不要亂玩我的密碼。沒有變化。所以,有一天我改人事主任的e-mail密碼。

沒有多久之後,人事室打電話過來。
“主任的e-mail好像有問題,沒辦法看。”
“對。”
“對?為什麼?”
“我有改他密碼。”
“為什麼要改主任的密碼?”
“因為在這裡每一個單位都隨便設我的密碼。我有居留證,政府把他的字號有改成十碼,所以跟你們身份證一樣長。我住在這裡,不是觀光客,所以不需要用護照號碼,我有居留證。而且,當密碼的時候也不要亂改字號,不然我根本沒有辦法做任何事。資料是從你們那邊來,所以,能不能跟所有單位說明一下這一件事?”
“喔……”
之後,我沒有再碰到這個問題……

不過,不只有我們學校會這麼厲害…… 我去年在一所國立大學兼課。他們各方面周到,有制度,有效率,但是…… 他們當然也有校務系統。老師們不只要輸入成績,也要“預警”,如果一個學生可能不會過。我收到系統相關的說明,根據這個說明我帳號跟初期的密碼應該是我的“身份證字號”。不過,我一直沒有辦法進去。一個原因:一定要用Windows,因為他們系統需要在使用者電腦上跑ActiveX!

好,我用我們學校的Windows電腦:帳號或密碼錯誤。我借用他們系辦的電腦:帳號或密碼錯誤。他們系秘書後來幫我找他們計中相關的人。他說一定是輸入錯誤,我應該有打錯字。(如果我不會正確地輸入我自己的居留證號碼,我之前要怎麼管理好幾台伺服器?)後來他要我唸我的“身份證字號”給他聽。
"LC0..."
“不對。”
“但是這是我的居留證號碼。”
“不對。不是這個。”
“但是,我居留證只有這個號碼。”
“不是這個。是24開頭的。”
“24?那是護照號碼!”
“就是那個。”

不過…… 還是進不去。秘書再幫我聯絡那個人。當然應該是我打錯字。他要我唸給他聽。
“24……8”
“不對,沒有後面那個8。”
“但是,我的護照就是這個號碼。”
“不對,後面那個8沒有。”
Hmm,為什麼我對一些學校的電算中心有點感冒……?

為什麼那麼多人不會了解在台灣工作的外國人不是觀光客?我們有本地的證件,跟身份證字號一樣長的字號。(不過,開頭兩個文字,所以很多線上表單不會接受 - 玉山銀行、台灣Sagem...)我已經八年用遠傳的門號(我知道,我會換……),但是我還是沒有記住他們用的“身份證字號” - 因為他們有想出完全不一樣的游戲。

四個字:亂七八糟……

2007-10-27

Marzipan

Weihnachten schleicht sich an, bald werden wieder Marzipankartoffeln gebraucht. Aber auch sonst braucht man manchmal Marzipan, für Gebäck z.B., oder für Kuchen. Marzipan gibt es aber nicht überall. Hier in Taiwan habe ich Marzipan bisher nur in geringen Mengen von Schokolade umschlossen in kleinen Ritter Sport-Tafeln im 7-11 gesehen.

Man kann Marzipan aber einfach selbst herstellen. Benötigt werden geriebene Mandeln, geriebener Zucker (OK, Mahlen ist vielleicht einfacher und zur Not kann man ja auch vorgemahlenen Zucker nehmen, es muß kein frisch gemahlener sein...) und ein wenig Wasser. Will man es etwas exquisiter, kann man auch Rosenwasser nehmen, aber das ist hier in Taiwan unverschämt teuer, da fast nur für Parfüm in Gebrauch.

Mischt man geriebene Mandeln und Puderzucker 1:1, werden sich womöglich die Kleinen freuen, ansonsten wird das Endprodukt aber ziemlich süß. Ich persönlich mische meist 2:1. Dem Gemisch wird dann vorsichtig Wasser zugefügt. Ich sage extra "vorsichtig", weil man schnell zu viel Wasser nehmen kann. Also lieber langsam zugeben und vielleicht noch ein wenig trockenes Gemisch in Reserve halten.

Das Gemisch wird ein Weilchen geknetet und ist dann im Prinzip fertig. Man kann sofort (so der Feuchtegrad stimmt) kleine Kugeln formen und diese in Kakao wälzen, oder das Marzipan für andere Dinge verwenden.

Dieses Marzipan wird Lübeck keine Konkurrenz machen, aber wenn man die Wahl hat zwischen diesem Marzipan und keinem Marzipan... Man kann übrigens etwas "feineres" Marzipan herstellen, indem man die geriebenen Mandeln siebt, so daß man wirklich eine Art Mandelmehl erhält.

So'n Quark...

Für bestimmte Dinge braucht man Quark. Wohnt man in deutschen Landen, dann muß man nur zum nächsten Supermarkt und findet Quark in Hülle und Fülle. Dummerweise ist das aber nicht in jedem Land der Fall. Wenn man auf einer mehr oder weniger tropischen Insel wohnt (Ich wohne derzeit in den Subtropen, arbeite aber in den Tropen. Das sind allerdings nur fünf Kilometer Weg.), dann kann es da in Sachen Milchprodukten schon mal ein wenig mau aussehen.

Nun kann man sich natürlich auch Quark selbst machen, aber die meisten Anleitungen gehen wohl davon aus, daß es bis zum nächsten Bioladen auch nicht sehr weit ist. Fast immer wird eine Labtablette erwähnt. Nun ist der nächste deutsche Bioladen von mir mehr als 9000km entfernt, aber ich brauche trotzdem Quark. Manchmal zumindest. Ein Niederlausitzer mag nun einmal ab und zu Pellkartoffeln und Quark. Aber auch das ist kein Problem.

Man braucht natürlich Milch, ohne die geht es schlecht. Ansonsten aber kann man hier schon aufhören mit den Zutaten, wenn man ein wenig Geduld hat: Ungefähr innerhalb eines Tages (abhängig von der Umgebungstemperatur) wird Milch nämlich sauer, wenn man sie einfach irgendwo hinstellt und dort vergißt. (Bei mir ginge das schneller, Milch ist halt sehr geduldig.)

Erkennt man, daß sich Quarkflocken gebildet haben, kocht man das Ganze kurz auf und gießt die Molke ab. Haben sich wirklich Quarkflocken gebildet, dann kann man dazu schon ein normales Sieb nehmen. Dieser Quark kommt in den Kühlschrank.

Hat man nicht so viel Zeit, kann man den Vorgang auch beschleunigen - auch ohne Labtabletten. Ein paar Tropfen Zitronensaft, mit der Milch verrührt, wirken da wahre Wunder. Den fertigen Quark könnte man auch weiterverarbeiten zu Käse, aber das wäre schon wieder ein anderes Thema...

2007-10-22

社會組科技須知 - 電腦與字

台灣的教育制度會從國中開始把學生分成“社會組”(”文組“)跟“自然組”(”理組“)。目的好像是讓學生較早開始專心走其中一個方向,可以在這個專長達到較高的水準,因為不用花時間學其它方面的事。不過,這個做法也有缺點:每一組缺另外一組專長的基本知識。雖然有人會說這當然是這種措施的結果,某一方面根本就是目的。但是我在我的工作天天接觸社會組的人,發現他們其實缺很多對我來說算是常知的基礎。而且,這些缺乏會導致很多不便。社會組的人在“科技”方面很容易被騙,而且也不太有辦法用2007年的時候普遍的周邊科技。所以我想在這個“社會組科技須知”系列簡單地解釋一些“科技”基礎。重點是幫助語言相關的人多了解他們周邊的“科技玩具”,主要是因為我希望我的學生不只“會語言”,而有辦法應用。這次的題目:電腦與字。

今年(至少在我的世界)2007年。所以,如果我要寫文件,我會用電腦。(OK,我快二十年前已經這樣做,主要是因為我寫的字太難看。)筆譯也會用電腦,不只為了寫目標語言的文件,原來的文件根本已經是電子檔。不過,台灣的大學跟學院怎麼教筆譯?上課時發一張紙,叫學生在另一張紙上寫他們翻譯版本 - 可用手寫。

如果那些學生畢業之後想幫一家公司翻一些網路上要用的文件,他們可能很快就遇到一個很痛苦的問題:亂碼。他們花不少時間翻文件,存檔,送出去,但是公司完全沒有辦法使用。為什麼?

小時候,我們上課的時候可能要送一個小小的信給教室裡的另一個同學。如果被老師發現,老師會把我們的信拿走,而且會看它。為了偽裝內容,我們用一個簡單的表格,一邊列字母表所有的文字,另一邊再列一樣的字,但是亂改順序,像這樣:
A B C D E F G H I J K L M
Q W E R T Y U I O P A S D

N O P Q R S T U V W X Y Z
F G H J K L Z X C V B N M
(我承認這個順序不太亂,但是大部分的老師們還是不會“破”這個加密方法。)兩邊的學生必須有同樣的表格,而且千萬不可以讓老師發現它。用這個表格,原來一句"see you after school"會變成"ltt ngx qyztk leiggs",但是收信的學生因為有同樣的表格會知道真的意思。在用拼音文字的國家,學生可以這樣做,在台灣需要的表格可能較大。(不過,這裡有一種東西叫注音符號……)

為什麼要說這個故事?因為電腦用一樣的做法,它只有兩個地方不一樣:電腦用的表格不是秘密,而是公開的標準。而且,電腦的表格只有一邊會有文字,另一邊都是數字。電腦本身只能處理數字,而且原則上只能處理位元。不過,因為there are only 10 kinds of people in the world: those who understand binary, and those who don't,我們在這裡還是用對人比較容易了解的數字。

早期的可以顯示文字的電腦用一個叫"ASCII"的表格。如果我們在那種電腦上寫"World",記憶體裡面電腦會記錄"87 111 114 108 100"。So far, so good. 不過,這個ASCII表格好像沒有包含德文的"Ö",法文的"ç"或丹麥文的"Ø"。那些國家的人被叫要用ASCII表,沒有辦法用到自己的語言需要的一些額外的字,當然有一點點不高興。所以,他們建立自己的表格:他們保留原來ASCII裡面已經有的文字,然後把一些他們覺得不那麼重要的符號換成自己需要的文字。

不過…… 如果我們看這個新的表格,我們會發現上面舉例的三個文字其實都有同樣的數值:92。當時,人還沒有想到網際網路或全球化,每一個國家做它自己的事。如果當時要列印,一定要確認在印表機上有沒有設好“編碼”。如果有設成丹麥文,但是要印德文的文章,德文的"äöü"就變成"æøå" - 不好玩。所以,後來有一些大一點的表格,但是這些表格還是最多只能包含200多字,不可能包含世界所有的拼音文字。所以,如果一台電腦要有辦法用多一些語言的字,它必須“知道”多一些表格,也必須有辦法切換那些表格。用錯表格,就會有一些亂碼。

不過,這樣沒有辦法在同一個的文件用屬於不同“表格”的語言。而且,像中文或日文的漢字要怎麼辦?好像不只有200個字…… 沒錯,這些表格會大一點,數值也要大一點。不過,基本的問題還是一樣:如果電腦用錯表格(編碼),就會有亂碼。其實,我們現在會有辦法在同一個文件用所有的語言,而不需要”切換“,因為有一個真大的表格(盡量)包含這個行球上所使用的字。(不過,這裡也有幾種表格,用不同的編碼方式,最流行的是UTF-8。)

所以,如果我們要存一個文字當,我們可能要注意我們要用什麼編碼,特別是軟體本土化(L10n)的時候。但是還有一個地方編碼錯誤造成很大的麻煩:網路上的HTML文件。原則上,每一個HTML文件(所以,每一頁,而且每一個frame也要)必須包含編碼資訊。十幾年前定的HTML規格要求這些設定。

如果按照HTML規格做,不管什麼語言,什麼作業系統或什麼瀏覽器,一定要正確地顯示出來。不過,”我會Frontpage“族從來沒有學HTML,而Frontpage的原始設定不會輸出標準的HTML。一些”目前只會support Microsoft“的廠商可能也要參考規格一下…… 所以,如果網頁上有亂碼出現,平常不是訪客電腦的問題,是提供那些內容的人在某一個地方做錯,所以訪客的電腦不知道現在到底要應用哪一個表格顯示字。

此外,這個網站用UTF-8,所以在一個文件使用多幾種語言也沒關系……

2007-10-21

抱歉,我沒有英文名字

真的。我不騙你。奇怪,對不對?外國人不是都有英文名字嗎?好吧,第一個不好消息:我在台灣雖然算是外國人,但是我不是美國人、英國人、澳洲人等,我是德國人。“哈,那你當然有德文名字!” 不。我的名字來自北歐。在挪威或瑞典很多人有同樣的名字。那,我有“北歐文名字”?(什麼是“北歐文”呢?)還是是挪威文名字?或者瑞典文名字?

好亂,對不對?沒錯。這個是我幾乎每天要克服的亂。讓我們看一下為什麼會亂。第一,台灣人所稱的“英文名字”到底是什麼?是來自英國的名字?還是用英語唸的名字?還是……?

可惜,台灣人認為一種語言跟它用的字是一體。所以,我現在寫中文,對不對?用中文字寫中文。Na, xianzai bushi zhongwen, duibudui?剛應該是英文,是不是?不過,英國人或美國人會不會看得懂?我懷疑……

可惜,台灣(還是該說“中華民國”?)的語言教育蠻差。我知道,小朋友們都很辛苦地學“英文”(學還是背?),但是他們缺很多基礎 - 因為他們老師們已經沒有那些基礎。我們先看一下一些名稱:“English”在這個語言叫什麼?“英語”、“美語”或“英文”。這些有什麼區別呢?“美語”是美國式英語,所以描寫一種發音。“英語”是一般的語言,不過主要是講話方面用的。“英文”是一般的語言。主要是寫字方面用的,但是也會包含講話。“英語”不會包含寫字的意思。到這裡能不能贊成?

那,Japanese呢?“日語”跟“日文”。French?“法語”跟“法文”。有沒有發現一個制度?語言分講話跟寫字。OK,下一個很好玩:Chinese?好像只有“中文”,是不是?“國語”不太能算,因為它的意思是“國家的語言”。所以,英國的“國語”是英語。看起來,在台灣字重要,話不重要。(中國有“漢語”……)

那,我現在用的是什麼字?一些人可能說是“國字”(懷念國小時代,是不是?),但是大部分的人應該會叫它們“中文字”。為什麼不要叫它們“漢字”?因為,它們根本是漢族的字,其他族好像有時候有自己的,其它的字,而且不只有“中文”在用這些字。其實,台灣人自己已經用兩種字寫這裡的語言:漢字跟注音。注音也是字。沒有意,只有音,但是它們也是字,而且跟漢字不同的字類。

那,如果可以用幾種字寫下一個語言的話,也可以把同一種字用在幾個語言。我的名字叫Olaf。不管是在德國、英國、法國、波蘭或芬蘭,我的名字一直是Olaf。它不是英文、德文、法文或挪威文的名字,它是用羅馬字寫的,來自北歐的名字。英語系列的國家現在用的字是羅馬字,跟法國,德國,瑞典等一樣。

但是為什麼在台灣人家一直問“英文名字”?他們需要的其實不是一個“英文”名字,他們需要的是一個用羅馬字寫的名字。而為什麼那麼多台灣的人、公司、學校需要“英文名字”?因為他們從來沒有學習怎麼用羅馬字拼中文。(還是哪裡有人教漢語拼音,痛用拼音或Wade/Giles?)不過,那又是另外一個故事……

那,為什麼我要花這麼多時間談這種好像小事情?第一:不對。第二:很煩。第三:很麻煩。在台灣有當過口譯的人應該有遇過這種麻煩。口譯跟筆譯不同沒有時間查資料,幾乎馬上必須有目的語言的版本。但是,一個口譯如果不認識住我隔壁的人,他要怎麼知道那個隔壁的王一樣在英語溝通的時候會變成"Peter"?特別是如果那個人到上個禮拜還叫"Jack"?

如果你覺得這都沒有問題,因為可以問那個人,你好像還沒有當過口譯。請問,哪裡有一個手冊包含2300萬台灣人,所有台灣公司跟學校的“英文名字”?名字不要翻,只可以用不同字寫。我的名字也可以寫Олаф。不同的字,同一個名字。如果你還是覺得這都很簡單,請你說一下這些公司的“英文名字”:倫飛、程研、日德科技。不知道?怎麼會呢?是你的英文不好?還是……?

朋友們,請你們了解:一個語言跟適合寫下那個語言的字是兩件分開的事情。拜托,不要再玩那個無聊的“英文名字”游戲!而不要再煩我問我的“英文名字”……

Sorry, I don't have an English name...

If you are not living in Taiwan, you may not understand why a German would need to emphasize this. The problem is that there is something rotten in the system they call education in Taiwan. Not just something, quite a few things, actually, but this is something affecting my work.

Taiwanese have a pretty weird view towards language. For them, a language and its writing system are one. And even though some of them should have noticed through learning Japanese for example that this is not quite true, they still stick to this view. Actually, Taiwanese themselves are using two writing systems (Hanzi and Zhuyin) for Chinese - but they do not notice that these are two different scripts.

So for Taiwanese, everything they write is "Zhongwen" (中文, Chinese, or more precisely "Chinese writing"), for which they use "Zhongwenzi" (中文字, Chinese characters). And since most Taiwanese learn only one foreign language and since that language is English, the characters used for writing that language are of course "English characters" (英文字(母)). It never came to their mind that one (spoken) language could be written in a number of writing systems, or that one writing system could be used for more than one language.

I know, I know: It's pretty obvious. Japan is using three (or four, depending on your view) writing systems, including those "Chinese characters", which in Japan are simply called "Kanji" (漢字), the characters of the Han. The same term btw. is used in the PRC: Hanzi (汉字). So, it's really Taiwan where the education system is teaching people some strange ideas about language.

Most Taiwanese can not imagine that English could be using a script that is not "English". It is the same writing system used by French, German, Danish, Italian and dozens of other languages: Latin script. This is something I learned when I just started to learn how to write during my first year at school. We were not writing "German letters", but "Latin letters" (Lateinbuchstaben in German).

But for Taiwanese, my name is an "English name", because it is written in the same letters as English. No, wait - he's a German, so he must have a "German name". (德文名字, the term used in this case, actually means "a name written in German", not a name of German origin) Things start to become interesting when I tell them that my name actually comes from Scandinavia, from Norway and Sweden. So what is it now? A name in "Scandinavian writing" (北歐文名字)?

So why would I need to write about this? Because it is causing trouble, and I am not talking about the annoyances I mentioned above. It is causing trouble for foreigners who have to deal with Taiwan or are living in/on it. And it is causing trouble for interpreters. Translators are somehow OK, because they still have time to check, but an interpreter can not afford such luxury. An interpreter needs to deliver a target language version "at once", more or less.

But what trouble would an interpreter experience? Well, when you learn a language, you will usually buy at least one dictionary. You can look up words in that dictionary, so you will know that "table" is called "tsukue" in Japanese or "zhuozi" in Chinese. You can find these, because they are terms used for a certain class of objects. That same class of objects exists in another country too, where people are using another language, so those people too have a word for that class of objects.

But can you find your name in that dictionary? Can you find your neighbour's name in it? Or the name of the company you work for? I doubt. Because these are names, also known as proper nouns. They are assigned to a certain object, not to a whole class of objects. And here the "fun" starts: Most Taiwanese think that they need an "English name". The same applies to companies and even many schools. But how is someone supposed to know what kind of "English name" a certain person/organisation is using?

How is someone who does not know my (imaginary) neighbour supposed to know that his "English name" is "Peter"? After all, until last week his "English name" was "Jack". How often would you want to update a dictionary listing all kinds of names for all people, companies and schools in Taiwan? And why does nobody notice what a crazy scheme this is?

If you think that this does not cause any trouble, ask a Taiwanese where you can buy a "Twinhead" notebook. That is the name written on the notebooks, even in Taiwan. You will find a few who know that name. Most however have never heard of it, even if they have such a notebook. But they know a company called "Lunfei" (倫飛). And no, "Twinhead" is not a translation of "Lunfei". (A name can and should usually not be translated...)

Fortunately, there are exceptions. While they use a strange transcription ("Tatong"), "Datong" (大同) is using the same name whether the communication is in English, Chinese or any other language. That's how a name should be handled. Or why can Japanese companies just use the same name in any language? OK, not quite... "Suzuki" for example is called "Suzuki" everywhere except Taiwan, here it is called "Tailing" (台鈴). You have to admit that "Suzuki" and "Tailing" sound extremely similar...

And why would Taiwanese need an "English name"? Simple: Because they don't know how to write their name in Latin script, since they never learned how to do that. The education system here does not care about romanisation, and even those who should know better seem not to care. But that is another story...