1999年10月20日 星期三

電腦多媒体專輯製作紀實

電腦多媒体專輯製作紀實

張東瀛 

原載 1998-7 微電腦傳真 p.282-286

 
 






壹、 前言 一九九二年春天,我把論文(A multimedia-based bilingual instructional system using an expert system shell 參考資料 4)中,與多媒体資料庫相關的部分改寫成多媒体編輯系統,用來整理歷年蒐集的台灣文化紀錄。 隨著硬体技術的發展,在 DOS處理圖形及音效開始有令人滿意的結果。 兩年前將影像部分以 MPEG-1格式在 Pentium-133 機台播放,畫質雖未盡理想,仍可接受。 後來又寫一個簡單的多媒体播放程式,將編輯好的文字和圖形合併,以圖形方式顯示,音效和影像外掛。如此一來,不論從DOS 或WINDOWS 95 都可瀏覽多媒体資料庫。
數年前,我對電腦多媒体已有所憧憬和期許(參考資料 3,5,6)。 雖然如此,個人整理資料,緩不濟急,不論深度和廣度都有所不足。 再者,相關資料之引用, 牽涉繁複的著作權問題,使得電腦多媒体開發製作,不論成本和難度都相當高。 幾年下來,我的認知是,凡事要靠機緣,不可操之過急。
去年夏天,在第三屆世界臺灣語文營巧遇林榮德教授。 林教授是我在台南市中求學時的音樂老師,致力兒童音樂教育多年,音樂和油畫創作曾在紐約林肯中心演出展示, 是個蜚聲國際的藝術工作者。隨後,林老師表示,希望把歷年作品做有系統的整理, 製成多媒体光碟。我想到有個現成的多媒体編輯管理系統,便答應下來。 作過可行性評估,把手邊的個案結束,決定用多媒体資料庫的方式來處理林教授的作品。 以知識工程技術,開發本土文化資源,一直是努力的目標之一。「林榮德音樂藝術專輯」, 終於讓我圓了這個夢想。
本文記述這個專輯的開發過程,文末隨附相關論文,謹供有興趣的讀者參考。



貳、軟硬体設備
從前硬体價位相對偏高,一九八二年間,一部單面單密度軟碟機要價台幣壹萬元,相當於大學畢業生一個月的薪水,當時開發軟体必需考慮硬体的普遍性。近年來電腦價格大幅滑落,更新周期更短,軟体設計不能以入門機種作為訴求。 在臺灣,多數個人電腦使用者選擇 IBM 相容PC。 因此軟体設計和測試都在IBM 相容PC進行。硬体規格如下:

主機板: 華碩P55T2P4
CPU: INTEL PENTIUM 133
RAM: 32MB
硬碟機: 2.4G/SEAGATE (5400RPM)
軟碟機: 1.44MB
CD-ROM: 24倍速
VGA 顯示卡: 32-bit PCI Local Bus Graphic Adapter
            ATI-264CT Graphics Accelerator
            最高解析度 1280x1024x256, 2MB Memory on board
音效卡: Creative Labs VibRA 16C PnP Audio Chip
        16/8 bit PCM 5 K Hz to 44.1 K Hz
顯示器: 15吋彩色顯示器
        點間距: 0.28mm
        掃瞄頻率: 水平30~64(KHz), 垂直47~120(Hz)
鍵盤: WIN95專用104鍵
滑鼠: Microsoft 相容
MPEG-1 影像轉換(擷取)卡: MPEGator (Snazzi, Vitec RT10)
Scanner: TWAINSCAN 9600 EP
Video Camera: Sony Hi8 CCD-TR81
放音設備: 一般家用音響
雷射印表機: Epson EPL-5200
以上設備在一九九七年以前添購(影像轉換卡擇一即可),約需台幣十五萬圓 軟体部分,多媒体編輯、播放系統和部分工具,大部份自行開發。一方面不需軟体授權,再者擁有原始碼,功能修改、添加都很方便。 由於預算有限,在不用未授權軟体的原則下,需用其它軟体時,儘量採用低價的共享 (Shareware)或免費的公用(Public Domain)程式。軟体表列如下:
DOS 6.2 及WINDIWS 95 作業系統------------電腦隨附軟体
ABC 資料管理程式-------------------------自行研發(參考資料 1)
TITES 多媒体編輯管理系統-----------------自行研發(參考資料 7)
TITES 多媒体播放系統---------------------自行研發
中文字型轉換程式-------------------------自行研發
Lotus Word Pro---------------------------電腦隨附軟体
倚天碟版中文 V3.0------------------------倚天公司出版
Dr. Halo IV 繪圖程式---------------------Media Cybernetics
Paint Shop Pro 繪圖程式------------------shareware
GoldWave 3.24 音效處理程式---------------shareware
Cool Edit 音效處理程式-------------------shareware
WinDAC32 CD音樂轉換 MP3工具--------------shareware
Sound Impression ------------------------音效卡隨附軟体



參、專輯製作計劃綱要
上述軟体和硬体大部份是個人工作室原有的設備。 決定接受案主託付的工作後,先到林榮德音樂教育中心洽商製作計畫。林老師的作品大致可分為文學、繪畫、音樂三部分。音樂中心有幼稚園、節奏樂團、音樂教室。歷年來曾舉辦不少國內 和國際性音樂教學演奏活動。 此外林老師令堂,林李榭榴女士遺留兩百多幅水墨(圖 1),也是極為珍貴的台灣文化資產。
經過一番思考,草擬一份專輯製作計劃綱要,請林教授過目,當晚做一番討論後定案。這份綱要便成了多媒体專輯的主要架構。
目         錄

A       序    言
B       音樂藝術文教基金會
C       林榮德年表
D       還給孩子一個春天 - 林榮德的教育理念
E       文學作品
F       紅瓦厝 - 林榮德畫集
G       古拙之美 - 林李榭榴的繪畫世界
H       音樂教室
I       音樂夏令營
J       節奏樂團
K       音樂著作
L       兒童音樂世界
M       台灣文化和世界和平之夜


資料庫按照主題分別建立,主要考慮未來需要更新時比較方便。 各資料庫完成 後再合併,另成一個總資料庫,專供自動展示使用。 圖形目錄(圖 2)是超媒体 (Hypermedia)結構的樞紐所在。應用網際網路常用的手形滑鼠指標,引導使用者 進入資料庫。資料錄包含文字、圖片和同步音效(背景音樂),影片部分以外掛方式處理。 原則上有文字敘述的資料錄搭配音效,無文字說明的圖片資料在自動 執行時則以時間控制換頁。 操作方式採用簡單的圖形界面(圖3),讓四歲以上的幼童不需特別訓練即可使用。今年春天,在臺南佳里高工做專題演講時,我曾以此為例,說明多媒体操作界面的設計,應以簡單實用為原則。一般而言,太過 複雜的操作方式,往往讓使用者退避三舍,說明書還沒看完就打退堂鼓了。

肆、文字處理
語言是人類用來溝通的重要工具,在錄音和錄影設備還沒發明以前的世界,文字 除了橫向溝通以外,還有縱向的記錄功能。電腦處理文字,通常依照三個步驟: 從鍵盤或其它輸入設備輸入,以文字交換碼(ASCII)處理,再從螢幕顯示字形。 英文由字母組成,一個 8-bit 的二進位系統就可將英文字母,符號和數字一網打盡。漢文由數萬個不同的象形字組成,顯示漢字需用 16-bit 系統,既佔記憶, 又需更多處理時間。輸入一個漢字平均要4~5個按鍵,漢字輸入和處理一直是開 發華文軟体的瓶頸。 漢字字形顯示也不如英文暢快。倚天中文的16x15字型用了好幾年,主要還是顯示速度的問題。比較美觀的24x24字型在80486 電腦問世以後才有機會亮相。
TITES 多媒体編輯系統處理文字的方法是,將文書編輯器和資料庫的觀念結合。 當年為了使用24x24字型,必需寫一個字形轉換程式,將倚天中文列印用的字型檔轉換成可供SVGA顯示的圖形,多媒体編輯系統才有比較好看的漢字字形可用。
在文字編輯過程中使用倚天中文16x15字型。資料錄建好後,合併圖片顯示則換成24x24字型。 瀏覽資料錄不用外掛中文系統,因此可用SVGA 1280x1024x256 高解析畫面。 TITES 多媒体編輯系統有一個類似照相機的圖像擷取功能,瀏覽資料庫時會把編輯好的圖文畫面存檔,供多媒体播放程式使用。 如此一來,文字和圖片可以同步於瞬間顯示,又能在編輯時隨時修改文字內容,真是又快又方便。 當時(一九九三年初)為了程式化這個構想,寫碼測試三天三夜,完工後快樂了好幾天。
編輯文字資料時,由於軟体是自己寫的,用來駕輕就熟。 已有現成文字檔的資料,可用資料轉換功能直接存入資料庫, 否則只好從鍵盤輸入。比較花費時間的倒是改編和重寫的工作。例如,林教授的教育理念,散見歷年來出版的書籍, 文章和講稿。若不經過精簡和整理,無法以資料錄方式呈現出來。我用不少時間閱讀林教授的著作,再改寫成十二篇短文,挑選合適的照片與音效,才完成這個主題。



伍、圖形處理
TITES 多媒体播放系統採用1024x768x256 PCX 圖形。 VGA 顯示卡問世以後, 電腦圖形邁入新的紀元。豐富的天然色彩(true color),高解析度畫面,以及功能齊全的繪圖軟体,使得從前必須應用暗房技巧和專業分色的圖形處理作業,都可在電腦進行。目前入門機種的電腦,皆能顯示1024x768x256圖片。 至於圖形格式則各有千秋,比較常見的有PCX,GIF,JPG等。選擇PCX作為圖檔格式的原因是: 第一,PCX為不失真壓縮格式。第二,沒有版權問題。網路通用的GIF壓縮格式雖較普遍,目前仍受專利保護,必需付費才能使用。至於JPG 則為失真壓縮,雖然体積小,解壓時間也長,換頁時有點拖泥帶水。一般而言,256色已能滿足肉眼的視覺要求。
圖片的主要來源有兩類,一是照片和印刷品,可用圖形掃瞄器(scanner)掃瞄後取得圖檔。通常用200~300 dpi取像,再縮小至所需尺寸。除非原稿特別小或作專業輸出,才會用400dpi以上取像。以300dpi為例, 掃瞄3"x5"照片需要 4 Mb 記憶体,若是A4 size,很快就會耗盡記憶資源。另類來源則是從錄影帶擷取。 一九八零年,AKAI VC-X1U第一代攝影機淨重2.4公斤。錄影時還要背一台7公斤的分離式錄影機。 最近幾年,手提攝錄影機不論体積,重量和功能都大有改善。錄影帶經影像擷取卡取得的靜態畫面是連貫的,每秒30張,很容易挑出令人滿意的照片。存入剪貼簿後,再用Paint Shop Pro 轉成PCX 圖檔,就OK 了。 有外賓來訪,或舉辦活動時,利用攝錄影機可以同時取得動態影像和照片,可謂一舉兩得。
圖片若要切割,整合或作局部修改,必需仰賴繪圖軟体。 大部分作業可在 Dr. Halo IV 完成。 EGA 時代, Dr. Halo III曾經流行一時。 六、七年前購買Dr. Halo IV 只要50美元,用到現在仍覺物超所值。 很多人喜歡玩高價軟体,一套還沒學會,又去追尋更新更貴的軟体。個人覺得,使用軟体應先衡量工作性質,選用合適的設備,完成工作才是正確的態度。


陸、音效處理
林教授主修聲樂和鋼琴教育,留德期間與兒童音樂宗師 Carl Orff 相熟,並和音樂律動專家 Gunild Keetman 女士合編奧而福樂器演奏曲集「古仔燈」。 回國後從事兒童樂教幾達三十年。這段期間,除了出版他所蒐集,改編的台灣民謠和 童謠音樂CD,發行以演奏「古仔燈」曲集為主的錄音帶「林榮德兒童音樂世界」, 節奏樂團每年巡迴演出,舉辦夏令營邀請國內外知名音樂家演奏,更遠赴紐約, 在林肯中心演出台灣交響詩和兒童環保音樂劇。這些作品都經由音樂中心的錄音室處理保存。
專輯所需的背景音樂來源有三: 錄音帶,音樂CD和錄影帶。 音樂CD以WinDAC 轉成WAV格式檔。錄音帶則以錄音機放音,透過音效卡用Sound Impression存 WAV檔。至於錄影帶有兩種處理方式: 第一種直接以錄影機輸出聲訊,再用Sound Impression存 WAV 檔。第二種方式比較麻煩。必需以影像編輯的方式處理,將聲訊分離存成MP2格式,再用WinAmp轉成WAV檔。方法容後敘述。
和圖形檔相比,數位音樂通常佔用更大的檔案空間。以音樂CD為例,取樣頻率 44K Hz,立体聲音效每分鐘約需9 MB。為了有效節省檔案空間,犧牲音質,在所難免。幾經考慮,決定選擇16-bit,11K Hz,mono 作為音效格式。口語旁白甚至只用8-bit格式。整体說來音質不是很好,不過還可接受就是。
由於背景音樂頗多,剪輯工作勢在必行。通常只取一段旋律,後端再作淡出處理。音樂來源不同,有時還得做順音,盡量讓預設音量維持在同一水準。雜訊太多時, 必需過濾。所幸這些工作,包括WAV格式轉換都可在 GoldWave 或 Cool Edit 進行,節省不少時間。
音效處理其實並不困難。 思考文章內容,尋找適當的音樂配合,往往花費更多時間,不過一切辛苦都是值得的。 有幾個夜裡,我獨自測試(聆聽)這張專輯, 從這些歌謠的旋律裡,彷彿看到台灣人在生活; 多變的性格,浪漫風采以及被壓抑的夢想。 這張專輯收錄近百首樂曲,加上幾乎整卷「童言童語」錄音,以電腦多媒体方式呈現,相信會讓讀者有一番不同的感受。


柒、影像處理
動態影像大概是多媒体中最吸引人的部份。 其實,回顧電腦發展的過程,從文書處理程式,8-bit音效卡,mono graphic card (Hercules)進展到今天的多媒体整合,傳統媒体包括文字,圖形,音效和影像,除了從類比轉成數位外,在質的方面並未有所提昇。一九八九年,電腦多媒体的浪潮,從美國西岸湧向世界各地。 兩年後,在大家的期盼下,蘋果公司的麥金塔上出現一隻搖首擺尾的蛇, 那是以每秒15框播出的動態影像。蛇的動作緩慢,比較容易掩飾捉襟見肘的窘相。不久,IBM PC 也急起直追,推出各種格式的動畫和影像。 事隔十年,無可諱言地,即使連尚未普及的MPEG-2在電腦上也無法和傳統的身歷聲電影相比。 那麼,為何仍有那麼多人力和資源不斷投入個人電腦的動態影像呢? 因為它大幅提高個人參與影像製作的能力。只要你有創意,電腦多媒体絕對可以提供你足夠的想像空間。 就在數年以前,一套BetaCam攝影剪輯設備,要上百萬台幣。 以今日的電腦科技,二十萬就可擁有從攝影,剪輯,配音,特效到製片一系列功能的設備。你能不心動嗎?
一般Hi8 畫質已經相當不錯, BetaCam當然更好。 電腦影像的品質主要還是取決於影像擷取卡。 即時MPEG-1壓縮卡可做影音同步轉換,影片播完,同時存檔。 MPEGator轉換卡年前相當風行,效果也不錯。可惜不能做非線性剪輯。 VITEC Multimedia 的RT10 卻有後來居上之勢,隨附的 VIDEO Clip MPEG-1 剪輯系統除了可做非線性剪輯,淡入淡出,字幕添加等特效以外,又能將視訊和聲訊分解結合,影音可分開剪輯,配音後再合併。
前文提到從錄影帶取出音效檔正是採用這種方式。 舉例說明如次: 有一次,我到台南近郊拍攝即將消失的鹽田風光,由於估算錯誤,頂著大太陽熬 了兩個多小時才逮到日落鹽田的景色,眼看著落日映著晚霞,電池卻沒了。勉強攝得幾段鏡頭,打道回府後,發現有幾個鏡頭因電力不足產生色變失框等現像。 轉換成MPEG 檔後,將聲訊和視訊分開存檔。聲訊部分取出一小段(MP2格式)經 由WinAmp 轉成WAV 檔另作他用。 視訊部分,將有問題或不需要的畫面剪除, 再複製若干鏡頭補足。 原來的聲訊沒有什麼內容,改用林教授編曲的台灣民謠 「日頭落山一片紅」取而代之。這首以木笛吹奏的民謠旋律極為優美,計算好長度後,調整部分視訊與之匹配,終於結合成新的影像檔。
一般作影像轉換時通常都選擇Video CD相容規格, 即
視訊部分
                picture rate: 每秒 29.97 框
                picture size: 352x240 (點)
                bitrate:  1.152 Mbits/s
聲訊部分(MP2)
                sampling frequency: 44.1K Hz
                mode:     立体聲
                bitrate:  224Kbits/s
林教授早期的錄影都是BetaCam,委托影像工作室拍攝、剪輯、配音並打上中文 字幕。一支30分鐘的影帶,動輒數十萬圓。後來改用Hi8製作影帶,成本降低不少。由於動態影像所耗檔案空間相當龐大,專輯只存放大約二十分鐘的短片。


捌、時間及成本分析
專輯所用素材和資料大部分由林教授提供,我負責系統設計和編輯。主程式是現成的,只作少數修改。除了幾次錄影以外,大部份時間投入編輯作業。自一九九 七年十月開始到今年五月測試完成,總計一百四十八個工作天。
前置作業(製作計畫,進度編排與管制,攝影,程式測試) --- 22.0 天-- 14.9%
資料編輯(文書處理,資料庫建立與更新,文稿撰寫及整理) - 36.5 天-- 24.6%
圖形處裡(圖形掃瞄,格式轉換,圖形編輯) --------------- 40.5 天-- 27.4%
音效處理(音效輸入,轉換,編輯,測試) ----------------- 18.0 天-- 12.2%
影像處理(影像擷取,編輯,配音,測試) ----------------- 21.5 天-- 14.5%
後製作業(校對及測試) ---------------------------------  9.5 天--  6.4%

依個人經驗,製作多媒体所需時間和成本因案而異。以本案而言,直接人工成本約 五十萬圓,與原先估計相近。至於投入素材製作的成本,保守估計,非千萬台幣不 能竟其功。


玖、未來展望
電腦多媒体的應用,真是無限寬廣。即使目前進展未臻理想,將來卻可預期。 DVD 技術與設備的普及,會讓多媒体製作,突破傳統媒体的窠臼與限制,邁入新的里程。 想想看,用將近 VCD三十倍容量的光碟(DVD-18 雙面約17GB),可以作出怎樣的東西來? 24bit,96K Hz Dolby 5.1音效,比 LD更好的 MPEG-2 影像, 更順暢,更逼真的虛擬實境(Virtual Reality)? 是的,這些都是事實,然而更重要的是,電腦多媒体將會加速推動數位革命的腳步,帶來二十一世紀新的文藝復興運動。


拾、結語

這張多媒体CD是為了紀念今年七月洛杉磯臺灣音樂藝術節 -「世紀台灣之音在美國」而製作的。 它累積二十多年來林教授和許多人心力的結晶,我把他們的大名列在相關作品的前面,以示尊敬和感謝。林教授和我誠摯的希望,將這張 CD 獻給所有愛惜台灣這塊土地的朋友。希望藉助電腦科技,結合音樂、藝術力量, 作為向世界展示臺灣精緻文化和環境保護理念的拋磚。也在此呼籲更多從事電腦科技的年輕朋友,與藝術文化界結合,為國家,為鄉土開拓新局。


參考資料

1. BASIC 語言與資料庫管理系統, 自動化科技  1987 年 4 月  p.79-902.

2. 電腦化教學專家系統, 自動化科技  1989 年 3 月  p.159-166
   (國科會科技論文索引 編號: JA 7807-1475)

3. 多媒体電腦系統, 自動化科技  1991 年 10 月 p.111-116
   (國科會科技論文索引 編號: JA 8101-1273)

4. A Multimedia-based Bilingual Instructional System Using An Expert
   System Shell (以專家系統發展工具建構電腦多媒体雙語教學系統)
   University Microfilms International 1992   No. 13-50454

5. 以 BASIC 語言建構多媒体雙語教學系統, 自動化科技  1993 年 5 月 p.95-106

6. 電腦多媒体在商業廣告之應用, HOPENET 光碟月刊  1994 年 10 月 p.158-161

7. TITES 多媒体管理系統, HOPENET 光碟月刊  1995 年 2 月  p.151-155