- 相關(guān)推薦
視音頻素材的編碼轉(zhuǎn)換
視音頻素材的編碼轉(zhuǎn)換
2004年度河南省廣播電視優(yōu)秀科技論文一等獎摘 要:本文提出了作者在實踐中總結(jié)出的各種視音頻文件素材的編碼轉(zhuǎn)換方法,并說明了編碼轉(zhuǎn)換中的一些原理和技術(shù)環(huán)節(jié)。
關(guān)鍵詞:視音頻文件格式、編碼轉(zhuǎn)換、文件頭信息
我們經(jīng)常從網(wǎng)上、 CD 、 VCD 中找到很多精彩的視頻、動畫、圖片和聲音。在將這些素材導入到非線編輯軟件過程中,最大的問題就是格式不一致或編碼類型不符合。這給編輯工作帶來了極大的遺憾。筆者經(jīng)過摸索和實驗,總結(jié)出一套常見素材格式編碼轉(zhuǎn)換的方法,在此與大家分享。
首先我們看一下常見能遇到哪些文件格式。視頻文件格式常有的: MPEG-1(.mpg .mpeg) 、 MPEG-2(.mpg .mpeg) 、 MPEG-4(.avi .mp4) 、 AVI(.avi) 、 divX(.avi) 、 WMA(.wma) 、 ASF(.asf) 、 MOV(.mov) 、 RM(.rm) 、 DAT ( VCD 中) 、 VOB(DVD 中 ) 。要說明的是 MPEG-1 和 MPEG-2 的文件后綴名均為 .mpg ,只是二者編碼方式不同。 AVI 文件本身就是一個集合,而非特指某種具體的編碼方式,可能包括的編碼有 MPEG-1 , MPEG-2 , MPEG-4 ( Microsoft MPEG-4 Video code )和 DIVX 等。 DIVX 和 Microsoft MPEG-4 Video code 同是 mpeg-4 的編碼方式,不同的是 DIVX 由 Microsoft MPEG-4 Video codec V3.0 修改而來,是 Divxnet works 公司開發(fā)的標準 。在 VCD 影碟中存放的視頻文件為 DAT ,在 DVD 影碟中的視頻文件是 VOB 。
常見的音頻文件格式有: WAV 、 MP3 、 MPEG 、 WMA 、 RAM 、 CDA 。其中 WAV 本身有多種編碼方式,在使用過程中要加以注意。
常見靜止圖片格式分為點陣圖和矢量圖,點陣圖有 BMP 、 JPEG 、 TGA 、 PSD 等,矢量圖有 CDR 、 DWG 等 。我們現(xiàn)在的非線編軟件大多只使用點陣圖,所以原圖若是矢量圖形,要首先使用矢量圖形編輯軟件將其導出為點陣圖形后再加處理。
還有一些動畫文件 FLASH 、 GIF 通過格式轉(zhuǎn)換 都可加以利用。
再談?wù)勣D(zhuǎn)換方法,分為硬件轉(zhuǎn)換和軟件轉(zhuǎn)換,區(qū)別是是否有專用的硬件板卡參與。在保證轉(zhuǎn)換質(zhì)量的前提下,我們使用軟件來轉(zhuǎn)換,這也比硬件更容易實現(xiàn)。
(一)視頻文件和動畫文件的轉(zhuǎn)換
通常我們的要求是轉(zhuǎn)為 AVI 或 MPEG-1 MPEG-2 ,這正是大多非線編軟件允許導入的文件格式。
1 、 WinMPG Video Convert
可將 MPEG WMV ASF MP4 MOV SWF DAT(VCD) VOB(DVD) 轉(zhuǎn)為 AVI 。具體的 AVI 編碼可自由設(shè)定。也可將 AVI 轉(zhuǎn)為 MPEG-1 MPEG-2 (.mpg .mpeg) 。我們使用 WinMPG Video Convert 的好處在于它支持輸入較多的文件格式,且對輸出 文件可詳細設(shè)定視音頻的編碼方式。下圖是輸出為 AVI 文件時的編碼選擇窗口。
對于視頻部分可以選擇編碼方式、分辨率、幀率,音頻選項除可選擇編碼方式、采樣頻率外,還可詳細設(shè)定碼率、質(zhì)量、是否立體聲,甚至可設(shè)過濾器,對某一頻段之外的聲音進行屏蔽,這對除去噪聲有很大幫助,見下圖。
此外,使用此方法可以選擇 AVI to MPG1 和 AVI to VCD ,二者 的共同點是都是輸出 MPEG-1 ,只是前者可以手動設(shè)置幀率和分辨率(下圖),后者輸出文件默認按照 VCD 標準,視頻為 25.0 fps, 分辨率 352*288 (4:3) ,音頻為采樣頻率 44100 Hz, 雙聲道。
2 、 Real 7ime Converter
支持將 RM 等 RealPlayer 流媒體文件 轉(zhuǎn)為 AVI 文件 ,使用前要求系統(tǒng)裝有 real player 。
可設(shè)置輸出 AVI 的編碼方式(下圖),
經(jīng)測試, Real 7ime Converter 對視頻文件轉(zhuǎn)換是實時的,轉(zhuǎn)換時間等于或稍大于媒體長度。
3 、 Super DVD Ripper
用于將 DVD 中的 VOB 視頻轉(zhuǎn)換為 AVI 。
4 、 TMPGEnc Plus
支持 AVI 、 MPEG-1 轉(zhuǎn)為 MPEG-1 、 MPEG-2 。使用向?qū)J娇赊D(zhuǎn)換為標準的 VCD 或 DVD ,若要對輸出文件進行編碼設(shè)定,必須使用手工方式。
此方法的主要特點在于對輸出的 MPEG 有更詳細的編碼設(shè)置,如設(shè)置 MPEG-2 的級別和類別、 GOP 結(jié)構(gòu) 、量化矩陣、碼流類型等。 對于一些非線編軟件或板卡有特殊導入要求的, TMPGEnc Plus 將派上用場。
可對 GOP 結(jié)構(gòu)進行設(shè)定
5 、 exe2swf 、 swf Browser 、 swf2video
用于全面處理 flash 文件。
exe2swf 可將已生成了可執(zhí)行文件( .exe )的 flash 文件還原為 swf 文件。
swf Browser 用于對 swf 文件進行分析,可單獨將其中的片斷 clip 、圖像、聲音單獨提出。
swf2video pro 可以將 swf 轉(zhuǎn)為 AVI (下圖) 。
6 、 gif2avi.exe
用于將 GIF 動畫轉(zhuǎn)為 AVI 。
其中 RLE8 Compression 是一種圖像的無損壓縮方法,只適合壓縮 256 色圖像數(shù)據(jù)。
7 、視頻捕捉 HyperCam
用于將 PC 屏幕操作抓為 AVI 文件,可用于宣傳片的制作。
要說明的是,由于不支持 DirectX 視頻的抓取,所以對屏幕中播放的影片、游戲畫面, HyperCam 無能為力。
我們已將各種視頻文件轉(zhuǎn)換為大多非線編軟件可以導入的格式,但是對于一些依賴板卡的軟件來說,必須轉(zhuǎn)換成板卡定義的標準格式才行。比如國產(chǎn)的創(chuàng)意 21 軟件,由于其使用 Matrox 板卡,對通用的視頻格式無法導入,這時我們可以利用板卡自帶的 DigiTools 軟件來實現(xiàn)轉(zhuǎn)換(見下圖)。轉(zhuǎn)換輸出的文件編碼格式為 Matrox MPEG-2 I-frame ,使用 16 進制編輯器查看,可看出 AVI 文件編碼中有 Matrox 板卡定義的文件頭信息,這也正是非線編軟件無法導入同樣編碼的其它視頻文件的原因:對于沒有此包頭信息的文件,不予接受。
Matrox 板卡的轉(zhuǎn)換工具
(二)音頻文件轉(zhuǎn)換
通常非線編軟件可導入的音頻格式為 wav 或 mp3 。
• windows 自帶的錄音機
常用非線編軟件對導入文件有編碼方式、采樣頻率和量化級數(shù)的要求。我們常常發(fā)現(xiàn)拿來的 wav 文件不被編輯軟件識別。最簡單的方法是使用操作系統(tǒng)自帶的錄音機軟件對這三方面進行轉(zhuǎn)換和設(shè)置。
2 、 Streambox Ripper
將 RA 、 RM 、 CDA 、 MP3 、 WAV 轉(zhuǎn)為 WAV 或 MP3 ,與此同時可設(shè)置采樣頻率及碼率。此方式的獨特之處在于,可使用均衡器對輸出文件針對頻段進行音量調(diào)整,這樣一是可以減少雜音,二是可以改變聲音效果。
3 、 WMA Workshop
WMA 是微軟定義的音頻文件格式,此格式的文件便于網(wǎng)絡(luò)傳輸,同時又保持了較高的音質(zhì),在國內(nèi)外的音樂站點上尤其流行,但是大多數(shù)非線編軟件卻不支持此類格式導入。 WMA Workshop 正可將 WMA 轉(zhuǎn)為 MP3 或 WAV(PCM) 。
可在 Options 中對輸出文件進行具體設(shè)置
4 、 WAVmaker
對 MIDI 文件的每個音軌進行重新采樣、量化和編碼后形成 wav 文件。
5 、音頻捕捉 Audio Record Wizard
對于電話線、麥克風、線入、 CD 、輔助(就是聲卡)、單聲道混音和立體聲混音的音頻輸入,可以使用音頻捕捉軟件捕捉到從聲卡經(jīng)過的聲音流,轉(zhuǎn)為電腦文件。比如我們選擇捕捉源為“線入”,可以把接到聲卡 Line In 的磁帶錄音機或 CD 機中播放的聲音捕捉下來,很輕松的將磁帶聲音轉(zhuǎn)換為計算機文件。我們還可選擇“立體聲混音( Stereo Mixer )”,將電子琴或其他 MIDI 設(shè)備的聲音錄入為電腦文件。
音頻捕捉的方式看似可以轉(zhuǎn)換所有的聲音文件,但其工作原理并非在源文件的基礎(chǔ)上進行格式和編碼的轉(zhuǎn)換,而是對“播出”后的效果進行重新采樣,因此這種“普適性”是以質(zhì)量可能的損失為代價的。
(三)不同格式的圖片轉(zhuǎn)換
非線編軟件圖片導入通常要求圖片格式為 BMP 、 JPEG 、 TGA ,除了格式要求之外,還要注意顏色表示的區(qū)別,有索引顏色、 RGB 顏色、 CMYK 顏色等。對于含有遮罩 的圖片,圖片格式設(shè)置為 TGA , 量化級數(shù) 32 位, 將遮罩部分 存儲為 alpha 通道。這些都可使用 Photoshop 來實現(xiàn) 。
結(jié)尾
不得不強調(diào)的是, 具體的實現(xiàn)必須要看非線編軟件的導入要求 ,文件能否被導入同時取決于文件格式和和編碼方式是否符合。此外由于視音頻源本身和轉(zhuǎn)換所采用的編碼方式不同,轉(zhuǎn)換后的質(zhì)量無法形成統(tǒng)一的標準,主要以主觀評定為準,是否跳幀、分辨率多大、清晰程度(是否有色塊,細節(jié)是否被模糊)都可作為評定依據(jù)。
【視音頻素材的編碼轉(zhuǎn)換】相關(guān)文章:
漢字的動態(tài)編碼與顯示方案08-06
《數(shù)字編碼》教學反思04-28
動態(tài)哈夫曼編碼的改進08-06
自適應算術(shù)編碼的FPGA實現(xiàn)08-06
平面圖形的轉(zhuǎn)換08-16
音頻壓縮的成功者——感知編碼08-06
多制式語音編碼及其DSP實現(xiàn)08-06
角色轉(zhuǎn)換之間作文07-25