美知广子猝死图解过程
免費論文網
畢業論文98463324職稱論文8338728網站已運行1096

格式支持論文 “基于內容對象的協同編纂動態發布系統”相關文檔格式的處理應用

導讀:本文關于格式支持論文范文,可以做為相關論文參考文獻,與寫作提綱思路參考。

作者署名:吳棄疾 胡大衛 段學儉

“基于內容對象的協同編纂與動態發布系統” (以下簡稱本系統)是上海世紀出版股份有限公司實施的一個出版流程數字化改造項目.該項目由上海市科學技術委員會和上海市論文范文支持,目標是通過對數字出版的技術研究和創新,建立一套適合大型出版集團的,面向內容對象的、具有相當強的通用性的協同編纂和動態出版系統.它通過數字化的手段,完善出版社的現有業務模式,打造新型出版流程,从而提高出版社的核心競爭力.

处理各種類型的文檔格式,并達成各種文檔格式的比較自由的相互轉換,是本系統的主要業務之一.系統中業務數據的产生、管理和發布,在相當大程度上都體現為把文檔作為某一特定格式存儲,或者對它進行轉換.

本系統中处理的

主要文檔格式

通常使用的文檔格式,在本系統中都能得到較好的处理.

kindle支持的格式:MXF格式轉換貼片廣告格式支持影院服務器

1..txt格式

txt是微軟附帶在其操作系統上的最常見簡單的文本格式,我們平時也稱呼它為純文本,因為txt主要保存文字信息,基本上不帶樣式也不支持圖像.基于此,它有容量小,兼容性好等優點,同時,也存在信息不豐富,不生動等缺陷.

2..doc/docx格式

doc是word文檔格式,支持圖像、表格、多媒體、數學公式等,可容納大量文字格式、腳本語言等信息.所以具有應用廣泛,表現豐富等優點.但因為該格式是屬于封閉格式,因此其兼容性較差.

docx是word2007以上版本使用的文檔格式,其實質上是一個zip包.如果我們把后綴從docx改為zip并解壓,可清楚的發現docx文檔中包含的各種信息,例如:主要文本內容保存于名為“word”的子文件中的document.xml文件中,圖片等其它文件保存于名為“media”的子文件中.由于docx是用新的基于xml的壓縮文件格式取代了其以前專有的默認文件格式,所以其兼容性與擴展性有了本質上的提升.

3..fbd格式

fbd是方正書版(北大方正自主開發的傳統排版軟件)的小樣文件格式,支持命令行方式的批处理排版、支持自動抽取目錄、排序、索引等,支持拼音、注音、大字庫等特殊要求,快捷規范,能滿足出版行業的排版需求.但其屬于專業領域的自主格式,不支持所見即所得,普遍性、兼容性、擴展性都比較差.

4..ffx格式

ffx是方正飛翔(方正公司2009年發布的論文范文排版設計軟件)的文檔格式,在原有的專業基礎上,增加了對word的兼容性,支持xml標準,支持長文檔处理,支持自然語言方式的公式輸入(專利技術),支持圖表等的專業处理,支持拼音等特殊要求,支持標準pdf、cebx輸出,支持災難恢復等,贏得了出版業內人士的認可.

5..html格式

html全稱Hyper Text Mark-up Language,即超文本標記語言,是目前網絡上應用最為廣泛的語言,也是構成網頁文檔的主要語言.html的結構包括頭部(Head)、主體(Body)兩大部分,其中頭部描述瀏覽器所需的信息,而主體則包含所要說明的具体內容:由html命令組成的描述性文本,可以說明文字、圖形、動畫、聲音、表格、鏈接等.由于它的本質是一系列標簽的集合,所以具有簡易性、可擴展性、與平臺無關等優點.但目前它在效能以及部分數據(如化學公式、音樂符號等)的表現上仍然存在缺陷.

6..xml格式

xml全稱Extensible Markup Language,即可擴展標記語言.它與html很相似,都是SGML(Standard Generalized Markup Language,標準通用標記語言)的某種簡化.不同之处在于:xml側重于數據本身.而html側重于數據的顯示模式.所以,xml是跨平臺的,是处理結構化文檔信息的重要工具,是以內容為核心的技術,更為簡單規范.這一特點,使它在數據存儲、交換、共享方面擁有充分的優勢.而樣式方面,則可以交給xls (Extensible Style Language)控制.這種內容和樣式的分離,給用戶需求提供了更多的表現靈活性,是目前發展的潮流和方向.

7..wmI格式

wml全稱Wireless Markup Language.即無線標記語言.它是基于xml的標記語言,屬于xml的子集,相對于html而言更為嚴格簡潔,所以相比html編寫的內容要消耗網絡瀏覽器更少的內存和CPU時間, 使得wml對廣域網和移動設備來說更加友好.

8.pdf格式

pdf全稱Portable Document Format,即便攜文件格式.它由adobe公司開發,以PostScript語言圖像模型為基礎,可以將文字、字型、格式、顏色及獨立于設備和分辨率的圖形圖像等封裝在一個文件中,并使用工業標準的壓縮方式,使其具有相對較小的容量,便于存儲和傳輸.它還支持超鏈接、多媒體、長文件等,安全性也比較高.而pdf的最大特點還在于其能忠實的再現原稿的文字、圖像、顏色等展現形式并且與操作系統平臺無關.這些特性使pdf在出版業中廣泛應用.

9.cebx格式

cebx全稱Common e-Document of Blending XML,即基于混合xml的公共電子文檔.它將各類采用xml技術的數據描述文件組織起來,并提供特定的訪問控制接口.主要包括版面數據(字符、圖表、多媒體對象等),版式描述信息(版面樣式的原味再現),版面對象的結構化信息(適合不同屏幕尺寸的流式自適應),腳本描述信息(增強CEBX的動態交互特性),安全描述信息(對于本地安全以及DRM安全的支持).

本系統對上述文檔都提供了高效能的处理.

本系統处理文檔格式的方式方法

本系統在基礎資源數據庫之上,搭建一個面向作者和編輯的內容生產、加工系統,并為作者和編輯提供強大易用的智能客戶端.通過此系統,作者和編輯按照各自的權限遠程參與撰寫、編輯新的產品,并根據需要,對歷史資源進行加工完善.當數據內容通過協同編纂达到我們的要求后,就可以根據需要,加載不同的樣式,完成發布.在整個過程中,包括了數據采集、數據处理、數據發布三個環節.

一、數據采集

1.txt格式

該階段對于txt格式的支持主要在于早期受計算機技術及存儲技術所限(三寸盤為当时主要外部存儲介質),txt格式的應用與保存比較普遍,部分將成为現階段的原始數據.例如:我們需要用到2000年某書的內容,而当时僅保存了txt文檔.

另一種情況是某些軟件不支持樣式文件的導出或者導出的文件格式并不被系統所接受,往往也會采用txt文件.例如:我們要使用到QuarkXPress排版文檔的部分內容,就可能會采用从中導出txt文檔的方式.

2.doc/docx格式

doc/docx格式是目前作者使用最為普遍的格式,同時系統的客戶端采用的也是word+插件的方式,無論對于全新撰文還是已有word文檔的引用,都提供了有效的支持.例如:作者按照出版社要求在客戶端完成寫作或者作者將已經完成的word文檔向出版社投稿等等,所以doc/docx將會是目前導入階段最常采用的格式.

3.fbd格式

長期以來,出版業內的排版工作絕大部分采用的是方正書版軟件,對fbd格式的導入支持,在歷史資源的入庫以及重用過程中,都將起到不可或缺的重要作用.例如:我們要將某期刊10年來的書版完稿文件中的試題入庫,或者我們要對某出版物(已有書版完稿文件)進行改版.

4.xml格式

xml是W3C組織制定的標準,xml的簡單規范使其易于在任何應用程序中讀寫數據,雖然不同的應用軟件也支持其它的數據交換格式,但他們都逐漸開始支持xml,這使xml正漸漸成为數據交換的唯一公共語言.系統自然也需要提供對其的導入支持.例如,從國外某出版社引進某出版物,對方提供的電子文檔就極有可能會是xml格式的.

5.html格式

html是互聯網上應用最為廣泛的文檔格式,對它的導入支持,主要目的是對于網頁文件內容的引用.

二、數據处理

1.xml格式

根據xml格式的特性,哪怕是不同的平臺、系統、軟件,都很容易分析加載以及輸出xml數據格式,它在數據存儲、交換、共享以及結構化、重組、擴展等等方面都擁有充分的優勢.所以,系統采用xml格式存儲數據并作為數據源.

2.docx格式

word格式是作者與編輯最常用的文檔形式,符合日常的操作習慣,所以系統采用word+插件形式的智能客戶端,在協同編纂過程中,采用docx格式.

3.pdf格式

系統流程的一個重要特點是內容和樣式分離,根據需要靈活加載樣式可以展現不同的發布效果.但在出版業務流程的實際操作中,有些環節需要我們結合內容與樣式看效果,比如我們需要審閱某出版物應用了特定版樣設計是否美觀.這個時候,我們就可以利用pdf格式忠實展現版面的這一特點,臨時將內容和樣式進行結合,通過pdf格式預覽效果.

數據發布

1.txt格式

txt容量小,兼容性好,現階段仍然是電子書、電子文檔的主流格式之一.例如:目前的大量電子書網站,都是采用的txt格式.同時,txt格式作為最普遍的格式流傳下來,因此現在的移動設備基本上都提供txt格式支持,而txt也因為僅僅是文字信息,所以能很好的適應移動設備的屏幕太小,進行流式閱讀.

2.htmI格式

發布成html,主要為滿足互聯網的 應用.例如:發布引擎根據網站端的發出的要求,調用資源庫內容,在網站端生成滿足一定條件和展現形式的html.

3.xmI格式

xml的特點使其逐漸成为數據交換的公共語言,發布成xml,可以滿足不同平臺、不同系統、不同應用程序件的數據交換.比如:pc上的xml數據,我們完全可以拿到mac機上應用.

4.wml格式

發布成wml主要用于移動設備,例如:創建可顯示在WAP瀏覽器中的頁面.

5.ffx格式

發布成ffx,滿足專業設計排版輸出的需求.比如:我們可以發布ffx文件,并進行打包預檢,然后送輸出中心出菲林.

6.pdf格式

發布成pdf格式,其一是可以作為電子書,展現的效果和傳統紙質書接近,包含“頁”的概念,再現了生動豐富的樣式,其主要缺陷在于,不能自動適應屏幕大小,很難在各類移動設備上方便閱讀.

發布成pdf格式的另一個重要作用是,它能滿足紙質書出版的需求.無論是傳統印刷還是數碼印刷,無論是輸出菲林還是直接制版印刷,Adobe公司都以PDF文件技術為核心,提供了完善的解決方案.它跨平臺的兼容性,它對色彩、字符、版本等的支持,它對“頁”的精確直觀展現等等優點,使pdf格式在出版業中被廣泛應用.

pdf格式還支持網絡端的瀏覽下載,我們在終端安裝pdf插件,就能很方便通過瀏覽器打開pdf文檔.

7.cebx格式

cebx格式,是由方正集團旗下方正技術研究院數字出版分院負責研發,目標是建立一種可靠且便易的電子文檔規范.它支持“版式”閱讀,提供類似pdf格式的原版原式的文檔呈現方式.同時,它包含了版面的結構化信息,所以可以實現版面內容的重排,獲取更好的屏幕自適應特性.這種帶樣式的“流式”閱讀,目前還存在一定的技術難點,期待完美的顯示效果.

結語

本系統通過以上流程環節對數據格式的处理應用,特別是通過xml核心技術的運用,使得原來松散的、多元的、錯誤的數據變得集中、統一、準確,形成數字出版的集中內容資源庫,便于業務高效運作與管理. 同時,本系統通過實現內容和樣式的分離,對內容采用結構化的存儲和处理方式,根據需要拆分成不同的組成部分并添加標引信息;樣式則一次設計、多次利用,彻底節省了出版物的排版工作量.最終通過動態出版技術,實現針對不同讀者的動態內容拼裝,靈活快速地組裝成對應各種媒體的不同出版物.

伴隨著計算機技術、通訊技術、網絡技術、存儲技術等的進一步發展,基于內容對象的協同編纂與動態發布系統必然會涉及和應用到更多的文檔格式,我們將不斷學習探討,發現和完善其運用,為數字出版領域更好地服務.

(本文作者尚有:張世軍、周怡、張瑩瑩、章琢之,由吳棄疾執筆

作者單位:上海世紀出版股份有限公司)

格式支持范文

1、比較好寫的醫學格式論文題目 醫學格式論文題目選什么比較好

2、經典科技格式論文選題 科技格式專業論文題目怎樣擬

3、經濟學格式相關論文題目 經濟學格式論文標題如何定

4、比較好寫的教師格式論文題目 教師格式論文題目如何定

5、最新格式指導論文選題參考 格式指導論文題目選什么比較好

6、法律格式論文題目推薦 法律格式論文題目選什么比較好

kindle支持的格式參考文獻總結:

關于格式支持方面的的相關大學碩士和相關本科畢業論文以及相關格式支持論文開題報告范文和職稱論文寫作參考文獻資料下載。

美知广子猝死图解过程 英超雪缘园 湖南幸运赛车 竞彩比分直播500n 网球比分为什么是15 极速十一选五 河北20选5 云南快乐10分 电竞比分网dota bet007足球即时比分 p3试机号 新疆十一选五 天津快乐十分 即时比分足球雷速体育比分 足球指数网免费 189比分直播 2012天下足球直播