素材是内容以不同形式和格式的物理表示。它能够被生产、改变、存储、交换、传输或者播出。各种各样用途的素材需要使用大量的用于不同目的的素材格式。一个能够表示所有不同的媒体类型(比如视频、音频、文本、图像和图形等)、满足所有不同需求的通用的素材格式是不存在的。然而,一个理想的内容管理系统应当是独立于媒体和格式的,例如它应当能够操作和管理所有的媒体类型和素材格式。实际上,内容管理系统并不仅仅是一个存储文件的仓库,它还必须理解文件结构、媒体语法、甚至特定部分的语义。除了纯粹的文件检索外,内容管理系统还提供媒体索引、自动信息检索和流媒体等功能和服务。即使是对于部分文件检索,系统也需要理解一些媒体类型和文件格式。因此,为了开发和使用内容管理系统,我们必须了解有关的素材格式以及它们的特点和特征。
此外,为了能够访问不同的媒体类型和素材格式,为特定目的选择最合适的媒体类型和素材格式,我们必须审视特定应用背景下的需求和约束。表示特定信息的媒体类型通常是事先决定的,但内容对象编码格式并非如此。针对各种媒体类型的编码和(数字)表示制定了大量的编码方案和标准。富媒体组织必须仔细地选择最适合的操作和满足其要求的格式。因此,对编码方案的基本原理、功能以及它们背后特征的基本理解是十分重要的。
在一个内容管理系统中,不同素材格式扮演的角色都具有两面性。一方面,它们代表被操作和管理的对象。素材的特点决定了特定的功能是否能被实现以及如何实现。另一方面,素材在内容管理系统中用于表示内容。目前,在内容管理系统中有多种不同的素材格式用于生产和表示,以及对内容的纯粹的表述。要仔细考虑每一个任务的特定需求,才能保证要求的功能能够最好地被实现。
内容管理系统除了对素材进行纯粹的管理外,还可以通过自动检索来获得内容的附加信息,产生一个内容对象的新的表示。例如,视频分析程序允许切点和编辑点检测,以生成内容对象的一个浏览型或情节串联图板形式的浓缩版本。转码处理可以从一种格式生成另一种格式的内容副本,以更好地符合某种要求。
本章讨论内容管理系统中与素材相关的话题,主要介绍基本原理、概念和最重要的标准,另外还讨论素材的处理过程,其中将解释主要相关技术的原理。
3.1素材的不同形式
在广播环境中,素材被定义为节目原材料,比如实际的节目项目。素材被更广泛地定义为内容对象的组成部分,它被用来表示采用多种编码格式的实际信息或消息(比如字面意思的内容)。相对应地,元数据是描述内容对象的关于数据的数据(见第4章)。因此,素材是直接表达和传递信息、创意、意图或印象的所有形式的媒体。
对于不同的媒体,素材会拥有不同的形式,如视音频、视频、音频和文本形式的素材元素等。此外,素材可以组成结构化的格式或文档。在一个内容管理系统中,管理和经营功能是最受关注的,例如与格式有关的问题。内容的解释留给处理素材的用户来做。
内容管理系统管理与内容对象有关的各种各样的素材,不同的格式适用于不同的目的。高码率素材格式通常要求更高的带宽和更大的存储能力。因此,大多数内容管理系统使用低码率的素材来代替高码率素材用于浏览和选择。但并不是所有的格式都适合这么使用,最重要的是要准确地表示出原始内容。
3.1.1基本素材元素
基本素材元素是基础组成部分。内容项目被表示为特定的基础素材(或媒体)类型,例如音频、视频、图像、图形和文本等。不同的媒体类型(例如音频、运动图像)可以组合。然而,这种组合建立了一种固定的联系,它不能够表达为需要选择的相关链接,而是一种一对一的相互关系。
素材元素可以根据它们的时间和表示特征进行分类。这种分类与用于多媒体系统的定义类似,是根据人类感知媒体的方式得出的。总的来说,分为离散型(例如非时间相关)和连续型(例如时间相关)2种媒体或素材类型。一个连续的媒体流由连续的、与时间相关的信息单元描述,这种与时间的相关性是指媒体(或其不同部分)对于用户的呈现。在这种情况下,媒体具有时间属性。为了向用户提供易于理解的信息,连续媒体的呈现必须发生在特定的时间限度内。例如在PAL制视频中,每秒必须25帧,每一帧必须在1/25秒内按照正确的顺序呈现,否则一个个帧所表示的信息就是无效的,系统也会被认为是失败的。然而,不同于那些由于超时而会导致严重损坏的实时系统(例如反锁制动系统),在处理连续媒体时,一定的错误率是被容许的,甚至是可以被忽略的。因此,可以根据素材及其处理结果来定义错误率,在这个容许范围内,素材及其处理结果是可以接受的。连续媒体素材的这种与时间的相关性是由时间线及其相联系的时码来表示的。基本的连续媒体素材元素有视频、音频和运动图形。
相反,离散媒体没有内在的时间要求,其表示的内容也与呈现时间无关。离散媒体有文本、图像和图形。
3.1.2结构化素材格式
除了基本素材元素外,内容管理系统还必须管理结构化的素材格式,例如网页、XML文档和多媒体文件。在结构化素材格式中,基本素材元素或其他结构化素材元素通过引用和链接组合在一起。结构化素材格式的不同组成部分之间通过建立一种关系来管理和决定信息的表示。例如,Web页面中的链接指向其他相关素材,这些链接也代表了基本组件之间的关系。
结构化素材格式间的关系不仅仅由明显的引用来建立,还可以由不同基本元素相联系的时间约束来建立。例如,绝对或相对的时码能够被指派给连续的基本素材元素,也可以被指派给离散的基本素材元素。在后面那种情况下,这决定了结构化素材格式中的离散媒体模块所表示的信息在什么时间呈现给用户。对离散媒体模块所施加的这些时间限制与连续媒体元素的时间限制相似。实际上,这些限制只在结构化素材格式所表示的特定内容对象的语义环境中才是有效的,而不像连续媒体那样是固有的。
管理结构化素材格式的挑战在于保持它们所表示信息的有效性和连续性。由于与结构化素材格式所表示的内容对象有关的不同的基本模块可能会被单独存储或被其他对象引用,因此它们就有可能会被重新部署和改变。这些改变并不会导致结构化素材对象中的引用和链接的改动,从而不会出现不一致的情况。在内容管理系统中,处理结构化素材格式时必须考虑到这一点。为了保证内容对象的完整性,内容管理系统必须明确地管理结构化素材对象的外部链接,防止可能导致内容对象的不一致操作。
3.1.3高码率和浏览格式
为了评价素材格式对制作、显示和存储的适用程度,关键是考虑素材格式的技术属性和应用场合。在为特定目标和特定系统选择某种素材格式时,应用实例提供了额外的选择标准。技术特征限制了素材的使用和管理,这反过来又对可能的工作流产生了影响。例如,高码率、高质量的视频通常都是高比特率的。以目前的通信和存储技术来说,所有用户直接使用这些格式是不可行的,必须使用替代格式(例如浏览格式)来准确地表示原始的素材。是否选用高码率格式是由质量、制作、广播和存档等方面的要求来决定的。相对应地,对低码率格式的需求来自于需要支持的工作流和内容管理系统基础架构。
为了检索和选择内容,对可选材料的快速准确地预览和审看是很重要的。在一个典型的处理视音频材料的工作流中,对视频内容的初选是基于关键帧的。接下来通过对所选视音频片断的低码率副本的浏览(听和看)来具体选择特定的内容。为了能够在专业环境下应用浏览副本,必须支持像标准的特技模式那样的某些功能(如快进、快退和逐帧往返等)。而且,因为需要快速访问浏览材料,浏览信号应当被高度压缩以节省网络带宽和存储空间。然而,有时情况并不完全相同,例如,内网用户浏览视频的数据传输率可以达到1.5Mb/s,而通过拨号连接的用户数据传输率也许只有64kb/s。因此,我们需要能够根据系统能力提供相应质量水平的可调节的比特率编码。
在内容管理系统中,使用低码率的浏览副本和高质量的材料是通行做法。在内容管理系统中为规范、选择和使用合适的浏览格式定义了2种方法:
·在代码层面定义和使用可以相互操作的、通用的标准格式或格式集。这保证了遵循良好规范的质量和功能,但是限制了跟随技术进步的选择自由。
·能够无缝地处理和显示多种格式的应用组件的开发。这在某些情况下可能会限制质量和功能,但能够充分利用技术上的进步。
这2种方法都是有效的,在开发和实现内容管理系统时都应该考虑到。总的来说,内容管理系统应当能够在保持互操作性的同时支持多种格式,并利用新格式的长处。EBU和SMPTE发表了一份浏览交换格式(Browsing Interchange Format, BIF)的技术要求。这份技术要求的目标是阐明低码率浏览格式所必须满足的条件。
3.1.3.1基本BIF要求
BIF格式试图用于媒体专业人员的浏览和选择,因此必须具备以下基本特征:
·视频(准确的帧和时码以及颜色)。
·双声道音频。
·与内容有关的元数据(包括访问权限、IPR管理和保护信息)。
·与材料有关的元数据(时码、唯一ID等)。
BIF应当支持流和文件传输,而且应当提供技术功能以支持促进至少2种常用的浏览模式:编辑决策列表(Edit Decision List, EDL)和非常窄带浏览。
EDL浏览器是一个允许人们查看内容和选择合适片段进行进一步制作的工具。这种格式允许材料的选择和EDL的生成。它也应当允许以浏览质量的水平、基于EDL无缝地查看选择好的内容。例如,这种选择有可能是一个新节目条目的草样,而不是随机的收集。为了支持EDL的生成,需要合并视音频流中的时间戳(或时码),而在BIF中也需要这样。每一帧的表示要能强制性地生成一个准确的EDL。更进一步,要求有与帧同步的音频,因为编辑决策常常基于声音事件。对于工作站终端的预览窗口,分辨率达到标准清晰度电视视频信号的四分之一就足够了。这种方式比SDTV有更高的容错率。
窄带浏览格式应当允许偏远的地方通过带宽相对较低的广域网(例如Internet)或拨号连接来进行远程内容浏览。在这种情况下,数据率应当是可调整的。64kb/s的数据率应当足以满足这种应用场合。为了实现这一点,分辨率和压缩效能之间必须要有一个折中。不必将每一帧都保留,同样,保留与帧同步的音频虽然更好,但也需要舍弃。对于这种类型的视频浏览,数据流并不一定需要是连续的。这种方式也会有很高的容错率。
3.2编码和压缩基础
为了评价在内容管理系统中放入不同素材格式的可能性和要求,了解其特征和工作原理是很重要的。一些基本的编码、压缩的概念和技术对所有的素材类型都是一样的。大多数编码和压缩方案(甚至专有格式)都是这些基本过程的组合。因此在讨论具体的编码和压缩格式之前,应该了解这些基本原理和技术。
3.2.1编码:从模拟到数字领域
基于计算机的内容管理系统的素材记录和处理通常包括模拟到数字的转换,这个过程叫做编码。模拟技术中的信息是连续的信号表示,而数字技术中的信息则转变成为二进制数字表示的数值。在这个转换过程中会发生信息丢失,因为连续值的每个独立的表示值只能是近似的。
数字格式的质量依赖于每个离散值所表示的尺度间隔或者间隔时间,还有用来表示每个值的比特数。前者被称为抽样,后者被称为量化。抽样率是模拟值(例如,一个连续的波)被抽样的比率。抽样率越高,量化中用来表示每个独立数字值的比特数越多,与原值的近似性也就越大,因此数字化信息的质量也就越好。ITU-R BT 601-5的国际视频标准指定了模拟到数字转换的国际标准。