中国视频在线(www.chinavideoonline.com)致力于收集各种流媒体相关的技术资料,以及流媒体常识和应用方案,力求为广大朋友了解学习和使用流媒体技术提供帮助
流媒体信息不可欠缺的检索技术
作者/来源:china.ftt.co.jp
一贯称之为宽频带网络的“内容杀手”的影像节目,就象现场直播节目的前提条件下,准备的视频素材显得无能为力。
互联网的存在,已经使地球规模的影像网络变为可能。
世界各国不仅时间不同,价值观各异,不同生活时空的人们一起分享的内容提供服务,是将广播时间变得可以自由定义,而目前广播的中继服务不适应的崭新领域的开拓。
对于按时间线组成的影像索引来说,仅仅通过贴在录像带背面的标签来标明信息是绝对不够的。
称之为视频点播的服务业,就是如此,当喜欢的视频节目,通过文字进行点播时,需要的影像随时都可以观看的新兴服务业。
那么,现在,我们如何来寻找我们需要的影像资料呢?
主要演员?导演的名字?或者是内容的一部分?或者是根据画面的表现来搜索呢?
这就意味着需要顺着这些问题的思维习惯来搜索。
数据库中关于影像的信息记录时,记录什么好呢?
那么,所谓“什么的信息”的影像部份里附随的,称之为“元数据”的东西显得越来越重要。
元数据作为计算机的专业术语,早已普及,现在,数字化文档的必要性使他变得与影像的信息也有关系。
数字化文档的要求,使检索的性能变得更高。
利用各种各样的手段进行检索,而检索的对象只有是数据,检索才可能实现。找出符合需要的实际影像也才可以实现。
如今往后的电视台,不止是每天24小时的播放, 而且还要有多频道的广播内容的意识。创作内容所需要的大量的信息自不必言。而且,不止是自家创作的素材,在这个竞争社会里,竞争对手的动向当然有记录下来的必要。取得各种各样的主题的内容等的方法里,差别化的思考方法是个重点。同样地,可以作为提供给赞助商的企画资料。
作为制作公司,是否也应考虑把元数据作为一种新商品的定位呢?
但是,一样地工作而绕过信息处理这个产生商品增值点。如果可以将收集,制作,使用过的资料做成数字化数据,加工成可检索的信息,那么这不就成为了不可多得的元数据了吗。节目计划时的企画案就这样作成了。采编记录是不可替代的信息致宝,采访人员的数据库也是制片人和导演的命根子。与视频编辑相比,EDL\'(Editing Decision List)编辑制定表则是严谨的向导。在进行制作工作的同时,数据也不知不觉地自动地储集,相对于制作完成时才开始进行数据整理及输入拷贝,不知是省出多少的时间。
覆盖多人以及长时间的工作,输出的内容的数据量也太大。
到这儿, 就得看自动地抽取元数据的方法了。
我们来看看各种各样的被提出的系统解决方案中的,成为基础的技术。
现在就来以和日立制作所合作开发的影像认识编辑管理软件“Mediachef”为例,来研究一下。
「Mediachef」与已经完成的应用软件相比,更是一个为系统开发而提供的软件图书馆。
影像管理业务的必要的功能就是不依赖与人手而自动地从影像中把某种特征给找出来。
从影像中寻找特征的要点,不外乎画面的切换,字幕的表现,含有色彩信息的物体的检出,物体进入画面的识别等等。适应于人眼的影像的意义和说明等的包含意义信息的理解,检出记录的要点中的具体的地址码(TIMECODE)--时间码兼而用之。
现在就来介绍一下基本技术。

■切入点的检出
切入点的检测也就是,影像画面的改变,画像变化(色彩的变化)的地方多得时候得以识别而检出切入点的。
本软件在非线性编辑的环境下,被BIN表示的影像整理等所利用。
■溶入点的检出
通过影像的连续帧的明暗(灰度)缓慢地以一定的比率变化的单调变化性进行识别将溶入点检测出来。
■“擦去”的检出
使用“擦去”效果的影像,与原画面比较在一定范围内明暗差(灰度)很大,这就检测出擦去点。
■静止的检出
影像处于静止状态区间,帧的明暗(灰度)的变化很小而被识别以检测出来。

■字幕的检出
影像中的字幕表示的地方,高灰度而且帧间的帧的明暗(灰度)的变化很小,可以识别字幕的开始点及结束点。
演出过程中的字幕插入的画面,因为关系的画面太多,检索(INDEX)表示和通过时间域中的全体流来把握比较有效。
■镜头运动“PAN-ZOOM”的识别
影像上下左右移动时,通过模样信息的移动量可以检测出镜头运动就得有无。而且,通过放大及缩小率的计算还可以检出变焦率。
利用这个机能,从视频图像可以制作成全景照片,而且,利用镜头还可以合成制作高解像度的照片。

■监视中动态物体侵入的检出
针对画面上定义的观测窗人物及物体的通过等进行检测。
由连续摄影中的动的部分的列表来实现。

■有色物体的识别
色彩信息是从影像中的,对每帧图像进行检测,与对象有关的信息中,通过对象是否在画帧中有表示的判断,开始点,结束点,位置信息等输出。这样的自动识别并与以记录,需要的正确的影像就能够很迅速地被找到。
互联网的存在,已经使地球规模的影像网络变为可能。
世界各国不仅时间不同,价值观各异,不同生活时空的人们一起分享的内容提供服务,是将广播时间变得可以自由定义,而目前广播的中继服务不适应的崭新领域的开拓。
对于按时间线组成的影像索引来说,仅仅通过贴在录像带背面的标签来标明信息是绝对不够的。
称之为视频点播的服务业,就是如此,当喜欢的视频节目,通过文字进行点播时,需要的影像随时都可以观看的新兴服务业。
那么,现在,我们如何来寻找我们需要的影像资料呢?
主要演员?导演的名字?或者是内容的一部分?或者是根据画面的表现来搜索呢?
这就意味着需要顺着这些问题的思维习惯来搜索。
数据库中关于影像的信息记录时,记录什么好呢?
那么,所谓“什么的信息”的影像部份里附随的,称之为“元数据”的东西显得越来越重要。
元数据作为计算机的专业术语,早已普及,现在,数字化文档的必要性使他变得与影像的信息也有关系。
数字化文档的要求,使检索的性能变得更高。
利用各种各样的手段进行检索,而检索的对象只有是数据,检索才可能实现。找出符合需要的实际影像也才可以实现。
如今往后的电视台,不止是每天24小时的播放, 而且还要有多频道的广播内容的意识。创作内容所需要的大量的信息自不必言。而且,不止是自家创作的素材,在这个竞争社会里,竞争对手的动向当然有记录下来的必要。取得各种各样的主题的内容等的方法里,差别化的思考方法是个重点。同样地,可以作为提供给赞助商的企画资料。
作为制作公司,是否也应考虑把元数据作为一种新商品的定位呢?
但是,一样地工作而绕过信息处理这个产生商品增值点。如果可以将收集,制作,使用过的资料做成数字化数据,加工成可检索的信息,那么这不就成为了不可多得的元数据了吗。节目计划时的企画案就这样作成了。采编记录是不可替代的信息致宝,采访人员的数据库也是制片人和导演的命根子。与视频编辑相比,EDL\'(Editing Decision List)编辑制定表则是严谨的向导。在进行制作工作的同时,数据也不知不觉地自动地储集,相对于制作完成时才开始进行数据整理及输入拷贝,不知是省出多少的时间。
覆盖多人以及长时间的工作,输出的内容的数据量也太大。
到这儿, 就得看自动地抽取元数据的方法了。
我们来看看各种各样的被提出的系统解决方案中的,成为基础的技术。
现在就来以和日立制作所合作开发的影像认识编辑管理软件“Mediachef”为例,来研究一下。
「Mediachef」与已经完成的应用软件相比,更是一个为系统开发而提供的软件图书馆。
影像管理业务的必要的功能就是不依赖与人手而自动地从影像中把某种特征给找出来。
从影像中寻找特征的要点,不外乎画面的切换,字幕的表现,含有色彩信息的物体的检出,物体进入画面的识别等等。适应于人眼的影像的意义和说明等的包含意义信息的理解,检出记录的要点中的具体的地址码(TIMECODE)--时间码兼而用之。
现在就来介绍一下基本技术。

■切入点的检出
切入点的检测也就是,影像画面的改变,画像变化(色彩的变化)的地方多得时候得以识别而检出切入点的。
本软件在非线性编辑的环境下,被BIN表示的影像整理等所利用。
■溶入点的检出
通过影像的连续帧的明暗(灰度)缓慢地以一定的比率变化的单调变化性进行识别将溶入点检测出来。
■“擦去”的检出
使用“擦去”效果的影像,与原画面比较在一定范围内明暗差(灰度)很大,这就检测出擦去点。
■静止的检出
影像处于静止状态区间,帧的明暗(灰度)的变化很小而被识别以检测出来。

■字幕的检出
影像中的字幕表示的地方,高灰度而且帧间的帧的明暗(灰度)的变化很小,可以识别字幕的开始点及结束点。
演出过程中的字幕插入的画面,因为关系的画面太多,检索(INDEX)表示和通过时间域中的全体流来把握比较有效。
■镜头运动“PAN-ZOOM”的识别
影像上下左右移动时,通过模样信息的移动量可以检测出镜头运动就得有无。而且,通过放大及缩小率的计算还可以检出变焦率。
利用这个机能,从视频图像可以制作成全景照片,而且,利用镜头还可以合成制作高解像度的照片。

■监视中动态物体侵入的检出
针对画面上定义的观测窗人物及物体的通过等进行检测。
由连续摄影中的动的部分的列表来实现。

■有色物体的识别
色彩信息是从影像中的,对每帧图像进行检测,与对象有关的信息中,通过对象是否在画帧中有表示的判断,开始点,结束点,位置信息等输出。这样的自动识别并与以记录,需要的正确的影像就能够很迅速地被找到。
(C) 2004-2006 中国视频在线 技术支持:梦想家网络工作室
