大数据:媒体文件存储的六大建议
王振 发表于:13年07月04日 16:45 [编译] DOIT.com.cn
大数据在今年可算是一个热门话题,但是对于广播行业而言,这只不过是老生长谈罢了。该行业在如何存储大量的媒体文件方面已经探索了好多年了。
CDW公司的企业存储专家穆萨·玛塔瑞耶说:“广播数据可算是真正的原始大数据,它们数量巨大,往往要占用大量的存储空间。”
如今,IT行业的每样东西都发生了变化。实际上,广播公司们需要像BBC更换《神秘博士》的演员那样频繁地改变自己的存储系统,而促进这一变化的,应该就是点播视频的发展。
玛塔瑞耶说:“你上网然后重新点播观看午间新闻,就这个动作对架构的性能要求很高,对数据的访问要求也很高。这就要求企业要加固背后的可横向扩展架构。”
下面就介绍几个小建议来帮助你优化媒体文件的存储。
1.确定使用场景
大数据对数据存储和数据分析都有要求。
NetApp产品及媒体娱乐解决方案部门的杰森·丹尼尔森说:“大数据对容量的要求是广播公司这么多年来一直努力解决的问题,但是在对大量消费者信息数据库分析这个问题上,大部分广播公司还未起步。”
不过,一些广播公司已经开始发力于大数据分析,比如说放弃进行用户调查而是选择分析Twitter数据来更快速地获得某项活动对用户影响的反馈。从存储的角度来看,大数据分析和媒体存储最主要的不同是大数据分析需要低延迟访问大量的小文件,而媒体存储则要不间断地访问数量相对较少的文件。
2. 将闪存用于流媒体
在建立文件系统时,把元数据和缩略图放在第一层存储中,这里最好选择固态硬盘或闪存,它们更适合于长文件,无论文件是低分辨率还是高解析度,它们都能轻松应对。另外还包括4k的视频——把它们放在更低层的存储层中。这样不仅适用于数据编辑,还适用于缓冲流媒体的点播。
StorageIO公司的高级顾问格尔兹·舒库茨说:“视频的缩略图和开头部分可以在线存储在固态硬盘中用来实现快速访问,后端的硬盘或磁带则用来支持后续访问(比如说减少一个视频下载或缓冲的等待时间)。”
3.根据使用环境选择正确的存储
应用对存储系统的需求是不同的。
玛塔瑞耶说:”对于广播媒体公司来说,最好的解决方案要取决于使用环境。如果我们讨论一些我们在媒体中经常见到的应用,其中有许多应用自出现的时候就要占用存储空间,不仅要在本地占用,还要跨过多个媒体通过光纤通道接口来实现大量数据转移。对于这种情况,许多应用程序都会有一个预先核实的它们支持的产品的生产商名单。“
他说自从考虑并选择了针对单组数据的存储系统之后,系统吞吐量和容量都增加了,支持更多的人同时下载或访问同一首歌曲或同一个视频,无论是实况转播还是在线流媒体,系统处理起来都游刃有余,系统架构也非常适合流媒体。
玛塔瑞耶说:“这个系统的另一个优势是它们可以协同工作,多个应用程序和用户可以通过简单的NFS访问这个系统,这就允许一个媒体文件可以在一个单一的平台上被下载,编辑,或以流媒体的形式播放。”
4.保留磁带
磁盘在许多领域都在代替磁带,但是磁带仍然在广播行业中起到重要作用,一个单一的视频文件就可以占若干TB的空间,利用磁带可以建立活动归档。但是,如果你不想把那些几乎再也用不着的视频文件移到线下,你就可以利用磁带库,把它们建成活动归档,在需要的时候把它们恢复到硬盘上。
Spectra Logic公司的业务发展及合作高级副总裁侯赛因·兹沙科瑞说:“大数据环境中最流行的战略是建立一个活动归档存储模式。活动归档价格低廉,是一个可以在线完成的解决方案。通过把文件系统扩展到磁带上,可以访问,存储所有被创建的数据。一个活动归档包括生产数据,不管它们多老,被访问的频率多么频繁,它们仍然可以被在线恢复。”
5.不要进行重复数据删除
对于某些种类的文件而言,数据去重和压缩有很大的优势,但是对于媒体存储来说,它们的帮助却不大。首先,许多文件一开始就已经是压缩格式了,比如MP3,MP4或WAV,再压缩就会降低质量了。
舒库茨说:“在媒体领域,不用考虑去重类型功能,也不用在乎那些可在性能(带宽),空间容量,可靠性,持久性以及管理方式等方面扩展的的存储方式。对于元数据,可编辑或访问频繁的热数据就适合存储于固态硬盘中,而高性能,低消耗的SAS及SATA硬盘,还有支持LTO,LTFS的磁带也可以满足数据对带宽和存储空间的要求。”
但处理非媒体数据应采用有更高IOPS的固态硬盘,而不是大容量的SAS或SATA硬盘。
6.要想到分析
EMC Isilon产品管理和市场部门副总裁山姆·克罗克特说:“当提到媒体存储时,大数据就是一个非常适用的术语。一些单一的文件很容易就达到了TB级,而每个电影都需要转换为大概16种不同的格式以便在全世界范围内传播,并应用到多个平台,媒体行业数据的增长要比其它行业多得多。”
但是广播行业需要对大数据进行分析,确保得到它们想要的回报。简言之就是,观众们在点他们的鼠标时有上千万种娱乐选择,通过大数据分析,企业要知道他们要提供给观众的是什么?
克罗克特说:“对于广播公司来说,最重要的是它们如何才能把它们的资产转化成货币。为了达到这一目的,广播公司们不仅要最大化观众的数量,还要从成千上万的观众们看到它们的资产。”