深圳市亿乐科技有限公司
地址:深圳市福田区梅林街道梅丰社区北环路梅林多丽工业区厂房3栋3层3315室
电话:宋先生 13923488935、0755-23912352
乐先生 15920077677
邮箱:595396453@qq.com
摘要
随着互联网内容不断更新迭代,短视频取代了文字、图片,占据了人们工作、生活之余的大部分碎片时间。在短视频业务快速扩张的背后,是各种技术的不断革新在质层,包括移动终端性能的提升,移动网络的提速,当然还有后端计算平台的日益强劲和稳健。
当我们从看图时代转向视频时代时,数据中心又需要什么样的变革来适应新的业务应用?
背景介绍
1、每月需存储PB级的数据
视频相较文字和图片的存储需要更大的空间,以国内某短视频平台的对外公开数据来看,仅从存储的视频容量来看,平台每月新增的短视频容量都将超过1PB。按照单块硬盘8T,每块服务器12块硬盘,每月为了存储这些视频就需要新增12台服务器。
2、占比高达80%的冷数据,如何处理
视频行业的数据都有一个共同的特点——数据的热度不均且变化较快。大部分上传的数据的高热度状态仅能保持1周甚至更短的时间。在数据中心中热数据、温数据和冷数据占总数据量的比例约为5%、15%、80%。冷数据也可以被叫做“低价值度的数据”,占用了大部分的存储空间,但是通常不会再产生价值(被观看)。虽然如此,但平台需要保证保有的数据不会被删除,如何安全且低成本的保存这些数据也成了一个必须要解决的问题。
3、如何面对高功耗的存储服务器带来的居高不下的运营成本
服务器产品在维护阶段具有周期长、维护成本高的特点,一般2年的维护成本就会超过购买成本。所以在设备运行过程中降低耗电量和简化维护成了必须重视的部分。目前国内大部分的存储服务器仍是基于Intel 双路至强CPU,并没有针对温冷数据的存储应用进行优化。大多数数据中心中的存储系统都处于低负载高功耗的状态。
解决方案介绍
计算与存储分离,各司其职
短视频背后的数据中心架构其实并不是特别复杂,从视频采集端到客户端,编解码、用户特征分析由专门的计算节点完成;CDN节点负责热点视频的缓存加速和分发;高密度的存储节点用于存储平台的视频数据。
CDN节点,考虑如何让热点数据最快发出
由于视频流量大,CDN节点所承载的吞吐量较大,因此对于存储容量和扩容的便捷度要求更高。另外由于CDN需要存储的数据热度不一,视频数据需要分级存储,将不同热度数据放在不同的存储介质中,充分发挥部件的利用效率,提升存储能效比。
对于CDN服务器的选择,通常会需要计算和存储两类服务器来支撑:
计算型主要用于处理分发任务等,需高主频CPU,内存和硬盘容量的要求并不高;
存储型用于关键节点的数据存储和快速分发,要求IT架构中需要大容量的SSD或高速HDD
浪潮SA5212M,是一款计算存储均衡类服务器。
存储性能上,SA5212M5搭配12块大容量SATA硬盘,单块容量达到8T,单机可容纳96T的CDN数据,满足CDN集群的庞大数据容量需求。对于相对热的数据,SA5212M5中可加入的4块2.5寸SSD盘位,将提升系统整体响应速度。
经实测,使用SSD固态硬盘后单台服务器的服务能力提升了1倍以上。
高密存储节点,提升存储能效比
作为存储节点的高密度服务器、不需要太高的计算处理性能,可以选择基于Intel Xeon-D处理器家族的SA5224M4机型,搭配单颗D-1521 CPU,借助Xeon-D的SOC特性和低功耗优势,通过大容量8T硬盘的使用,以追求更优的TCO收益。从实际测试数据来看来看,搭载D-1531 CPU的SA5212M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。
一般服务器的生命周期为三年,按此计算,1000台的存储服务器集群可节省至少1050万的电费。
高硬盘IO和网络IO
在短视频的传递链条中,用户端上传的视频直接存入4U36盘位组成的存储集群中,并通过分布在各地的CDN节点传送到用户端观看,因此对后端存储服务器的硬盘IO表现有较高的要求。
SA5224M4机型,其36盘位顺序写的总带宽接近4.8GB,顺序读接近6GB,有力支撑了硬盘高IO读写的性能需求。此外, SA5224M4的板载万兆优势,可构建起10Gb的内部高速互联网络,保障了数据访问和传输所需的网络带宽。
更高的机柜部署密度
衡量服务器的磁盘密度不仅要看每U空间支持的磁盘数量,还要放在机房供电环境下,评估单机柜支持的磁盘密度。基于Intel Xeon-D平台的集成性和低功耗优势,在20A的机柜中,42U的空间内,SA5224M4可部署9-10台,单机柜磁盘部署密度提升25%,即以往双路4U36需要部署5个机柜的磁盘密度,当前4个机柜就能解决。不仅提高了单机柜供电利用效率,更减少了租赁机柜的数量,节省服务器生命周期内的运营成本。
客户收益
1、浪潮SA5212M是计算存储均衡类服务器,在存储性能上,搭配12块大容量SATA硬盘,单块容量达到8T,单机可容纳96T的CDN数据,满足CDN集群的庞大数据容量需求。而对于相对热的数据,SA5212M5中可加入的4块2.5寸SSD盘位,将提升系统整体响应速度,经实测,使用SSD固态硬盘后单台服务器的服务能力提升了1倍以上。
2、搭载D-1531 CPU的SA5212M4的计算性能已经达到原E5-2620V3 平台服务器的80%左右,但是单CPU的TDP(散热设计功耗)只用45W,相比传统E5 CPU功耗降低35W以上。按照服务器三年的生命周期,1000台的存储服务器集群就能节省下至少1050万的电费。
3、而目前应用的SA5224M4机型,其36盘位顺序写的总带宽接近4.8GB,顺序读接近6GB,有力支撑了这种硬盘高IO读写的性能需求
4、于Intel Xeon-D平台的集成性和低功耗优势,在20A的机柜中,42U的空间内,SA5224M4可部署9-10台,单机柜磁盘部署密度提升25%,即以往双路4U36需要部署5个机柜的磁盘密度,当前4个机柜就能解决。不仅提高了单机柜供电利用效率,更减少了租赁机柜的数量,节省服务器生命周期内的运营成本。