1. 首页>>FinOps实践分享

知名金融机构 | FinOps实战技术方案

本文主要介绍了国内某知名金融机构FinOps领域的探索与实践。方案针对各类资源明确了分摊思路,实现了包含私有云、公有云、服务器等5个资源大类,10个资源小类在内的精细化成本度量,并通过走势分析、定期账单发布等手段辅助用户进行成本评估。注:实践内容来源于该金融机构

 

一、FinOps方案整体设计

针对现有的资源分布,为尽可能全面地描绘出基础资源成本构成,FinOps测算成本范围包含数据中心(含网络/机房资源)、云服务、线路等类型。确定范围后,需要针对各类型的资源建立起成本度量模型,并对涉及的底层数据资源进行线上化、规范化治理。度量作为FinOps运营体系的基础,其准确性将直接影响后续的运营结论见图1

28.png 

1  方案整体设计

 

基于度量结果可以开展后续的优化及运营工作,当前所采取主要措施包括自动化账单发布、提供资源布局规划调整、低效资源治理等。

 

二、成本度量算法模型

首先,对于公有云、网络线路等租赁类资源,账单明细由服务商提供,我们需要建立起完善的线上化标签管理体系,确保资源有归属、变更有管控,对于公用类资源建立合理的分摊策略,做到应分尽分。

 

对于自建类资源,需构建合理的成本算法,该算法应该能够准确衡量投入成本,将投入成本按照模型转换为各应用/组织的分摊成本,同时未分摊出去的投入成本将作为保留成本。保留成本规模将用来衡量管理方运营水平,下文给出主要的自建类资源成本算法模型。

 

1)物理服务器成本。为全面核算物理服务器成本,考虑从物理服务器自身使用成本、占用机柜资源成本、网络接入成本三个方面进行成本测算见图2

29.png 2  服务器使用成本算法模型

 

服务器占用机柜资源成本需精确至具体机位占用情况,考虑机柜实际使用率,服务器使用机柜成本应根据其具体的占用比率决定,同一机柜中闲置机位的成本应视作管理方保留成本,不做分摊。机柜成本测算模型见图3

30.png 3  服务器占用机柜成本算法模型

 

服务器网络接入成本需精确至端口级别精细化分析,考虑按照不同机房、不同带宽的交换机端口定价,同一机房、同一带宽类型端口单价定价一致。网络交换机按照用途可分为核心交换机、汇聚交换机及接入交换机,由于直接与物理服务器相连的为接入交换机,因此通过获取接入交换机与物理服务器的连接关系进行成本核算,核心与汇聚交换机成本按照一定的规则累加至相应的接入交换机上合并计价见图4

31.png 4  服务器网络接入成本算法模型

 

2)私有云成本。对于私有云,由于不同应用类型对服务能力的需求不尽相同,例如一些核心业务系统对可靠性、响应时间等指标要求非常高,而另一些应用则可能在这些方面要求较低,只要能满足基本使用要求即可,因此私有云需要考虑能够提供差异化的服务以满足不同的使用需求,原则上不同资源池虚拟化出的云主机单价不同。为了测算不同组织架构、不同应用系统的私有云成本,我们需要获取其在不同资源池的资源使用情况,并根据不同资源池的云主机单价,核算出最终成本。核算方案概括见图5

32.png 5  私有云成本算法模型

 

三、底层资源数据图谱

以运营场景牵引底层数据治理,为落地上述模型,需构建精确的底层资源数据图谱,这对于资产数据量庞大的企业来说是个不小的挑战。下文总结了涉及的核心能力。

 

一是端口级别服务器与交换机关联关系的自动化获取,通过采集、解析交换机的动态配置信息,对所有设备采集到的邻居关系数据分析计算,构建拓扑地图。

 

二是云资源池拓扑的自动化构建,资源池计算资源(宿主机)网络资源(网络交换机)存储资源(存储)关联关系是云网资源拓扑的重要组成部分,不仅对于运营场景,为业务运维也可以提供重要的数据支撑。

 

三是线路带宽分析,专用线路与共用线路区分,共用线路通过流量实现精细化分析等技术手段实现应用方归属划分。

 

系统设计

公司基础设施运维体系经过多年的持续建设,已经形成了以IT资源管理平台为核心的运维服务层,向下分别对接云、网、数据中心各领域运维系统的运维能力层,已经具备了相对较完善的自动化运维能力。各系统经过长期运行积累了大量相对完善的运维基础数据,具备了从强调运维能力建设向重点提升运营能力转型的前提条件。

 

架构设计

综合考虑系统应用场景、现有的技术条件、平台能力和后期系统扩展性,基础设施运营台采用上层运营台做场景数据展示加底层大数据中台做数据服务支撑的两层架构设计。

 

系统前端设计主要考虑三类不同用户视角,即基础设施资源管理方、基础设施资源消费方和基础设施资源运营管理员。资源管理方为领导者视角,需要能统揽各项资源、各组织架构、各应用不同时间的成本情况;资源消费方为具体基础设施资源的用户,需要能以时间、资源、组织维度查看本部门资源成本详情;资源运营管理员除了需要使用详细的成本查询功能外,还需要进行成本运营配置和在定期发布账单前的完成账单数据审批核验操作。

 

华泰数智中台是一套大数据能力开放平台,旨在把数据转变为资产,通过平台提供的数据统一接入功能,实现多业务平台的数据汇聚,打破数据孤岛;通过在线分析建模、离线数据开发实现数据分析处理;通过离线数据同步、在线API服务、在线报表实现数据发布。基础设施运营台数据中台充分借助华泰数智中台的平台能力,通过数据统一接入将IT资源管理平台、云网管理平台、网络运维平台等众多底层运维能力平台数据统一接入到中台,建设了基础设施运维数据湖仓,具体数据湖仓采用分层建设,ODS为贴源层,每个底层能力系统对应一个专有Schema,存储系统原始数据,DW为数据仓库层,根据具体的运维数据场景分为云、网、数据中心、通用数据4个主题,每个主题域对应数据清洗之后的数据细节层(DWD)、业务模型宽表层(DWM)和存储聚合数据的服务层(DWS),最上层为针对特定应用场景提供数据支撑的应用数据层(DWA)。所有运营台的具体应用场景均由中台提供统一的场景化的运营数据。

 

系统后台设计采用典型的MVC三层架构。模型层为中台离线计算的结果数据;控制层对各类资源的成本明细进行加工聚合形成按资源、组织、应用、时间的结果数据;展示层负责针对不用用户视角的具体页面做数据呈现。

 

传统的流程审批管理平台与数据运营平台分别负责不同业务领域,一般不会互通,运营平台提供数据服务,需要有专门的业务人员从运营平台取数分析,人工书写分析报告,线下经过领导批阅后发送至各业务部门。基础设施运营平台建设过程中通过提供开放API,实现了数据运营平台和流程管理平台之间打通,流程平台定期触发流程,通知数据运营平台自动化生成报告,经过一系列流程审批操作,系统自动通过邮件发送业务报告,使得传统的人工操作流程化、数字化。

 

四、应用成果总结及展望

目前,以成本分摊为基础,结合其他资源效能评估、配额管控等手段,FinOps运营体系已经应用在公司日常的运营管理实践中,推动低效资源治理、公有云多供应商布局的资源合理使用,进一步推进基础资源持续降本增效。据统计,本年度公司在线云资源利用率提升25%以上,资源节省率约15%

 

对标FinOps领域关键能力,目前该金融机构的FinOps运营体系以成本度量及感知为主,成本优化主要方式依赖于低效资源下线,主动成本优化方面需进一步加强。后续计划面向用户建立成本优化正向反馈机制,提供行之有效的用量优化、预算规划、成本异常识别等系统工具,进一步实现成本的精细化运营。

 


本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://finops.itqm.com/47.html

联系我们

在线咨询:点击这里给我发消息

微信号:4008-233-655

工作日:9:30-18:30,节假日休息