负责爱奇艺的商业智能、大数据、个性化推荐和用户增长等部门和方向。在互联网产品设计和研发方面有近二十年经验,曾就职于微软、hulu、雅虎等公司,也曾在国内知名互联网公司负责过创业项目。
作为行业领先的视频娱乐平台,爱奇艺拥有着海量的用户数据和内容数据,随着业务和用户规模的发展,在过去十几年的发展过程中,这些数据的规模和形式在不断的被丰富,逐渐形成了行业里稀有的超大规模应用场景。爱奇艺长期以来重视数据基础的建设,深刻理解数据之于业务价值所在,在此思路的指引下,不仅仅搭建了行业领先的大数据基础平台,而且在此基础上在搭建了一系列行业领先的大数据应用,涵盖了行业领先的个性化内容分发平台、用户增长平台、商业决策智能平台等一系列对业务发展有决定性意义的系统和应用,对大数据理论的发展和工业界的实践应用提供了教科书式的案例。在本次交流中,将首先从宏观视角来介绍爱奇艺在大数据领域的架构布局,然后结合典型应用,对爱奇艺的大数据实践做一个全方位的介绍,希望借此机会可以和行业里的同行深度交流,共同推进行业技术进步,助力业务变革。
现任新炬网络(605398)董事、副总经理,程先生拥有超过20年IT行业管理经验,计算机本科、工商管理硕士及香港科大EMBA。
现任华为云数据库服务产品部总经理,负责华为云数据库业务的战略制定与发展,数据库云服务产品与解决方案研发、运营、运维和交付等。在数据库领域、IT基础设施、虚拟化和底层软件具备丰富的开发经验和团队管理经验,长期负责华为公司IT基础设施的研究与开发、虚拟化、数据库等解决方案的交付。
分布式、云原生、国产化是当前数据库的几大主要趋势,华为云坚持在数据库上长期战略投入,自主创新,22年围绕这几大趋势,在技术、商业、生态上完成多项升级,打造企业核心应用云化的智能数据底座,算得快,用得好,信得过,给世界提供一个更优的数据库选择。
1、技术实践上,在面向金融政企的国产分布式数据领域,GaussDB在高可靠、安全、性能方面进行进行多项新特性发布,全面超越国外主流数据库产品;在面向互联网的云原生领域,云原生数据库完成三大转变,实现Serverless、Regionless、Modeless的全新架构演进。
2、商用实践上,GaussDB持续加速,上线全球最复杂的华为流程IT ERP系统,以及多家国有大行核心系统,从国内走向海外。
3、生态建设上,22年更多的合作伙伴加入GaussDB朋友圈,为客户提供有竞争力的创新解决方案,发布数据库HCIE专家级顶级认证,完善职业认证体系。
阿里云数据库资深产品总监,数据库行业15+年从业经验。熟悉业界主流开源数据库和商业数据库的技术原理和商业本质,长期跟踪金融、运营商、互联网等行业数据库解决方案的演进趋势,对数据库产业的未来发展趋势有深入洞见。
云原生数据库领域近年来发生了系列深刻变革,阿里云数据库率先提出了主导未来数据库发展的核心“四化”趋势——云原生化、平台化、一体化和智能化。
● 云原生化:基于基础服务构筑服务,使用户从购买资源向购买能力转变,加速数据业务上云,例如资源解耦、Serverless等能力。
● 平台化:基于云平台提供一站式数据管理与服务,提供标准的OpenAPI体系,减少业务烟囱。
● 一体化:聚焦客户业务场景,通过多产品一体化体验,简化开发、管理和运维,避免数据搬迁,具体包括:处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化。
● 智能化:融合AI能力的数据库自治服务,提升运维效率与体验;数据库内置机器学习 (ML) 功能,无需移动数据即可进行模型训练、生成推理和预测。 阿里云数据库未来将全面拥抱并推进数据库“四化”大趋势的演进与落地。
教授级高级工程师,中国移动集团首席专家、中国移动科协信息技术学部专家,全国最早通过Oracle OCM认证的数据库专家,甲骨文Oracle数据库客户顾问委员会数据库专家委员,TGO鲲鹏会荣誉导师。
本议题将重点讲述浙江移动在长期运维数字化转型过程中,针对技术风险打造出一套具备自身免疫能力的、系统性的防控体系,从而推动故障处置从1-5-10的基础上向1-1-1突破。
主导过互联网金融、电商、社交、广告等主流产品模式的研发和管理工作;有多个项目的全球化部署和运维经验,擅长互联网大型复杂度系统的高并发、高可用设计,擅长精益研发流程构建和研发效能提升;熟悉大数据、人工智能行业的应用模式和落地经验,拥有丰富的战略规划和管理能力。 搭建平安产险数据体系,带领大数据平台架构能力升级,夯实数据基础,提升数据开发、数据计算效能,全年降低数千万费用。主导数据治理,提升数据质量,统一看数逻辑,提升数据使用效率。同时建设产险数据产品体系,支持业务人员智能作业,支持平安产险数字化转型。
保险数据呈现大规模、多样性的极速增长,看数用数也愈加要求高时效和高精准。但大多数企业数据应用方式仍较为传统,用户找数取数难,数据化运营少。为了应对多变的业务数据时效诉求和数据离散难管理,我们打破数据湖与数仓间的壁垒,构建实时的数仓一体架构,使得割裂数据融合统一,减少数据分析中的搬迁,实现统一的数据管理,同时增强业务数据时效,更好为业务赋能。
复旦大学计算机科学技术学院,教授,博导。主要研究兴趣包括:工业物联网大数据、智能运维等。2012年获得教育部自然科学二等奖(第三完成人)。主持或主要参与科技部重点研发计划、国家青年973、自然科学重点 面上基金、上海市科委、上海市经信委的多个项目,以及华为、微软、IBM等企业的资助项目。在数据库领域顶级国际期刊和会议SIGMOD、VLDB、ICDE、TKDE等发表论文40多篇。担任众多国际学术会议的程序委员会委员,包括SIGKDD、ICDE、DASFAA、WAIM等。国际学术期刊VLDB Journal、TKDE、KIS等的审稿人。
时序数据分析和挖掘是工业大数据处理的重要环节,现有时间序列数据库主要支持数据快速读写和简单聚集查询,通用时序分析工具主要关注预测和异常检测等单一分析功能,领域时间序列分析工具支持更丰富的分析手段,但不具有数据库能力。本次报告将介绍团队在工业时间序列管理和分析系统方面的实践探索。报告首先介绍工况切分、关联分析等若干典型的工业时序分析算法,然后从数据管理、算法库、分析流程搭建等方面介绍系统的整体架构和核心模块。
前IBMer,十年数据中心运维研发经验,主导建立了部门运维工具体系,运维超十万规模服务器。
携程云平台研发总监,负责携程云与大数据平台基础设施建设及平台研发。
目前任职平安集团科技会数据管理团队负责人、平安科技副总工程师。北京邮电大学计算机软件与理论专业硕士学位。曾任Teradata大中华区产品及解决方案总经理、就职于IBM GBS、SAS等数据领导者,拥有19年的数据合规、数据治理、数据中台与数据智能相关的实施、咨询服务的经验。开创“合规高效的数据管理及运营体系”,一方面致力于企业数据中台产品和应用的规划建设;另一方面研究落实国家和监管法律法规对企业数据资产管理、数据制度建设、数据合规安全使用等方面的要求。深耕领域涉及银行、保险、通信运营商、交通、医疗、汽车、高科技制造、零售等。
平安集团拥有超过20家的专业子公司,以及多个集团部门、组织,数据平台林立。根据国家和监管频繁出台法律法规以及集团战略的要求,需要加强数据合规管理,规范数据架构,促进数据交互,提升应用价值。2019年底,平安集团启动数据中台建设,采用“共建共享、安全合规、多劳多得、技术为先、面向市场”的设计原则,打造开放共赢的数据中台体系,目的是一方面整合集团内外数据能力,形成合力更加全面立体高效的赋能全业务;一方面建设合规高效的数据管理及运营体系,加强集团对数据资产的管控和治理,保证数据合规安全的使用。
腾讯大数据实时湖仓团队负责人,专家工程师,Apache基金会成员,Apache Spark Inlong Livy PMC成员,曾就职于Hortonworks,Intel,10年的大数据从业经验,专注于分布式流批计算引擎的研发和优化。
湖仓一体技术是当前大数据领域最为炙手可热的方向之一,湖仓一体技术可以为业务带来原先Hadoop数仓所无法提供的能力,包括流批一体架构、行级更新、schema evolution、更为丰富的查询优化等等。腾讯自20年开始投入该领域,为业务带来新的能力。本次分享会为大家介绍什么是数据湖技术,主流的数据湖技术(Iceberg、Hudi、Delta Lake)它们的能力和适用场景,以及如何在业务场景中使用湖仓一体技术代替原有组件。同时也会为大家介绍腾讯内部的业务如何使用湖仓一体技术改造原有架构,带来降本增效。最后也会为大家介绍我们在做的实时湖仓技术,将湖仓一体从准实时提升到实时。
历任蚂蚁数据库SRE,网商银行首席数据库架构师。主导了蚂蚁计费去O,网商银行等核心业务系统的分布式架构升级工作。围绕OceanBase内核构建了产品生态体系(ODC OMS OCP),并在阿里云上完成了产品GTM。当前负责OceanBase泛互联网&海外方向解决方案负责人。
本次分享主要介绍蚂蚁集团发的发展过程中基础设施面临的问题与挑战,以及我们如何基于OceanBase构建蚂蚁统一存储架构,同时在容器化、单元化、异地多活、大促弹性、智能运维上沉淀最佳实践,提升运维效率与业务连续性,降低硬件成本。
1、蚂蚁业务发展历史与数据库面临的挑战
2、一站式数据迁移最佳实践
3、蚂蚁单元化改造与OceanBase异地多活最佳实践
4、OceanBase大促弹性核心揭秘
5、数据库自愈在蚂蚁的探索
翼支付产品总监,8年大数据产品设计及管理经验,曾就职于苏宁易购。2018年加入翼支付,现担任翼支付大数据与人工智能研究院产品中心负责人,牵头负责数智中台能力体系建设及公司数据治理项目推进。有丰富的企业数据治理、大数据平台建设及数据智能化应用经验。
一、数据治理体系顶层设计部分
1)数据治理体系的五大要素
2)翼支付数据治理方法论——“二三四法则”
二、翼支付数据治理实践部分
1)数据治理的效益评价设计
2)核心数据链路治理
3)数据规范设计与落地
4)数据治理平台体系建设
有 15 年的数据库领域工作经验。2014 年加入华为,一直致力于华为数据库工具体系、生态体系的建设和推广,在数据集成、应用迁移、数据库运维等方面具有丰富的经验,对Oracle,MySQL,PG,MongoDB,Redis等多款主流数据库及生态有着深厚的理解和实践。
GaussDB是华为云深度融合在数据库领域的多年经验,结合企业级场景需求,推出的新一代企业级分布式数据库。该产品具备复杂事务混合负载能力,性能优越,同时支持丰富的企业级特性。本次演讲主要内容分享华为云GaussDB数据库在金融领域的核心业务场景中,如何平稳快速完成传统数据库搬迁的最佳实践与思考。
现任vivo运维总监,负责vivo互联网业务的业务运维工作;曾先后在百度、腾讯工作过,有客户端、国际化、大数据算法等在离线业务的运维经验;加入vivo后主导建设了业务的高可用性建设,使业务可用性达到99 99%水平。
硕士毕业于东北大学,持续深耕智能运维领域多年,带领团队致力于京东智能运维算法迭代,把智能算法能力落地京东线上横向业务场景,算法在监控、数据库、网络、资源调度等多个纵向场景取得突破,提升了产品和运维的技术竞争力。善于将实践中沉淀的技术与日常算法工作中积累的技术与创新总结成专利和IEEE论文,申请智能运维发明专利30余项,IEEE国际会议论文收录4篇。
任职中国银行信息科技运营中心技术经理,主要负责X86平台运维工作和监控管理工作,熟悉虚拟化、监控技术。
众所周知,在一个复杂的分布式系统中,我们并不能阻止系统软硬件故障的发生,而应该致力于在这些异常行为被触发之前,尽可能多地识别出会导致这些异常的的环节。当我们识别出这些风险时,就可以有针对性地对系统进行加固、防范,从而避免故障发生时所带来的严重后果。这就是本次分享的重点混沌工程想要实现的。
本次分享将介绍基于分布式建设的混沌工程实践在中国银行的探索:
1、混沌工程背景
2、中国银行混沌工程实践介绍
3、混沌工程平台建设思路
在高可用架构设计、业务逻辑设计和优化方面,有较为丰富的经验。目前负责新浪智能数据分析平台建设,致力于运维大数据价值挖掘,提升运维服务质量和产品用户体验度。ClickHouse中国社区发起人之一,国内最早大规模使用ClickHouse的用户之一,对ClickHouse的架构、使用、优化,有较好的理解和实践经验。
中国工商银行软件开发中心云计算实验室高级经理,分布式基础技术服务团队负责人,2015年加入软件开发中心,先后参与工商银行分布式服务、批量、监控、事务等分布式基础支撑平台的建设,目前主要负责分布式事务平台,以及行内分布式转型期间账务一致性等重难点问题攻坚。
1、 主机业务服务化背景及规划。
2、 主机业务服务化转型建设方案。
3、 工商银行在服务化产生的事务问题解决方案
4、 事务模型在工商银行常见业务场景中的适配
5、工商银行主机业务分布式转型解决方案及成果介绍
美团数据库自治服务团队负责人,对数据库故障分析、性能优化有丰富的实践经验跟浓厚兴趣,善于从数据库源码(MySQL)的角度深入分析问题,并给出最佳实现方案,最近对AIOps在数据库领域的实践有浓厚的兴趣;在进入美团之前,曾就职于微软(中国)SQL Server团队。
拥有丰富的一二线MySQL运维经验,先后在阿里云,爱可生担任数据库运维;目前为爱可生数据库产品负责人,爱可生开源社区发起人,爱可生华东技术服务总监。
在商务智能及大数据领域有近10年的从业经验,之前就职于MicroStrategy、Qlik等国际BI厂商为客户提供商务智能及相关行业解决方案,目前负责Denodo华东地区业务。
利用元数据逻辑架构搭建的最新一代数据中台,使数据贴近数据源进行计算、消费以及实时呈现相关数据报表。同时提供方便快捷的数据分享方式让企业打通行业上下游的物理瓶颈,达到数据协作的功效,最大化实现数据的内在价值。
中国信通院云计算与大数据研究所大数据与区块链部高级业务主管,长期从事数据领域技术产品、服务、应用相关的标准、政策和产业研究等工作。牵头制定完成10余项大数据技术产品行业标准,深度参与各年度《大数据白皮书》编写工作,主持相关大数据产品评测工作,同时牵头制定《大数据服务能力成熟度模型》系列标准、《数据中台能力成熟度模型》系列标准,在数据领域持续推动面向供需双方的成熟度评估工作,具有丰富的数据领域产业研究、标准、评测及评估经验。
阐述数据中台的概念沿革、发展历程以及当前数据中台所代表的企业数据能力框架,进一步介绍中国信通院牵头编制的《数据中台成熟度模型》系列标准,以及依据标准开展的相关评估工作
华夏银行中间件运维负责人,协调推进基础软硬件运维的自动化和智能化 。十七年运维管理经验,对运维自动化有丰富的实践经验。
主要介绍华夏银行云数据中心在向四层三域一中台架构演进的过程中,对移动化和无人化运维的探索路径和经验总结,包括移动化运维体系的搭建方案、安全措施、最新成果,无人化运维的实现方案、经验总结、最新成效和未来计划:
1.华夏银行云数据中心的四层三域一中台运维架构是如何构建的。
2.华夏银行构建移动化运维体系过程中的经验总结。
3.什么是无人化运维,华夏银行对无人化运维探索的成果及经验总结。
本人在字节跳动负责公司级可观测性领域海量时序数据库,熟悉大数据整套技术与业务体系, 在分布式系统,如Spark、Flink以及Presto等OLAP领域有超过8年的从业经验,擅长深入引擎底层定位和解决问题,擅长系统性梳理和解决问题。
字节跳动的可观测性领域的海量metrics时序数据库从17年演化至今经历了从少量数据到海量数据,从单机到分布式,从开源的拿来主义到坚定自研的道路,逐步构建出了一套相对完善分布式计算与存储的时序数据处理能力。此议题旨在分享这一路走来我们的收获与遇到的问题,帮助观众对此领域有更深入的理解。
光大银行准实时数据平台技术负责人,专注于分布式系统内核研发。在OLAP & 消息中间件领域有较丰富经验。 开源爱好者,Apache RocketMQ committer,Prometheus contributor。
金融级的实时消息服务架构演进过程
如何实现复杂平台架构拆分,将业务逻辑与数据平台逻辑解耦,构建统一的消息总线服务
在构建消息总线服务过程中,如何对周边生态进行扩展,实现高效的监控、统一的SDK封装;如何引入 Schema Registry 解决数据耦合的问题
后续进一步建设金融级消息总线服务的重点计划
曾在阿里云和英特尔从事开源大数据框架的开发工作,在大数据领域有多年研究经验,是Apache Hive和Apache Flink项目的Committer,目前在哔哩哔哩基础架构部门负责OLAP平台的建设。
湖仓一体是近阶段非常火热的方向,如何保持湖的灵活性的同时,提供仓的高效分析效率依然是一个亟待解决的问题。本次分享主要介绍哔哩哔哩的OLAP平台遇到的问题和挑战,以及我们如何基于Apache Iceberg建设湖仓一体的架构,在数据分布/索引/预计算等多个方面增强优化,提升数据分析效率,降低分析成本。
1、了解湖仓一体架构的好处。
2、如何基于Apache Iceberg建设湖仓一体的架构。
3、开源Iceberg目前的一些可提升优化的方向。
4、哔哩哔哩在落地实践上的一些经验。
2017年 入职深圳前海微众银行股份有限,担任 基础科技-大数据开发工程师 2017-2019 在大数据平台负责大数据Apache Hadoop周边生态组件在微众银行各业务场景下落地、二次开发和运维等事项 2019-至今 在存款科技担任 高级数据开发工程师,负责存款核心大数据的数据管理和应用,保障各业务的稳定、高效运行。
主要介绍微众银行在数据管理和应用方面的思考和沉淀,通过对数据资产从数据的生成,加工,管理,应用等全链路的治理,更好、更高效的对业务赋能,对成本把控,节省数据管理人力投入,更高要求的对数据进行价值挖掘和应用。主要包括:
1. 微众银行大数据IT架构
2. 大数据在金融银行业应用和面临的一系列挑战
3. 微众银行数据仓库在监管高要求的架构设计、数据管理、数据应用的探索
4. 微众银行在海量实时数据应用上面临的困惑和“突围”之道
5. 后续如何高效的进行数据资产管理和未来演进路线
蚂蚁集团基础设施团队SRE技术专家,在蚂蚁基础设施团队从事关于SLO的健康度体系建设,以及异常检测、故障定位、预案推荐等场景下的AIOps实践。曾就职于携程技术保障中心SRE专家岗,负责AIOps的实践探索和落地,以及多个AIOps产品的设计研发。毕业于复旦大学信号处理方向,对人工智能、机器学习、神经网络及数学有浓厚的兴趣,在人工智能技术结合运维场景的实践方面有深入研究。
SLO为应用的服务质量定义了明确的目标,帮助团队提供一致的客户体验、平衡功能研发与平台稳定性,改善与内部和外部用户的沟通。蚂蚁的基础设施团队负责包括K8S资源调度、中间件、L4/7流量调度、数据&智能、缓存等众多异构系统,以SLO构建基础设施侧的健康度体系,除了为各个系统定义明确的性能目标,也为系统可观测性、应急等提供了一套通用的框架,通过将AI赋能SLO数据、结合实际场景(AIOps典型实践场景),从运维数据中挖掘更多的价值,让运维更加提效和智能。
本专题将分享SLO的介绍、如何从0到1构建SLO、AI结合SLO数据发挥更大价值、以及基于SLO的健康度体系在运维场景下的一些成功实践。
现就职于快狗打车数据智能部,数据仓库团队负责人 数据仓库架构师。经历过互联网广告平台、电商平台、自营电商等不同业务主体、不同发展阶段的数据仓库建设,积累有丰富的数据仓库建设实践经验。
快狗数据仓库经过多年建设迭代,如何更精细化的管理企业数据资产?如何更好的赋能企业业务发展?如何做好面向未来的数据建设?本次分享将会和大家一起交流快狗数据仓库的技术建设和未来演进之路。
1 摩托罗拉 子公司UniqueSoft Java专家 主导自动逆向工程系统Java方向研发 2 阿里本地生活中间件技术专家负责DAL中间件的研发,同时负责多活体系中全局控制中心和数据层的建设 3 现任货拉拉核心基础设施技术专家、数据库中间件团队负责人。 对数据库中间件研发有深刻的理解跟丰富的实战经验。
随着企业体量不断增长,业务不断丰富和多元化,伴随着单体架构向微服务架构演进&单云环境向混合云环境过渡,DB层稳定性建设迎来了全新挑战。静态的某个DB长期稳定运行已经不能满足企业要求,新的稳定性体系必须是能够应对海量存储以及频繁表结构变更,数据迁移,容量扩缩容的反脆弱稳定性体系。
小红书数据库专家,DBA负责人,负责数据库运维体系建设和数据库管理平台开发。曾就职于美团点评、携程,在数据库高可用、自动化运维等方面有丰富的探索和实践经验。
本次分享我将介绍小红书MySQL高可用的架构演进,主要包括:
1. 构建MySQL主从架构下的跨云高可用方案
2. 从单云同城双活到跨云多地区多活架构的切换策略
3. 基于DB Proxy、Orchestrator、配置中心的MySQL跨云高可用实践经验
阿里云数据库事业部生态工具和管控产品负责人,12年+的数据库领域专家经验,国内云计算第一代产品经理,负责了多款云数据服务相关产品的立项、规划和落地,对一站式数据管理有深度的理解和实践。
智能化,是数据库未来的重要发展方向之一。AI for DB,帮助数据库具备自感知、自定位、自修复、自运维的能力,可以有效简化数据库的运维难度,帮助数据库实现“自动驾驶”。
博士 高级工程师 云平台运营运维专家 浙江移动自主可控专家
信创产业纳入国家战略,国家提出“2+8”发展体系 (党、政,金融、电信、交通、电力、石油、航空航天、教育、医院行业)。浙江移动长期坚持自主可控探索,创造了运营商行业IT系统自主可控方面的多个第一。信创产品不成熟,羸弱的产品与客户和领导期待间的鸿沟需要实践者去弥补,浙江公司总结出一套完整的实践经验解决“选型难”和“保障难”问题。
浙江大学硕士,网易严选数据治理平台团队负责人,主要负责严选数据治理平台的建设、批流融合架构在严选的落地等工作。
随着业务的快速发展,数据支撑越来越多的业务场景,我们数据任务和服务也会井喷式的增长,再加上大数据的服务链路是非常长的,涉及到收集、存储、访问、计算、数据加工、数据挖掘、数据服务等。随着数据规模和场景快速变化,特别在互联网公司,开发效率优先的工作模式下,数据体系的快速腐化是不可避免的,这不仅影响到数据研发效率,甚至影响整个公司的决策效率。
本次分享主要给大家介绍的是严选对于数据治理的方法论和落地实践,通过对整个生命周期的数据/任务/服务组件的治理 ,保障数据稳定高质地进行生产,并推进整体的资源优化,以及大数据平台的演进和优化:
1、如何提升数据体系的可观测性、可运维能力以及稳定性;
2、如何更高效低成本数据治理,发现和减少数据系统的腐化问题。