区块链和kubernetes整合
⑴ 如何用区块链构建一个价值流通网络
区块链技术 银行将给社会带来三个层次的变革:1.0是货币;2.0是整个金融领域的应用;3.0是超越货币市场之外的其他应用。有资料显示,美国和欧洲所有大型金融机构,都有10至20个区块链项目的内部开发和评估。明年银行将会在区块链技术上投资超过10亿美元。
全球货币形式正在经历一场巨变。数字货币的发行对央行货币供应、货币发行权、监管机制都会提出挑战。
在交易支付领域,区块链具有去中心、无须信任系统、去中介化、不可篡改、加密安全等优点,这种无需信任的点到点模型,意味着商业银行作为支付中介和信用中介的必要性降低,削弱传统商业银行在货币创造过程中发挥的作用,进而波及存款和信贷领域。
在数字货币完全取代现金的极端情况下,传统意义上的网点也将失去存在的价值。不过,发行数字货币不仅需要移动数字设备作为硬件支持,还要解决数字身份认证以及隐私保护等问题。因而,商业银行有足够的时间来研究应对。
当前金融体系仍主要靠中心化方案来解决信用问题,即通过政府、银行等中心化的权威机构来建立信用。区块链技术通过技术背书而非中心化信用机构来促成交易。
基于区块链的智能资产能构建无需信用的借贷关系。智能资产的核心思想是控制所有权。在区块链上已注册的数字资产能通过私钥来随时使用。在互联网上借钱,可将智能资产作为抵押,智能合约的自动执行可锁定抵押的智能资产,而贷款还清后可确认合约条件来自动解锁,借贷双方出现争议的概率由此大幅降低。
区块链技术能实现机构间的直接交易而大幅降低成本。以跨境支付为例,在传统支付模式下需要两三天的处理时间,而区块链采用点对点的支付方式只需几秒至几个小时。西班牙桑坦德银行(SANTANDER CENTRAL)研究,通过减少跨境支付、证券交易及合规中的成本开支,区块链技术每年能为银行业节省150亿至200亿美元。
目前银行中后台部门从事大量账目登记、结算等功能,部分复杂交易还需要人工记录和操作。同时,在复杂交易项目中,往往需涉及多个交易主体,多方沟通和核对。区块链中的智能合约可通过将操作规则或协议代码化,自动执行,减少人工干预,从而实现更高效和标准化的金融服务。
区块链技术对扩大金融共享大有帮助。比如在肯尼亚和菲律宾已发展出以比特币为桥梁的国际汇款工具,使没有银行账户的人,通过手机APP就能即时跨境收发款项。
比特币之所以能实现全球货币和支付的功能,很重要的原因是区块链技术实现了不同国家地区、不同政治文化背景人群的信用共识,从而能突破机构、地区甚至国家的信用局限。
区块链可保存监管记录和审计痕迹,为监管、审计等提供便利并能有效控制欺诈、手工输入错误等操作风险。由于交易确认即完成清算和结算,还大大降低了交易对手的风险。区块链的分布式网络和共识机制在,也减少了金融机构受到黑客攻击、服务器宕机等系统风险。
当然,区块链技术在金融行业的大规模运用还面临诸多挑战。
首先是现行法律和监管的制约。区块链技术不断在变化,司法及监管机构仍处于研究状态,金融区块链技术应用必将面临不同程度的合规问题。
其次,目前还没有成熟的底层区块链技术平台方案。区块链仍面临诸多技术难题,比如容量的可扩展性、隐私保护、无法以净头寸结算、事后不可追索等。区块链技术整合到现有金融系统的成本高,大规模使用区块链技术不仅要重塑IT架构和业务流程,还要克服来自内部文化理念的冲突。
因此,区块链技术需要全体金融行业的协同一致才能真正落地。
当前,我国商业银行可通过内部试验和联盟合作方式把握区块链技术背景下衍生的互联网金融新模式,把区块链技术作为实现“互联网+”的有力工具。
海外金融业区块链技术实践,大致有内部实验室、投资区块链公司和建立合作伙伴关系三种。考虑到监管因素,国内金融机构一时还难以通过直接投资区块链公司来把握该技术领域的新动向,但可考虑组建研发实验室、与科技公司合作等方式参与研究。
在国内方面,布比区块链是国内领先的区块链技术服务商,自成立以来一直专注于区块链技术与产品的研发与创新,拥有多项核心技术,并在多个方面取得了实质性的创新,形成多项核心技术成果,例如:可数学证明的分布式共识技术、快速的大规模账本存取技术、支持业务形态扩展的多链总账技术、异构区块链间的互联技术等。开发了自有的区块链基础服务平台,已在股权、供应链、积分、信用等领域开展应用。布比区块链一直致力于以去(多)中心信任为核心,构建开放式价值流通网络,让数字资产自由流动起来。
为了在未来的应用中占据主动,争取话语权,我国商业银行应积极参与国际国内标准制定,申请区块链技术专利,加强对区块链技术细节的深入研究,进行必要的技术储备,包括在跨境支付、银行间结算、票据、供应链金融、消费金融、抵押贷款等具体业务领域应用的可行性等。
区块链技术与普惠金融、共享经济的结合,是可以重点突破的领域。可通过与科创企业合作等方式共同研究如何借助区块链技术在金融覆盖不足和经济欠发达地区实现低成本的资金转移;研究借助区块链技术,在区块链上生成借贷双方不可伪造,公开唯一的电子合同,提升P2P等新型借贷模式的安全可靠性;研究通过区块链注册资产并控制私钥的方式来实现对企业抵押资产所有权的掌控。
区块链技术 银行由于监管原因,区块链技术目前还难以在金融业务中直接应用。但商业银行可将区块链技术应用在降低经营管理成本、提高员工福利待遇等不受金融监管的领域。比如积分兑换、实物资产与采购系统等领域推进一些小范围的试验。
⑵ Kubernetes为什么那么重要
Kubernetes(k8s)是自动化容器操作的开源平台,这些操作包括部署,调度和节点集群间扩展。如果你曾经用过Docker容器技术部署容器,那么可以将Docker看成Kubernetes内部使用的低级别组件。Kubernetes不仅仅支持Docker,还支持Rocket,这是另一种容器技术。
使用Kubernetes可以:
自动化容器的部署和复制
随时扩展或收缩容器规模
将容器组织成组,并且提供容器间的负载均衡
很容易地升级应用程序容器的新版本
提供容器弹性,如果容器失效就替换它,等等...
想了解更多Kubernetes更多知识可以在网上找找教程视频,下面这个就很不错。
⑶ 区块链是如何与商业应用做整合的
目前,国内的区块链企业大都还处于理论阶段,不过旺链科技的农产品溯源案例还是可以的,能将产品的生产,加工,销售等,每一个环节都数字化,直接用手机扫一下就能购买。
⑷ 区块链是是什么技术,对我们的生活和社会有什么影响
什么是区块链技术?
在讨论如何在日常生活应用区块链之前,让我们先谈谈区块链是什么,它是如何工作的?
区块链是一个开放的分布式数据库,本质上是一个用于存储信息(数据)的计算机文件。
区块链的名称来自其结构特征:文件由数据块组成,每个块都链接到前一个块,形成一个链,每个区块均包含数据,如交易记录以及该区块何时被编辑或创建的记录,信息(数据)都盖有时间戳,这就是区块链的由来。
至关重要的是,不同于公司或政府机构拥有的集中化数据库,区块链不受任何人或实体的控制,数据在多台计算机上完整地复制(分发)。
因为它是一种分散式存储和访问数据的方式,这使它变得异常安全。因为与集中式数据库不同,攻击者没有一个单一的入口点,数据的安全性更有保障。
除了去中心化和安全这两大特点,使区块链成为一项区别于其它技术的领先技术的特点还有:
不可篡改性:一旦进入区块链,任何信息都无法更改,甚至管理员也无法修改此信息。它使区块链具有易于审核的优势。
可访问:网络中的所有节点都可以轻松访问信息。
无第三方:区块链可以帮助点对点交易,因此,无论您是在交易还是交换资金,都无需第三方的批准。区块链本身就是一个平台。
区块链技术的影响?
一、区块链技术公开、不可篡改的属性,为去中心化的信任机制提供了可能,具备改变金融基础架构的潜力,各类金融资产,如股权、债券、票据、仓单、基金份额等均可以被整合进区块链账本中,成为链上的数字资产,在区块链上进行存储、转移、交易。使其在金融领域的应用前景广阔。例如,在跨境支付、保险理赔、证券交易、票据等方面有了典型的应用。
二、目前的物联网生态体系,依赖中心化的网络管理架构,所有的设备都是通过云服务器连接。随着网络规模的扩大,中心化云服务器、大型服务器和网络设备的基础设施和维护方面将占用高昂成本。
在去中心化的物联网中,区块链是发生互动的设备间促进交易处理和协作的框架,网络上的每个设备都可以作为一个独立、微型的商业主体运行。
三、公共服务是促进经济增长和社会进步的因素,公共服务的供给对政治、经济、社会发展过程中各类主体及制度、文化、态度、行为等都会产生重要影响。传统的公证依赖政府,而有限的数据维度、未建立的历史数据信息链常常导致政府、学校无法获得完整有效的信息。利用区块链可以建立不可篡改的数字化证明。在数字版权、知识产权、证书以及公益领域都可以建立全新的认证机制,改善公共服务领域的管理水平。
⑸ kubernetes 提供什么功能
Kubernetes,是开源容器应用自动化部署技术,也就是大家经常说的k8s。
Kubernetes(k8s)是自动化容器操作的开源平台,这些操作包括部署,调度和节点集群间扩展。如果你曾经用过Docker容器技术部署容器,那么可以将Docker看成Kubernetes内部使用的低级别组件。Kubernetes不仅仅支持Docker,还支持Rocket,这是另一种容器技术。
使用Kubernetes可以:
自动化容器的部署和复制
随时扩展或收缩容器规模
将容器组织成组,并且提供容器间的负载均衡
很容易地升级应用程序容器的新版本
提供容器弹性,如果容器失效就替换它,等等...
它有这些特点:
可移植:支持公有云,私有云,混合云,多重云 multi-cloud
可扩展:模块化,插件化,可挂载,可组合
自动化:自动部署,自动重启,自动复制,自动伸缩/扩展
如果还有想要了解的可以到官网或是相关教程视频中看看,比如B站这个视频教程:
⑹ 如何学习,了解kubernetes
Kubernetes的名字来自于希腊语,意思是“舵手”或“领航员”。K8S是将“ubernate”替换为“8”的缩写。
据说Google的数据中心运行着20多亿个容器,而且Google十年前就开始使用容器技术。最初,Google开发了一个叫Borg的系统(现在命名为Omega)来调度如此庞大数量的容器和工作负载。在积累了这么多年的经验以后,Google决定重写这个容器管理系统,并将其贡献到开源社区,让全世界都能受益。这个项目就是Kubernetes,简单来讲,Kubernetes是Google Omega的开源版本。
Kubernetes是一个容器集成管理系统:
☑开发人员只需关注业务代码
一旦使用Kubernetes技术,开发团队不需要关心那些和业务没有关系的底层代码(通信组件、协议转换、服务治理等),只需关心项目业务即可。
☑全面拥抱微服务架构
微服务架构主要包含两个问题:服务架构拆分和服务治理。服务拆分是指将一个完整的服务拆分为多个微服务,拆分后增加服务维护难度。一旦使用Kubernetes云原生技术后,就不需要关心服务治理问题,一切交给Kubernetes实现。
☑无缝分布新的应用功能
开发、测试、上线都是在同一个环境上。
☑弹性扩缩应用
面对突发性事件,例如搞促销活动,应用负载爆发,根据CPU和内存指行扩容。促销活动结束后,再根据CPU和内存指标进行兼容,节约硬件资源的使用。
☑自动化运维平台
以Kubernetes为核心构建一套devops平台,从开发到运维整个流实现自动化开发流程
·快速部署(发布)应用
·负载均衡
·弹性容错
等等
无论是传统企业还是互联网公司都在进行企业数字化转型(提高企业生产效率),云原生(以Kubernetes为核心的云架构体系)是企业数字化(自动化、智能化)转型的重要路径。
最近刚好有这个课程可以推荐给大家,有需要的可以私聊我哈~
⑺ 华为云产品全景图有哪些理解
在云技术堆栈中,最能体现软件能力之一的就是PaaS平台及服务,在2018中国软件百强企业榜单中,华为已经连续十六年获得第一。华为云基于华为软件能力30年经验的积累,自2016年以来华为云企业应用服务就在陆续推出PaaS产品。
在2019华为分析师大会(HAS2019)期间,华为云PaaS首席科学家、华为云智能应用平台总设计师熊英博士亮相,对外整体介绍了过去几年华为云形成的PaaS技术全栈能力以及完整的云原生计算平台——华为云智能应用平台3.0。作为CNCF(云原生计算基金会)初创会员董事,拥有20多年软件开发与架构设计经验的熊英在云原生领域有深刻的理论与实践经验。熊英表示,鉴于云原生对于未来企业软件产业的重大影响,华为云在2015年就将其列入战略技术投资范围,如今已经取得了大量成果,成为了云原生技术的领导者。
(华为云PaaS首席科学家、华为云智能应用平台总设计师熊英博士)
以华为云智能应用平台3.0为代表的华为云企业应用服务技术,其优势在于全栈云原生计算的能力以及面向数字化转型需求的支撑平台,目标是让企业上云更简单、数字化转型更智能。在云原生计算领域,Kubernetes和云原生技术推广的最大困难在于技术复杂性,而华为云在Kubernetes+Docker、微服务以及Serverless等云原生技术“三驾马车”领域,都推出了简便好用的产品与服务,不断降低云原生技术使用门槛。
华为云智能应用平台3.0集华为软件技术能力之大成,凝聚了华为全球数字化转型的实践以及华为多年来在开源软件领域的持续投资成果,堪称“软件百强之首”的华为,推出的云原生大时代的扛鼎之作。
华为云企业应用服务全景图
华为云企业应用服务的整体架构在吸收全球顶级云原生系列开源项目的基础上,也融入了华为自己特色的技术体系。华为云智能应用平台3.0主要特色包括一个“底座”、两大应用创新平台和一个应用创新解决方案:一个“底座”就是ServiceStage微服务应用平台,两大应用创新平台就是企业集成平台ROMA、智能边缘平台IEF,以及区块链解决方案BCS。而承载华为云智能应用平台3.0的,就是全行业首发的华为云容器多云及混合云管理平台(MCP),比Google的Anthos还提早一个月发布。
就整体华为云企业应用服务的全栈技术来说,包括:一站式微服务应用管理平台,含有ServiceStage微服务云应用平台、应用编排服务AOS、微服务引擎CSE、容器镜像服务SWR、应用性能管理APM、云性能测试服务CPTS、应用运维管理AOM;企业级云中间件,含有分布式缓存服务Redis、分布式消息服务DMS、API网关APIG、区块链BCS;Kubernetes容器平台,含有云容器引擎CCE、云容器实例CCI;高性能Serverless无服务器函数FunctionGraph;以及智能边缘云IEF和企业集成平台ROMA等。
具体理解,华为云企业应用服务以Kubernetes等容器技术为核心,围绕Kubernetes的核心功能提供云容器引擎CCE和云容器实例CCI等。自2016年首发CCE,华为在2017年成为第一批全球Kubernetes认证的服务提供商,CCE也首批通过了Kubernetes的一致性认证。CCE是华为云自研推出的高性能、高可靠公有云容器全栈解决方案,贯穿应用开发、交付与运维流程,提供完整的一站式云上应用生命周期管理方案,深度整合华为云的计算、存储、网络能力。
在容器底层的微服务治理方面,ServiceStage是凝结华为微服务团队多年研发经验的云原生应用开发平台,面向企业提供AI、区块链、微服务、移动和Web类应用开发的全栈解决方案,帮助用户快速创建企业级云原生应用,加速业务创新。ServiceStage提供Spring Cloud、Service Mesh和ServiceComb商业版(微服务引擎CSE),帮助企业快速构建基于微服务架构的分布式应用。
ServiceStage 可支持多种编程语言,集成 Eclipse、IDEA、Jenkins、Maven 等多种工具生态,支持线下开发环境和线上云环境的无缝集成,面向DevOps提供应用开发、编译、构建、发布、部署、配置、压测、上线、运维和治理等全栈、全生命周期能力。而微服务引擎CSE则是一站式微服务管理平台,提供高性能微服务框架和一站式服务注册、服务治理、动态配置和分布式事务管理控制台,帮助用户实现微服务应用的快速开发和高可用运维。
在无服务器函数计算方面,华为2017年已经上线函数服务,是国内首家发布函数编排服务的云服务提供商。华为云推出的全球首款基于Kubernetes的无服务器容器实例CCI,用户只需要管理运行在Kubernetes上的容器化业务,其余的底层计算资源管理全部交给华为云自动化管理。
在云原生计算“三驾马车”之外,华为云企业应用服务的企业集成平台ROMA和智能边缘平台IEF则满足了大型跨国企业的复杂计算环境连接以及云与边缘计算的协同。ROMA能够连接企业IT系统、数据、消息、API 、设备、云服务,提供统一的应用与数据集成平台。ROMA源自华为内部信息化建设集成经验,帮助企业简化集成,加速应用上云。ROMA在云上云下应用集成、云间应用集成、跨区域集成、设备数据集成、企业能力开放、B2B集成、业务出海集成等场景中,解决了企业数字化转型过程中需要连接传统应用与云原生应用、工业与IT设备和数据、私有云和公有云、全球各节点等多种复杂的集成和连接需求。智能边缘平台IEF则将华为云AI服务延伸到边缘侧,将边缘节点智能化,充分满足业务的实时性需求、优化计算资源使用。
华为云的全球首个容器多云&混合云解决方案(MCP),提供跨云平台(不同公有云之间或公有云到私有云)的Kubernetes集群和云原生应用统一监控、部署、运维的能力,以及业务流量的跨云统一治理、地域亲和策略,帮助企业用户客户轻松应对业务流量高峰的冲击、云单点宕机故障以及业务全球一体化运营区域化接入的诉求。
⑻ 云计算发展前景,云计算培训是真的吗
云计算定义与分类
云计算自亚马逊推出弹性计算云服务之后被广泛传播,最终成为定义当前信息技术变革大潮的名称。云计算作为信息技术创新服务模式的集中体现,已成为支持各行业发展的关键信息基础设施。云计算是一种以网络方式接入到一个可扩展,弹性的共享物理或虚拟资源池的服务模式,用户可以通过自服务和管理的方式来按需购买该服务。云计算用户只需要很少的管理手段或者与服务商间的交互,便能够快速完成计算资源的拓展和释放。
根据云服务提供资源的类型不同,云计算服务模式分类软件即服务(SaaS)、平台即服务(PaaS)以及基础设备即服务(IaaS)三类。
全球云计算服务市场规模分析预测
公共云服务市场将继续呈现出高速发展态势,并一直持续至2018年,2017年全球云服务市场规模达2602亿美元,同比增长18.5%。这种强劲的发展未来几年云服务市场仍将保持较高的增长率。云服务呈现出的这种强劲发展势头有望在未来5到7年内仍然保持下去,并预计到2020年时,全球云计算市场的规模将达到4114亿美元。势头反映了人们从传统IT服务向云端服务的转变,因为企业越来越倾向于追求数字化商业战略。
2017年云应用服务(SaaS)也实现年增长21.6%,达到586亿美元;云管理和安全服务的增长率达到22.5%,云应用基础架构服务(PaaS)也表现出强劲的发展势头,达到26.7%的增长率。
中国云计算整体市场规模分析预测
据前瞻产业研究院发布的《云计算产业发展前景与投资战略规划分析报告》最新统计数据显示,2016年中国云计算整体市场规模达到514.9亿元,整体增速为35.9,高于全球平均水平。其中,公有云服务市场整体规模为170.1亿元,同比增长66%,预计2017-2020年中国公有云市场将持续高速增长,到2020年市场规模将达到603.6亿元。
在私有云市场方面,2016年中国私有云市场规模达到344.8亿元,增长率为25.1%,预计2018年市场规模将达到520.3亿元,增长率为22.3%。
云计算企业将强化云生态体系建设
各巨头正纷纷打造以“我”为主的云生态,强化对云计算行业的掌控力。阿里云推动云合计划,计划招募1万家云服务商,共同构建生态体系,为企业、政府等用户提供一站式云服务。
云生态将可能成为云计算行业竞争力的标志,2017年,各厂家将实质性推动云生态建设,也将有更多云计算企业启动云生态战略。
价格战将加速云计算企业优胜劣汰
由国内外云计算巨头主导的价格战近年来持续上演,主要云计算厂商表示将跟随降价。降价有利于云计算更快普及,将加速中国云计算市场进化历程,同时也会直接影响云计算企业收入,可能加速产业洗牌速度。阿里云在2016年年中进行了17次产品价格下调,如此降价幅度,难免让中小云厂商倍感压力,甚至逐渐失去竞争力而遭到淘汰。以美国市场为例,主要云计算厂商推动的价格下降促使市场整合,在几轮降价之后,美国几十家云服务商变为当前的三家主导。2017年,伴随价格战的继续,云计算企业优胜劣汰将开始显现。
区块链相关云计算产品和服务将涌现
区块链技术和应用的开发、测试、部署较为复杂,门槛仍然较高。云计算具有资源弹性伸缩、成本低、可靠性高等优势,它与区块链结合,可以帮助企业快速低成本地开发部署区块链,促进区块链技术成熟,推动区块链从金融向更多领域拓展。随着区块链逐步走向应用,将有更多云计算企业推出区块链相关的产品和服务。
细分行业云服务将成为中小厂商生存之道
国际和国内云计算市场均呈现强者恒强的局面,但同时可以看到,各大巨头提供的云服务存在一定程度的同质化,而用户需求千差万别,呈现多样化,各大巨头无法满足各类用户的具体需求。随着云计算产业生态链不断完善,行业分工呈现细化趋势,从游戏云、政务云、医疗云,到2016年快速壮大的视频云,都体现出行业云的发展潜力。在云计算白热化的竞争态势下,中小厂商需要瞄准用户精细化需求,提供行业云等差异化云服务,以获得竞争优势。
容器技术应用将更为普及
容器服务具有部署速度快、开发和测试更敏捷、系统利用率高、资源成本低等优势,随着容器技术的成熟和接受度越来越高,容器技术将更加广泛地被用户采用。谷歌的Container
Engine,AWS的Elastic Container Service,微软的Azure Container
Service等容器技术日臻成熟,容器集群管理平台也更加完善,以Kubernetes为代表的各类工具可帮助用户实现网络、安全与存储功能的容器化转型。国内看,各家公司积极实践,用户对于容器技术的接受度得到提升,根据调研机构数据,近87%的用户表示考虑使用容器技术。
企业上云进程将进一步提速
在“互联网+”、《
中国制造2025》等一系列战略推动和企业自身转型升级迫切需求下,企业越来越重视信息技术的应用,而云计算无疑是企业更快部署信息化应用的“利器”,诸多行业企业成功上云已起到良好示范作用。国内云计算服务能力日臻完善,价格不断下降,为企业上云提供了较好条件。
⑼ 当下大数据发展的 8 个要点
作者 | 章剑锋
笔者从 2008 年开始工作到现在也有 11 个年头了,一路走来都在和数据打交道,做过大数据底层框架内核的开发(Hadoop,Pig,Tez,Spark,Livy),也做过上层大数据应用开发(写 MapRece Job 做 ETL ,用 Hive 做 Ad hocquery,用 Tableau 做数据可视化,用 R 做数据分析)。今天我想借此机会和大家聊聊我所理解的大数据现状和未来。
首先让我们来聊聊什么是大数据。大数据这个概念已经出来很多年了(超过10年),但一直没有一个准确的定义(也许也并不需要)。数据工程师(DataEngineer)对大数据的理解会更多从技术和系统的角度去理解,而数据分析人员(Data Analyst)对大数据理解会从产品的角度去理解,所以数据工程师(Data Engineer) 和数据分析人员(Data Analyst)所理解的大数据肯定是有差异的。我所理解的大数据是这样的,大数据不是单一的一种技术或者产品,它是所有与数据相关的综合学科。看大数据我会从 2 个维度来看,一个是数据流的维度(下图的水平轴),另外一个是技术栈的维度(下图的纵轴)。
其实我一直不太喜欢张口闭口讲“大数据”,我更喜欢说“数据”。因为大数据的本质在于“数据”,而不是“大”。由于媒体一直重点宣扬大数据的“大”,所以有时候我们往往会忽然大数据的本质在“数据”,而不是“大”,“大”只是你看到的表相,本质还是数据自身。
在我们讲清楚大数据的含义之后,我们来聊聊大数据目前到底处在一个什么样的位置。从历史发展的角度来看,每一项新技术都会经历下面这样一个技术成熟度曲线。
当一项新技术刚出来的时候人们会非常乐观,常常以为这项技术会给人类带来巨大的变革,对此持有过高的期望,所以这项技术一开始会以非常快的速度受到大家追捧,然后到达一个顶峰,之后人们开始认识到这项新技术并没有当初预想的那么具有革命性,然后会过于悲观,之后就会经历泡沫阶段。等沉寂一定阶段之后,人们开始回归理性,正视这项技术的价值,然后开始正确的应用这项技术,从此这项技术开始走向稳步向前发展的道路。(题外话,笔者在看这幅图的时候也联想到了一个男人对婚姻看法的曲线图,大家自己脑补)。
1、从大数据的历史来看,大数据已经经历了 2 个重要阶段
两个重要阶段是指过高期望的峰值和泡沫化的底谷期 。现在正处于稳步向前发展的阶段。我们可以从 googletrend 上 big data 的曲线就能印证。大数据大约从 2009 年开始走向人们的视野,在 2015 年左右走向了顶峰,然后慢慢走向下降通道(当然这张曲线并不会和上面这张技术成熟度曲线完全拟合,比如技术曲线处在下降通道有可能会使讨论这项技术的搜索量增加)。
接下来我想讲一下我对大数据领域未来趋势的几个判断。
2、数据规模会继续扩大,大数据将继续发扬光
前面已经提到过,大数据已经度过了过高期望的峰值和泡沫化的底谷期,现在正在稳步向前发展。做这样判断主要有以下 2 个原因:
上游数据规模会继续增长,特别是由于 IOT 技术的发展和成熟,以及未来 5G 技术的铺开。在可预测的未来,数据规模仍将继续快速增长,这是能够带动大数据持续稳定向前发展的基本动力。 下游数据产业还有很多发展的空间,还有很多数据的价值我们没有挖掘出来。虽然现在人工智能,区块链抢去了大数据的风口位置,也许大数据成不了未来的主角,但大数据也绝对不是跑龙套的,大数据仍将扮演一个重要而基础的角色。可以这么说,只要有数据在,大数据就永远不会过时。我想在大部分人的有生之年,我们都会见证大数据的持续向上发展。
3、数据的实时性需求将更加突出
之前大数据遇到的最大挑战在于数据规模大(所以大家会称之为“大数据”),经过工业界多年的努力和实践,规模大这个问题基本已经解决了。接下来几年,更大的挑战在于速度,也就是实时性。而大数据的实时性并不是指简单的传输数据或者处理数据的实时性,而是从端到端的实时,任何一个步骤速度慢了,就影响整个大数据系统的实时性。所以大数据的实时性,包括以下几个方面:
快速获取和传输数据 快速计算处理数据 实时可视化数据 在线机器学习,实时更新机器学习模型目前以 Kafka,Flink 为代表的流处理计算引擎已经为实时计算提供了坚实的底层技术支持,相信未来在实时可视化数据以及在线机器学习方面会有更多优秀的产品涌现出来。当大数据的实时性增强之后,在数据消费端会产生更多有价值的数据,从而形成一个更高效的数据闭环,促进整个数据流的良性发展。
4、大数据基础设施往云上迁移势不可挡
目前IT基础设施往云上迁移不再是一个大家还需要争论的问题,这是大势所趋。当然我这边说的云并不单单指公有云,也包括私有云,混合云。因为由于每个企业的业务属性不同,对数据安全性的要求不同,不可能把所有的大数据设施都部署在公有云上,但向云上迁移这是一个未来注定的选择。目前各大云厂商都提供了各种各样的大数据产品以满足各种用户需求,包括平台型(PAAS) 的 EMR ,服务型 (SAAS) 的数据可视化产品等等。大数据基础设施的云化对大数据技术和产品产生也有相应的影响。大数据领域的框架和产品将更加 Cloud Native 。
计算和存储的分离。我们知道每个公有云都有自己对应的分布式存储,比如 AWS 的 S3 。 S3 在一些场合可以替换我们所熟知的 HDFS ,而且成本更低。而 S3 的物理存储并不是在 EC2 上面,对 EC2 来说, S3 是 remote storage 。所以如果你要是 AWS 上面做大数据开发和应用,而且你的数据是在 S3 上,那么你就自然而然用到了计算和存储的分离。 拥抱容器,与 Kubernate 的整合大势所趋,我们知道在云环境中 Kuberneate 基本上已经是容器资源调度的标准。 更具有弹性(Elastic)。 与云上其他产品和服务整合更加紧密。5、大数据产品全链路化
全链路化是指提供端到端的全链路解决方案,而不是简单的堆积一些大数据产品组件。以 Hadoop 为代表的大数据产品一直被人诟病的主要问题就是用户使用门槛过高,二次开发成本太高。全链路化就是为了解决这一问题,用户需要的并不是 Hadoop,Spark,Flink 等这些技术,而是要以这些技术为基础的能解决业务问题的产品。 Cloudera 的从 Edge 到 AI 是我比较认同的方案。大数据的价值并不是数据本身,而是数据背后所隐藏的对业务有影响的信息和知识。下面是一张摘自 wikipedia 的经典数据金字塔的图。
大数据技术就是对最原始的数据进行不断处理加工提炼,金字塔每上去一层,对应的数据量会越小,同时对业务的影响价值会更大更快。而要从数据(Data) 最终提炼出智慧(Wisdom),数据要经过一条很长的数据流链路,没有一套完整的系统保证整条链路的高效运转是很难保证最终从数据中提炼出来有价值的东西的,所以大数据未来产品全链路化是另外一个大的趋势。
6、大数据技术往下游数据消费和应用端转移
上面讲到了大数据的全链路发展趋势,那么这条长长的数据链路目前的状况是如何,未来又会有什么样的趋势呢?
我的判断是未来大数据技术的创新和发力会更多的转移到下游数据消费和应用端。之前十多年大数据的发展主要集中在底层的框架,比如最开始引领大数据风潮的 Hadoop ,后来的计算引擎佼佼者 Spark,Flink 以及消息中间件 Kafka ,资源调度器 Kubernetes 等等,每个细分领域都涌现出了一系列优秀的产品。总的来说,在底层技术框架这块,大数据领域已经基本打好了基础,接下来要做的是如何利用这些技术为企业提供最佳用户体验的产品,以解决用户的实际业务问题,或者说未来大数据的侧重点将从底层走向上层。之前的大数据创新更偏向于 IAAS 和 PAAS ,未来你将看到更多 SAAS 类型的大数据产品和创新。从近期一些国外厂商的收购案例,我们可以略微看出一些端倪。1、2019 年 6 月 7 日,谷歌宣布以 26 亿美元收购了数据分析公司 Looker,并将该公司并入 Google Cloud。2、2019 年 6 月 10 日,Salesforce 宣布以 157 亿美元的全股票交易收购 Tableau ,旨在夯实在数据可视化以及帮助企业解读所使用和所积累的海量数据的其他工具方面的工作。3、2019 年 9 月初,Cloudera 宣布收购 Arcadia Data 。 Arcadia Data 是一家云原生 AI 驱动的商业智能实时分析厂商。面对最终用户的大数据产品将是未来大数据竞争的重点,我相信会未来大数据领域的创新也将来源于此,未来 5 年内大概率至少还会再出一个类似 Looker 这样的公司,但是很难再出一个类似 Spark 的计算引擎。
7、底层技术的集中化和上层应用的全面开花
学习过大数据的人都会感叹大数据领域的东西真是多,特别是底层技术,感觉学都学不来。经过多年的厮杀和竞争,很多优秀的产品已经脱颖而出,也有很多产品慢慢走向消亡。比如批处理领域的 Spark 引擎基本上已经成为批处理领域的佼佼者,传统的 MapRece 除了一些旧有的系统,基本不太可能会开发新的 MapRece 应用。 Flink 也基本上成为低延迟流处理领域的不二选择,原有的 Storm 系统也开始慢慢退出历史舞台。同样 Kafka 也在消息中间件领域基本上占据了垄断地位。未来的底层大数据生态圈中将不再有那么多的新的技术和框架,每个细分领域都将优胜劣汰,走向成熟,更加集中化。未来更大的创新将更多来来自上层应用或者全链路的整合方面。在大数据的上层应用方面未来将会迎来有更多的创新和发展,比如基于大数据上的BI产品, AI 产品等等,某个垂直领域的大数据应用等等,我相信未来我们会看到更多这方面的创新和发展。
8、开源闭源并驾齐驱
大数据领域并不是只有 Hadoop,Spark,Flink 等这类大家耳熟能详的开源产品,还有很多优秀的闭源产品,比如 AWS 上的 Redshift ,阿里的 MaxCompute 等等。这些产品虽然没有开源产品那么受开发者欢迎,但是他们对于很多非互联网企业来说是非常受欢迎的。因为对于一个企业来说,采用哪种大数据产品有很多因素需要考虑,否开源并不是唯一标准。产品是否稳定,是否有商业公司支持,是否足够安全,是否能和现有系统整合等等往往是某些企业更需要考虑的东西,而闭源产品往往在这类企业级产品特性上具有优势。
最近几年开源产品受公有云的影响非常大,公有云可以无偿享受开源的成果,抢走了开源产品背后的商业公司很多市场份额,所以最近很多开源产品背后的商业公司开始改变策略,有些甚至修改了 Licence 。不过我觉得公有云厂商不会杀死那些开源产品背后的商业公司,否则就是杀鸡取卵,杀死开源产品背后的商业公司,其实就是杀死开源产品的最大技术创新者,也就是杀死开源产品本身。我相信开源界和公有云厂商最终会取得一个平衡,开源仍然会是一个主流,仍然会是创新的主力,一些优秀的闭源产品同样也会占据一定的市场空间。
最后我想再次总结下本文的几个要点:
1、目前大数据已经度过了最火的峰值期和泡沫化的底谷期,现在正处于稳步向前发展的阶段。2、数据规模会继续扩大,大数据将继续发扬光大3、 数据的实时性需求将更加突出4、大数据基础设施往云上迁移势不可挡5、大数据产品全链路化6、大数据技术往下游数据消费和应用端转移7、底层技术的集中化和上层应用的全面开花8、开源闭源并驾齐驱
⑽ 区块链究竟是什么
什么是区块链?
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 [1] 。
区块链(Blockchain)是比特币的一个重要概念,它本质上是一个去中心化的数据库,同时作为比特币的底层技术。区块链是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一次比特币网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。
区块链诞生自中本聪的比特币,自2009年以来,出现了各种各样的类比特币的数字货币,都是基于公有区块链的。
数字货币的现状是百花齐放,列出一些常见的:bitcoin、litecoin、dogecoin、dashcoin,除了货币的应用之外,还有各种衍生应用,如Ethereum、Asch等底层应用开发平台以及NXT,SIA,比特股,MaidSafe,Ripple等行业应用。
2016年1月20日,中国人民银行数字货币研讨会宣布对数字货币研究取得阶段性成果。会议肯定了数字货币在降低传统货币发行等方面的价值,并表示央行在探索发行数字货币。中国人民银行数字货币研讨会的表达大大增强了数字货币行业信心。这是继2013年12月5日央行五部委发布关于防范比特币风险的通知之后,第一次对数字货币表示明确的态度。 [4]
2016年12月20日,数字货币联盟——中国FinTech数字货币联盟及FinTech研究院正式筹建,火币是联合发起单位之一。 [5]
可以用区块链的一些领域可以是:
▪ 智能合约
▪ 证券交易
▪ 电子商务
▪ 物联网
▪ 社交通讯
▪ 文件存储
▪ 存在性证明
▪ 身份验证
▪ 股权众筹
我们可以把区块链的发展类比互联网本身的发展,未来会在internet上形成一个比如叫做finance-internet的东西,而这个东西就是基于区块链,它的前驱就是bitcoin,即传统金融从私有链、行业链出发(局域网),bitcoin系列从公有链(广域网)出发,都表达了同一种概念——数字资产(DigitalAsset),最终向一个中间平衡点收敛。
区块链的进化方式是:
▪ 区块链1.0——数字货币
▪ 区块链2.0——数字资产与智能合约
▪ 区块链3.0——各种行业分布式应用落地
区块链分为三类,在货币发行的《区块链:定义未来金融与经济新格局》 [2] 一书中就有详细介绍,
其中混合区块链和私有区块链可以认为是广义的私链:
公有区块链(PublicBlockChains)
公有区块链是指:世界上任何个体或者团体都可以发送交易,且交易能够获得该区块链的有效确认,任何人都可以参与其共识过程。公有区块链是最早的区块链,也是应用最广泛的区块链,各大bitcoins系列的虚拟数字货币均基于公有区块链,世界上有且仅有一条该币种对应的区块链。
联合(行业)区块链(ConsortiumBlockChains)
行业区块链:由某个群体内部指定多个预选的节点为记账人,每个块的生成由所有的预选节点共同决定(预选节点参与共识过程),其他接入节点可以参与交易,但不过问记账过程(本质上还是托管记账,只是变成分布式记账,预选节点的多少,如何决定每个块的记账者成为该区块链的主要风险点),其他任何人可以通过该区块链开放的API进行限定查询。
私有区块链(privateBlockChains)
私有区块链:仅仅使用区块链的总账技术进行记账,可以是一个公司,也可以是个人,独享该区块链的写入权限,本链与其他的分布式存储方案没有太大区别。(Dec2015)保守的巨头(传统金融)都是想实验尝试私有区块链,而公链的应用例如bitcoin已经工业化,私链的应用产品还在摸索当中。