您当前的位置:首页 > 互联网百科 > 大数据

如何释放非结构化数据的价值?

时间:2021-04-20 10:19:35  来源:雷锋网  作者:

人们正在从不断产生的数据中挖掘着价值,作为新的生产要素,数据量越大将代表着人工智能将越智能。

因此,人们渴望从大量的数据中挖掘出价值,在此前,对于数据潜能的挖掘的最大限制就是算力,而现如今,存储日益成为一大限制因素。

随着非机构化数据的的不断涌现,存储这一限制则越发明显,而据Gartner数据显示,目前全世界80%的数据是非结构化数据;同样,IDC也预测,截至到2023年,文件和对象数据的容量将增长3倍,且90%的新企业的应用将是基于云原生设计的。

而这也就对非结构化数据的存储、使用和管理提出了更高要求,同时也对存储基础设施的性能和可扩展性提出了前所未有的挑战。

给企业用户提供一个高效、高可用、高可靠的存储产品,则成为了存储厂商发力的重点。

 

对象存储成为企业“新宠”

“今天的非结构化数据可谓‘无处不在’”。

在戴尔科技集团大中华区非结构化数据存储事业部技术总监胡渊汶看来,企业和机构的非结构化数据主要就有三大部分:

  • 一是IT部门管理的数据,包括文件共享,主目录,文件档案库,甚至包括视频监控;

  • 二是行业应用的数据,包括媒体里面有4K编辑、播出系统和媒资系统,生命科学有基因测序分析、石油能源、气象、地震的高性能计算,EDA、ADAS(汽车自动驾驶辅助系统),银行影像系统等等;

  • 三是大量的新兴业务产生的数据,特别是随着企业采用新的应用架构、微服务、容器等技术,传统的存储解决方案和数据库无法提供这些新应用和新架构所需的简易性和灵活性。

在这一背景下,对象存储由于主要操作对象是对象(Object),它既能够像块存储一样高效检索,又能像文件存储一样极致扩展,结合了块和文件存储的优势,受到了市场不断的认可。其存储协议,也是大家熟知的S3、Swift等。

如何释放非结构化数据的价值?

戴尔科技集团大中华区非结构化数据存储事业部技术总监胡渊汶

胡渊汶表示:“对象存储由于其具有高扩展性和易管理的特性,作为企业存储战略的关键元素,对象存储已经成为更多企业在数字化转型中的第一选择。”

同时,越来越多的公有云厂商把对象存储当做“云存储”在售卖。

但在实际应用中,虽然公有云的对象存储服务有其优势,但考虑到安全合规以及带宽成本等问题,企业倾向于部署企业私有的对象存储方案。

胡渊汶介绍说,在企业私有化部署场景中,对象存储主要有两类用法,一类是面向传统场景提供归档存储。另外一类,面向现代化的应用程序,比如互联网大数据分析、AI等场景,比如云原生架构这类负载。

第一类用法利用的是对象存储低成本以及写入少读取多(WORM)的特性;第二类主要利用其高扩展性和高灵活性的优点,更为关键的是,就是其存储协议支持S3,而大多数现代化应用和云原生应用都能够兼容S3,这就让对象存储有了更多的“用武之地”。

此外,为了克服对象存储性能上的不足,业内近几年来开始尝试用全闪存来提升性能,性能型的对象存储成为趋势后,应用场景将进一步扩大。

 

企业需要什么样的对象存储产品?

 

当前,对象存储越来越快的走入到了企业的应用场景之中,并在各个方面担当“重任”。

随着非结构数据呈现指数级的增长,对于面向企业的对象存储产品提供了更多更高的要求。

基于对企业用户的需求,戴尔科技集团更新了旗下的企业级对象存储平台——戴尔易安信ECS。

据胡渊汶介绍,ECS采用横向扩展式架构,在容量、对象数量、文件规模或节点数量等方面无限制,因此无论行业客户的数据中心位于何处,都可以轻松跟上指数级数据增长的步伐,同时也只需以类似于公有云的规模添加新节点和支持工作负载,就能同时实现私有云基础架构的可靠性和控制。

由此也实现了更好的TCO成本,数据显示,与行业领先的公有云提供商相比,通过ECS构建一个对象存储云,总拥有成本可降低59.5%。

如何释放非结构化数据的价值?

同时,它还具备全球可访问能力,支持8个站点的虚拟数据中心的联合;此外,ECS采用Active-active架构,支持XOR等能力,也带来更加简化的管理;ECS还能充当二级存储,为关键业务应用释放昂贵的主存储资源。

在存储协议方面,ECS支持包括S3、NFS、SMB、CIFS、Swift、CAS、ATMOS、HDFS等多协议,同时也能通过RESTful API来支持云原生的应用,这样就能适应目前企业往云原生转型的趋势;更为关键的是,多协议支持和良好的互操作性,企业也可以借助ECS构建现代数据湖,进而通过数据湖实现Splunk分析,以及流数据分析存储等能力。

在数据安全保护方面,ECS内置了数据保护功能,具有静态数据加密、纠删码、三重镜像等功能,能够使得存储平台安全性增强,同时还新增了更多的安全能力,包括支持新的安全管理员角色,能够将特定的使用权和特权授予安全管理员;提供了新的安全API,不仅方便自动化地报告安全设置,同时企业也能将ECS整合到已有的安全解决方案中;此外,也支持外部的密匙管理器,帮助企业满足合规要求。

在部署方面,ECS支持软件定义模式部署,也可以通过一体机这种“交钥匙”的方式部署,同时服务供应商也能通过ECS提供相应的部署,灵活的部署方式,可以让企业拥有更好的可扩展性、性能、弹性和经济性,真正满足了企业现代化应用的需求。

除此之外,ECS还能够定制元数据,内置元数据搜索功能,可以支持多达30个元数据字段,不但可以快速轻松定位数据,也能支持元数据更加精细的搜索。

值得注意的是,ECS还具有强一致性的多站点访问能力,能够通过全局命名空间,让任意数据可以在任意站点进行读写,支持应用访问无缝切换。

“ECS的多站点和强一致性能力,能够给前端业务带来很大的便利性,不需要处理很复杂的一致性的关系,就能实现数据的完整性、数据一致性的保证。”戴尔科技集团大中华区非结构化数据存储事业部资深系统工程师白光茁说到。

 

对象存储如何实践应用?

 

随着云原生相关理念的逐步升温,越来越多的企业都将目光瞄向了对象存储。

据IDC《2020年Q2,中国软件定义存储及超融合存储系统市场季度跟踪报告》显示,SDS在2020年上半年较去年同期实现38.3%增长,其中对象存储出货比例增长46%,超过软件定义存储市场总体增长率,对象存储是存储市场增长的新动力。

这表明着越来越多的企业都开始选择使用对象存储,据胡渊汶介绍,海通证券利用ECS对象存储的扩展性建立了存储资源池,不仅降低了初期成本投入和TCO ,还解决了传统磁带库性能低下、可靠性不足等问题,同时还获得了数据全生命周期管理能力,更为后续在业务中融入人工智能等技术做好了准备。

如何释放非结构化数据的价值?

胡渊汶认为,企业在对旧的定制应用系统做现代化改造时,最好的做法是改变应用使用存储的方式。

因为基于NAS文件存储来开发传统应用的体系其实非常复杂,有几个应用就需要对应有几套文件系统,甚至还有五花八门的专有API,这导致应用开发和存储管理的成本都很高。而且,许多应用都只能本地使用,无法以Web应用和移动应用方式来访问,非常不现代化。

现代化的云原生应用中直接使用对象存储来存储数据,数据绕过Web服务器,直接通过API存取数据到对象存储,开发过程简化。而且对象存储的管理成本很低,一个人就能轻松管理PB级的数据。配合对象存储,云原生架构会使得企业软件的开发迭代速度变得非常快。

从胡渊汶的介绍中了解到,国内某大型商业银行的手机银行有许多新应用需要大量频繁迭代,于是,该银行逐步把这部分业务转型为云原生业务,底层存储中采用了ECS,存放着超过100亿个对象,每天大概要接受2亿左右的请求,在ECS之上部署了200多个应用。

该银行的应用开发部署的节奏明显加快,最多一个季度上线了50个应用这在以前是不可想象的,这是云原生架构以及对象存储技术的价值体现。(雷锋网雷锋网雷锋网)



Tags:非结构化数据   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,如有任何标注错误或版权侵犯请与我们联系(Email:2595517585@qq.com),我们将及时更正、删除,谢谢。
▌相关推荐
人们正在从不断产生的数据中挖掘着价值,作为新的生产要素,数据量越大将代表着人工智能将越智能。因此,人们渴望从大量的数据中挖掘出价值,在此前,对于数据潜能的挖掘的最大限制就...【详细内容】
2021-04-20  Tags: 非结构化数据  点击:(106)  评论:(0)  加入收藏
结构化数据和非结构化数据是大数据的两种类型,这两者之间并不存在真正的冲突。客户如何选择不是基于数据结构,而是基于使用它们的应用程序:关系数据库用于结构化数据,大多数其他...【详细内容】
2019-08-08  Tags: 非结构化数据  点击:(180)  评论:(0)  加入收藏
▌简易百科推荐
张欣安科瑞电气股份有限公司 上海嘉定 201801 摘要:随着电力行业各系统接入,海量数据涌现,如何利用电网信息化中大量数据,对客户需求进行判断分析,服务于营销链条,提升企业市场竞...【详细内容】
2021-12-14  安科瑞张欣    Tags:大数据   点击:(9)  评论:(0)  加入收藏
1、什么是数据分析结合分析工具,运用数据分析思维,分析庞杂数据信息,为业务赋能。 2、数据分析师工作的核心流程:(1)界定问题:明确具体问题是什么;●what 发生了什么(是什么)●why 为...【详细内容】
2021-12-01  逆风北极光    Tags:大数据   点击:(25)  评论:(0)  加入收藏
在实际工作中,我们经常需要整理各个业务部门发来的数据。不仅分散,而且数据量大、格式多。单是从不同地方汇总整理这些原始数据就花了大量的时间,更不用说还要把有效的数据收集...【详细内容】
2021-11-30  百数    Tags:数据   点击:(21)  评论:(0)  加入收藏
数据作为新的生产要素,其蕴含的价值日益凸显,而安全问题却愈发突出。密码技术,是实现数据安全最经济、最有效、最可靠的手段,对数据进行加密,并结合有效的密钥保护手段,可在开放环...【详细内容】
2021-11-26  炼石网络    Tags:数据存储   点击:(17)  评论:(0)  加入收藏
导读:网易大数据平台的底层数据查询引擎,选用了Impala作为OLAP查询引擎,不但支撑了网易大数据的交互式查询与自助分析,还为外部客户提供了商业化的产品与服务。今天将为大家分享...【详细内容】
2021-11-26  DataFunTalk    Tags:大数据   点击:(15)  评论:(0)  加入收藏
导读:数据挖掘是一种发现知识的手段。数据挖掘要求数据分析师通过合理的方法,从数据中获取与挖掘项目相关的知识。作者:赵仁乾 田建中 叶本华 常国珍来源:华章科技数据挖掘是一...【详细内容】
2021-11-23  华章科技  今日头条  Tags:数据挖掘   点击:(20)  评论:(0)  加入收藏
今天再给大家分享一个不错的可视化大屏分析平台模板DataColour。 data-colour 可视化分析平台采用前后端分离模式,后端架构设计采用微服务架构模式。 前端技术:Angularjs、Jq...【详细内容】
2021-11-04  web前端进阶    Tags:DashboardClient   点击:(39)  评论:(0)  加入收藏
在Kubernetes已经成了事实上的容器编排标准之下,微服务的部署变得非常容易。但随着微服务规模的扩大,服务治理带来的挑战也会越来越大。在这样的背景下出现了服务可观测性(obs...【详细内容】
2021-11-02  大数据推荐杂谈    Tags:Prometheus   点击:(40)  评论:(0)  加入收藏
同一产品对老客户的要价竟然比新客户要高?这是当下“大数据杀熟”的直接结果。近年来,随着平台经济的蓬勃发展,大数据在为用户服务之外,也引发了多种不合理现象。为了有效遏制“...【详细内容】
2021-10-29    海外网   Tags:大数据   点击:(31)  评论:(0)  加入收藏
本人03年开始从事贸易行业,多年来一直致力于外贸获客和跨境电商选品等领域,最近有些小伙伴反馈海关数据演示的都挺好为啥用起来不是那么回事?大家看到数据时关注的有产品、采购...【详细内容】
2021-10-28  QD云龙    Tags:数据   点击:(33)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条