探索财经奥秘,指引财富未来

Terrium跳入湖边水域,但并非所有人都相信

admin 2024-05-25 13:43:48

凭借统一企业数据仓库的愿景,Teradata吸引了包括汇丰银行、联合利华和沃尔玛在内的全球主导客户.

但本月早些时候,它确认了对湖屋概念的支持,该概念结合了混乱的数据湖和结构化数据仓库,以及随时随地分析的想法,由对象存储和开放表格格式支持.

尽管它的出手可能是被迫的,但观察人士指出,Teradata的主流高性能、基于块存储的分析仍然有一席之地.

这家拥有45年历史的公司此前宣布支持开放表格格式(OTF)阿帕奇冰山和Linux Foundation Delta Lake.

在这样做的过程中,它顺应了一种行业趋势,即在现场对数据进行分析,而不是将数据转移到一家商店进行商业智能和其他分析.

Teradata还首次赞许地谈到了湖屋体系结构,这是竞争对手Databricks引入的一个术语,用来描述机器学习和数据探索的环境,以及传统的商业智能和分析通常在更严密的企业数据仓库环境中进行.

Teradata声称,人工智能的采用将数据仓库、分析和数据科学工作负载整合到了统一的湖库中.

“OTF支持进一步增强了Teradata的湖库能力,提供了一个设计灵活、经济高效且易于使用的存储抽象层,”该公司在一封企业信函中表示.

Teradata工程研究员路易斯·兰德里在接受The Register采访时表示,对OTF的支持并不意味着该公司不再相信企业数据仓库.

他告诉我们,“这是互补的.

”“我们认为,我们需要能够在数据所在的地方播放数据.

在许多情况下,这将意味着高效的块存储,以实现低延迟和所有这类好东西.

但在许多情况下,这并不是数据的布局方式.

不同的客户有不同的需求.

我们的目标始终是确保他们从集成的数据中获得最大的价值.

“,他说,数据仓库和湖屋的想法不仅仅是技术,而是架构,客户可以选择适合他们的方法.

”这意味着继续提供我们围绕高吞吐量工作所做的服务级别,这些工作实际上只能从块存储中获得服务.

但我们也需要能够处理位于对象存储或某种外部存储中的数据,这样我们才能提供一个整体的、单一的视图,了解哪些可用,哪些可访问,哪些安全,以及人们对Teradata系统的所有期望.

自2020年以来,Teradata一直在对其主数据仓库外部的数据进行分析,当时它更新了Teradata QueryGrid,并与StarBurst Data合作集成了Presto连接器,以便Teradata的Vantage分析平台的用户可以访问和查询各种云和本地数据源.

但它坚称,它不会支持湖边小屋的概念.

在2022年接受The Register采访时,时任CTO Stephen Brobst表示,数据湖和数据仓库是统一架构的一部分,但是离散的概念.

虽然Teradata在2022年8月推出了自己的数据湖,但Brobst表示,企业将原始数据放置在哪里和数据仓库之间存在着重要区别,数据仓库优化了查询性能并控制了治理.

创建一个混合型湖屋“实际上并不是很有用,因为你不想拥有超过所需的数据副本.

”兰德里说,他和今年1月离开Teradata的Brobst“在我任职的十年里一直很有趣,一直在讨论各种想法.

”他说,“我不认为我们在方法上改变了主意.

技术行业在发展,我们的目标是为我们的客户提供尽可能好的集成数据解决方案.

这并不是什么新鲜事,我们在过去的几年里才开始致力于这一点.

”然而,一位不愿透露姓名的经验丰富的Teradata支持工程师告诉The Register,他担心公司已经迷失了方向.

他说:“无论他们喜欢与否,无论他们是真心的,Teradata都必须支持这匹马.

”这位消息人士指出,在十多年前的大数据热潮中,Teradata最初拒绝使用Hadoop,然后采用了使用Hadoop的趋势.

与此同时,拥有数据仓库和数据湖系统的云供应商--特别是谷歌和微软--正在开“空白支票”,试图吸引Teradata最大的客户使用他们的系统.

他说,尽管Teradata在用户并发性和查询优化方面可能拥有卓越的数据仓库产品,但客户对简化的解决方案越来越满意,只要它能让他们上云.

同时,使用对象存储和OTF可能不会提高效率,但它会让用户处于主导地位,他说.

他说,人们基本上是在说,‘我不在乎你叫它湖边小屋还是别的什么.

’他们说我们只是想把我们的数据转储到对象存储中,然后下一步我们想要在它所在的地方处理它.

然后他们想要一个任何人都可以使用的覆盖,这样它就不是对象存储中的专有格式.

我认为这给所有的供应商带来了很大的麻烦.

让我们选择冰山作为获胜者…这意味着你的数据现在以一种开放的格式存储在你能得到的最便宜的存储中.

从最终用户的角度来看,这是一个赢家.

“,Amalgam Insights首席执行官兼首席分析师Hyoun Park同意Teradata在采用湖屋概念和OTF方面是被迫的,但他表示,客户仍然看重高性能的数据仓库系统.

”Teradata被迫接受数据湖屋概念,因为数据湖和非结构化数据在人工智能和机器学习中的重要性.

Teradata仍然是数据仓库的首选,尽管他们当然必须应对Snowflake在那里的侵略性.

但是,没有人真的怀疑Teradata能够支持高质量的企业数据仓库.

Park说,企业数据仓库仍然是一个“卓越的概念”,但问题是,企业预期支持的数据/分析应用程序的数量已经迅速扩大.

“数据仓库在企业中总是有一席之地,支持你的前50个应用程序,因为你想要一个高性能的数据存储来尽可能快地支持分析,而数据仓库是实现这一点的最佳方式.

”然而,挑战是,目前收入超过10亿美元的企业通常拥有超过1000个应用程序.

仅仅是将这些其他应用程序引入数据仓库的努力就会造成严重后果.

如果你想把这些数据用于从分析到人工智能的任何事情,你必须把剩下的数据放在某个地方,所以这就是数据湖的用武之地.

这是这种两层模式的推动力.

数据依赖型应用的扩展--如机器学习和人工智能--以及云计算和对象存储的引入,已经融合在一起,改变了企业数据管理和分析环境.

雪花通过分离存储和计算来颠覆一切,而Databricks将SQL式的BI工作负载附加到其数据湖机器学习环境中.

数据湖公司Cloudera和无头数据仓库供应商Tablular都对市场有不同的看法,强大的云平台提供商也是如此,它们同样声称提供了一套无所不包的数据产品套件.

Teradata能否在这个复杂多变的市场中蓬勃发展仍不明朗.