IoT Spotlight - EP 156 - How do you manage petaflops of IoT data - Matan Libis, VP of Product, SQream

播客 > Ep. 156 - How do you manage petaflops of IoT data

Ep. 156

How do you manage petaflops of IoT data

Matan Libis, VP of Product, SQream

Monday, December 19, 2022

在这一集中，我们采访了 SQream 的产品副总裁Matan Libis 。 SQream 提供了一个分析平台，可以最大限度地减少本地和云端对时间敏感的数据的总洞察时间 (TTTI)。

在本次演讲中，我们讨论了现代数据库架构对于从 petaflops 数据中提取洞察力的价值。我们还探索了将传统数据仓库与数据湖合并为湖屋，在湖屋中查询大量数据而无需复制到仓库。

关键问题：

管理 peta 级数据集的独特架构要求是什么？
制造业、电信业和银行业的数据管理要求有何不同？
数据湖、仓库和 Lakehouse 之间有什么区别？

音频文字.

Erik：Matan，感谢您今天加入我们的播客。

马坦：谢谢你邀请我。

埃里克：好吧。我真的很期待你在这里指导我。这有点技术性，比我通常在播客上主持的话题更具技术性。通常，我们更关注最终用户应用程序。在这里，我们真正要讨论的是如何管理数据的基础架构。所以，我期待着摆脱困境。

Matan：是的，我们会努力让它变得有趣。

埃里克：我很想从更多地了解你自己开始。我的意思是，你不是我们在播客上最年长的人，但你在过去的 10 年、15 年里积累了丰富的经验，包括——我不知道你是否是创始人但是，至少，您最终成为了一家在加入 SQream 前几年被收购的公司的首席执行官。您能否谈谈其中的一些亮点，是什么让您今天担任 SQream 产品副总裁的职位？

马坦：好的。所以，我们将从头开始。我是马坦。我认为我在 SQream 担任产品副总裁将近八个月，实际上感觉时间更长，因为我们非常忙。在那之前，我来自一个完全不同的领域，专注于 AR，增强现实，这几天被大肆宣传。但我们更关注技术方面，关注 3D 和计算机视觉技术。正如你提到的，我什至有机会成为一家以色列初创公司的首席执行官，该公司从早期阶段就开始开发增强现实的基础设施，顺便说一下，当时从制造车间开发物联网用例。

2019年，我很高兴带领公司成功并购一家美国公司。然后，我在那家公司工作了两年，起初是以色列办事处。但最后，我负责管理整个研发团队。所以，我有机会在我的职业生涯中扮演不同的角色。在此之前，我其实在教育领域有自己的创业公司。我有机会把它带到美国市场。我实际上搬到了美国市场几个月。它在教育领域。所以，我从美国各地的校园出发，试图把它带进来。我必须从那个时候学到很多东西。所以，这是背景。

你问到是什么让我加入了 SQream。首先，我对公司面临的挑战很感兴趣，仍然面临。我确定我们会进一步讨论。从本地迁移到云端，并将技术堆栈带入一个新领域是非常具有挑战性和非常有趣的。就我个人而言，我喜欢这种挑战。另外，我不想被困在同一个空间里。多年来，我一直在增强现实中。我想提高自己和世界其他地方，我可以处理其他技术，我可以学到更多的其他空间。我很高兴我做了这个改变。我在 SQream 的产品团队中有一支很棒的团队。每天去办公室超级有趣，我学到了很多东西。我很高兴我有一个舞台或一个地方可以分享我在过去八个月中学到的东西。

埃里克：太棒了。好吧，让我们进入您正在处理的技术主题。对于一部分观众来说，描述 SQream 最简单的方式可能是它是 Snowflake 的竞争对手。所以，这对观众中的一些人来说直观上是有意义的。您网站上的标题是洞察任何规模数据的最快时间。它是一种用于将原始数据转化为洞察力的数据库基础设施。这是我们可以考虑的另一种方式。您如何描述您所在的领域？

Matan：我会尝试采用较少的技术方法，然后我们可以跳入技术性更强的方法。正如您提到的，SQream 实际上允许公司从其数据中获得答案并获得业务洞察力，了解它无法实现的地方。因为我们会在其他玩家无法处理数据量的地方大放异彩。很明显，我说的是 SaaS。这就是我们卖的。我们卖性能。这始终是这里的关键。但不仅如此。我们允许我们的客户处理他们的数据。我们通常在一个数据上面发光。这对我们来说非常独特。我们实际上是在使用 GPU。稍后，我们可以谈谈技术堆栈。我们正在利用 GPU 来更快地了解更多数据。这就是我们带来的。

埃里克：是的，我们肯定要深入研究技术堆栈以及为什么你能够区分，以及这些围绕海量数据的用例。但也许我们可以先从用例的角度来介绍它们。那么，传统数据库或流式数据库无法服务的场景有哪些？

Matan：首先，我们讨论的是您希望从中获得洞察力的数据量。我们的顶级客户的主要用例之一，我们谈论的是他们在 SQream 上管理 10 PB 的原始数据。这些数字太疯狂了。我们谈论的是每天有 100 TB 的数据被摄入 SQream，超过 100 名数据工程师正在询问，每小时超过 9,500 个查询，这些数字。当我们谈论规模时，这就是规模。这不仅仅是购买更多存储空间。能够真正获得洞察力并能够执行非常复杂的查询和复杂的连接，这是我们感到舒服的地方。这就是为什么我们的大多数客户都是企业客户。因为，通常，我们更适合拥有大量数据的公司。同样，我们谈论的不止一个数据。这是我们通常感到舒服的地方。

埃里克：好的。需要这样做的场景是什么？我们是在谈论管理飞机、来自飞机引擎的数据吗？我们是在谈论非常庞大的车辆或制造厂资产车队网络吗？您将产生 10 petaflops 的场景是什么？

Matan：让我们谈谈两个用例。第一个，让我们从制造领域开始，这是一个非常物联网的用例。在制造车间，所有公司都希望能够——他们对制造商的梦想是使用他们收集的所有数据来预测机器故障或设备故障，防患于未然。这是简单的肉。每个人都在谈论物联网以及有多少传感器一直在收集所有数据。但我觉得没有足够多的人在谈论，“好吧。我们将如何处理数据？我们将如何获得洞察力？”

因此，在那个用例中，对于制造商来说，他们在生产线上，在地板上，有很多传感器。他们试图通过这个过程检测很多东西。然后，正如我提到的，他们正在尝试处理数据。他们正在 SQream 之上构建机器学习模块，以便再次获得机器故障或设备故障预测。这很常见。我们在很多制造商中都看到了它，但我们也在电信公司中看到了它。例如，他们希望能够预测很多网络故障。所以，这是一个非常物联网的用例。顺便说一句，这是我们最常见的用例之一。我们的大客户，这就是他们所追求的。我们看到他们将其扩展并将其带入越来越多的工厂，并将此用例扩展到越来越多的生产线，因为他们从中获得了很多价值。我们都能理解。对于大型制造商来说，能够预测错误或生产线问题，对他们来说是非常值得的。所以，我很高兴我们能够为我们的客户带来这种价值。

关于第二个用例，让我们谈谈电信。我们有客户，他们希望收集所有关于他们的用户和客户的数据——他们在电话上花费了多长时间，或者他们发送了多少条短信，所有这些用户数据。在 SQream 之前，他们可以看六个月。他们分析和查询了六个月的数据。和我们一起，他们可以做两年。

通常，来参加家庭聚餐时，人们会问我，“好吧。你是做什么的？”我想，“我在这家名为 SQream 的公司工作”，这已经很奇怪了。他们试图理解。我们是关系数据库。它并没有变得更容易。然后我总是展示这个用例。我们允许公司在他们想做的任何地方提出更大的问题。如果他们只能分析六个月的数据，现在他们可以做得更多。这就是我们带来的价值。

埃里克：好的。好吧，我认为这是一个很好的深入研究和了解更多的方法。因为从我的角度来看，我会说，你有六个月的数据。你有两年的数据。你有 4 倍的数据。感觉这不应该是一个巨大的跳跃。或者如果你想处理四倍多的数据，也许你只是以某种方式减少变量的数量。但这听起来像是功能方面的一步改变。为什么会有阶跃变化？为什么仅仅通过在网络中添加更多的处理，另一个数据库就无法管理这两年的数据？

Matan：所以，你得到了更多。事实上，这一切都与内存和更多类似的东西有关，你收集这些数据的事实，以及 SQream 可以在存储之间分离以进行计算的事实，并且可以在一个独立的地方和另一个实际允许的地方扩展它们那。

因为在存储方面，你会认为你可以买越来越多的存储。但这并不意味着您将能够管理该存储。总之，您将能够深入了解您的问题或疑问。这是变化真正开始的地方。我们的价值主张不仅仅取决于我们可以处理的数据量。正如我所提到的，这也是关于独立扩展存储和计算的机会。我们能够支持复杂的查询，如多重连接、存储和聚合。

很明显，到最后大家都在讲性价比。这不仅仅是为了获得最佳性能。您希望以合理的成本获得它们。这一直是我们玩的游戏。我会去市场。我再次提到了企业。它总是以 POC 开头。我们的客户总是想自己尝试。我们总是从 POC 开始，他们实际上开始在自己身上进行测试。他们可以看到他们可以从中获得的价值。

埃里克：是的，您的网站上有一些性能指标将 SQream 与 Snowflake 和 Redshift 进行比较。你所拥有的数字，粗略地说，我会说在摄取时间和查询时间方面有 8 到 10 倍的改进。然后在总成本方面也有 8 倍、9 倍的改进。这些将如何计算？为了得出这些基准，您将测量哪些变量？

Matan：正如我所提到的，如果我们谈论的是传统仓库，那么获得洞察力的总时间是从摄取数据开始的。之后，我们将讨论未来。我们也会看看我们将如何解决这个问题。但实际上，首先是摄取到仓库的时间，然后才是查询。在您已经获取数据之后，现在您想要查询它。因此，这是您获得问题的答案、查询的答案以及与之相关的成本所花费的时间。我们正在谈论存储。我们谈论的是云计算，以及与之相关的一切。

因此，这就是我们衡量获得洞察力的总时间的方式，这是与其他人相比的基准。我们采用相同的数据集，相同的查询。我们正在做同样的过程。我们摄取相同的数据，然后尝试查询它。我们看到花了多少时间以及花费了我们多少。另一个价值主张是，因为我们正在使用 GPU，所以我们需要更少的物理硬件，这实际上会导致更小的碳足迹。这是，我知道，人们并不总是谈论它。但这对于一类客户来说是非常大的。如果他们没有足够的空间来放置他们需要的所有硬件，使用我们，他们需要更少的空间来放置他们的计算和存储。

埃里克：这是一个有趣的观点。所以，你在 GPU 上运行而不是 CPU。是这样吗？

Matan：首先，我们正在使用 GPU。这并不意味着我们不使用 CPU。我们只是确保在 GPU 上进行正确的计算。顺便说一下GPU的原因，GPU针对同时执行多个简单的操作和任务进行了优化。这实际上就是大数据分析的工作原理，存储表，聚合。正如我提到的，不仅是 GPU，而且我们正在卸载大部分复杂任务以获得最佳性能。

埃里克：明白了。现在，您是在运行自己的数据库，还是总是在 Azure、AWS 或其他提供商上构建？

Matan：我们总是运行自己的数据库，但如果我们谈论的是内部部署，我们会与供应商建立合作伙伴关系。直到不久前，我们还是一个非常传统的本地数据仓库。正如我提到的，我们已经从存储中分离出来。因此，我们有很多合作伙伴，例如 Hitachi 和 Weka，它们实际上在为我们的客户提供存储。

如果我们谈论的是云部署，是的，我们就是所谓的多云。我们可以做所有大型云提供商——GCP、AWS——甚至刚刚与 Oracle 的 OCI 建立了合作伙伴关系。因此，这实际上取决于用例和客户。我们尽量保持不可知论。

埃里克：好的。知道了。你可以看到，我将继续用这些无知的问题来刺激你。

马坦：没关系。

埃里克：这是我在这里的角色。最后，我的目标是让我理解这一点。然后，希望我们的听众也能。如果我在考虑架构，我们有用于数据分析的 SQream。您运行自己的数据库。然后你拥有所有这些其他组件。您有存储空间，也许是通过大型提供商提供的云存储空间。您还有其他事情，例如分析、构建机器学习算法等等。您可能有数据湖、Hadoop 等。您正在运行 SQL 查询。你有关于数据科学方面的 Python、TensorFlow 等。所有这些组件如何组合到解决方案中？您在内部做什么，SQream 在哪里与数据管理堆栈的这些其他组件接口？

Matan：就 SQream 中的组件而言，我们正在谈论 SQream DB。这是我们的主数据库。这是我们的主要产品。我们也有我们现在正在建设的东西。这将是湖边的房子。我们很快就会讨论它。但就组件而言，我们有引擎。这就是查询引擎，这是我们技术的精髓。我们有存储管理器编译器，它实际上负责优化 SQL，SQream DB 上的实际 SQL。我们围绕它有很多连接。这是它周围的生态系统。

例如，在将许多地方的原始数据带到湖中之后。然后你使用中间的仓库，你需要什么就查询什么。通常，您将它连接到一些 BI 工具，如 Tableau 或 Power BI。为此，我们拥有一整套基于 JDBC、ODBC 或某些本机连接的连接，它允许最终用户（可以是实际使用 Tableau 或其他 BI 工具的数据工程师）获得见解并执行这些操作报告和仪表板。

埃里克：好的。如果我们回到您之前提到的那些用例，其中一个用例对我来说直觉上感觉实时数据更重要。如果我们谈论的是制造环境，那么您实际上是在尝试实时或至少相对实时地对事件做出反应。然后在另一种情况下，听起来可能需要几天或几周，甚至几个月才能进行更多交易，但需要大量数据来尝试提取业务洞察力。有不同的架构吗？制造商、电信公司、银行和航空公司是否需要不同的解决方案？

Matan：答案是，是的，监管是不同的。我们需要确保我们匹配。如果我们谈论 InfoSec，不同的行业有不同的监管。今天，显然，这是一件非常重要的事情，尤其是对于这类客户而言。所以，这是非常敏感的。他们之间是有区别的。

就实时而言，显然，这是分析型数据库。这不是实时的，但有时会更接近实时。为此，这在电信公司或制造商之间的部署方面没有什么不同。只是用例不同以及它们对数据的处理方式不同。正如您提到的，我们的一些客户正在建设。待所有数据准备好或原始数据已经入库。我们为构建机器学习算法做了所有准备，帮助他们做出决策。他们中的一些人只是在构建报告并试图分析几个月前的数据。因此，它更多地取决于用例。在 RM 方面，正如我提到的，在行业之间，我们需要匹配不同的法规。有些行业更准时。一些行业已经在转向云端，这通常会使规模更容易。这显然是云应用程序的优势之一。这主要是区别。

埃里克：当涉及到不同类型的数据时——结构化数据与视频或声波等非结构化数据呢？是否有您更喜欢关注的特定数据集，更适合您的数据库结构？

Matan：我们主要关注结构化数据，这些数据来自一个已经搬进湖屋的仓库。在数据分析的未来，我们正在向新的半结构化和非结构化数据开放。因此，除了传统的数据仓库用例之外，我们将能够支持其他用例。实际上，我们是从半结构化开始的。这就是明年年初将要发生的事情。希望他们也能使用完全非结构化的数据类型。

埃里克：好的。我得问你这个。 lake house，是不是像仓库和数据湖的结合体？

马坦：是的，你明白了。

埃里克：好的。这是我第一次听说。这说得通。

Matan：我们可以触及这一点。会很开心。

埃里克：那么，那是什么意思？我想，数据湖更多的是池——它可以更非结构化，也许是结构化的仓库。那么，就结构与数据湖和仓库的区别而言，湖屋意味着什么？

Matan：Warehouse，最重要的是我们将计算与存储分开。使用仓库，您必须将所有数据提取到仓库中，对吗？这就是为什么他们称它为仓库。但是每个人都在使用湖泊。我们正在谈论 S3。这是最重要的事情。我认为 AWS 带来了它。事实上，您可以将所有数据类型从一个地方、一个湖上的任何地方扔掉。现在，有了湖边小屋，你就可以查询湖边本身了。您无需将其移动到第三个位置，也无需等待并支付双倍存储空间的费用。显然，您正在失去所有这些通信时间和网络时间。所以，你可以查询你的湖。这就是他们所说的湖边小屋。

我不得不说，这是数据分析领域最大的趋势。我们看到所有的大玩家都在尝试推出他们自己的解决方案和他们自己的湖屋答案。我们在其中。我们计划推出我们自己的湖屋产品。从 2023 年开始，它将成为云原生，这对我们作为本地公司来说是非常重要的一步，拥有原生云 SaaS 解决方案。我们真的很期待。

我们实际上是在研究使用，大多数用例都是围绕准备工作进行的。我们看到，例如，在广告技术中，他们正在收集大量数据，并且他们正在使用云。我们看到很多用例，他们需要准备数据并将其从一个地方移动到另一个地方并进行转换。因此，我们从准备形成平台开始我们的产品。 2023 年晚些时候和未来几年，我们计划拥有一个完整的湖屋解决方案，希望有一天能够取代我们的本地解决方案。

埃里克：好的。有趣的。我正在看你的网站。那是 Panoply 平台吗？那是一个低代码平台。也许这是一个不同的解决方案。

马坦：不，不是。我正在与您分享一些尚未公开的见解。它还没有在网站上。 Panoply，这是我们大约一年前收购的公司。伟大的团队，伟大的产品。实际上，他们正在帮助企业创建一个没有代码的仓库。这是我们针对较低级别数据的无代码解决方案，数据客户实际上是百货商店，一些 CFO 会喜欢创建一些数据仪表板。他们没有数据工程师团队，一个数据工程师团队，可以帮助他们创建任何仪表板并知道如何将 SQL 与 Panoply 一起使用。他们只需点击几个按钮即可创建自己的报告。显然，这是与 SQream DB 不同的用例，最终他们将联合起来，但他们仍在为此努力。

埃里克：好吧，让我们多谈谈这里的人。因为这实际上是我来自的地方。它与业务方面合作，与了解日常运营和用例来源的业务、销售、营销、制造等部门合作。

通常，他们的团队规模相对较小。他们的数据科学团队相对较小。通常，也许还比较初级。所以，他们可能有几个 20 多岁。不知何故，他们需要使用它来将需求转化为结果。

那么也许在组织的某个地方，有一个更加成熟成熟的团队。但通常，实际访问这些资源可能很困难。有时间瓶颈等等。也许听起来您已经有了基于收购 Panoply 的几种不同方法。但是谁会是典型的用户呢？如果有人想使用这样的解决方案，他们的团队必须具备什么样的能力才能有效地使用像 SQream 这样的解决方案？

Matan：首先，这是一个 SQL 数据库。所以，最终用户知道 SQL。通常，这些是数据科学家或数据工程师。他们负责这件事。我总是把两者分开——有两种方法。可能，它不仅适用于技术，而且我只知道它是技术。

有时您要去找一个潜在客户，并试图向他解释为什么他需要您的解决方案，以及他如何从您的解决方案中受益。另一种方法是，他们已经在寻找这种类型的解决方案。你在卖。您只需要向他们表明您是最好的或最适合他们的。对我们来说幸运的是，正如您在开头提到的那样，我们市场上有很多大公司——其他参与者都是大公司。从所有云提供商一直到 Snowflake，只有华尔街最大、最成功的 IPO。它只是表明市场已经受过教育。我们只需要证明我们为什么更好。

因此，您询问了最终用户。通常，他们知道 SQL。有时，Python，这在数据科学家中很常见。他们非常熟悉工具、BI 工具和 ETL 流程。但他们通常是我们的另一个决策者，但他们是最终用户。从产品的角度来看，我们试图同时考虑这两者。我们面临着如何销售它的挑战。然后我们需要确保实际使用它的最终用户，在我们已经弄清楚之后，他需要高兴。这不是两种不同的方法，但我们需要确保我们的目标是正确的消息，正确的接收者。

Erik：预算通常来自 CIO 职能还是 CTO 职能？它通常来自业务部门，还是来自制造组织的工程？

Matan：我们通常看到的是 CIO 级别。不具体是 CIO，C 级别。我们谈论的是大预算、长期承诺，通常还有 CIO。这是实际上很容易将其推入组织内部并真正了解替换、添加或使用 SQream 的需求的人。这就是为什么决策者与最终用户之间存在如此大差异的原因。

埃里克：是的，我想这不是自下而上的解决方案。这更像是一个自上而下的解决方案。

Matan：不幸的是，够了。我非常喜欢自下而上的解决方案和自下而上的市场策略。至少，在本地，这不是很常见。

埃里克：帮我理解这在最终方面是如何运作的——因为，我想，自上而下，你有一组自上而下的要求，这些要求通常是一致的。但是你也有或多或少无限的方式可以使用这个数据库中的数据来为不同的团队服务。所以，你说，好的，组织。我们可以访问该数据库并能够提取见解。还有各种各样的工厂总经理，业务部门负责人，他说，“嘿，我认为我们可以提取对我有用的见解。”他们必须以某种方式将这些转化为需求，将它们发送给数据科学团队，然后再将它们转化回解决方案。

你能分享一些关于它如何工作的最佳实践吗？因为，从我的角度来看，我经常与自下而上的团队合作——与亚洲业务部门的负责人合作，就像这样。我感到很痛苦，我们可能在世界某个地方拥有一支伟大的团队。我们可能在世界某个地方拥有出色的基础设施。但就副总裁访问这些资源并在合理的时间范围内构建某些东西的能力而言，仍然存在一些痛苦。您是否有任何与成功地能够（比方说）将此基础架构部署到位的好处最大化的公司合作的最佳实践？

Matan：最佳实践很难。始终，我们有一个非常技术和庞大的交付团队，有时会实际与客户合作实施和培训。正如我提到的，需要进行大量优化。这取决于用例。正如您提到的，您需要了解许多小调整，以及如何使用它。很明显，我们有很多技术文档，我们正在确保这也在我的团队的产品责任范围内发生，以确保我们正在编写和更新所有这些技术文档。

其中很多也与我们的交付团队合作。 POC 中有很多发现。我们进入 POC，了解实际用例。我们的交付团队实际上为他们提供了白手套体验，以真正了解他们的需求以及我们如何才能变得更好，以及我们如何优化他们获得的硬件，甚至更多，他们应该购买哪些硬件。

显然，我们正在努力利用 GPU。现在 GPU 不是很常见的东西。因此，我们需要确保人们提前订购。如果他们需要任何帮助，我们会帮助他们动手。因此，它非常特定于用例，尤其是当我们谈论 10 PB 的规模时。

在我和你以及我们的听众之间，有时我们也对我们的客户突破我们的界限很感兴趣。没有人出售数据库说，“好吧。你最多可以使用 10 PB”。昨天，我们使用了 10 PB。一个月后，它可能是 15 个。我们需要为此做好准备，尤其是对于正在扩展的人来说，没有最佳实践。我不知道。三个月内 50% 的数据。我们需要非常有创意。老实说，这是发生在 SQream 的魔法的一部分。我们是谁的事实，我们可以做出反应，我们可以为我们的客户提供这种体验。

埃里克：是的，就在你提到它们之后，我对硬件方面很好奇。在过去的 12 个月中，您是否也必须在管理公司无法获得所需硬件的情况下发挥创造力？或者它通常只是延迟一个月左右的事情，但通常你能够解决硬件方面的需求？

马坦：哦，太有创意了。从获得另一个伙伴关系。因为无论潜在客户想要与我们从未见过他的某个存储供应商合作，现在我们都需要建立关系以赢得这个机会。所以，我们将在一个月内建立这种关系。有时我们很有说服力，或者我们想继续 POC。我们不想等待客户。我们不想等 60 天，直到你在他的工厂里拿到所有的硬件。因此，例如，我们说服他在 Cloud 上执行此 POC。

对于我们的一些客户来说，这是超级新的。也许这是他们与云的第一次实际互动。我们从云提供商——谷歌、AWS 或甲骨文，无论谁需要——引入我们的合作伙伴，以确保它发生。所以，创造力非常——至少，在我看来，它非常以创业为导向。我们必须这样才能在今天的比赛中表现出色。

埃里克：好的。那么，让我在这里用一个创造力问题来埋伏你。所以，你知道我坐在中国。我不知道你有多密切地关注这个。美国最近批准了某些类型的芯片进入中国，这意味着中国人将不得不在如何利用旧芯片来完成机器学习等方面变得非常有创意。

我不知道你对此有多熟悉。但基本上，我不知道，10 年内，7 纳米等可能不会在中国上市。谁知道？您是否认为这真的是他们构建复杂数据结构的能力的一个重大瓶颈，而这些数据结构是他们进行非常复杂的 AI 所需要的，或者您是否看到了他们可以围绕它构建架构的方法？

马坦：好的。首先，这只是我的意见。我不想在这里变得过于政治化。但如果这会成为一个问题，我认为它会。这就是他们这样做的原因。他们想制造这个问题。至少，在短期内，我相信中国会克服这一挑战。我们的投资者之一是阿里巴巴，谈论中国的云提供商。所以，我很确定他们正在为此制定解决方案。我认为，如果中国有人会体验到西方硬件的匮乏，我希望这只会在短期内发生。然后希望在一两年内，中国能够赶上并拥有自己的硬件。

我们也在研究其他选项，而不仅仅是在 GPU 上足够接近。我们正在研究其他类型的特殊硬件。顺便说一句，现在 GPU 也不是很常见，尤其是自 COVID 以来。我们做的不止于此。我们过去只使用我们能得到的最强大的硬件。 NVIDIA 推出了新的 GPU。让我们推荐我们所有的客户购买它。因为更强大的 GPU 会带来它们或其他任何东西。更强大的硬件可能会带来更好的性能。

但是我们提到这是一款性价比游戏。就业务而言，最好的硬件不一定有意义。因此，我们始终确保进行基准测试，而不仅仅是在最新的硬件上。我们还采用较旧的硬件，有时您可以获得 2 倍的性能，但价格是 4 倍。在这些情况下，您可能更愿意购买旧硬件。因为正如我们提到的，这不是实时决策。通常，它可以接近实时。所以，如果某件事需要一两分钟，但要花四倍的时间，那就不一定有意义了。

埃里克：是的，我明白了。这说得通。最后一个问题，从我这边来说。你已经提到湖屋是一个你对未来感到兴奋的概念。在接下来的三到五年里，您在这个领域还有什么特别兴奋的事情吗？

Matan：我认为，对我来说，这是摆在桌面上的最大问题。他们都在迁移到云端。所以，之前，我们说的是湖边别墅。首先，数据分析正在向云端转移。它已经发生在几年前。我们从 GCP 看到了 Redshift 和 BigQuery。显然，雪花。不提雪花就不能谈论数据。我们在云中看到了超级成功。

但是当你阅读文章时，你会看到——我知道他们中的大多数人都在谈论 80% 的数据仍在本地。直到现在，我们才看到企业一点一点地转向云端。我们仍然看不到很多在云上运行 10 PB 的企业。

但是你问我未来五年会发生什么。我确信一切都会转移到云端。去那里的方式是混合的。混合，意味着不仅仅是双重提供云和内部部署，而且它们将被连接起来。因此，如果您在本地更新某些内容，它将在云端进行更新，反之亦然。我认为这将是迈向云的中间一步。也许需要 10 年才能到达那里。但我非常相信，在某个时候，我们会到达那里，人们会在他们自己的储藏室前停下来，把它放在他们的工作中，在办公室的其他角落，在大楼里，并保护它.

埃里克：是的，这似乎有道理。这只是时间问题，但我认为经济学是存在的。此外，从安全的角度来看，人们可能会感到安全。但现实情况是，让 AWS 控制您的数据比您的 IT 团队要好得多。

马坦：没错。在我们提到缩放和自动缩放之前，对吗？

埃里克：是的。伟大的。好吧，Matan，您认为还有什么其他重要的事情要让人们知道吗？

马坦：我不这么认为。这很有趣。

埃里克：好吧。惊人的。嗯，谢谢。

马坦：埃里克，谢谢你。嗯，很高兴认识你。谢谢你招待我。

音频文字.

联系我们

欢迎与我们交流!