播客 > Ep. 198 - Rethink Database Design for the AI Era
Ep. 198
Rethink Database Design for the AI Era
Eric Daimler, CEO & Co-founder, Conexus AI
Friday, January 12, 2024

今天,我们请来了Conexus AI的首席执行官兼联合创始人埃里克·戴姆勒 (Eric Daimler) 。 Conexus AI 作为混合生成式人工智能平台,促进可靠、快速的数字现代化,使企业能够无缝迁移、集成和改造其 IT 系统。

在本集中,我们深入研究了类别代数的利用来实现域驱动的互操作性方法。这种方法侧重于计算最佳数据模型,而不是依赖于手动设计。此外,我们还探讨了架构师误解数据库实际结构的常见问题,从而导致 IT 程序失败,而不是遵循其最初预期的结构。

关键讨论点:

  • 在构建正确的架构以有效利用其数据资产时,公司应考虑哪些关键概念(例如数据网格和策略)?
  • Conexus AI 如何帮助面临去中心化数据挑战的公司?
  • 就数据使用和结果而言,前后场景是什么样的?

要了解有关我们客人的更多信息,您可以在以下位置找到他:

网站:https://conexus.com/

领英:https://www.linkedin.com/in/ericdaimler/

音频文字.

埃里克:埃里克,感谢您今天加入我们的播客。

埃里克:很高兴来到这里,埃里克。

埃里克:是的,在我们进入详细主题之前,我认为先介绍一下您来自哪里的背景知识很重要。你的背景非常迷人。

埃里克:谢谢。

Erik:一方面,有相当的技术背景。另一方面,也要把一脚或至少半脚踏入公共领域。您能快速谈一下您职业生涯中的一些亮点吗?我认为白宫作为机器智能和机器人技术研究员的职位很有趣。因为感觉白宫可能就是从那时开始考虑这些话题的。也许我错了,但感觉就像是最近的事。当然,我认为您在董事会中担任的许多角色也可以让您在日常工作之外进行思考。

埃里克:是的,我这样做已经有一段时间了。人们如何认识我,如果他们认识我的话,实际上是从我在奥巴马政府期间担任科学顾问开始的。我是第一位在白宫任职的人工智能权威,俗称科学咨询小组。它扩展为我之后一整套有能力的人的整体倡议。我并不是说现在有三个人在做我的工作。但有三个人在做这项工作。我希望能回去。它确实为国家和美国的盟友创造了一个了不起的轨迹,我认为我们能够创造的价值正在 2023 年展示其成果,我们首先更新了总统关于无处不在的合作的倡议机器人技术。这就是我花了时间的地方,这可能是最重要的事情。

为了为此做好准备,我一直在以各种身份研究人工智能。我曾在斯坦福大学、华盛顿大学和卡内基梅隆大学担任人工智能研究员,并在那里获得了博士学位。我曾是沙山路的一名风险投资家,现在我正在创办第六家初创公司。正如你所说,我担任过一些董事会董事职务。其中一些至今仍然活跃。我做过AI。其他人已经扮演过许多不同的角色,但我不知道有谁在人工智能领域扮演过所有这些角色。因此,我绝对认为我对行业正在发生的事情以及未来的前景有一个罕见的(如果不是独特的)视角。

埃里克:快速地讨论一下政府的角色。因为我认为可以公平地说,美国几十年来在很多领域都没有强有力的产业政策。也许科技领域一直是一个自由市场或多或少被允许在相当有限的监管或方向下自由运行的领域,而这种情况似乎正在以某种方式发生变化。您对此有何看法?我的意思是,显然,你在其中发挥了作用,所以我想这是一个净积极的结果。但如果你看看今天的现状,以及美国如何围绕人工智能的发展推动他们的技术政策,你认为我们走在正确的轨道上,还是只是作为一个国家正在解决问题?

埃里克:是的,我喜欢你的建议,埃里克,也许我参与的任何事情都会产生积极的结果。这真好。我想考虑一下。关于产业政策的令人兴奋的对话,我不确定美国是否真的改变了立场。尤其是在硅谷,政治上确实存在自由主义倾向。让政府让开吧。我在这里忙着创新。我不确定这是否改变了。尽管如此,肯定有人希望确保我们带给世界的东西有所贡献。我们不能幸免于这项技术的潜在危险。我们希望确保它能够实现让我们的生活更美好的目的。

我认为从政府的角度来看,我们不一定要改变技术的理想方向。我在政府所做的就是与其他一些非常聪明的人合作,代表总统谦虚地谈论人工智能研究的未来方向。我认为,政府历史上有一种独特的能力来资助那些不会立即产生商业应用的工作。这是我当时所提倡的,也是今天继续提倡的。我很高兴的是,随着我们训练大型语言模型,非营利组织、学术界、政府和营利性超大规模企业之间的经济动态和结构发生变化,这种情况仍在继续。

埃里克:好的。谢谢。这就说得通了。我很欣赏你解释重点。我认为这将为我们讨论您今天所做的工作提供一个很好的起点。因为从企业发展的角度来看,人工智能在很大程度上有助于向前发展,至少在我看来,它更加系统化、可预见。

许多公司在人工智能方面面临的挑战之一是,从博士的角度来看,它的发展可能与从公司职位的角度来看是不同的。但从公司的角度来看,它看起来非常像一个逐步的过程,你可以拥有像自动驾驶这样的东西,这是八年前多次向我们承诺的。除了小型飞行员之外,我们在街上看不到任何此类车辆。但是,假设三年或未来的某个时候,突然之间,它们就会出现在那里。看起来每个人都会——就像有人打响指一样,突然间人工智能——

因此,作为一个企业,期望与现实对于预测这一点非常重要。因为对于特定企业来说,它可能会产生非常大的影响,无论是有利还是不利。您如何看待理解我们今天所处的位置以及推动人工智能特定领域向前发展的可行性这一普遍挑战?

埃里克:是的,里面有很多话要说。我不想让你陷入困境。但我们可以问听众,只是为了在他们的头脑中做一些小练习,当他们认为第一辆自动驾驶汽车在世界上的公共街道上运行而无需人类驾驶员的帮助时。所以我要再说一遍。哪一年,一辆某种风格的汽车在没有司机驾驶的情况下完全自动驾驶地行驶在公共道路上?你的问题的建议,我们可能会说,什么? 2010 年或者回到 2005 年。也许我们回到 2000 年会说,好吧,这只是之前进行的一些研究的表达。

但真正的答案是1983年。宾夕法尼亚州匹兹堡的卡内基梅隆大学,有一辆面包车。一辆大货车。它的计算能力比当时整个发展中国家还要强大。说的是神话。在阳光明媚、干燥的日子里,它的行驶速度为每小时五英里。然而,它却能自行行驶。时机问题是,用风险投资家的一句古老格言来说,不要将清晰的愿景与短期的时间范围混为一谈。所以我们非常清楚会发生什么。但是,男孩。但找出时间几乎是不可能的任务。找出近期发生的事情之后会发生什么通常几乎是不可能的。

例如,我正在与一个团队合作,试图预测 1999 年互联网的未来。因此,在网页变得无处不在并变得更加商品化之后。因为最初,网页是一门艺术。创建网页是一门生意。但奇怪的是,IBM 预测了网页之后会发生什么。他们围绕电子商务开展了整个活动,并且很好地预测了网页之后会发生什么。他们说网页的重要性将会下降。但这并没有帮助他们定义应用经济。 IBM 在这方面处于什么位置?无处可去,尽管他们在某种意义上预测了未来。我们所有看过《星际迷航》剧集的人都可以从一般意义上预测 iPhone 的外观。但我们谁也不知道确切的表达方式是什么样的。即使我们在某种程度上详细地想象了这些设备的外观,您也可以更进一步说,我们没有人会预测到会有 IBM 拥有的名为应用程序开发人员的工作或应用程序经济。一般意义上的预测。

就像今天一样,TikTok 上的影响者。未来几乎不可能从任何有意义的意义上进行预测。我真正为我公司的客户提供的是适应性。你可以说这是个人的适应能力,但公司在组织上需要迅速适应新的现实。与我的背景相符,我想说的是,灵活性来自于以有原则的方式快速处理数据的能力。如果你用英语或任何语言与人们互动,你就无法快速学习和转变组织。您正在使用定性的、非正式的方式来经营企业。您需要使尽可能多的业务形式化、编码化、系统化。因为这是你能够开始看到即将发生的事情并能够调整你对即将发生的事情的反应的唯一方法。这就是答案。这是灵活性。不要像其他人一样试图观察水晶球。

埃里克:好的。明白你了。所以这里的解决方案不是预测。解决方案是架构。这可以让你对出现的任何现实做出反应。您能否解释一下数据网格企业战略的概念,或者您认为有用的任何其他概念 - 比方说,我们想象一家财富 500 强公司,其高级管理层不是 IT 专业人员。他们都已经 60 岁了,而他们生活的世界里,这一点并不特别重要。现在,突然之间,这非常重要。那么对于他们来说,定义公司如何构建正确架构的重要概念是什么?

埃里克:当然。其中很多术语都是为了营销,并且它们会发生变化。人工智能本身并没有真正的意义。通用人工智能并不真正意味着今天的含义。因此,如果我们谈论数据网格、数据结构、数据仓库、数据集市或数据湖,这些只是有趣的术语。但我可以说,从一般意义上来说,人们需要做的就是将他们的数据整合在一起。然后他们可能会出于特定目的稍微构建数据。因此,让我们将所有数据收集到一个大云中。它可以是 Snowflake 或 AWS 等上的云。让我们收集所有数据。然后让我们以某种方式构建它,但我们需要由所有者来构建它。因为当我们把所有这些放在一起之后,我们确实有一些个人需求。我们有营销。我们有制造业。我们有销售。这与营销不同。我们也许有客户满意度。我们有我们的供应商网络。因此,也许存在一些个人需求,并且可以在数据仓库等结构化环境中。

什么是数据结构——这只是一个术语。 Data Fabric 表示,我们将集中这些数据的所有权,并让专人管理这些数据,以满足不同部门的不同需求。数据网格意味着数据所有权是分布式的。因此,可以形成单独的数据所有权集群。假设您有一个药物研究项目和另一个药物研究项目。但按程序划分所有权是有道理的。当不同地区对数据存储有不同的规定时,您可能会遇到类似的司法管辖区问题。要么是技术可以实现这一点,但这通常只是一个手动过程。因此,您可以广泛地思考您想如何处理数据,然后考虑什么是正确的技术来实现这一目标。

我不能说你可以对其中许多技术采取非常挑剔的眼光,因为数据湖常常让人们失望。如果我把美国国会图书馆的所有书籍扔进另一个仓库,而没有借助杜威十进制系统,这就是人们所说的数据湖。只要把它扔到一个大房间里就可以了。好的。我们开始吧。我所有的数据都在一起。嗯,那没有帮助。这一切都与检索有关,而不仅仅是存储。那我该如何把这些数据取出来呢?这通常就是人们所说的数据结构或数据仓库的含义。那么,如果他们要构建名字、姓氏,他们会如何构建?也许这不是某些数据的特征。这有点像取出建筑物中的所有书籍,然后按颜色或高度对书籍进行排序。您必须非常小心如何使这些数据可用。

在我的公司 Conexus,我们的客户知道他们拥有想要使用的数据,但他们就是无法获取这些数据。他们将一份数据存储在 SAP 中,另一份数据存储在 Oracle 中。还有其他数据以其他域和其他格式存储。其他结构可能位于其他地区。他们就是无法将这些结合在一起。但他们知道这是可用的。也许理论上是可以的。但实际上,他们实际上无法做到这一点。这有时就是这些数据结构的问题。数据网格,对不起。使用当今可用的解决方案,这将继续成为一个问题。但这解决了高管在部署这些技术时可能会问的问题。确切地告诉我这将如何带来我的数据以满足我的运营需求。

埃里克:是的,昨天我会见了新加坡一家顶级三级公司的数字化主管。她说的第一句话是,“我不知道我们有什么数据,也不知道如何访问它们。”因为他们有——她坐在新加坡。他们有老挝、柬埔寨、越南和泰国。每个市场都使用自己的技术堆栈。他们有自己的数据。他们在某种程度上有自己的 CRM。所以没有那么集中的可见性。当然,本地团队也有限制,因此他们可能不会以特定的系统方式构建数据。然后你就有你的分销合作伙伴,他们当然拥有大量数据。但接下来你就会进入我们如何才能真正访问它的主题。我们可以访问什么以及何时访问等等?

这真的让我印象深刻。这是一家非常大的公司。数据应该比较简单吧?因为我们处理的不是复杂的供应链数据或制造数据。实际上都是相同类型的数据,比如谁在购买啤酒,以及从哪个场所购买什么类型的啤酒。所以它应该相对简单,但仍然是一个尚未解决的问题。接下来让我们了解一下 Conexus AI。对于如何帮助公司应对这一挑战,您的价值主张是什么?

埃里克:这是埃里克的一个很好的引导,因为你刚刚描述了价值主张。 Conexus 是一家数据集成公司,我们允许提供更多组织的数据,并具有速度、成本和完整性方面的优势。就应用而言,我们的应用范围广泛,从国防到能源发现和分配,再到物流和制造。事实上,每个大型组织都存在使用他们实际收集的数据的问题。目前,经典方法是手动的。他们将使用旧工具,花费数月甚至数年的时间,并消耗数亿甚至数十亿美元,这些资金通常会流入大型咨询公司。所以我们是一家有物质利益和速度、成本和诚信的数据集成公司。

埃里克:明白了。如果我们可以在这里选择埃森哲,我想今天的默认情况是,有人可能会打电话给埃森哲并说,我遇到了问题。你能派 50 个人来做这件事,两年后看看他们能否想出解决方案吗?我们可以用任何其他大型集成公司来取代它,但他们正在尝试在这里做很多工作。正如您所说,这是一个非常手动的过程。您如何利用技术来解决这个问题?该问题的哪些具体方面可以通过技术解决?也许你可以解释一下。我不知道在这里解释术语有多大用处。但您的网站上有一些术语——可组合工程设计、范畴论、范畴代数——看起来它们是您技术的核心。那么您能否用通俗易懂的方式为我们解释这些内容并帮助我们理解这里的底层技术是什么?

埃里克:当然。我们可以选择埃森哲。这是一家经营良好的公司,拥有一些非常聪明的人。他们通过将这种特殊类型的手动操作整合在一起,每年赚取 67 亿美元。这并不是说你会雇佣 50 个人在几年内完成一项工作,然后我们就会看看他们会做什么。你将在五年内雇用 500 名员工,60% 的情况下他们会回来告诉你项目失败了。或者,他们会告诉您我们解决了 80% 的问题,并且他们会宣布它成功了。嗯,但实际上,他们做了简单的部分。最后20%是最难的部分。所以他们并没有真正解决让所有数据可用的问题。

我们有一家货币中心银行来找我们,告诉我们他们最初是如何分配 2000 万的,然后又分配了 8500 万,然后他们不得不重新开始,五年后又分配了 1 亿。最后,他们花费了 10 年时间和 2.1 亿美元或类似的资金来开发缩小规模的产品。他们来找我们说,好吧,我们解决了问题。但我们知道,一旦添加或弃用另一个数据库,我们就会重新开始。

我们正在做的、Conexus 正在做的是将数学发现商业化。数学的一个分支称为范畴论。为了让大家更熟悉,我将其称为分类代数。范畴论是一门抽象的数学。这与类型理论有关。但也许,人们理解它的一种更简单的方法是与我的博士学位所关注的图论相关。人们将通过其可视化(即使不是名义上的)来了解图论。他们会认出这些看起来像蜘蛛网的图表,在那里他们会看到事物以多种不同的方式与其他事物相连。它变成了任何事物之间看似无限复杂的联系。可能是毒品。这可能是生物学的。它可能是社交网络。这是使用图论的一种方法。大约 25 年前,这项创新真正开始兴起,用于检测和破坏恐怖分子网络。数学是其中的核心。它现在用于检测金融系统中的欺诈行为。

您可能只是将这种可视化,即具有关系的概念扩展到不同的维度级别。如果我们想到棋盘并想到 3D 国际象棋 - 添加几个棋盘。将它们堆叠起来,这样你就可以在不同的维度上移动你的胸部——我们也许可以对该图做同样的事情。如果你有蜘蛛网图,请将其设为几个维度,或者将其设为无穷多个。或者,正如我们在数学中所说的,我们所说的维度。所以是无穷多个。这些是任意数量的维度。因此,如果维数图论是范畴论,我们可以说它是一种更丰富的图论。

另一种描述方式是图论可能描述你和我,埃里克,有一种关系。所以你和我从现在的谈话中就建立了关系。这就是一种关系。是的,不是?很好。我们有关系。但如果你让我们参加铁人三项比赛,我们的关系可能会非常不同。我们可能是铁人三项赛中的竞争对手。这是一种丰富的关系,它不仅仅是是与否、开关,而是微妙的。这是依赖于上下文的。整个世界就是在这种背景下出现的。因为这就是您的数据。您的数据有上下文。您的数据有描述。

在一个简单的示例中,当我想到 Excel 中的列名称具有部件号时,这就是上下文。如果我有一列中有一个部件号和一个部件号列表,如果我随后进行剪切和粘贴或与另一个 Excel 电子表格合并,更不用说其中 1,000 个部件号的上下文,则部件号的上下文仅适用于一定数量的部件那些专栏。需要保留上下文才能使数据具有任何意义。但很多时候,它就丢失了。今天发生的情况是,您只是没有原则性的方法来维护集成这些 Excel 电子表格列的程序员的纪律。你可以说,我认为这本质上就是数据库。因此,当这些东西集成到 100 次时,更不用说 1000 次了,就会出现错误。我们是人类。所以你会遇到数据错误,或者你只是遇到了一定程度的复杂性,这使得你几乎无法使用它。这是经典的方法。范畴论作为一种数学,作为一种抽象数学,允许通过我们最初拥有的软件表达来解决该问题。

我可以走得更远。实际情况是,NASA(最初是这项技术的推动者之一)发现他们花了 10 年的时间来开发火箭,而这越来越不可行。因为技术发展得足够快,以至于他们在完成之前就发现结果已经过时了。他们认为我们需要更快地采取行动。但随着项目的完成,构成火箭的技术在这些背景下的相互关系无法保留。因此,没有人主张一个更简单的世界正在出现。我们可能都一致认为,世界正在变得更加复杂,随着我们发明和创造更多,事物之间的关系也变得更广泛、更深、更多。因此,我们需要一种新技术将所有数据整合在一起并保留上下文。这就是范畴论的价值。这就是该软件为每个存储和使用数据的公司提供的功能。这就是我们所看到的人工智能的美好未来。

Erik:这主要是人工智能所需的解决方案吗?因为正如您所描述的那样,我有点回想起跨不同地区和不同组织单位管理 CRM 的这个非常简单的问题。这本身似乎就是一个未解决的问题。但这确实不是人工智能问题。这只是每个地区或每个业务部门拥有不同数据结构的问题。但尽管如此,我们还是有一些共性并且渴望知道,好吧,我们正在为这个市场的客户提供服务。您是否也在该市场为他们提供服务,也许以不同的方式?也许是在不同的子公司或其他什么地方。所以这不是人工智能问题,但仍然是数据集成问题。

现在,您的技术是否也适用或用于这些,或者是存在现有解决方案的情况,并且您确实专注于将人工智能应用于这些数据集的具体问题?

埃里克:我鼓励观众拓宽他们对人工智能的看法。它确实在大型语言模型中找到了当前的上镜表达方式。神经网络的子集或神经网络的表达,它们本身就是机器学习的表达,机器学习本身就是概率人工智能下的一个领域。

但人工智能有一个完全不同的领域,称为符号人工智能、确定性人工智能。如果您还记得高中逻辑课或哲学课上的内容,那么逻辑学有自下而上和自上而下的方法。先有归纳,然后有演绎。入职培训是指您使用这些法学硕士。演绎是当你使用符号人工智能时。最终,我们必须将它们组合在一起,以适应复杂环境中的许多应用程序。但是,目前上镜的法学硕士目前非常流行。这些技术不就是海量数据的集合和对它们的重新配置吗?正如他们所说,法学硕士的自动完成类似于符号人工智能如何在数据库内数十亿或数万亿的数据点上工作。我们认识到这些模式,并使用数学找到连接真理的可证明完整的、最小的路径。它在许多此类应用中确实是相当互补的。它或多或少都是人工智能,这取决于你说它是象征性的还是概率性的。

埃里克:好的。是的,我想今天很多人都将 AI 和 ML 视为同义词,对吧?但除了机器学习之外,人工智能可能还有更广泛的含义,这是目前的选择。

让我们通过查看您的解决方案来使这一点更加具体。因此,您拥有适应性强的数据整合和适应性强的数据互操作性。您能否向我们介绍几个案例研究,从头到尾地说明问题所在?团队是谁?我认为了解你在这些公司实际上与谁一起工作也很有趣。那么,就人们如何使用数据而言,部署解决方案之前和之后是什么样子的呢?

埃里克:是的,我可以提供一些。人们最熟悉的一个就是 Uber。每个人都了解 Uber 的业务。此外,这是一个知名品牌。他们很快就成长起来,专注于自己的事业。他们长大后就像你在新加坡的朋友一样,在他们的组织中拥有数据库,他们知道这些数据库存在,但他们无法访问它们。 Uber 是在按城市建立数据库的基础上发展起来的,因为他们试图在跨城市扩张时管理公司的部署。他们拥有遍布世界每个城市的数据库。

最终达到 300,000 个数据库。然后,他们需要确保尊重根据法规创建的隐私网格,例如,这些法规可能对驾驶执照和车牌具有不同的敏感性。他们还希望研究一些互补的地理区域来进行基本的供需测试,其中两个城市可能相邻,但可能拥有独立的数据库。他们如何计划根据天气或发生的事件来应对供应或推动需求?这需要——当时,这是一个手动过程——数十甚至数百人手动工作,以尊重从这些不同数据库创建的管辖权偏好。他们环顾世界,研究如何将这些数据库整合到一个统一的视图中。

他们找到了我们。他们找到了Conexus。我们与他们合作开发了集成这 300,000 个数据库的解决方案,以便他们能够更敏捷地提出普通商业智能问题,并更轻松地尊重其运营所在司法管辖区中嵌入的隐私网格。按照他们的说法,基于我们能够提供的技术,他们每年将节省 1000 万美元。这是 Uber 的一个很好的用例,说明 Conexus 如何帮助 Uber 改善业务。

埃里克:好的,还有类似的数据库。也许他们根据隐私法规或只是这些地区管理团队的突发奇想来跟踪一些不同的变量。我猜您还遇到过其他情况,比如说,一家拥有 CRM 的制造商。他们有供应链系统、MES 和 ERP。所以系统的不同层次。他们有不同的团队,必须紧密合作,但在完全不同的系统和架构中捕获完全不同类型的数据。您如何看待这些环境?

埃里克:是的,所以我们为一家能源公司做到了这一点,在设计特定零件时(该公司是美国财富 50 强公司之一),他们必须将机械工程师、土木工程师的工程模型结合在一起工程师、电气工程师、地质学家。他们对自己所处的环境以及需要在该环境中设计的部分都有不同的看法。

对他们来说,这样做的传统方法是发送,本质上是发送 Excel 电子表格,让每个人再次了解某人对最大面积表面压力的解释如何与其他人对最大面积表面压力的解释保持一致。因此,您可以确定是否要安装法兰、法兰有多大以及将其放置在何处。这确实是一件很了不起的事情。然后还有一名内部审计师和一名外部审计师,因为错误真的会让人丧命。我笑只是因为这是一个如此繁重的过程。

好多了。将这些多个工程模型输入到 Conexus 有效、可预测的人工智能中,并创建可证明完整且可证明最简单的输出,效果要好得多。因此,不需要花费六周到六个月的时间,而是需要六秒到六分钟的时间来创建综合来自这些复杂工程模型的所有这些视图的输出。这就是人工智能应该做的事情。这就是你用它的目的。这是一个帮助我们更有效、更快速、更诚信地协作的工具。

埃里克:明白了。因此在这种情况下,输出是特定查询的解决方案。然后我想,理想情况下,不是黑盒解决方案,而是他们可以分解和理解的东西。因此,如果监管机构对您这样做的原因有疑问,您可以准确解释该模型是什么以及它是如何做出决策的。

埃里克:哦,那太漂亮了。它不仅不是一个黑匣子。它实际上必须被表达为制成品。然后你必须真正地知道,这样这个东西才能在现实世界中发挥作用。你会发现,符号人工智能的美妙之处在于,你甚至会看到人工智能如何创建合成模型的路径。美妙之处在于,没有任何东西是被创造出来的。没有什么是虚构的,或者用流行的术语来说,就是幻觉。虽然这有点不太准确。这些模型的创建过程中没有任何混淆。这不仅是接受真理,而且是发出真理。这种真实的人工智能只能通过符号人工智能来实现。

埃里克:好的。很有意思。因为当然,与生成人工智能这一新领域相关的任何事物的挑战之一是创作一首诗的概率论。它不适用于解决可能导致危及生命的情况的工程问题。

埃里克:是的,你的听众可以问问自己。有多少人愿意乘坐由大型语言模型设计的飞机?答案是零。但是一个真实的、可预测的人工智能,请给我注册。

埃里克:所以这些都是很好的案例。我知道您很快还将推出一本名为《未来是正式的:利用技术解决社会最大问题的路线图》的书。这本即将出版的书是否专门关注 Conexus 正在开发的解决方案,并将其应用于社会问题?您能为我们提供一些有关思考过程的背景信息吗?

埃里克:是的,我们希望向人们传授更广泛的流程,告知企业如何更好地为人工智能世界做好准备。正如我们之前谈到的,在一个你无法真正预见两年多未来但知道你需要更加灵活和适应的环境中,所涉及的准备工作将更加正式。未来是正式的。或者,你可能会说,要更有纪律或更严格。其表达方式是采用业务流程并将其形式化,以便机器人可以对其采取行动。这确实是了解您的流程是否足够严格的黄金标准。另一种谈论它的方式是硬件设计。如果您可以将业务规则编码到半导体中,那么您就知道您已经进行了适当的思考。这就是必要的。

举个例子,我们正在与另一家非常大的公司合作,该公司有一个董事会级别的倡议,就像 2023 年那样,关于人工智能。这项针对人工智能的董事会级倡议用水晶球展望了未来,并看到了无处不在的协作机器人,这让我很暖心。因为这是我们 2016 年在白宫时的设想。展望 10 年,我们看到了无处不在的协作机器人。 2023 年,这家公司在不远的将来为自己预见到了这一点。他们在这个制造环境中看到,用“无处不在”这个词来说,成千上万的机器人与工人一起工作。其中一些可能对人类有害,但它们是协作机器人。所以不是您在汽车上看到的焊接类型。当这些机器人四处移动时,如何保证人们的安全?他们不仅仅完成我们今天看到的机器人的任务。它们将无处不在。那么我们如何对这些规则进行编码呢?

这要求企业经历 2 或 3,000 个不同的业务流程,就像众所周知的细齿梳一样,但具有足够的严谨性,以便机器人可以解释。这就是工作:2 到 3,000 个业务流程,其清晰度可供机器读取。这就是我们需要做的。这就是公司需要做的。我们正在努力在《未来是正式的》一书中阐述如何做到这一点。因此,高管,一直到工程师,都可以掌握这些技能,帮助他们的组织做好适应未来的准备。就是这个想法。

埃里克:好的。是的,这是一个有趣的问题。因为业务流程当然是矛盾的,对吧?如果您有 10 个业务流程,就会出现矛盾。然后你就相信人类能够找出矛盾并适当地确定优先顺序。如果你看 2,000 个,就会出现各种各样的矛盾。有点合乎逻辑。弄清楚如何使机器人能够确定这些优先级并解释某种程度的模糊性,这是一个令人着迷的问题。

埃里克:是的,这是一个很好的观点。有些业务流程会是矛盾的。有些你可能不知道是矛盾的,但只有当你开始将它们形式化时才会发现它们是矛盾的。会有细微差别,并且有些领域可能真的很难正式化。或者,也许您不想形式化,而部分输出是创造性的。但当我设计飞机时,我希望我的创造力受到限制。我不希望机翼、机身和发动机之间的振动协调具有创造性。我希望这是非常精确的。

埃里克:哦,这真是一个有趣的思考过程。因为你认为,人类是有概率的,对吧?人类,我们确实制造了非常精确且非常安全的车辆。但我们也在以具有一定程度不确定性的概率方式做到这一点。所以也许这是必要的。但尽管如此,你如何感觉检查呢?如何让算法的一个方面是概率性的,而另一种算法则在发布之前对其进行严格的评估过程?

埃里克:所以这里的规则是,当你想向人工智能学习时,你需要使用大型语言模型,即概率模型。当你想教授人工智能时,这意味着当你有关于飞机设计或能量构造或分配的规则时,你就可以使用确定性模型。你两者都想要。您可以同时使用两者。当你想教学时,你可以使用确定性。当你想学习时,你会使用概率。

埃里克:好的。说得通。最后一个问题。到目前为止,我们已经排除了水晶球的价值。尽管如此,我还是要问你关于未来的问题,但也许只是 Conexus 的未来。未来 24 个月里什么让您兴奋?您要推出的新产品?您在监管框架中看到董事会如何做出令人兴奋的决策方面是否发生了变化?早上醒来时你在想什么?

埃里克:嗯,我正在考虑的是确保我的团队得到照顾,并且我们的客户感到满意。但具体来说,我想的是,人们如何逐渐认识到,我认为,从长远来看,大型语言模型值得大肆宣传,但在短期甚至中期内,人们开始认为大型语言模型被过度炒作了。迄今为止,许多大型组织的实际用例已证明非常有限。从长远来看,它具有吸引力。我喜欢有这么多人参与有关人工智能的对话。但人们逐渐认识到,我们需要将真实性和可预测性融入到这些学习算法和人工智能的部署中。这对我和我的组织来说是极大的鼓舞,因为这是我们未来的基础。这就是为什么我在 2017 年离开白宫后将自己的职业生涯押在了这件事上。

我们看到与世界上一些最大的公司和一些你可能听说过的政府进行了一些精彩的合作。这是美妙的时光。让我感到一定程度乐观的是,我们今天所享受的生活方式是由生产力的提高所带来的——我并没有忽视人工智能的部署给我们带来的所有很多、很多、很多、很多的危险。我们已经经历了几十年、几个世纪了。我认为我们正在进入这样一个时代,生产力的提高很可能会加速,并为我们所有人带来更高的生活水平。

我认为挑战很可能是我们将开始看到迄今为止一直被忽视的世界其他人口,并认为世界正在变得更糟。事实上,只是所有这些人都以一种我们一生中大部分时间都看不到的方式变得可见。因此,我通常对发达国家和发展中国家生活质量的改善持乐观态度。

埃里克:是的,太好了。我的意思是,这将是——是的,技术就是力量。所以我们一定会更加强大。那么我们能否有智慧以一种普遍有益而不是特别有益的方式来部署它呢?我想这将是下一代或两代人面临的挑战。埃里克,精彩的谈话和你正在建立的一家非常有趣的公司。我们还没有触及的最后一点对人们理解很重要吗?

埃里克:我真的鼓励人们尝试人工智能。一些非常棒的应用程序正在出现。在我们的世界中探索这些的方法是积极地进行实验。我鼓励我的朋友和家人在浏览器上打开 Anthropic' Pi 和 ChatGPT 的选项卡,也许还可以打开任意数量的其他图像生成器,只是为了看看您可以用它做什么。我们拥有 25 年、30 年使用现代搜索的经验。我们现在需要训练自己成为敏捷的工程师。尝试该技术是对组织的个人建议。 2030 年的获胜组织将是拥有最正式规则的组织,因此具有最大的适应性和灵活性。

埃里克:是的,很好的建议,埃里克。非常感谢今天的谈话。

埃里克: 太棒了,埃里克。这是一段美好的时光。

联系我们

欢迎与我们交流!

* Required
* Required
* Required
* Invalid email address
提交此表单,即表示您同意 IoT ONE 可以与您联系并分享洞察和营销信息。
不,谢谢,我不想收到来自 IoT ONE 的任何营销电子邮件。
提交

Thank you for your message!
We will contact you soon.