本周,我们采访了Ganymede的创始人Nathan Clark 。 Ganymede 是面向生命科学公司的云原生数据平台,专注于将物理实验室仪器与数字工作流程相集成。
在这一集中,我们讨论了在生命科学研究实验室和制造设施中集成和自动化流程的挑战。我们还探讨了实验室未来的样子,以及公司如何利用当今的云来提高生产力和保证合规性。
关键问题:
● 制造过程自动化的关键要素是什么?
● 主要和次要用户在为实验室建立数据基础设施时扮演什么角色?
● 您将如何构建技术堆栈,以及您在何处与其他遗留系统和技术进行交互
● 人们如何衡量企业在制造和研发方面的客观收益?
音频文字.
Erik:Nathan,感谢您今天加入我们的播客。
内森:当然。很高兴来到这里。
埃里克:内森,你是从波士顿打来的。我得告诉你那是我妻子最喜欢的城市。我在上海这边。她在 Philips 工作,所以她在他们的校园里呆了一段时间。她喜欢它,因为她在夏天去过那里,而且她在周围划船。她想搬到那里去。我说,好吧,你先在那边过个冬天,再跟我说搬家的事。这是一个很酷的城市。考虑到您所在的空间,它显然也是适合您的城市。
我想快速谈谈你是如何结束的。因为只看你的简历,你就开始在高盛担任交易员。然后你正在与一家公司合作,这家公司也在支付领域。因此,金融是一个利润丰厚的行业。这通常是人们渴望进入的行业,尤其是像高盛这样的公司。是什么旅程将您从那里带入了生命科学的世界?
内森:是的,我喜欢我在高盛的工作,我也喜欢金融学。但我认为,对我来说,我一直被技术所吸引,并被试图寻找自动化方法所吸引。我认为在交易之类的角色中,它有点机械化。您拥有自己建造的大型银行机器。你在给它上油,照顾它,然后操作它。但我真的总是被吸引去建造这台机器。所以,我认为这就是我去一家公司的原因,这是一家现在购买,以后付款的公司。我看到它在技术方面有非常强劲的增长轨迹和声誉。所以,对我来说,这是一个帮助从头开始建立金融机构并在早期与真正强大的工程师一起工作的机会。我发现,当我去那里的时候,我喜欢那个。所以,那对我来说是个好地方。
但随着公司的成长,我想我也开始意识到,好吧,尽管我热爱金融,但我真的很喜欢生命科学,因为它是一个可以产生影响的地方。我认为金融对世界很有帮助,但不是在道德上。但我认为生命科学才是真正吸引我的地方。所以,我们总是朝着那个方向努力,我自己和我在一家公司遇到的联合创始人。我去了一家名为 Benchling 的公司工作,这有点像湿实验室生命科学运营的 CRM——跟踪你的实验、跟踪你使用的细胞、跟踪 DNA 等等。但很快,我最终决定自己推出 Ganymede。随着时间的推移,我会说,这是一个非常一致的轨迹。我热爱金融,但我只是感受到技术和生命科学的吸引力。
埃里克:创办公司的决定是一个沉重的决定,因为你正在放弃稳定的生活,跳入高风险的冒险,失败的可能性很高。当时是什么让你——因为你在你感兴趣的领域与一家非常有趣的公司合作——实现了飞跃?是你决定我想成为一名企业家,还是你只是看到一个问题然后说,我不敢相信没有人解决这个问题;我觉得我能行吗?当时是什么触发了这个想法?
内森:我认为确实是后者。当人们有兴趣创办一家初创公司时,我喜欢告诉他们,尤其是在企业 B2B 领域,在某种程度上,想法是一毛钱一打。你可以四处询问人们他们的问题是什么,他们会告诉你他们的问题。您可以很快地构建一个相当大的问题列表。尤其是在大型企业公司,你可以提前观察到很多这样的情况。
但是,对我来说,真正让我越界的是,正如你所说,我开始与人们交谈并四处询问,看看人们是否会对 Ganymede 所做的事情感兴趣,我们可以深入研究什么。他们不只是说,“是的,这是我的问题,”但他们实际上是在说,“嘿,你什么时候可以开始构建这个,因为我现在需要这个?”所以,在那之间。然后我还发现,真的,我想,与我的联合创始人 Benson 同步,他非常渴望开始,我们意识到,好吧,现在是时候了。我们需要发出通知并立即开始处理。我认为那是找到人们实际要求付钱给你的想法。那是真正推动我们越线的共鸣。
埃里克:我们是一家咨询公司,对吧?这是一家数字化咨询公司,因此我们自然而然地与人们交谈并了解他们的问题,并希望解决其中的一些问题或将他们引向像您这样的公司。就在过去的 12 个月里,消费品领域(香水等)的几家公司提到了完全相同的问题。在他们的实验室中,存在大量手动流程、较长的交付周期、决策瓶颈等。我不知道。我想有一些重叠。生命科学在某些领域存在独特的问题。
这很有趣,因为我们根本没有深入那个领域。他们只是浮到顶部。因此,您会感觉到这是某种东西。确实存在对解决方案的渴望。在我们详细了解 Ganymede 所做的事情之前,让我们试着对这里的问题格局给出一个很好的综合视角。今天是什么样子,人们的痛点是什么?
内森:我会说我们开始的很多地方都是研发实验室的分析仪器,非常关注生命科学。我们正在向制造业和更广泛的领域扩展很多,所以我对此有一些评论。特别是在研发方面,我认为我们观察到的问题空间是事情非常复杂。它们很复杂是有充分理由的。
由于人类的进化,生物学作为一门科学是一团糟。与集成电路之类的东西相比,我们的身体是如何制造的并没有多少抽象,集成电路的每一层都是精心设计的。尤其是在研发方面,甚至一旦你的研发开始工作,你开始制造你创造的一些疗法或药物,你就会想出一些定制的,从头开始的东西。研发就是尝试新事物。因此,这并不仅仅意味着您在同一个函数中尝试不同的参数。这意味着您正在尝试不同的功能。您正在尝试不同的流程。
所有这些东西相互碰撞,使得生物学和药物学非常、非常难以描述,也很难确定它们的数据结构是什么。我认为,从历史上看,我在我所做的所有研究中肯定观察到的是,在这个领域构建应用程序非常困难。实际上很难自动化任何事情。因为你在自动化什么?你可以让硬件工作,但很难理解软件是什么。很难理解您试图在某些自动化设置中捕获的过程是什么。尤其是在研发层面,你真的总是让人们几乎不可能拥有任何自动化的数字化,而不是仅仅以更结构化的格式捕获数据,从我们所看到的。
有时会有点对点的自动化。当谈到自动化实验室时,人们也会谈论自动化孤岛,机器人手臂在空间中被称为“工作单元”的设置。但整个设施没有统一的东西。从传统企业的角度来看,我认为我肯定会说,嘿,我可以登录某个门户网站,在这里查看我的数据,我的生产过程吗?不,因为无法描述或捕捉它。我认为,对我们来说,这似乎是真正阻碍的核心问题,尤其是科学生物学的研发。就是它太复杂了,无法确定。因此,除了以断开连接的方式记录内容之外,很难对数据做任何事情。
这真的启发了 Ganymede。我想很多人传统上会这样说,“嘿,好吧,让我们聚在一起,为科学中的所有概念制定一些标准。我们如何为这些不同的事物创建一些分类法,以便我们能够开始让实验室仪器或应用程序以这种一致的格式输出数据?”但这是行不通的。这些努力最终总是停滞不前。因为你无法确定科学中的所有概念。您不能在这里真正开发无代码解决方案。你不能说,“哦,我要采用 OPC 风格,并拥有所有这些我要从 A 映射到 B 的标签,就像中间件一样。”它不起作用,因为周围有太多概念。我认为这就是我们真正观察到的地方,这里确实需要软件开发人员来处理这种级别的复杂性。
埃里克:让我们再深入一点。因为我想,在一个非常高的层次上,很多人会关注这个研发过程。您可以将制造过程视为一种同义词。好的,我可以绘制流程。我们有设备。数据来自设备。我们采取行动。我们将数据放入系统。在纸面上,它们最终可能看起来非常相似。是不是在一个制造过程中,它被设计成标准化的,你没有太多的空间给人脑去发挥或解释?在这个过程中,这是一个非常重要的元素。它让一个人参与自主决策。这是困难的关键因素,它阻碍了之前自动化此过程和连接笔记的努力吗?
内森:我会说这是一个大问题,是的。我想说这里确实存在三个典型的数据问题,这使得纯粹从数学角度来看很难将其纳入传统的类 CRM 工具或类中间件工具中。一个就是你所说的,如果你在制造过程中,你可以定义你的过程。它可能会稳定一两年,至少,希望如此。在研发中,它似乎每周都在变化。因此,这意味着很难让独立的 IT 人员或第三方顾问介入并与科学家合作来稳定流程。因为即使你正在稳定它,它也会发生变化。因此,需要进行一些去进化。我们经常发现地面上的科学家完成最后一英里,然后让中央方或第三方以更模块化的方式建立骨干网。
第二,我想说的是,有大量的数据聚合。打破 OPC 风格点对点映射范式的东西说,好吧,我有标签,A、B 和 C,这些在很多分析仪器中转到 XYZ,我们经常发现实际上味道更多就像,“嘿,这个实验我做了七次,我需要把它汇总到一个平均值。我关心的是平均值。”因此,您将获得这种聚合样式映射——一对多或多对一。数据点之间的那些更复杂的关系很难在无代码工具中描述。但他们在这里无处不在。
那么第三个,我想说,也和你说的完全一样。在研发中,当你做一些分析并得到一些有趣的结果时,有趣的部分意味着你将要做一些复杂的决定,并从那里有分支逻辑和分支路径。这不像你在做质量控制,你说,好吧,好吧,质量控制是通过,失败。通过,失败,这是一个非常简单的决定。但在研发中,你可能有很多很多分支点。由于所有这些原因,它随着时间的推移而发展。统计数据稍微复杂一些,因此关系不仅仅是一对一的。即使在实验空间内,您也有很多分支。我想说它在空间和时间上非常复杂。
埃里克:明白了。好的。好吧,让我们来看看 Ganymede 是做什么的。但也许在我们进入细节之前,您可以在较高的层次上勾勒出我们的愿望是什么,这对您很有用。你想在实验室完成什么?
Nathan:综上所述,我希望这能让我们的方法作为一种解决方案变得非常清晰,也就是说我们将其视为一个软件工程问题,解决方案 — 很难没有任何代码可以在这里工作。因此,我们希望打造完美的开发者平台,让软件工程师进入太空,或者让太空中的科学家和数据科学家自己编码。这已经发生在湿实验室之外的更大规模、数据驱动的生物学部分,如基因测序。现在有一个完整的数据科学学科,生物信息学,人们正在建立管道。他们正在编写 Python 脚本。他们非常高效地进行这种大规模计算,并在自定义业务逻辑中创建了大量代码。因此,我们想首次将其引入湿实验室,我认为这是一种与以往任何人都不同的方法。
我想每个人都会看到这里的复杂性,并且总是说,嘿,让我们让科学家参与进来。让我们为他们提供无代码工具。最后一公里就这样解决了。我们可能有更悲观的看法,也就是说,不,确实需要一个会编码的人。科学家可以帮助他们提供建议,但那个人将成为处理这种复杂逻辑的桥梁。到目前为止,这是一个非常有效的范例。
我们的长期愿望是创建湿实验室生物学和制造的生物信息学和开发人员社区。我认为,人们在空间中散布了一些我们肯定认同的短语,比如 LabOps。那是一个大的。有一家公司,Elemental Machines,创造了它。他们在传感器和数据领域做了很多出色的工作。我认为这类似于机器学习等行业的发展方式,在过去,每个人都是数据科学家,数据科学家会进行分析。但它背后并没有太多的基础设施。
如今,有了像 Databricks 这样的公司,每个人都开发了机器学习操作这一学科,在那里你有专门致力于构建流程和基础设施的人,连接机器学习开发过程的不同部分。同样,我们想把它带到湿实验室空间。这是我们的长期愿望。从战术上讲,在实验室仪器连接数据基础设施中有很多工作要做,这是我们现在正在研究的产品的实际内容。但从长远来看,我们认为这是需要软件工程解决方案的事情。
埃里克:如果我们看看今天部署中的用户和问题空间,我们有研究团队正在使用实验室。我们有这些信息的消费者——他们可能是企业,可能是管理层,他们正在使用实验室经过大量处理的输出。然后我们有管理技术、部署技术和管理那些系统的人,他们在历史上可能就像 IT 部门,也许 IT 人员嵌入在一些公司的研究团队中,但基本上是 IT。所以,这实际上是连接系统并集成它们。
现在我们正在进入这个数据科学时代,然后你就进入了重点,问题是,好吧,我们有数据科学家吗?他们坐在哪里?他们和 IT 坐在一起吗?他们坐在实验室里吗?根据我在这里的经验,通常情况下,它就像一个数据科学人员。也许在大公司的总部,他们有一个合适的团队。但在很多情况下,在中国这里,就像我们的数据科学家一样,这对那个人来说是一项艰巨的任务。在这些不同的人中,谁会是主要用户,谁会是次要用户?那么他们的角色是什么,不仅仅是使用 Ganymede,而且在一般情况下,在为实验室建立这个数据基础设施方面?
Nathan:我认为整个用户群与您所描述的非常相似。我认为,正如您之前所说,在很多方面,生物研发是制造业的一个特例。它非常受流程驱动。我认为它有这些非常复杂的现象。因此,它有相同的 IT 人员、数据科学家、技术科学家和现场人员。我想说,我们最终的业务在某种程度上介于中后期研发公司和大型制药公司之间。中间有一个空间我们并没有真正触及,那就是临床试验。那是在这些阶段之间。
我想说的是,在研发方面,我们通常会非常直接地与数据科学家或过程工程师合作,有时甚至直接与科学家本人合作。我们确实总是在寻找一些赞助商或拥护者,我会说,他们可以编码并成为实验室中的那个人。那么在大规模的医药制造方面,就是你描述的那样。 IT 通常是我们的客户。 IT 更加集中。通常,我会说,在生物和制药领域,我们看到有很多数据科学家嵌入到业务中。不止一个。因此,有一种非常好的纪律侵入式编码能力是新生的,它开始出现在企业、设施中,无论它们在哪里。因此,我们可以让这些人成为我们的拥护者。告诉他们,嘿,如果你以前用脚本编码,现在我们可以用 Ganymede 编码了。看,它为科学家们创造了一个漂亮的无代码界面。
但最终,最终受益的用户肯定是科学家。我认为我们正在尝试做的是说,好吧,数据科学家,无论谁在 Ganymede 中编码——有时 IT 团队自己直接,或者有时 Ganymede 作为服务的一部分——他们正在构建工具和代码,然后将在 no由科学家直接编写代码,并使科学家或工厂技术人员受益,并使他们的工作流程自动化,使他们的数据输入自动化,在他们移动 U 盘上的数据时实现自动化。在过去的计算机之间,没有更多。
埃里克:好的。这就说得通了。然后让我们看看技术堆栈。我通常的想法是,你接触机器,然后连接到云,然后处理,然后将数据发送到应用程序,以便人们可以对它们采取行动。也许您采用了不同的方式来构建它。您将如何构建技术堆栈?那么您今天播放的图层在哪里?您在哪里与其他遗留系统或其他技术进行交互?
内森:我想说,我们有两个主要层次。一个是我们所说的代理层,它是机器的接口,也是网络或其他云中应用程序的接口。但是,需要获取数据。为此,我们拥有各种各样的技术。因此,从我们拥有的可以插入 USB、以太网、RS-232 等的物理设备到 ScriptRunner 中基于 Windows 的文件观察器,再到我们拥有一个纯粹基于浏览器的系统,再到一个 API-基于网络代理,可以通过 API 持续同步应用程序的数据。
所有这些,对我们来说,他们所做的就是获取数据,然后同步数据并为 Ganymede 云创建一个实时数据接口。 Ganymede 云将使用这些数据,保持同步。然后每个单独的数据源都变成了一个数据框,一个为我们准备的表格。因此,我想说,我们几乎尝试从我们看到的所有数据源中构建一个数据库。这是事情开始与现状截然不同的地方,也就是说,我们认为处理这种复杂性的最佳方法是将其视为数据库软件工程问题。
而不是说,嘿,我们将拥有 JSON 样式或 OPC 样式格式的非结构化数据日志,一切都是表格。我们的代理人将把数据放入表格格式。我们的代理不会执行任何业务逻辑。本地不允许业务逻辑。所有业务逻辑都必须在云中定义。这包括驱动程序。所以,我们将从设备发送原始信号并将它们放在云端,然后解析这些的驱动程序都是基于云端的,这很棒。因为它允许开发人员进去说,“嘿,我可以看到来自任何仪器的所有原始数据。我可以立即在云端更新驱动程序。”因此,这就是我们的云的用武之地,它获取所有这些数据帧,为您将它们放在一个单一的控制平面中,并允许人们实际编写代码、构建代码并在 Ganymede 版本中运行代码作为真正的云平台。
我想说的是,虽然我们肯定比 AWS 或 GCP 更具体,但我们让用户编写和运行自己的代码、存储数据、对其进行版本控制、管理的能力或多或少与 AWS 或 GCP 相当与真正的云提供商。因此,我们从一个非常非常低的水平开始,试图朝着生命科学的正确方向发展,一般来说,任何具有这种高度复杂性的事物。
埃里克:明白了。那么在应用层,做数据可视化吗?您是进行分析,还是主要处理信息并将其提供给其他系统?
Nathan:我们有一些内置的本地分析和可视化。我想说我们不会尝试专注于此。很难与 Power BI 或 Tableau 之类的东西竞争。因此,这些可以连接起来。我们的数据层以数据湖格式存储所有内容。这很容易连接到人们可能拥有的任何 BI 工具。但我们确实有一些本地可视化。
因为我们允许人们编写任意代码,所以我们可以托管驱动程序。我们可以将解析器托管到所有这些集成的仪器和应用程序。但我们也可以主持科学分析。这是这里的杀手级应用程序,我们不仅在集成仪器并将数据从 A 移动到 B,而且我们实际上还在进行完整的统计。在某些情况下,我们有完整的机器学习模型,就在中间。这就是它对生命科学非常有效的原因,我认为这是一个很大的差距。所有这些东西都交织在一起,你真的需要一个地方,你可以说,嘿,我的乐器司机就在这里。然后我的统计模型就在这里。他们一起流血。你知道吗?没关系。我们会招待他们俩。
我认为,我们正在做一个非常完整的端到端过程,说,“嘿,你运行了你的仪器。我们将收集所有数据。做那个分析说,嘿,你运行了七次。这是标准偏差。我们将把标准偏差统计数据放入您的应用程序中以记录它。也就是说,我会说,最终在 Ganymede 中构建的端到端。这都是用户定义的代码。我们有很多现成的,但您可以随时打开并编辑它或构建您自己的。
Erik:关于从机器上获取数据的任务的问题。因此,今年早些时候,我在一家化学公司的实验室环境中开展了一个项目。他们试图从某些机器上获取数据。在某些情况下,唯一可行的解决方案似乎是使用摄像头,观察机器并从界面读取数据。好吧,它是 45。然后你基本上得到的是物理上可见的数字,也许是一个闪烁的红灯。化学品可能是一个对价格更敏感的行业。也许他们使用的设备比许多生命科学公司都旧。他们也只是老公司,所以也许他们有更多的遗留设备。但是与您合作的公司的情况如何?您能够插入并提取数字数据的是 99% 的设备吗?您是否还必须找到变通方法才能从不具有接口的设备获取模拟数据?
内森:我们一定要找到解决方法。我想说,幸运的是,由于许多仪器在生命科学中所做的工作具有这种统计性质,因此它们确实更有可能发出您可以解析和处理的文件。但是,你所描述的,嘿,这是一些完全锁定的仪器,没有端口,你必须将相机对准屏幕并读取数据,这肯定也会发生。我认为这就是我们所说的我们的范式将要成为的地方,你知道吗,我们知道没有灵丹妙药。没有一个标准可以让一切都符合。我们不会像对待 OPC 可访问的或拥有 Web API 或类似的东西那样对待整个世界。相反,我们将假设一切都会像那样——非常分散,很难连接——并构建不同的方法来使用不同的代理获取数据。然后让用户定义他们想要如何解析业务逻辑。
在这些数据非常干净的情况下,我们可以从一些 API 或一些非常容易解析和引入的文件中获取它。然后在数据非常混乱的情况下,您可以通过非常笨拙的方式获取数据。所以,这通常是我们可以进行 OCR 的地方。我们在 Ganymede 中有一个系统,用于解析图像或 PDF 等内容,如果数据是这样的话。我们可以与条形码扫描仪集成。如果需要,我们还可以让用户、开发人员在 Ganymede 中创建一个表单,供用户输入数据。我认为我们试图假设没有灵丹妙药,并且这些非常困难的集成将会发生并且无处不在。我们会尽可能地把它粘在一起。但我们不会说“哦,这是我们可以联系的唯一方式。所以,我们不能碰这个。”
实际上,我认为我们最终能够覆盖人们拥有的 95%、99%。因为我们会在仪器允许的范围内进行整合。我们将尽我们所能,努力创造最流畅的体验。但它可能并不总是能够真正实现端到端的完全自动化。但在很多情况下,确实如此。
埃里克:是的,我想这份工作至少应该随着时间的推移变得更容易,对吧?我认为新推出的设备往往更具连接性。
内森:主要是。
埃里克:快速提问——是的,请。
内森:我主要是想说。我认为该行业正在朝着正确的方向转变,但这是一个缓慢的过程。希望一切都会好起来。
埃里克:是的,没错。因为这不仅仅是一个技术问题,对吧?围绕构建墙壁与使您的解决方案连接起来有一种完整的心态。我想,这既是一项技术性的公司战略决策。
内森:没错,是的。
埃里克:让我们看看。所以,你刚才提到你不接触临床试验。为什么不?围绕它有哪些独特的并发症?作为业务问题,它只是不有趣吗?什么原因?
内森:我会说,这只是一个非常不同的领域。我们的专业一直在说,“嘿,你有所有这些实验室仪器。你有你正在做的所有这些统计数据。我们可以将它们全部放在一个地方,让你在它们之上编写代码并自动化它们。”临床试验,那里有一大堆不同的软件。更多的是关于医患互动。它也受到更多监管。我们不想触及任何包含人类身份信息的数据。就我们平台的用途而言,我们的平台仅用于处理运营数据。因此,这是一种不同的监管制度。这是一个非常不同的数据问题,我会说。
实际上,您在这些临床试验中使用了一套更清晰的工具。您知道您正在使用的五、七种不同类型的应用程序的不同首字母缩写词。更像是其中的数据非常混乱。我们发现,这通常更像是一个数据清理问题。还有其他公司专注于数据清理,我们会让他们做他们的事情。我们更专注于数据结构和分析结构,这更适合湿实验室和物理过程。
埃里克:让我们试着让它尽可能具体化。我认为做到这一点的最好方法是通过端到端的案例——从他们必须面临的挑战到部署解决方案。如果有帮助,您也可以将两个或三个案例混合在一起。但我认为了解 KPI 是什么或人们希望实现的具体影响也很有趣。是某一个过程、时间短了,还是提高了质量控制到某一个措施?这里的目的是什么好处,客观的好处?
内森:是的,我会给你两个案例:一个是更大规模的制造,另一个是业务的研发方面。在制造方面,我们与一家名为 Apprentice 的公司建立了合作伙伴关系。 Apprentice 是一个制药制造执行系统。他们本身就是一家初创公司,比我们大得多。他们筹集了超过 1 亿美元。和他们一起工作真是太棒了。他们所做的是,通过他们的 MES,他们有一个应用程序,制药厂车间的技术人员可以使用该应用程序来描述他们的流程、捕获数据、拥有他们的电子批次记录等等。正因为如此,Apprentice 确实非常希望与人们在工厂车间使用的许多仪器和机械进行更多的本地集成。因为这种制药制造受到难以置信的锁定和监管,所以对于客户以及这些领域的 IT 和合规人员来说,不仅自动化数据输入以加快技术人员的速度,这具有很高的价值,尽管这是一个很大的优势,但也对合规原因。能够记录数据并确定人们所做的一切都是真实的,这一点非常重要。
他们来找我们,学徒,说:“嘿,我们有一大群客户真的可以从天平、实验室天平更深入地集成中受益。”在制药过程中,当你制造一种药物时,第一步通常是称出你要准备的药物或药丸的不同成分——活性药物成分,那些基质会坐进去,不管是什么。
他们在那个领域面临的问题之一是他们会建立公差,好吧,你需要从中权衡多少?你可能会说,好吧,我可以称出 50 到 55 毫克,因为食谱上说是 52 毫克。所以,我的容忍度是 50 到 55。如果高于或低于该值,我将不得不拒绝该批次并将其丢弃。最终发生的事情是人们会因为不小心而称重 56 毫克。他们会说,“你知道吗?实际上,它已经足够好了。我称之为 55。所以,这是不宽容。我可以继续我的一天。”这是个大问题。那是因为有人手动记录数据。它不是直接来自任何东西。他们只是看着屏幕上的秤,然后写下数字。
对他们来说,我们所做的就是说,好吧,让我们让这些量表更自然地整合。天平如何整合?大多数情况下,他们没有 PC。他们没有网络组件。它们只有一个 USB 端口、一个以太网端口或一个 RS-232 端口。因此,我们使用我们的边缘设备,与它们连接。边缘设备没有解析器或业务逻辑层来标准化边缘设备上的数据,它们实际上只是接收来自 USB 端口、RS-232 或以太网的信号,并将它们发送到云端逐字。同样,他们将从云中获取信号并将其逐字逐句地放回秤中以控制秤。
我想说,这是我们的方法大有帮助的地方。因为这意味着这些规模都非常不同,非常少——它不是 OPC。它实际上是通过电线传输的字符串。你会得到类似 w19G 的东西,这意味着我们重 19 克,或 T 代表等级。每个规模都有完全不同的实现。他们的记录很差。有些文档是错误的,尤其是当您要访问许多多个制造商时。
因此,这就是我们基于云的方法非常有效的地方。因为我们能够说,嘿,我们将把所有的字符串都从秤上拿下来,然后用基于云的驱动程序实时处理它们。然后将它们放入 Web API 中,供学徒应用程序使用、读取和写入。通过这种方式,我们能够非常高效且快速地为新的秤类型编写新的驱动程序。
与许多制造商不同的是——他们已经建立了一些连接层。例如,大型制造商 Mettler Toledo 拥有所谓的 LabX。这是他们规模的数据层,但它非常具体。很难设置。它充满了梅特勒托利多如何看待世界的语义学。 Apprentice 的经验以及 Apprentice 的客户对 Ganymede 的经验是,我们实际上是一根魔杖,当你说我大规模指出时,它是什么制造商并不重要。只要它有一些连接器,我们就会连接边缘设备。我们只会说,嘿,我们看到所有的琴弦都脱落了。我们可以查找文档,然后非常快速地创建映射到这些字符串的含义。这完全是基于网络的。你不需要任何人。一旦事物在本地连接,您就不再需要任何人了。您可以从世界任何地方开始在 Web 上编码并快速完成。
对于制造执行系统和这些受监管的制造客户,我认为这是非常具有变革性的。因为他们能够真正从根本上加速这一过程,从需要数月才能整合秤的事情,而且可能不值得,到现在每个秤类型需要几天或几周的事情。同样,我认为在科学湿实验室中也是如此,那里的问题有点不同,但同样的价值支撑是说,这对我来说非常重要。更少的合规性,更多地加速我的科学家,因为他们今天花了很多时间进行数据输入。但这是一回事。
同样,如果我拥有我购买的所有这些实验室仪器,实验室仪器只会将文件发送到附加到它们的 OPC 上。就是这样。他们完成了。人们最终不得不在本地打开这些文件并在 Excel 中进行一些分析,或者将文件导入某些软件进行一些分析,然后进行分析并将其放入 Benchling 或制造执行系统等应用程序中,或者LES,或任何它可能是。这是一个非常一致的流程,非常容易出错,而且非常需要手动处理数据,比如,嘿,我必须得到这个文件。我必须手动进行分析。然后我必须手动将它放入某个应用程序或其他东西中。
我认为,我们有更好的方法。我们说,好吧,我们要连接到仪器上。我们将获取文件,将其原始托管在 Ganymede 中,然后自动在软件层构建解析器。自动进行分析。然后自动将最终结果放入需要去的地方。对于科学家来说,这在某种程度上是相同的价值支柱,更注重节省时间而不是合规。但我会说,它们可能会加快 10% 到 20%。他们每周花费数小时、数小时和数小时进行数据输入。它就这样消失了。所以,它真的从根本上加速了人们。在科学领域,它减少了进行实验所需的时间,然后查看输入的数据以对其进行调试并决定您的下一个实验将是什么。此外,在这样的环境中,它有助于节省员工人数。因为您不需要那么多科学家来运行相同的实验室流程。
埃里克:好的。伟大的。在这两种情况下,这听起来都是一个非常高价值的解决方案,而且有些直觉认为这是市场需要的解决方案。你已经提到人们基本上在问你,我什么时候可以买到它?我刚刚看了你的一些数据。你是一家相对年轻的公司,成立 10、11 个月。你筹集了大约 1500 万美元。显然,投资者对这里的业务非常有信心。问题的答案是什么,为什么是现在?这感觉像是一个需要解决的问题。为什么梅特勒托利多没有,为什么过去十年一直在向这些公司销售的X大型设备制造商没有,为什么这个问题基本上没有得到解决?
内森:到目前为止,我们确实成长得非常非常快。我认为是因为这里有这样的需求,而且还没有解决。这是个好问题。我想说,这可能有两个主要原因导致这个问题还没有得到解决。一是,人们处理这个问题的方式总是说他们最终开发的是非常本地化的解决方案,或者非常类似于应用程序或类似于公司内部平台的解决方案。比如说,梅特勒托利多。他们很棒,但他们并不专注于软件。正如您所说,制造商通常会受到激励去尝试并达到这些局部最优,他们只提供连接到他们机器的解决方案。因此,这破坏了人们能够连接到一切的价值支柱。他们最终不得不为他们在整个业务中涉及的十几个不同的仪器制造商和应用程序提供十几个不同的连接层。
通常,人们有时确实已经安装了这些东西。然后我们最终成为所有这些连接层之间的连接层,只是因为它们都是如此分散且彼此断开连接。然后,我想说的是,该领域几乎没有真正的软件工程。成为一名软件工程师是一个非常困难的领域。因为人们经常想要构建应用程序,而你不能在这里真正构建应用程序。人们想要构建无代码解决方案,这在其他行业非常有效。但你不能在这里真正做到这一点。软件工程师所做工作的传统范式并不适用。
我们观察到的唯一真正有效的是处于非常原始水平的开发人员平台和云基础设施,我想说,这是一种非常极端的软件工程类型——你在生物领域了解不多,因为很少有传统上,云基础设施工程师有充分的理由关注这个领域。但我认为现在终于对我们来说,我们真的引进了大量的软件工程人才,大量的云基础设施工程人才,并且真正以前所未有的方式将大锤带入了这个领域。我会说,这是另一方面。我们能够在更深层次上进行构建,并利用当今行业中存在的更深入的软件工程人才。
埃里克:迷人。嗯,很明显,你是个敏锐的人。看起来你有一个很棒的创始团队。听起来你真的找到了正确的时间和正确的问题。如果我们展望接下来的 12 个月、24 个月,您会看到什么?在接下来的几个开发周期中,您需要解决哪些问题?
内森:我会说,12 到 24 个月在创业领域是一个非常长的时间。那段时间我们有很多计划。我认为,我们现在作为一家公司所处的位置,在这里的一年内,即 2022 年,我们在核心后端方面已经建立了很多。我们在后端级别拥有轨道和功能,可以真正执行任何实施,以连接任何仪器或设备或应用程序。现在,从这里开始,我们目前正在工作的地方是生产更多的网络应用程序,而不是仅仅通过命令行与 Ganymede 的系统交互,实际上有一个图形界面。然后下一步,进入明年,就是说,好吧,这个网络应用程序现在可供人们自助服务,登录。
我认为,尽管我们正在做很多大型传统企业销售,但我们非常、非常专注于说我们想要创建一个非常好的工具,作为这些生物技术公司或这些制药公司,这样他们就可以在不与我们交谈的情况下使用 Ganymede。这对他们来说是一个巨大的优势。因为这样,他们就可以跳过整个企业销售周期。他们可以移动得更快。他们不必与我们交谈。虽然,我们总是会深入参与大型企业交易,但这也对我们有帮助,因为我们确保该平台非常强大且非常模块化,以至于有人可以自助使用它。这对我们内部也有帮助。因为我们的内部开发人员也将从中受益。我们在某种程度上将他们视为等同于外部开发人员。
说来话长,我认为自助服务功能对我们来说很重要。能够进入我们的网站,实际上只是打开并重新启动一个新的环境,这对我们来说很重要。我认为,对于该领域的许多公司来说,很难拥有这样的解决方案,因为他们并不专注于云基础设施。只需单击一个按钮即可自动启动整个云基础架构环境的想法非常令人生畏。但这就是我们来自的地方。本质上,这是我们的 DNA。因此,我们希望深入其中,真正利用它,并从那里走得更远。
展望 2023 年,我认为我们将要讨论的其他几个主题是,一个,现在,Ganymede 是一个非常有凝聚力的集成平台,您可以在其中做很多事情。但是我们想开始将其解耦并使其更加模块化说,嘿,如果你只想使用 Ganymede 的数据库,因为它是生命科学制造的一个很好的数据库,就在这里。让它自己发疯。如果你只是想使用我们的计算层因为它设置得很好,或者你只是想使用我们的代理并自己安装它们,你可以单独使用它们。我们将开始让事情变得更加开源、开放核心,这样您就可以在您的系统中下载和使用 Ganymede。
我认为,我们永远不会完全在本地进行,因为我们认为未来在云端。但我们正在努力让人们能够在他们的云中自行托管 Ganymede。由于这通常是客户的巨大需求,因此他们投资了这些在内部构建为私有云的大型云层。为什么不能在那个环境中运行 Ganymede?
然后我认为,从长远来看,我们真正关注的是,尽管我们与生物技术公司和制药公司合作很多,他们从自动化中获得直接价值,但从长远来看,如果他们更加自助服务,我们实际上我想主要关注融入其中的事情。我们希望能够说,嘿,任何时候当你从我们合作的制造商那里得到一台新仪器并打开它时,它就会创建一个新的 Ganymede 云,比如我的 instrument.client .com。您将能够进入那里并在网络上查看那里的所有数据。无需再进入本地 PC 上的文件。一切都只是将其数据直接写入本地云。应用程序也一样。我们希望构建正确的基础设施和连接层,让所有这些不同的东西和生物实验室在该基础设施级别相互交谈,并真正开始构建一个更好的连接层。这是我们的长期目标。
我认为看看这个行业的发展方向,这里已经有很多尝试为实验室构建更好的集中层的失败尝试。其中很多都失败了,因为人们试图编织科学语义来尝试让分析本身开箱即用。我们的看法是,它永远不会开箱即用。它总是需要的——业务逻辑总是需要重新定义。但是您可以做的是为可用数据提供正确的基础架构层。所以,这就是我们所痴迷的。我认为这就是我们将在 2024 年开始关注的很多内容。对于仪器制造商、应用程序等来说,这是非常强大的工具,能够非常深入地耦合 Ganymede 作为他们的云层,代表这个 on-预压机。
埃里克:太棒了。好吧,我可能会在 12 个月后再次邀请您。你是对的,12 个月在创业世界中是很多时间。你们,伙计们,显然行动很快。我参与过相当多的企业创新项目,其中 12 个月的时间刚好足以进行一些内部调整,你想朝哪个方向前进。内森,你正在建立的伟大企业。感谢您今天带领我们完成它。真的,我很想在 12 个月、18 个月后聊天,看看你在哪里。
内森:是的,我很乐意签到。正如您所说,有些东西仍将处于相同的销售渠道中。企业创新过程 12、18 个月,它就会出现在原地。然后希望我们的工程团队可以同时构建整个宇宙。所以,我们将看看我们能走多远。