下载PDF
IBM > 实例探究 > 帝国数据银行将处理数十亿文本数据的时间从几天缩短到 30 分钟
IBM Logo

Teikoku Databank, Ltd. Shortening the time to process billions of textual data items from several days to 30 minutes

技术
  • 分析与建模 - 大数据分析
适用行业
  • 金融与保险
适用功能
  • 商业运营
用例
  • 质量预测分析
服务
  • 数据科学服务
挑战
帝国数据银行有限公司拥有数百万家公司的数据。为了保持竞争力,该公司希望结合从互联网收集的“大数据”来分析这些专有信息。然而,互联网上发布的信息已经开始对公司业务产生重大影响,因此应对这种情况已成为当务之急。他们拥有经过调查和整合的公司信息,以回答诸如“该公司是什么样的公司?”和“他们有多值得信赖?”等问题。他们没有保留与互联网上类似的信息,例如拥有的产品种类或产品在市场上的评价。然而,客户一直要求他们提供包含此类互联网信息的公司信息。
关于客户
帝国数据库的历史可以追溯到 1900 年帝国兴信社成立之初,距今已有 100 多年。该数据库以“作为可靠的信息合作伙伴,支持经济活动并为社会发展做出贡献”为企业理念,在企业信用调查、信用风险管理服务、数据库服务、营销服务和电子商务支持服务等领域开展业务。作为主营业务的企业信用调查包括“在企业之间进行商业交易时,调查对方的资产状况、销售业绩、声誉等真实情况”——例如,澄清各种商业信息的调查。他们在早期将计算机引入到企业信用调查中,以提高业务效率和客户服务。
解决方案
该公司在服务器集群中部署了IBM® InfoSphere® BigInsights™软件。InfoSphere BigInsights软件基于Apache Hadoop,可实现大数据集的分布式处理。在系统结构方面,他们最初尝试使用单台服务器抓取互联网并处理信息,没有进行并行化,但速度很慢,无法使用,几天都无法完成。测试计算表明,这还需要几周的时间,而且有些处理会在中途停止。当将InfoSphere BigInsights软件引入同一台服务器后,处理速度大大提高。
运营影响
  • Now Teikoku Databank can process billions of items of textual data in 30 minutes.
  • It is analyzing 4.75-fold more data for customers, which has improved its competitive advantage.
  • By implementing a service that uses both the highly reliable corporate information of about 1.6 million companies that they had previously cultivated, as well as the big data that is rapidly processed with BigInsights, they achieved strong differentiation from their competitors.
数量效益
  • Processing time reduced from several days to 30 minutes
  • Analyzing 4.75-fold more data for customers

相关案例.

联系我们

欢迎与我们交流!

* Required
* Required
* Required
* Invalid email address
提交此表单,即表示您同意 IoT ONE 可以与您联系并分享洞察和营销信息。
不,谢谢,我不想收到来自 IoT ONE 的任何营销电子邮件。
提交

Thank you for your message!
We will contact you soon.