DoSTOR存储分析 数据抓取解决方案受到关注

DoSTOR存储分析 10月15日国际报道:现在有越来越多的供应商开始将堆积如山的印刷文献转换成可搜索的数据,它们预计能在今后几年借此大赚一笔,弗吉尼亚阿什伯恩的Brainware公司也不例外,也想分一杯羹。

该公司以前是欧洲企业内容管理方案供应商德国SER公司的分公司之一。 后来Vista Equity Partners公司在2002年将它收购并投入了至少100万美元的投资,虽然它与母公司之间存在着非常紧密的转售合作协议,但它仍是一家独立的公司。

从那以后,Brainware公司的业务就一直处于上升阶段,它拥有80名员工和400家客户,其中有一半企业客户在欧洲,另一半在美国,比如EDS、Southern Company、US FoodService、壳牌石油公司、Kimberly-Clark、Pitney Bowes、Her Majesty的Prison Service、Capgemini和Halliburton等。这些企业客户中,有许多客户每年的发票都在100万张以上。

尽管目前企业界普遍开始转向无纸化商业,但是这些企业仍然在使用大量纸质发票、厂商投标、购货单、保险单、法律文件和其他等。例如,据说Halliburton公司就有一个发票处理系统,其中包括55万个不同的厂商,各自的发票都必须放到相应的企业资源计划数据库中以满足其他应用软件的需要。

那就是Brainware公司生存的基础。它利用合作伙伴ABBYY公司提供的扫描仪,将图片从纸质转换为电子格式,然后接受Brainware Engine软件的支持。 那个数据包利用模糊逻辑来提取数据、利用一款所有权搜索引擎来组织它们,然后将它放到客户的ERP系统中。对于Halliburton公司来说,这个ERP系统是基于SAP的。

对于大型企业和政府机构来说,这种内容抓取方式是很普通的。实际上,ERP在高盛公司进行的100位首席信息官级IT经理评出的最新IT开支优先项目中排在第六位。

与Anydocs、Kofax、EMC(它在2005年以2.75亿美元收购Captiva公司而进入了这片市场)和IBM(它在2006年以16亿美元收购FileNet公司而进入这片市场)等公司相比,Brainware公司拥有大量优势。这片市场上的其他公司还包括Banctec、Datacap和Reedsoft等。

Brainware公司声称它的领先优势在于内容提取的速度非常快。Brainware公司官员表示,一般来说,软件供应商利用各种模板来从发票或者其他商业表格中检索数据。 据Brainware公司说,这种方法就迫使客户建立一个新模板来满足他们所需使用的各种业务凭证的需求。

例如对于Halliburton公司来说,利用这种方法提取数据需要使用到55万个模板。

Brainware公司还称,其软件可以处理结构化和非结构化数据,比如可以在同一个包括发票和购货单的可搜索数据库中增加电子邮件,而且搜索速度并不会因此减慢。公司首席执行官Carl Mergele说:"我们并不是存储关键字,而是存储与内存有关联的字、短语、句子、段落、文章等。"

系统知道有多少数据被放进去了,因此效率就得到了提高。

虽然要想弄清楚Brainware公司声称的这些或那些功能到底能给它多少竞争优势是一件很困难的事,但是公司客户和合作伙伴的不断增加有力地证明了市场对Brainware公司产品的需求确实处于稳定增长状态。

需求有多大? 纽约研究公司Harvey Spencer Associates的Harvey Spencer称,数据抓取软件市场规模为15亿美元,而且仍以每年16.5%的速度在递增。

Spencer指出,Brainware公司的目标锁定在高端市场,其产品的定价也是据此而定的。 其普通产品的定价都在50万美元以上。

公司首席执行官Mergele比较顽固,坚持他的公司产品和功能实际上价值更高。他说:"在Southern Company公司的业务上,我们的竞争对手是EMC公司,而且我们的产品价格是它们的两倍。 但是Southern Company公司仍选择了我们 ,我们公司的业务已经起步。"他说公司近几年的增长率超过了1200%。