写于 2016-12-12 03:03:10| 网上赌场网址导航| 网上赌场网址

Chuck Bednar for redOrbit.com - 您的Universe Online威斯康星大学麦迪逊分校开发的新计算机系统在从科学期刊中提取数据并将其输入数据库的任务中表现得比人类更好或更好

新的机械阅读和索引系统,称为PaleoDeepDive,由前UW计算机科学教授ChristopherRé及其同事设计

它的发展在PLOS ONE期刊的最新版本中有详细介绍

“我们证明了系统并不比我们测量的所有东西都差,而且在某些类别中它更好,”现任斯坦福大学的Ré在一份声明中表示

第一作者,威斯康星大学麦迪逊分校的地球科学教授沙南彼得斯补充说,计算机的进步“标志着寻求快速,精确地总结,整理和索引全球科学家的巨大成果的里程碑

”研究人员建立在斯坦福的DeepDive机器读取系统和HTCondor开源分布式作业管理框架创建了PaleoDeepDive

然后,他们安排了它与人类科学家之间的竞争,他们手动将数据输入古生物学数据库,该数据库包含由美国国家科学基金会(NSF)和国际机构资助的古生物学研究数据

根据该大学的说法,PaleoDeepDive“模仿组装古生物学数据库所需的人类活动”

彼得斯表示,他和他的同事“从相同的文件中提取相同的数据,并将其与人类研究人员完全相同的结构,使我们能够严格评估我们的系统和人类的质量

”所产生的大部分知识古生物学家被分解成数十万种不同的出版物,尽管彼得斯说许多研究问题需要“合成方法:例如,在任何给定时间,地球上有多少物种

”而不是试图找到如此他们称之为正确的意义,他们决定“将整个提取问题视为概率问题”,Ré表示

Ré指出,计算机通常很难解读即使是最简单的声明

为了说明他的观点,他引用了一项研究,其中包含“暴龙雷克斯”和“加拿大艾伯塔省”这一术语

在这样的案例中,艾伯塔省是指化石被发现的位置,还是存放在哪里

两种情况的概率大致相等,并且它使PaleoDeepDive成为人们的主要优势

“如果不返回图书馆并重新检查原始文件,就无法评估或增强人工手动输入古生物学数据库的信息

另一方面,我们的机器系统可以在添加新信息时基本上随时扩展和改善结果,“彼得斯说

他补充说,他们的系统的优势可能来自计算机工具的改进

“随着我们获得更多的反馈和数据,它将在全面做得更好,”彼得斯解释道

“另一方面,我们的机器系统可以在添加新信息时基本上随时扩展和改善结果

”机器读取试验需要访问数万篇文章,尽管下载量可能很大学术出版公司Elsevier让UW-Madison的研究人员每周可以获得10,000次下载

据彼得斯说,到目前为止,古生物学数据库已经产生了数百项关于生命历史的研究

“最终,我们希望能够创建一个几乎可以立即完成许多地质学家和古生物学家在一生中小规模地尝试做的计算机系统:阅读一堆文件,安排一堆事实,并将它们联系起来彼得为了解决重大问题,彼得斯补充道

- 在Twitter,Facebook,Instagram和Pinterest上关注redOrbit

- 购买亚马逊 - 2014年最热门的电子礼品