研究团队开发幕后工具以更好地发现生物医学数据|热门


(相关资料图)

Scripps Research 的科学家开发了一种新工具,可以使数据集、科学资源和培训材料更易于在线发现,从而帮助更快、更有效地促进科学发现。

2023 年 4 月 20 日在BMC Bioinformatics上发表的一篇论文中描述了这种称为数据发现引擎 (DDE) Schema Playground 的新工具。DDESchema Playground 是一种基于浏览器的资源,使科学家能够使他们的数据更容易找到并且可以在网络上访问,这在过去一直是一个重大障碍。

该资源是 Data Discovery Engine 不可或缺的一部分,Data Discovery Engine 是一个用户友好的网站,可帮助提供商更有效地将其科学数据集与潜在目标用户联系起来。研究人员可以使用 Schema Playground 以更具互操作性的方式构建有关其数据集的信息,门户成员还可以注册他们的数据集,使数据集更易于发现和重用。

“一般来说,在网上有效地搜索和寻找东西是很困难的,尤其是在研究资产的复杂性水平上,”资深作者、斯克里普斯研究所综合结构与计算生物学系副教授 Chunlei Wu 博士说。“结构良好的元数据,通常在搜索引擎的幕后,是成功在线发现的关键。DDE 提供了一套幕后元数据工具,如模式游乐场,以在生物医学数据提供者和研究人员之间架起桥梁,因为数据消费者。”

作者之一、Scripps Research 的科学家 Ginger Tsueng 将 DDE 的效用比作使菜谱可以在网上找到。您的搜索结果可以根据评分、准备时间、配料等有用的标准进行细分。这些具体、准确的搜索结果是可能的,因为每个在线条目中都包含元数据(关于数据本身的描述符)。

但是,虽然食谱等信息的元数据已经标准化,因此更容易找到,但生物数据集的情况并非如此,主要是因为它们的复杂性。例如,传染病临床前研究的数据集可能与免疫学临床试验的数据集有很大不同。此外,每个研究分支都有自己独特的元数据类型,因此很难在其中进行搜索。