挖掘生物活性信息宇宙

BioMiner 将论文、专利、表格、图片和化学结构转化为结构化活性知识。

它同时是一个在线活性抽取工具,也是一个持续增长的超大规模活性数据集, 让隐藏在文档中的活性证据变得可搜索、可验证、可复用。

实时多模态挖掘 生物活性条目
论文 PDF
EGFR
target mention
专利 CLAIM
EXAMPLE 47 Cmpd 12
compound evidence
表格 ASSAY
Cmpd Target IC50 12 EGFR 8.4 nM
activity value
IMAGE
structure + curve
BioMiner 引擎 解析 · 对齐 · 抽取
靶点 EGFR 证据已关联
配体 Cmpd 12 结构已对齐
活性 IC50 8.4 nM 自表格抽取

How it works

从 PDF 到结构化活性,三步完成

  1. 1
    上传文献

    提供单篇 PDF 或文件夹批量提交,支持论文、专利、表格、图片。

  2. 2
    多模态抽取

    BioMiner 协调 MLLM、OCSR 与 Markush 枚举模型,自动对齐结构与活性。

  3. 3
    校正并导出

    在工作台中复核每条活性证据,导出 CSV 或继续追加到 BioUniverse 数据库。

BioUniverse

在公开数据库中预览抽取结果

EJMC、NLRP3、PoseBuster 等已上线的活性数据集都是由 BioMiner 抽取整理。

进入 BioUniverse →
条活性记录
3 个公开数据集
个独特靶点