如何从文献/专利/图片等中快速提取化学结构?

对从事化学、药物化学研究、AI药物设计、化学信息调研的专业人员来说,获取在期刊和专利等出版物中的“有效数据”最直接载体是化学结构,通常以化学分子结构式来表示。传统获取化学分子结构式的方式是通过化学结构编辑软件绘制,但该方式耗时且易出错。在某些使用场景下科研工作者可截屏期刊或专利中的化学分子结构式进行保存,但无法满足对结构进一步修饰编辑的诉求。OCSR(化学结构识别)方法的诞生使科研工作者快速提取各类文件中化学分子结构式成为可能,从而节省绘制结构时间。市场上已有多款免费开源工具可将图片或者pdf中的化学分子结构式直接提取为各类化学专业软件可兼容的格式文件,因在操作易用性、识别率、识别准确度等产品性能上还存在较大的优化空间,未得到广泛应用。

近期由望石智慧产研团队开发的StoneMIND Collector(简称Collector),已于2021年9月1日正式推出Windows版本(Mac版也将于近期推出),所有用户均可免费下载使用。

Collector 基于OCSR(化学结构识别)和IUPAC(标准化学名称)识别技术,主要提供一键截图、极速识别结构、结构编辑、化学名称一键转结构等功能,用户在Collector简洁的纯中文界面里可快速提取化学分子结构式的各类格式文件,大量节省用户绘制结构时间。

产品特色

1. 极速识别:随时随地轻松提取结构,一次截屏一个结构,一次快速识别操作只需1秒钟!(分子量大且复杂的结构因网速差异识别时间在2-4秒之间)

2. 实时校正:内置功能齐全的结构编辑器,支持实时编辑或校正识别后的结构;编辑器支持R基及常用基团简写插入、常用复杂母体结构插入、一键美化、IUPAC(标准化学名称)结构转换等。

3. 格式多样:支持识别后结构的sdf文件格式下载及mol/smiles格式的一键复制。

4. 识别准确度高:对于常规截图的化学分子结构式和常用1000个化学基团名缩写,均可一键识别。Collector对含有多元环、螺环、手性的复杂化学分子结构式均具有非常高的识别准确度。

5. 识别记录追溯和收藏:Collector帮助用户追溯历史识别记录,同时用户可通过收藏功能实现对常用或感兴趣分子的快速复现。

(0)

相关推荐