二、与药物开发相关的信息
(一)PubChem数据库
PubChem数据库(http://pubchem.ncbi.nlm.nih.gov/)收录了超过9.4千万个化合物、2.37亿种化学物质的化学结构、标识符、理化属性、生物学活性、专利、毒理学、健康、安全等数据。收录的物质主要是小分子物质,也有大分子物质,如包括药物在内的化合物、包括siRNAs和mRNA在内的核苷酸、碳水化合物、脂质、肽、化学修饰大分子物质等。是NIH分子文库计划(MLI)的重要组成部分,是MLI的资料存储库。建立PubChem的目的在于促进公共部门对小分子数据库的使用,拓展小分子技术的研究,以便更深入广泛地理解与健康和疾病相关的基因、细胞及有机体的功能,帮助生物医学研究人员发现具有疾病治疗潜在活性的分子结构。
PubChem 包括BioAssay(化学成分的生物活性筛选资料)、Compound(小分子化学物质结构)、 BioActivities(具有生物活性的化学物质筛选数据)、Target(药物基因靶向)、Patents(药物专利)五个数据库,通过NLM的Entrez平台提供服务,检索规则与方法同PubMed。
与PubMed相比,PubChem还提供结构检索(Structure Search,http://pubchem.ncbi.nlm.nih.gov/search/search.cgi)。
1.结构检索的入口:提供从名称/文本(Name/Text )、身份识别/相似度(Identity/Similarity )、亚结构/母体结构(Substructure/Superstructure )、分子式Molecular Formula和三维结构(3D Conformer) 检索
①名称/文本:可使用结构描述中的化合物名称、同义词、主题词、分子量、CID登记号等作为检索词。词组要用双引号,如“4-(diaminomethylideneamino)butanamide”;分子量可用“:”表示范围,如:100.5:200[molecularweight],表示检索分子量在100.5g/mol-200.0 g/mol之间的化合物。
②身份识别/相似度:输入化学物质的部分或完整结构检索药物。相似度指化学物质的结构相似的百分率,检索时可指定与某结构的相似度。
③亚结构/母体结构、三维结构:与身份识别/相似度相似。
④分子式检索:输入分子式检索,如C9H8O4
2.结构式辅助输入:身份识别/相似度检索和亚结构/母体结构检索,都需要输入结构式,结构式是图形模式,与文本输入不同。PubChem提供了结构式辅助编辑工具,具体使用方法如下:
图5-8 PubChem结构式绘制对话框
①点击Draw a Structure标签下的【Edit】按钮,系统弹出结构式编辑框(图5-8);
②从工具箱中选定需要的元素;
③用鼠标将选定的元素拖曳到结构式绘制框适当的位置;
④完成结构式绘制后,点击工具箱右下方的【Done】按钮,系统返回检索对话框;
⑤点击【Search】按钮,完成检索,返回结果。
(二)美国临床药物试验研究信息
由美国国立卫生研究院(NIH)与所有的NIH研究所和FDA合作建立。面向患者、患者家属、卫生保健专业人员及公众提供有关在各种疾病中进行的药物临床研究信息(http://ClinicalTrials.gov)。
图5-9ClinicalTrials.gov检索结果列表
可以通过疾病或症状、药物、研究机构、国家等作为检索词检索正在进行或已经完成的临床试验。检索结果列表可以查看试验的状态(招募、进行中、终止、已完成)、临床试验名称、疾病、药物(干预措施)、地域等信息。
如查找双硫仑(disulfiram)发现目前有一个有关双硫仑联合铜剂治疗转移性乳腺癌的二期临床项目正在招募参与者(图5-9)。从ClinicalTrials.gov中可以获得的一项临床研究的方案摘要:包括研究目的概述,参与者招募情况,病人参与标准,研究地点和具体联系方式;研究设计,研究阶段,研究中使用的药物或疗法及用于何种疾病。相关信息MEDLINEplus和PubMed在内的医药网站中的相关疾病主题链接。
(三)NIST的Chemistry WebBook
是美国国家标准与技术研究院 (National Institute of Standards and Technology,NIST)的基于Web的物性数据库(http://webbook.nist.gov/chemistry/) ,Chemistry WebBook可以看作是NIST的标准参考数据库Standard Reference Data中一部分与化学有关的数据库的Web版本,可通过分子式检索、化学名检索、CAS 登录号检索、离子能检索、电子亲和力检索、质子亲和力检索、酸度检索、表面活化能检索、振动能检索、电子能级别检索、结构检索、分子量检索和作者检索等方法,得到气相热化学数据、浓缩相热化学数据、相变数据、反应热化学数据、气相离子能数据、离子聚合数据、气相IR色谱、质谱、UV/Vis色谱、振动及电子色谱等。
(四)Dialog系统的药学信息
Dialog系统是世界上最大的联机数据库检索系统(http://www.dialog1.com/pharmaceuticals),其药物信息分为新药要点(Drug Pipeline Summaries)、产业情报(Industry Intelligence)、工业通讯(Industry Newsletters)、医药专利信息(Pharma Patent Information)、监管信息(Regulatory Information)、研究文献(Research Literature)、研究新闻(Research News)等几大类,选中某类后进入检索状态。
(五)药物专利检索
专利是新药开发和研制中最为重要的文献,药物专利包括药物用途专利、制备方法专利和药品专利(药物化合物专利、药物组合物专利、药物制剂专利)。有关专利检索请参见第章第节,从以下这些网站可获取有价值的药物专利信息:
(1)各国药品管理机构网站:如美国FDA橙皮书
(2)各国专利局官方网站:如SIPO、USPTO…
(3)公益性免费专利数据库网站:如free patents online(目前世界上唯一一个提供化学结构检索的免费专利数据库网站)
(4)商业性专利数据库网站:如Delphion
(5)大型国际商业性联机检索系统:如STN 、DIALOG…
检索和使用药物专利时应注意以下问题:
(1)检索制备方法专利,除了检索制备方法外,要对化合物专利进行全面检索,规避侵权;药物组合物专利应对药物组合物和制剂专利同时检索;药物剂型专利,除了特定剂型外,应对关于该药物的剂型专利全面检索,确保技术的竞争力。
(2)保护区域的确定,应进行全面的同族专利和法律状态检索,确定专利保护的地理空白区。
(3)使用号码途径利用优先权号检索同族专利,要注意号码转换。如:
CN85108115 新低血糖剂的制备方法
优先权:1984.11.13 US 670,776
申请人:美国伊莱利利公司
利用欧洲esp@cenet网站检索,则需将优先权号码转换成US19840670776。
(4)使用名称途径检索,要注意同一公司的不同称谓。如美国保洁公司,还普罗格特和甘保尔公司、普罗格特 - 甘保尔公司、普罗格特和甘布尔公司……等名称,
(5)使用主题途径,要注意名词同义词、单复数及动词不同时态: 如:诺氟沙星( Norfloxacin ),也叫氟哌酸,淋克星,力醇罗,喏氟沙星,正氟氯霉素,1-乙基-6-氟-1,4-二氢-4-氧代-7-(1-哌嗪基)-3-喹啉羧酸 ; 诺氟哌酸 ; 1-乙基-6-氟-4-氧代-1,4-二氢-7-(1-哌嗪基)-3-喹啉羧酸等。
(6)使用分类途径要分清国际专利分类法(IPC)、欧洲专利分类法(ECLA)、美国专利分类法(USPC)、日本专利分类法(FI/F-TERM)、中国专利范畴分类等的异同。
(六)药物靶点数据库
1.Chembl数据库: Chembl数据库(https://www.ebi.ac.uk/chembl/)是欧洲生物信息研究所开发的免费数据库,它通过从大量文献中收集各种靶点及化合物的生物活性数据,为药物化学家们提供了一个非常便利的查询靶点或化合物的生物活性数据的平台。通过该数据库,用户可以快速查询到某个靶点目前已报道的化合物及其活性信息,也可以查询某个化合物在哪些靶点做过生物活性测试及其数据。这些数据都来源于各种已报道的文献,数据较为可靠,且能够溯源,查询到数据的出处。
可通过化合物(药物)名称、靶点、细胞、组织、分析测试、文献等途径查找。在详细信息中有化合物(药物)作用靶点预测(Target Prediction)信息。
2.CTD数据库:比较毒物遗传学数据库(Comparative Toxicogenomics Database,http://ctd.mdibl.org),汇聚了各种不同类型分子的化合物以及来自各种生物体的毒理学数据,目的是促进人类了解环境化合物对人类健康的影响。通过提供化学物质-疾病-基因-蛋白质之间的关系透视图,将相关靶点、通路与疾病机制假说集成,促进环境暴露(化学物质)致病机制的研究,促使人们深入了解这些差异的遗传基础。
CTD提供化学物质、疾病、基因、基因本体、生物体等入口检索,也提供药物、基因、通路组合检索,检出的结果信息详细。
如用disulfiram(双硫仑)使用化学物质名(Chemicals)入口检索后,选择与其相关的疾病,发现该药物与多种疾病有关(如脑缺血、感冒、肿瘤等)。进一步过滤疾病,限制在cancer类,发现该药与多种肿瘤的研究有关系(图5-10)。其研究作为临床证据使用,证据分为与治疗相关( curated )和通过相关基因的作用推断(inferred)两种类型。列表相关的基因和参考文献均可通过链接打开追踪其原始来源。
图5-10 CTD药物-基因相关信息