赔偿的英文译语怎么说-dear什么意思
2023年4月3日发(作者:日本笔记本)
如何在ncbi上检索NCBI包括五个部分,第一部分是欢迎进入NCBI,包括NCBI的最新信
息、计划与活动、读者来信、服务地址和用户评论等。第二部分是基因序列数据库(GenBank),
包括基因库概述、检索与投稿。第三部分是数据库服务,包括免费的PubMed检索、Entrez
检索、BLAST序列族性检索、电子邮件服务(详见本章第四节)、匿名FTP服务。第四部分
是NCBI的其它资源。GenBank的检索在NCBI主页的第二部分点击\"SearchingGenBank\",
即可进入GenBank的检索屏幕。NCBI•提供了五种检索,即Entrez浏览检索、BLAST序列
类似性检索、dbEST检索、dbSTS•检索和文本检索(TextSearching)。一、Entrez浏览检索
检索的数据库及其检索信息Entrez浏览器(EntrezBrowser)可以检索以下与NCBI•
链接的基因序列数据库的分子生物数据和书目文献资料。••••
(1)GenBank、EMBL、DDBJ中的DNA序列;••••
(2)SWISS-PROT、PIR、PRF、PDB中的蛋白质序列以及DNA序列数据库中翻译的蛋白质
序列;••••
(3)基因和染色体图像数据;••••
(4)PDB以及收入NCBI分子模型数据库(MMDB)的蛋白质三维结构;••••
(5)通过PubMed检索Medline和PreMedline数据库。••••
检索功能••••
Entrez提供了以下三种检索功能。
••(1)自由词检索功能•••
用户可以通过文本词、关键词、截词、期刊名或文献的作者检索Entrez数据库。截词用*号,
期刊名必须用Medline刊名缩写,作者姓名必须是姓在前,名在后,用首字母缩写。
••••(2)索引词表(ListTerms)检索功能
••••索引词表检索是当你键入检索词,Entrez•在你选定的字段中显示从该检索词开始的一
个索引词表窗口,这时,你可以选择一个或几个词进行检二子乘舟 索,这对单词拼写不准确时非常有
用。•例如:在输入框中键入\"P53\",选择文本字段(TextWords)和索引词表(ListTerms)•检索功
能,再点击\"Search\",这时返回一个以\"P53\"开始的索引词表窗口,浏览选择一个或几个索引
词,点击\"Search\",Entrez将返回检索结果。
••••(3)自动检索功能
••••自动检索功能就是Entrez浏览器根据用户输入的检索式自动进行检索,返回当前检索
式检出的文献数,如满意,可进一步取得检索何其芳《秋天》 结果,如不满意,则可对当前检索式进行修改,
直到用户满意为此。例如在输入框键入\"P53\",•选择所有字段和自动检索功能,•点击
\"•Search•\",•Entrez返回一个Web页,包括当前检出文献数、加词检索和修改当前检索三
个部分。如果你对检出文献数不满意(过多或过少),可以在加词检索部分增加更专指的检索
词,以提高查准率,也可以在修改当前检索部分选择某一布尔算符(AND、OR、NOT、
ANDNOT),对当前的检索策略进行修改,直到你满意为止。
••••对于检出文献,用户可以选择浏览格式进行浏览,也可以打印或存盘。
••••3Entrez检索规则
(1)Entrez支持\"*\"号截词检索;•
(2)Entrez对你键入的词可以进行逻辑识别。例如:键入\"LipmanDJGenomics\",Entrez将它识
别为作者的姓名LipmanDJ和自由词•Genomics•,•并将提问式转换为\"•Lipman•DJ•\"•AND
Genomics。对于Entrez不能识别的提问式,如bac1,必须加双引号,•系统就会将它们作
为一个词进行检索;
(3)Entrez支持复杂的布尔逻辑检索;
(4)Entrez支持限定字段检索;字段标识符的全称如下:WORD=TextWord,TITL=TitleWord,
MESH=MeshTerm,MAJR=MeSH•Major•Topic,•AUTH=AuthorName,JOUR=JournalName,
ECNO=EC/RNNumber,GENE=GeneName,DATE=PublicationYear,
PDAT=Publication/CreationDate,MDAT=ModificationDate,PAGE=FirstPage,VOL=Volume,
KYWD=Keyword,ORGN=Organism,ACCN=AccessionNumber,PROT=ProteinName,
SUBS=Substance,PROP=Property,FKEY=FeatureKey和PTYP=PublicatonType
二、BLAST序列类似性检索序列类似性检索就是将新测定的核酸或蛋白质序列对核酸或蛋
白质序列数据库进行检索,找出与之相似的序列,从而评判新测定的序列是重复别人的工作,
还是在前人的基础上有所创新,或是发现了新的序列。现在用于序列类似性检索的软件很多,
下面主要介绍GenBank的序列类似性检索工具枣BLAST。
简介BLAST是BasicLocalAlignmentSearchTool的英文缩写,意即碱基局部对
准检索工具,是一种序列类似性检索工具。它采用统计学记分系统,能将真正配对的序列同
随机产生的干扰序列区别开来;同时采用启发式算法系统,即采用的是局部对准算法(Local
AlignmentAlgorithm),而不是全序列对准算法(GlobalAlignmentAlgorithm)。全序列对准算
法是在检索结果中两个被比较序列所有片断均类似;而局部对准算法是找出两个被比较序列
的\"最类似\"片断,并得出可能只包含两个序列的某个部分的对准结果。在BLAST的基础上,
NCBI又开发了BLAST2.0、GappedBLAST和PSI-BLAST。BLAST2.0•是一种新的BLAST
检索工具,它对BLAST作了改进,运行速度更快,灵敏度更高,同时具有GappedBLAST
和PSI-BLAST两种软件的新功能。GappedBLAST允许在对准的序列中引入空位(•碱基缺
失或插入),引入\"空位\"(Gaps)意味着在比较两个相关序列时不会出现中断(Break)现象。这些
空位对准的记分系统更能反映相关序列的类似程度。PSI-BLAST的全称是Position-Specific
•IteratedBLAST,意即特殊位置重复BLAST,它提供了自动、易用的概貌(Profile)检索,是
查找序列同源(SequenceHomologues)的有效方法。目前,PSI-BLAST•仅用于比较蛋白质查
询序列与蛋白质数据库中的序列的类似程度。
2.使用NCBIBLAST服务的四种基本方法(1)经由WWW使用的BLAST使用BLAST最
容易的方法是WWW方式。在用户的浏览器中键入NCBI的URL地
址:http//,进入NBCI主页,然后链接到BLAST主页。BLAST•主页提
供了好几种BLAST检索软件,包括BLAST、BLAST2.0、GappedBLAST和PSI-BLAST等,
其中BLAST和BLAST2.0提供了基本检索和高级检索两种模式。
(2)网络版的BLASTBLAST2是标准的网络BLAST客户软件,它可以通过NCBI匿名的FTP
服务器(ftp://)下的/blast/network/bla指日可待的意思 st2/获取。PowerBlast是用于大规模分析
基因序列的网络BLAST客户应用软件,它可以通过•NCBI•匿名的FPT服务器
(ftp://)下的/blast/network/blast2/powerBLAST/获取。
(3)独立运行的BLASTBLAST2.0可以在本地计算机上独立运行,也可以在自建的序列数据
库中进行BLAST检索,•还可以下载NCBI数据库中的记录。BLAST运行的软硬件环境为
IRIX6.2、Solaris2.5、•PECOSF1(第四版)和Win32系统。可独立运行的BLAST2.0在NCBI
匿名的FTP服务器(ftp://)下的/blast/execu呐喊鲁迅先生原文 tables/获取。
(4)电子邮件的BLAST通过电子邮件对基因库进行BLAST检索(详见本章第四节二)。3.
BLAST的检索方法(1)BLAST数据库的选择BLAST检索的数据库包括两大类:一类是肽
序列数据库,另一类是核酸序列数据库斗折蛇行 。
①肽序列数据库包括:nr:所有无冗余基因库CDS转录产物、PDB、SwissProt以及PIR序
列month:最近30天注释的所有新增的或修订的基因库CDS转录产物、PDB、SwissProt•
和PIR序列。SwissProt:SwissProt蛋白质序列数据库中最新的主要注释(无更新)序列。yeast:
Yeast(SaccharomycesCerevisiae)蛋白质序列。:基因CDS转录产物。pdb:从
Brookhaven蛋白质序列数据和三维结构衍生出来的序列。Kabat:免疫学上感兴趣的蛋白
质序列Kabat数据库。alu:从重复序列数据库(REPBASE)选取的Alu重复序列,适用于过
滤查询序列中Alu重复序列。通过匿名FTP从下的/pub/jmc/alu目录中获取。
②核酸序列数据库包括:nr:所有无冗余的GenBank+EMBL+DDBJ+PDB序列;但不包括
EST、STS、GSS或HTGS序列。month:最近30天注释的新增加的或修订的
GenBank+EMBL+DDBJ+PDB序列dbEST:GenBank+EMBL+DDBJ+PDB中EST部分的无冗
余数据。dbSTS:GenBank+EMBL+DDBJ+PDB中STS部分的无冗余数据。htgs:高允许能
力(HighThroughput)基因序列。yeast:yeast(SaccharomycesCerevisiae)基因核酸序列。:
大肠杆菌()基因核酸序列。pdb:蛋白绿杨阴里白沙堤的意思 质数据库。Kabat:免疫学上感兴趣的核酸序列
Kabat数据库。Vector:GenBank载体数据库。mito:线粒体序列数据库。alu:从重复序列
数据库(REPBASE)选取的Alu重复序列,适用于过滤查询序列中Alu重复序列。通过匿名
FTP从下的/pub/jmc/alu目录中获取。epd:真核生物的启动子数据库。gss:
基因搜寻序列,包括单递基因数据、外切核酸酶捕获序列和AluPCR序列。
(2)BLAST程序的选择BLAST是一种碱基局部对准检索工具,实质上是一种序列类似性检
索工具,它运行•blastp•、blastn、blastx、tblastn、•tblastx•等五种程序的启发式检索算法;
这五种程序是利用改进的Karlin和Altschul的统计学方法来描述检索结果的显著性。这些程
序不支持主题形式检索,也就是不支持主题词、自由词、文本词等检索。下面介绍五种程
序的基本功能。blastp:将待查询的蛋白质序列及其互补序列一起对蛋白质序列数据库进行
查询;blastn:将待查询的核酸序列及其互补序列一起对核酸序列数据库进行查询;blastx:先将
待查询的核酸序列按六种可读框架(逐个向前三个碱基和逐个向后三个碱基读码)翻译成蛋
白质序列,然后将翻译结果对蛋白质序列数据库进行查询;tblastn:先将核酸序列数据库中的
核酸序列按六种可读框架翻译成蛋白质序列,然后将待查询的蛋白质序列及其互补序列对其
翻译结果进行查询;•tblastx:•先将待查询的核酸序列和核酸序列数据库中的核酸序列按六
种可读框架翻译成蛋白质序列,然后再将两种翻译结果从蛋白质水平进行查询。因此,根
据你查询的目的和序列选择合适的blast程序,有助于获得满意的检索结果。
(3)BLAST参数的设置BLAST提供了许多参数可限制你的检索,以达到满意的结果。对于
BLAST基本检索,•系统预设的参数默认值即可满足需要,不需要你重新设定。但是对于
BLAST高级检索,可开窗选择如下几种参数,也可在输入框增加其它参数。
①直方图(Histogram):显示每次检索评分的直方图。有yes、no两种选择,默认值为yes
②描述(Descriptions):限定描述性类似序列的条数。有default、0、10、50、100、250•、500
等七种选择,默认值为100。
③对准(Alignments):限定检出高积分片断配对(High-scoringSegmentPairs,HSPs)的数据库序
列的条数,有default、0、10、50、100、250、500等七种选择,默认值为50。如果检索到
的数据库序列超出设定值,BLAST仅显示最具统计学念奴娇 昆仑 意义的配对序列,直到设定值。
④期望值(Expect,E值):它是期望数据库中具有某一统计学意义配对序列的值。有default、
0.001、0.01、0.1、1、10、100、1000等选择值,•默认值为•10•,一般地,期望值越低,限
制越严格,甚至会导致无随机配对序列。
⑤Cutoff:设定高积分片断配对(HSPs)的Cutoff值。有default、60、70、80、90、100、110
等七种选择值,其默认值一般通过期望值来计算得出。一般地,Cutoff值越高,其限制就越
严格,甚至会导致无随机配对序列。⑥矩阵(Matrix):为BLAST、BLASTX、TBLASTN和
TBLASTX程序指定一个交替记分矩阵。其默认值为BLOSUM62,有PAM40、PAM120、
PAM250和IDENTITY等四种有效选择。但交替记分矩阵对BLASTN不起作用。
⑦股(Strand):把BLASTN检索限定在数据库序列的股的首端或末端;或者把BLASTN、
BLASTX、TBLASTX检索限定在查询序列股的首端或末端的机读部分。•⑧过滤器
•(•Filter)•:过滤器可以过滤查询序列中低成分复杂性•(•Low•Compositional•Complexity)片
断。它只过虑查询序列及其转录产物中的低成分复杂性片断,•不能过虑数据库序列中的低
成分复杂性片断。用户可以在BLAST和BLAST2.0•的高级检索中选择相应的过滤程序以
消除对检索结果的干扰,如不用过滤功能则选择\"NO早发白帝城古诗朗读视频 NE\"。但是在BLAST和BLAST2.0•基
本检索中,因为,系统对于不同的BLAST程序设定了默认值,例如对于blastn程序,其默
认值为\"DUST\",对于其他程序,默认值为\"SEG\",所以用户只须选择用不用过虑功能,而
不必设定过虑程序。值得注意的是,过滤器中的SEG和XUN程序不能过滤SWISS-PROT
数据库中的低复杂性片断,因此,虽然过滤器可以应用于SWISS-PROT数据库序列,但并
未起作用。⑨NCBI-GI:在输出结果中除存取号和位点名称(LocusName)外,还可以选择
NCBI-GI标识号。有yes和no两种选择,其默认值为no。
(4)BLAST检索结果BLAST程序用大致相同的格式显示检索结果,它包括四个部分:一是程
序的介绍;二是一系列配对数据库序列的描述,从积分高到低排列,一行描述一条序列;三是
实际的序列对准;四是检索中设定的参数及其它统计数据。
•••••三、dbEST检索dbEST是基因库的一部分,主要收录核酸序列数据库的表达序列标
志以及\"单递\"(SinglePass)cDNA序列等信息。dbEST使用的提问式是IRX格式,其通用的
IRX格式是:Term,这里的可以是一个或几个用空格分隔的字段标识符。\"Term\"可以是词或
词组。
••••dbEST中的字段:•
•••DBIDEST登记号LIBX馆藏描述
••••IDSEST名称或GenBank存取号,GI号SUB发送者信息
••••CLIN克隆信息或来源信息CIT引文信息
更多推荐
ACCN是什么意思N的用法读音典
发布评论