關于知識產權行業標準《電子文件標準》中部分特征關鍵詞表的修訂(第248號)
發表時間:2017-08-04 瀏覽次數:1768
國家知識產權局公告
第二四八號
為了更好地滿足社會公眾對于生物序列專利申請、檢索的信息化需要,國家知識產權局對知識產權行業標準《核苷酸和/或氨基酸序列表和序列表電子文件標準》(ZC 0003—2001,以下簡稱“《電子文件標準》”)中的“4.4.4、生物體:其數字標識符為?!焙汀氨? 與核苷酸序列相關的特征關鍵詞表”的內容進行了修訂。具體修訂內容如下:
一、《電子文件標準》第4部分“序列表和序列表電子文件中的數字標識符、內容及其格式”
4.4.4、生物體:其數字標識符為。
在數字標識符之后,應當用中文或拉丁文(當同時采用中文和拉丁文時,拉丁文應當放在中文之后并用圓括號括起來,例如,草履蟲種(Paramecium sp.)注明該序列來源的生物名稱,即科學命名的生物屬種;或者是“人工序列”、“Artificial”、“未知”或“Unknown”。
二、《電子文件標準》附錄1“核苷酸和氨基酸符號和特征關鍵詞表”
表5 與核苷酸序列相關的特征關鍵詞表
關鍵詞 |
說 明 |
allele |
相關的個體或菌株含有相同基因的穩定的其它形式,該形式區別于這一位置的現有的序列(和或許其它序列) |
attenuator |
存在調節轉錄的終止的DNA區域,它控制了一些細菌操縱子的表達;位于啟動子和第一個結構基因之間,引起轉錄的部分終止的序列區段 |
C_region |
免疫球蛋白輕和重鏈的恒定區,和T-細胞受體α,β,和γ鏈;根據特定的鏈可包括一個或多個外顯子 |
CAAT_signal |
CAAT盒;位于可能參與RNA聚合酶結合的真核生物轉錄單位的起始點的75bp上游的保守序列的一部分;共有序列=GG(C或T)CAATCT |
CDS |
編碼序列;對應于蛋白質中的氨基酸序列的核苷酸的序列(位置包括終止密碼子);特征包括氨基酸概念上的翻譯 |
conflict |
在這一位點或區域,單獨確定的“相同”序列有所不同 |
D-loop |
置換環;線粒體DNA內的一個區域,其中RNA的短的序列與DNA的一條鏈配對,代替了這一區域的原始配對DNA鏈;也用于說明在RecA蛋白質催化的反應中,侵入的單鏈替代雙鏈DNA的一條鏈的區域 |
D-segment |
免疫球蛋白重鏈的多變區,和T-細胞受體的β鏈 |
enhancer |
順式-作用序列,它增強了(一些)真核生物啟動子的作用,并能在任一方向和與啟動子相關的任何位置處(上游或下游)起作用 |
exon |
編碼剪接mRNA部分的基因組區域;可以含有5'UTR,所有CDS,和3'UTR |
GC_signal |
GC盒;位于真核生物轉錄單位起始點上游的保守的富含GC區域,可以以多重拷貝 |
gene |
鑒定為基因的生物學意義的區域,并已經指定名稱 |
iDNA |
間插DNA;通過幾種重組中的任何一種能被消除的DNA |
intron |
被轉錄的DNA區段,但通過同時剪接位于其兩側的序列(外顯子)即可從轉錄本內部將其除去 |
J_segment |
免疫球蛋白輕鏈和重鏈的連接區段,和T-細胞受體α,β和γ鏈 |
LTR |
長的末端重復,在確定序列的兩端直接重復的序列,類型典型地見于逆轉錄病毒中 |
mat_peptide |
成熟的肽或蛋白質的編碼序列;翻譯后修飾之后成熟的或最終的肽或蛋白質產物的編碼序列;位置不包括終止密碼子(與相應的CDS不同) |
misc_binding |
不能用任何其它Binding關鍵詞(primer_bind或protein_bind)表述的與另一個組成成分共價或非-共價結合的核酸中的位點 |
misc_difference |
特征序列與記載中存在的有所不同,并且不能用任何其它不同關鍵詞(conflict,unsure,old_sequence,mutation,variation,allele或modified_base)表述 |
misc_feature |
不能用任何其它的特征關鍵詞表述的具有生物學意義的區域;新的或少見的特征 |
misc_recomb |
任何一般性的,位點特異性的或復制的重組事件的位點,該位點中有不能用其它重組關鍵詞(iDNA和virion)或來源關鍵詞的修飾詞(/insertion_seq,/transposon,/proviral)表述的雙螺旋DNA的斷裂和愈合 |
misc_RNA |
不能用其他RNA關鍵詞(prim_transcript,precursor_RNA,mRNA,5'clip,3'clip,5'UTR,3'UTR,exon,CDS,sig_peptide,transit_peptide,mat_peptide,intron,polyA_site,rRNA,tRNA,scRNA和snRNA)限定的任何轉錄本或RNA產物 |
misc_signal |
含有控制或改變基因功能或表達之信號的任何區域,所述信號不能用其他Signal關鍵詞(promoter,CAAT_signal,TATA_signal,-35_signal,-10_signal,GC_signal,RBS,polyA_signal,enhancer,attenuator,terminator,和rep_origin)表述 |
misc_structure |
不能用其他Structure關鍵詞(stem_loop和D-loop)表述的任何二級或三級結構或構象 |
modified_base |
被指示的核苷酸是經修飾的核苷酸,并應由被指示的分子(在mod_base修飾詞意義中給出)所取代 |
mRNA |
信使RNA;包括5'非翻譯區(5'UTR),編碼序列(CDS,外顯子)和3'非翻譯區(3'UTR) |
mutation |
在此位置處,相關品系的序列中具有突發的,可遺傳的變化 |
N_region |
在重排的免疫球蛋白區段之間插入的額外的核苷酸 |
old_sequence |
在此位置處,所表述的序列修改了此序列以前的版本 |
polyA_signal |
聚腺苷酸化之后內切核酸酶裂解RNA轉錄本所必需的識別區域;共有序列=AATAAA |
polyA_site |
RNA轉錄本上的位點,通過轉錄后聚腺苷酸化該位點將被加上腺嘌呤殘基 |
precursor_RNA |
仍不是成熟的RNA產物的任何RNA種類;可包括5'剪切區(5'clip),5'非翻譯區(5'UTR),編碼序列(CDS,外顯子),間插序列(內含子),3'非翻譯區(3'UTR),和3'剪切區(3'clip) |
prim_transcript |
初級(最初的,未加工的)轉錄本;包括5'剪切區(5'clip),5'非翻譯區(5'UTR),編碼序列(CDS,外顯子),間插序列(內含子),3'非翻譯區(3'UTR)和3'剪切區(3'clip) |
primer_bind |
起始復制,轉錄或逆轉錄的非-共價的引物結合位點;包括合成的例如PCR引物元件的位點 |
promoter |
參與RNA聚合酶的結合以啟動轉錄的DNA分子區域 |
protein_bind |
核酸上非-共價的蛋白質結合位點 |
RBS |
核糖體結合位點 |
repeat_region |
含有重復單位的基因組區域 |
repeat_unit |
單個重復元件 |
rep_origin |
復制起點;復制核酸以得到兩個相同拷貝的起始位點 |
rRNA |
成熟的核糖體RNA;將氨基酸裝配成蛋白質的核糖核蛋白顆粒(核糖體)中的RNA成份 |
S_region |
免疫球蛋白重鏈的開關區;它參與重鏈DNA的重排,導致來自相同B-細胞的不同免疫球蛋白類的表達 |
satellite |
短的基本重復單位的很多串聯重復(相同或相關的);大多數具有的堿基組成或其它性質與基因組的一般水平不同,這使得它們與大部分(主帶)的基因組DNA分離開來 |
scRNA |
小的細胞質RNA;幾個小的細胞質RNA分子中的任何一個存在于真核生物的細胞質和(有時)核中 |
sig_peptide |
信號肽編碼序列;被分泌的蛋白質的N-末端結構域的編碼序列;此結構域涉及新生多肽與膜的結合;前導序列 |
snRNA |
小的核RNA;很多小的RNA種類中的任何一個都被局限于核中;幾個snRNA參與剪接或其它RNA加工反應 |
source |
鑒定序列中特定范圍的生物來源;此關鍵詞是強制性的;每一項至少要有一個跨越整個序列的單一來源關鍵詞;每個序列可允許有一個以上的來源關鍵詞 |
stem_loop |
發卡結構;由RNA或DNA單鏈的相鄰(反向)互補序列之間的堿基一配對形成的雙螺旋區域 |
STS |
序列標記位點:表述基因組上作圖界標并能通過PCR檢測的短的,單拷貝DNA序列;通過測定STS系列的次序即可作出圖譜的基因組區域 |
TATA_signal |
TATA盒;Goldberg-Hogness盒;在每個真核生物RNA聚合酶Ⅱ轉錄單位起點前約25bp處發現的保守的富含AT的七聚體,它可能涉及使酶定位以正確地起始;共有序列=TATA(A或T)A(A或T) |
terminator |
或者位于轉錄本的末端或者與啟動子區域相鄰的DNA序列,該序列可導致RNA聚合酶終止轉錄;也可以是阻抑蛋白的結合位點 |
transit_peptide |
轉運肽編碼序列;核編碼的細胞器蛋白質N-末端結構域的編碼序列;此結構域參與將蛋白質翻譯后運送到細胞器中 |
tRNA |
成熟的轉移RNA,小的RNA分子(75-85個堿基長),介導核酸序列翻譯成氨基酸序列 |
unsure |
作者不能確定此區域的準確序列 |
V_region |
免疫球蛋白輕鏈和重鏈的可變區,和T-細胞受體α,β和γ鏈;編碼可變的氨基末端部分;可由V_segment,D_segment,N_region和J_segment組成 |
V_segment |
免疫球蛋白輕鏈和重鏈的可變區段,和T-細胞受體α,β和γ鏈;編碼大多數可變區(v_region)和前導肽的最后幾個氨基酸 |
variation |
含有來自相同基因的穩定突變的相關系列(例如RFLP,多態性等),在此(和可能其它)位置處所述相同基因與被表述的不同 |
3’clip |
在加工過程中被切下的前體轉錄本3'端大部分區域 |
3’UTR |
不被翻譯成蛋白質的成熟轉錄本的3'末端區域(終止密碼子之后) |
5’clip |
在加工過程中被切下的前體轉錄本5'端大部分區域 |
5’UTR |
不被翻譯成蛋白質的成熟轉錄本的5'末端區域(起始密碼子之前) |
-10_signal |
Pribnow盒;細菌轉錄單位起點上游約10bp處的保守區域,它可能參與結合RNA聚合酶;共有序列=TatAaT |
-35_signal |
細菌轉錄單位起點上游約35bp處的保守六聚體;共有序列=TTGACa[]或TGTTGACA[] |
上述修訂內容自2017年8月18日起正式實施;原標準中的被修訂的內容同時廢止。
特此公告。
國家知識產權局
2017年7月24日