附录A:如何取得欲分析之序列
附录A 如何取得欲分析之序列
透过网络抓取序列范例:
首先,我们可以先进入NCBI 网站( http://www.ncbi.nlm.nih.gov/) (图A.1),在首页 “Search”下拉式选单及“for”文字盒中选择及输入适当选项内容,例如 Search Nucleotide ; for cyp1A,然后按下”Go ”按钮进行搜寻。
A.1 NCBI 网站
此时 NCBI会传回如下之画面,目前 NCBI Nucleotide database 已经分成三个数据库,适当选择所需内容,点选所显示之数字进入适当数据库并进行下一步选择。三个数据库分别为
CoreNucleotide contains all Nucleotide records that are not in EST or GSS. They are of interest to most users.
EST contains only Expressed Sequence Tag records. GSS contains only Genome Survey Sequence records.
223
Vector NTI 教育训练手册
A.2 CoreNucleotide数据库
例如点选图A.2中 “81 CoreNucleotide” 之选项,可以进入更细部的选择,在CoreNucleotide数据库中总共含有81笔相关记录(图A.3),可依使用者所需进行点选,于此我们选择斑马鱼 (zebrafish Danio rerio) 为范例进行说明,所以将点选第4笔数据 NM_131879 (Danio rerio cytochrome P450, family 1, subfamily A (cyp1a), mRNA)并得到如下图A.4:
A.3 得到81笔斑马鱼的相关数据
224
附录A:如何取得欲分析之序列
A.4 点选NM_131879得到的结果
可以在左上角“Display”下拉式选单中选取“FASTA”,并得到以下仅含序列内容的画面信息(A.5)。
A.5 NM_131879FASTA格式的数据
225
Vector NTI 教育训练手册
确定为所需之序列内容后,在“Display”下拉式选单右边 “Send to” 的下拉式选单选取“File”,此时系统将启动档案下载对话窗口,按下“储存”进行档案(FASTA格式)下载。
A.6 下拉式选单,选择File,进行储存
定序序列分析范例:
实验结果送交定序完成后,我们会从定序的公司收到两个档案(图A.7): 一个是序列的文本文件(如.seq之类),另一个是雷射图谱的档案(.abI)。这两个档案需要特定的软件才能开启,如果没有相关的软件,我们可以由下列的方法取得序列。首先我们将鼠标移至序列文本文件上方按下鼠标右键后,点选开启:
226
附录A:如何取得欲分析之序列
A.7 得到的两个附档名为seq及abI的档案
接着点选从清单对话盒中选取要开启的程序(A.8):可以选择用记事本(Notepad)或是用文本编辑器(WordPad)开启:
如此一来我们就可以顺利的取得序列,接下来就可以将此序列汇入欲分析的软件内进行分析。
A.8 可以用记事本(Notepad)开启
227
Vector NTI 教育训练手册
NOTE:用记事本开启的档案可能会出现乱码(如下图所示),这是因为字型格式不同或是句柄所引起,我们只要调整字型格式就可以修正乱码(图A.9)。在此推荐使用WordPad开启档案,将会减少乱码出现的机会。
A.9 可利用WordPad,或其他可开FASTA格式的程序开启
228