很多老師會發現,高通量測序后需要生信分析的過程中,需要填寫一個信息分析表。而信息分析表中有一個對生信分析很重要的信息——基因組文件及注釋文件。通常這類文件我們都是需要老師提供對應的下載鏈接,以便于生信直接利用這個鏈接去下載數據進而做分析,這樣做的目的主要是為了避免公司分析使用的基因組信息不是老師研究的物種(同一物種不同屬有不同的基因組)或者研究的版本(基因組版本經常會更新,但是不同版本的注釋文件略有差異,盡量不要用來進行聯合分析)。因此,老師自己去尋找對應的基因組注釋信息以及提供對應的下載鏈接就顯得很重要啦~而這類信息很多老師都不知道該怎么去尋找并提供。
參考基因組的注釋信息通常需要基因組文件(genome.fa)、基因結構注釋文件(gene annotation.GFF)以及蛋白注釋文件(pep.fa)。在此,愛基百客基于比較常見的數據庫(NCBI和Ensembl),對參考基因組注釋信息的查找做了一個簡單的介紹,有需要的老師可以參考一下。