说实话,做过转录组的小伙伴都清楚,测序公司发回来的Excel表格看着真让人头疼。打开一看,全是一长串像天书似的Locus_tag,根本搞不清哪个是哪个。要想知道哪个基因上调、哪个下调,还得自己跑到NCBI的GenBankCtrl里一页页翻找ID,这效率低得让人怀疑人生。正好趁国庆放假没事干,我就把之前写的那个“序列信息小工具”给升级了。现在只要把公司发来的.gbk或者.gbff文件直接拖进去,点一下“一键解析”,就能直接生成一个Excel表。这Excel表上不仅有Gene Name,还把Product、GeneID、RefSeq这些信息都给打包好了。这些列名跟主流转录组软件的命名完全一致,直接复制过去就能用。 操作起来特别简单。第一步把GenBank文件拖进工具里就行,网页端也能用;第二步点击一下按钮,工具会自动去匹配Locus_tag和Gene Name的关系;第三步把生成的结果粘贴到你的转录组数据表格里。这时候再去看那些表达量数值就直观多了,想做GO或者KEGG富集分析?直接用这个新列做输入就行了。 以前那可真是折磨人。每次都要先打开GenBankCtrl再Ctrl+F搜Locus_tag,然后去NCBI查Gene Name,回来再给表达量贴数据。这一套流程下来要折腾好几遍才能搞定一个样本。现在完全不一样了。直接拖文件、点按钮、复制结果,整个过程也就一两分钟时间。省下的功夫拿去写论文难道不香吗?这才叫真正告别了“抄粘贴”的科研日常。