IGV批量查看变异并过滤
IGV可视化准备
Nature biotechnology文献:Integrative Genomics Viewer
Downloads IGV ; igvtools为一些数据可视化预处理程序
PS:igv 要求java 1.8 ,安装java1.8可参考链接
export JAVA_HOME=/home/wangdong/softwares/java1.8/jdk1.8.0_172
export JRE_HOME=/home/wangdong/softwares/java1.8/jdk1.8.0_172/jre
export PATH=$PATH:/home/wangdong/softwares/java1.8/jdk1.8.0_172/bin
export CLASSPATH=./:/home/wangdong/softwares/java1.8/jdk1.8.0_172/lib:/home/wangdong/softwares/java1.8/jdk1.8.0_172/jre/lib
IGV可视化数据准备
- 不是什么数据都可以拿IGV看的,参考基因组必须为FASTA格式;
- IGV只是负责将比对结果可视化,并没有比对过程,所以不能直接载入reads;
- 需要将待比对的reads与前面指定的参考基因组用bwa进行比对;
- 比对后的sam文件也不能直接载入,要转bam;bam排序;bam建索引(可以一步完成);
需要两个文件.bam文件和.bam.bai文件
IGV批量查看变异
生成批量查看.bat文件
IGV批量运行的.bat文件命令参数及例子:Controlling IGV through a Port , a batch file example IGV-snapshot-automator项目
使用命令:
java -Xmx1024M -jar ~/bin/igv-2.3.52/igv.jar -b IGV_screenshot.bat
VNC Viewer使用
VNC (Virtual Network Console)是虚拟网络控制台的缩写。它 是一款优秀的远程控制工具软件,由著名的 AT&T 的欧洲研究实验室开发的。VNC 是在基于 UNIX 和 Linux 操作系统的免费的开源软件。VNC基本上是由两部分组成:一部分是客户端的应用程序(vncviewer);另外一部分是服务器端的应用程序(vncserver)。Download VNC Viewer ,解压后按照README安装即可
工作流程:
- 服务器端启动VNC Server,使用命令vncserver,之后输入密码并确认,之后获得数字1,表示vncserver创建的第一个vnc viewer用户;
- 在win7的客户端创建连接即可
之后点击igv.sh运行igv,在Tools的Run Batch Script,导入.bat文件即可!
变异的过滤
在对Func.refGene,ExonicFunc.refGene,1000g2015aug_eas等进行hard filter后,一般全外显子测序找到的突变依然还有一两百个,接下来需要通过直观的可视化,验证SNP/SNV calls和结构重排,进一步去除假阳性的结果。IGV Tutorial(推荐)
查看技巧
- File—>Load from Server可以加载许多tracks
- 在reads区右键可以选择不同的查看方式
可以同时开多个igv.sh或者将IGV_snapshots.bat文件合并,并删除掉除最后一个之外的所有exit语句
maxPanelHeight 设置很重要,默认800,但是igv截图不全,所以设置为10000
通过命令行自动截图
服务器上vncserver源码下载链接,选择Generic scripts x64,然后下载即可,安装可查看README文件。具体可参考(1)vnc 源码安装; (2)linux命令:VNC服务的配置及使用
- 开启vncserver
- 设置环境变量DISPLAY: export DISPLAY=:1 (你vnc开的几就写几)
- 修改igv.sh中-Xmx4000m,增大igv分配内存
- igv.sh -b IGV_snapshots.bat
过滤标准
- 高质量的SNVs和SNPs要求在所有的reas中High base qualities,并且不能在reads的末端;
- Good mapping quality of reads, no strand bias, allele frequency consistent with heterozygous mutation
Important metrics for evaluating the validity of SNVs:
- Coverage
- Amount of support
- Strand bias / PCR artifacts
- Mapping qualities
- Base qualities
- 通过Coverage track查看比对情况,没有比对上参考基因组的碱基将在Coverage track和data panel以不同颜色高亮显示;
- 低质量的碱基calls是半透明的(faint,semi-transparent)
区分SNP突变和错配:
- SNP突变如果是杂合,会在Coverage track处显示红蓝box,当鼠标悬停在上面时显示allele counts 和frequencies。可以在此处右键,选择sort alignments by > base查看,以此根据碱基的透明度确定SNP碱基call的质量;
- 而错配的情况在在Coverage track处是没有红蓝box的。通过在此处右键,选择shade base by quality使得用半透明颜色表示的低质量碱基全部高亮显示,方便查看;接着选择Sort alignments by > read strand,然后Color alignments by > read strand,以此确定是否存在stand bias。
Important metrics for evaluating SVs:
- Coverage
- Insert size
- Read pair orientation
具体使用可查看:IGV Lecture - Long, from Broad Institute ,也包括了查看RNA-seq比对情况的操作
vncviewer 连接上后黑屏解决
(1)修改/home/wangdong/.vnc/xstartup文件
vi /home/wangdong/.vnc/xstartup
##如果使用的是gnome图像界面,则需要注释掉以下两行,
#xterm -geometry 80x24+10+10 -ls -title "$VNCDESKTOP Desktop" &
#twm &
##并添加以下这行:
gnome-session &
(2)改变xstartup的权限
chmod 777 /home/wangdong/.vnc/xstartup
ps: 首选在图形桌面用命令行运行igv.sh,再点击igv.sh运行
命令行下批量运行IGV
- 开启Xmanager - Passive
- 在Xshell5的Poperties—>Tunneling—–>Forward X11 connections to
- 命令行下使用igv.sh -b IGV_snapshots.bat
igv命令行参数可查看:链接
ps: windows下需要提前安装好igv
参考
(3)如何使用VNC Viewer连接远程CentOS服务器
(4)Quick Visual Inspection Of Mapping Images For A List Of Regions