IGV批量查看变异

IGV批量查看变异并过滤

IGV可视化准备

Nature biotechnology文献:Integrative Genomics Viewer

Downloads IGV ;  igvtools为一些数据可视化预处理程序

PS:igv 要求java 1.8 ,安装java1.8可参考链接

export JAVA_HOME=/home/wangdong/softwares/java1.8/jdk1.8.0_172
export JRE_HOME=/home/wangdong/softwares/java1.8/jdk1.8.0_172/jre 
export PATH=$PATH:/home/wangdong/softwares/java1.8/jdk1.8.0_172/bin 
export CLASSPATH=./:/home/wangdong/softwares/java1.8/jdk1.8.0_172/lib:/home/wangdong/softwares/java1.8/jdk1.8.0_172/jre/lib

IGV可视化数据准备

  • 不是什么数据都可以拿IGV看的,参考基因组必须为FASTA格式;
  • IGV只是负责将比对结果可视化,并没有比对过程,所以不能直接载入reads;
  • 需要将待比对的reads与前面指定的参考基因组用bwa进行比对;
  • 比对后的sam文件也不能直接载入,要转bam;bam排序;bam建索引(可以一步完成)

需要两个文件.bam文件和.bam.bai文件

IGV批量查看变异

生成批量查看.bat文件

IGV批量运行的.bat文件命令参数及例子:Controlling IGV through a Port ,   a batch file example    IGV-snapshot-automator项目

使用命令:
java -Xmx1024M -jar ~/bin/igv-2.3.52/igv.jar -b IGV_screenshot.bat

VNC Viewer使用

  VNC (Virtual Network Console)是虚拟网络控制台的缩写。它 是一款优秀的远程控制工具软件,由著名的 AT&T 的欧洲研究实验室开发的。VNC 是在基于 UNIX 和 Linux 操作系统的免费的开源软件。VNC基本上是由两部分组成:一部分是客户端的应用程序(vncviewer);另外一部分是服务器端的应用程序(vncserver)。Download VNC Viewer ,解压后按照README安装即可

Linux环境VNC服务安装、配置与使用

工作流程:

  1. 服务器端启动VNC Server,使用命令vncserver,之后输入密码并确认,之后获得数字1,表示vncserver创建的第一个vnc viewer用户;
  2. 在win7的客户端创建连接即可

之后点击igv.sh运行igv,在Tools的Run Batch Script,导入.bat文件即可!

变异的过滤

  在对Func.refGene,ExonicFunc.refGene,1000g2015aug_eas等进行hard filter后,一般全外显子测序找到的突变依然还有一两百个,接下来需要通过直观的可视化,验证SNP/SNV calls和结构重排,进一步去除假阳性的结果。IGV Tutorial(推荐)

查看技巧

  1. File—>Load from Server可以加载许多tracks

  1. 在reads区右键可以选择不同的查看方式

  1. 可以同时开多个igv.sh或者将IGV_snapshots.bat文件合并,并删除掉除最后一个之外的所有exit语句

  2. maxPanelHeight 设置很重要,默认800,但是igv截图不全,所以设置为10000

通过命令行自动截图

服务器上vncserver源码下载链接,选择Generic scripts x64,然后下载即可,安装可查看README文件。具体可参考(1)vnc 源码安装; (2)linux命令:VNC服务的配置及使用

  • 开启vncserver
  • 设置环境变量DISPLAY: export DISPLAY=:1 (你vnc开的几就写几)
  • 修改igv.sh中-Xmx4000m,增大igv分配内存
  • igv.sh -b IGV_snapshots.bat

过滤标准

  1. 高质量的SNVs和SNPs要求在所有的reas中High base qualities,并且不能在reads的末端;
  2. Good mapping quality of reads, no strand bias, allele frequency consistent with heterozygous mutation

Important metrics for evaluating the validity of SNVs:

  • Coverage
  • Amount of support
  • Strand bias / PCR artifacts
  • Mapping qualities
  • Base qualities
  1. 通过Coverage track查看比对情况,没有比对上参考基因组的碱基将在Coverage track和data panel以不同颜色高亮显示;

  1. 低质量的碱基calls是半透明的(faint,semi-transparent)

区分SNP突变和错配:

  1. SNP突变如果是杂合,会在Coverage track处显示红蓝box,当鼠标悬停在上面时显示allele counts 和frequencies。可以在此处右键,选择sort alignments by > base查看,以此根据碱基的透明度确定SNP碱基call的质量;

  1. 而错配的情况在在Coverage track处是没有红蓝box的。通过在此处右键,选择shade base by quality使得用半透明颜色表示的低质量碱基全部高亮显示,方便查看;接着选择Sort alignments by > read strand,然后Color alignments by > read strand,以此确定是否存在stand bias。

Important metrics for evaluating SVs:

  • Coverage
  • Insert size
  • Read pair orientation

具体使用可查看:IGV Lecture - Long, from Broad Institute 也包括了查看RNA-seq比对情况的操作

vncviewer 连接上后黑屏解决

参考:vnc viewer连接黑屏

(1)修改/home/wangdong/.vnc/xstartup文件
vi /home/wangdong/.vnc/xstartup

##如果使用的是gnome图像界面,则需要注释掉以下两行,
#xterm -geometry 80x24+10+10 -ls -title "$VNCDESKTOP Desktop" &
#twm &
##并添加以下这行:
gnome-session &

(2)改变xstartup的权限

chmod 777 /home/wangdong/.vnc/xstartup

ps: 首选在图形桌面用命令行运行igv.sh,再点击igv.sh运行

命令行下批量运行IGV

  • 开启Xmanager - Passive
  • 在Xshell5的Poperties—>Tunneling—–>Forward X11 connections to
  • 命令行下使用igv.sh -b IGV_snapshots.bat

igv命令行参数可查看:链接

ps: windows下需要提前安装好igv

参考

(1)可视化工具之 IGV 使用方法

(2)IGV_Batch_Screenshots.md

(3)如何使用VNC Viewer连接远程CentOS服务器

(4)Quick Visual Inspection Of Mapping Images For A List Of Regions

(5)Unable to adjust image height via batch script

(6)Xshell显示图形化界面

-------------本文结束感谢您的阅读-------------