驱动中国2017年12月11日消息 上周,谷歌发布了一款DeepVariant程序工具,它具备先进的AI深度学习能力,能利用测序数据拼凑更精准的人类基因图谱,还可以精确识别DNA序列中的突变。这也是15年前科学家对人类基因测序后,首次实现计算机工具来解码基因数据。 据悉,DeepVariant可实现将高通量测序所测区的数据,转换成完整的基因组图像。其可以自动识别测序数据中的插入基因、缺失突变以及单碱基对变异。之前,科学家所运用的高通量测序,虽然可以让基因测序更容易实现。不过,这一测序方法所提供数据有限且易出错。 目前, 科学家普遍使用的测序方法有: GATK、 VarDict 和 FreeBayes。不过这些工具都是通过排除读取错误来鉴别突变。像使用最广泛的GATK,就是通过简易的人工设计的算法来测序。不过,谷歌推出的DeepVariant借助AI神经网络来构建基于图像要比这些方法都要更精确。 谷歌的研究团队,试着将DNA测序数据转换成一个图像从而利用图像识别技术来建立更精确的DNA序列。科学家还对数百万份基因组测序以及高通量测序法进行了研究,来教会DeepVariant哪些数据重要,哪些可以忽略。 据DeepVariant的创造者来自哈佛大学公共卫生学院的Brad Chapman教授介绍,“其中一个挑战在于基因组的复杂片段,每种工具都有优缺点。这些复杂区域对临床测序异常重要,使用多种方法很有必要。” 谷歌此次发布的DeepVariant,在之前由三种颜色和三种数据组成的基因图像在新发布的版本中达到了7种,可以更精准的表示基因数据信息。此外,DeepVariant目前还是款开源软件,其他研究人员也可以使用DeepVariant进行基因测序的研究。
|