Python的Scanpy
包和Seurat
包一样,是单细胞数据处理的利器,其中,Scanpy
中有一种堆积的小提琴图,可以很好的展示marker的表达情况,但是在Seurat
中并没有内置命令。因此,我自己尝试提取数据并用ggplot2
包来画该图。
首先来展示以下画图的成果,如图
Python的Scanpy
包和Seurat
包一样,是单细胞数据处理的利器,其中,Scanpy
中有一种堆积的小提琴图,可以很好的展示marker的表达情况,但是在Seurat
中并没有内置命令。因此,我自己尝试提取数据并用ggplot2
包来画该图。
首先来展示以下画图的成果,如图
Bedtools作为基因组研究的 “ 瑞士军刀 ”, 功能强大且易于操作,是生信行业不可多得的好软件。通常对bed区间的注释,我们使用其中“ 求交集 ”的功能(bedtools intersect) ,但是有一个很不方便的地方,我们通常要生成对应的bed文件,再注释完成后还需要用R语言等读入才能继续分析,所以整合度不是很好,本文希望提供R语言的思路来解决该问题。
单细胞数据数据量很大,加重了分析的负担,但只要掌握好的方法和工具,就可以无往而不利。今年要说的这个如题,是因为在区分亚类的时候,提取了大类型并调整分辨率重新聚类计算的亚类。针对这种情况,该如何实现呢?
在生物信息学中经常用到的脚本语言主要是python
和perl
,他们被用来处理文本,大量统计,流程控制等等,其自身也是各有优势。比如说perl
天生就为了处理文本而生,但是python
确是有名的胶水语言,特别在整合C
代码时显示出巨大的优势,其语法简洁易懂,易于维护更让其成为仅次于C
和JAVA
的第三大语言,但其糟糕的性能在处理大量循环时会让人忍不住抓狂。因此,Julia
语言应运而生,其控制了python
中没必要的动态性,加之使用JIT技术让其能够保有高性能的同时具备简洁的语法。
在此工作流程中,介绍了 Qiime2 和 R 中 16S rRNA 基因扩增子数据分析的主要步骤。本教程是为哥本哈根大学食品科学系的 MAC 2023 课程准备的。尽管这些步骤是为 Oxford Nanopore Tech (ONT) 测序设计的,但也在 Ilumina 短读长上进行了测试。
1 / 2