XiaoHanys

单细胞数据如何绘制stacked violin?

Python的Scanpy包和Seurat包一样，是单细胞数据处理的利器，其中，Scanpy中有一种堆积的小提琴图，可以很好的展示marker的表达情况，但是在Seurat中并没有内置命令。因此，我自己尝试提取数据并用ggplot2包来画该图。

首先来展示以下画图的成果，如图

2024-09-20 生物信息

阅读全文

使用R语言实现bedtools求交集的功能?

Bedtools作为基因组研究的 “ 瑞士军刀 ”，功能强大且易于操作，是生信行业不可多得的好软件。通常对bed区间的注释，我们使用其中“ 求交集 ”的功能（bedtools intersect) ，但是有一个很不方便的地方，我们通常要生成对应的bed文件，再注释完成后还需要用R语言等读入才能继续分析，所以整合度不是很好，本文希望提供R语言的思路来解决该问题。

2024-09-20 编程语言

阅读全文

再说转录组数据标准化（TPM，RPKM，FPKM）

基础概念讲解

在RNA-Seq的分析中，我们常用RPKM、FPKM和TPM作为转录组数据定量的表示方法。

它们都是对表达量进行标准化的方法，为何不直接用read数表示，而选标准化呢?

2024-09-20 生物信息

阅读全文

单细胞数据如何混合亚类和大类做点图分析Marker基因

单细胞数据数据量很大，加重了分析的负担，但只要掌握好的方法和工具，就可以无往而不利。今年要说的这个如题，是因为在区分亚类的时候，提取了大类型并调整分辨率重新聚类计算的亚类。针对这种情况，该如何实现呢？

2024-09-20 生物信息

阅读全文

ClusterProfiler:真的不只是富集分析

网上很多教程都在讲Y叔的clusterprofile富集分析的教程，但是查阅了官方文档后才知道，这个包真的不仅仅只有这个功能，其他功能也很强大。

2024-09-20 生物信息

阅读全文

在生物信息学中经常用到的脚本语言主要是python和perl，他们被用来处理文本，大量统计，流程控制等等，其自身也是各有优势。比如说perl天生就为了处理文本而生，但是python确是有名的胶水语言，特别在整合C代码时显示出巨大的优势，其语法简洁易懂，易于维护更让其成为仅次于C和JAVA的第三大语言，但其糟糕的性能在处理大量循环时会让人忍不住抓狂。因此，Julia语言应运而生，其控制了python中没必要的动态性，加之使用JIT技术让其能够保有高性能的同时具备简洁的语法。

2024-09-20 编程语言

阅读全文

16S rRNA基因扩增子分析

在此工作流程中，介绍了 Qiime2 和 R 中 16S rRNA 基因扩增子数据分析的主要步骤。本教程是为哥本哈根大学食品科学系的 MAC 2023 课程准备的。尽管这些步骤是为 Oxford Nanopore Tech (ONT) 测序设计的，但也在 Ilumina 短读长上进行了测试。

2024-09-20 生物信息

阅读全文

如何批量计算相关性

1.只计算相关性，不考虑显著性检验：

library(corrr)
library(dplyr)
data(mtcars)
mtcars%>%correlate()%>%rearrange()%>%stretch()

2020-02-17 生物信息

阅读全文

一文读懂lncRNA分析

文章已经过时，请去官网查阅相关文档

1:对测序下机数据进行质量检测（QC）

2020-02-17 生物信息

阅读全文

单细胞数据如何绘制stacked violin?

不同的语言处理gzip压缩文件的时间对比

首先在shell中测试如下命令

使用R语言实现bedtools求交集的功能?

再说转录组数据标准化（TPM，RPKM，FPKM）

基础概念讲解

单细胞数据如何混合亚类和大类做点图分析Marker基因

ClusterProfiler:真的不只是富集分析

python, perl 和julia的性能对比

16S rRNA基因扩增子分析

如何批量计算相关性

1.只计算相关性，不考虑显著性检验：

一文读懂lncRNA分析

1:对测序下机数据进行质量检测（QC）