-
Notifications
You must be signed in to change notification settings - Fork 0
Expand file tree
/
Copy path2.lncRNA_EXPRESION-DIFERENCIAL.R
More file actions
82 lines (48 loc) · 2.25 KB
/
2.lncRNA_EXPRESION-DIFERENCIAL.R
File metadata and controls
82 lines (48 loc) · 2.25 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
### -- Analisis de expresion diferencial -- ###
# Hasta ahora lo que se ha hecho es obtener los datos lncRNA que nos interesa
# analizar, se obtuvieron los datos clinicos de pacientes en 2 matrices:
# Normal Tissuel (NT)
# Primary Tumor (TP)
# Los ids de NT y TP son los colnames de los datos, los 14k son los rownames,
# o sea ensembl id
# La suma de NT Y TP debe ser alrededor de 1200 <- es 1215
# El siguiente paso es el analisis de expresion diferencial!!
####
# Cargando matrices de pacientes
NT_matrix <- read.csv("NT_matrix.csv") # matriz de Normal Tissue
rownames(NT_matrix) <- NT_matrix[,1]
NT_matrix <- NT_matrix[,-1]
TP_matrix <- read.csv("TP_matrix") # matriz de Primary Tumor
rownames(TP_matrix) <- TP_matrix[,1]
TP_matrix <- TP_matrix[,-1]
# Si te das cuenta, ahora los colnames estan separados por "." en lugar de "-"
# recuerda eso por si te da problemas despues
#### --- Preparando CountData, ColData y Design --- ####
# El analisis de DESEq necesita tres parametros: countData, coldata y design
### CREANDO DESIGN -> CONDICION
# Nombres de pacientes
nombre_normal <- "normal"
nombre_tumor <- "tumor"
# Numero de pacientes
numero_normal <- ncol(NT_matrix)
numero_tumor <- ncol(TP_matrix)
# Asignando condicion | DESIGN
condicion <- factor(c(rep(c(nombre_normal,nombre_tumor),
c(numero_normal,numero_tumor)))) #design
### CREANDO COUNTDATA
# Uniendo las dos matrices en una like why idk
datos_matrix <- rbind(NT_matrix, TP_matrix)
datos_matrix <- as.matrix(datos_matrix) #COUNTDATA
colnames(datos_matrix) <- make.unique(colnames(datos_matrix)) #Haciendo que los colnames no sean iguales
### CREANDO COLDATA | informacion de muestra
coldata <- data.frame(col.names=colnames(datos_matrix), condicion)
rownames(coldata) <- coldata[,1] ###PEDOS
coldata <- coldata[,-1]
#comprobando que estan en el mismo orden
#all(rownames(coldata) %in% colnames(datos_matrix))
#### --- DESeq2 --- ####
#dds <- DESeqDataSetFromMatrix(countData = datos_matrix,
#colData = coldata,
#design= ~ condicion)
#dds <- DESeq(dds)
#dds