lncRNA-master-regulators-MAIN/2.lncRNA_EXPRESION-DIFERENCIAL.R at master · Dulma-mora/lncRNA-master-regulators-MAIN · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
            ### -- Analisis de expresion diferencial -- ###

# Hasta ahora lo que se ha hecho es obtener los datos lncRNA que nos interesa
# analizar, se obtuvieron los datos clinicos de pacientes en 2 matrices:
# Normal Tissuel (NT)
# Primary Tumor (TP)
# Los ids de NT y TP son los colnames de los datos, los 14k son los rownames,
# o sea ensembl id
# La suma de NT Y TP debe ser alrededor de 1200 <- es 1215

# El siguiente paso es el analisis de expresion diferencial!!

####

# Cargando matrices de pacientes

NT_matrix <- read.csv("NT_matrix.csv") # matriz de Normal Tissue
      rownames(NT_matrix) <- NT_matrix[,1]
      NT_matrix <- NT_matrix[,-1]

TP_matrix <- read.csv("TP_matrix") # matriz de Primary Tumor
      rownames(TP_matrix) <- TP_matrix[,1]
      TP_matrix <- TP_matrix[,-1]

# Si te das cuenta, ahora los colnames estan separados por "." en lugar de "-"
# recuerda eso por si te da problemas despues

#### --- Preparando CountData, ColData y Design --- ####

# El analisis de DESEq necesita tres parametros: countData, coldata y design

      ### CREANDO DESIGN -> CONDICION

   # Nombres de pacientes
nombre_normal <- "normal"
nombre_tumor <- "tumor"

   # Numero de pacientes
numero_normal <- ncol(NT_matrix)
numero_tumor <- ncol(TP_matrix)

   # Asignando condicion | DESIGN
condicion <- factor(c(rep(c(nombre_normal,nombre_tumor),
                           c(numero_normal,numero_tumor)))) #design

      ### CREANDO COUNTDATA

   # Uniendo las dos matrices en una like why idk
datos_matrix <- rbind(NT_matrix, TP_matrix)
datos_matrix <- as.matrix(datos_matrix) #COUNTDATA

colnames(datos_matrix) <- make.unique(colnames(datos_matrix)) #Haciendo que los colnames no sean iguales


      ### CREANDO COLDATA | informacion de muestra

coldata <- data.frame(col.names=colnames(datos_matrix), condicion)

rownames(coldata) <- coldata[,1] ###PEDOS
coldata <- coldata[,-1]

   #comprobando que estan en el mismo orden
#all(rownames(coldata) %in% colnames(datos_matrix))


#### --- DESeq2 --- ####

#dds <- DESeqDataSetFromMatrix(countData = datos_matrix,
                              #colData = coldata,
                              #design= ~ condicion)
#dds <- DESeq(dds)
#dds