GPTCelltypeSXY:

基于GPT4模型对scRNA分群进行自动注释(国内网络可用)

安装数信院GPT注释的两个包

install.packages("remotes")
remotes::install_github("EddieLv/apiSXY", force=T)
remotes::install_github("EddieLv/GPTCelltypeSXY", force=T)

导入安装的R包，并设置GPT令牌

# Load packages
library(GPTCelltypeSXY)
library(apiSXY)

# 'sk-XXXX'是令牌，可以找数信院客服付费领取(或淘宝搜索'数信院生信服务器'购买)
Sys.setenv(OPENAI_API_KEY = 'sk-XXXX')

🚀 使用GPT进行自动注释

# markers是一个list, 也可以是Seurat FindAllMarkers()出来的data.frame
markers <- list("C0" = c("Ager", "Hopx", "Pdpn")) # 这里的例子为了方便是一个自定义list
# model表示使用哪个大语言模型(可以是gpt4, gpt4o, gpt-4-turbo)
# tissuename表示你需要注释的组织/器官等，比如肺癌单细胞测序(scRNA data of lung cancer)、癌症类器官(organoids of cancer)等
res <- gptcelltype(markers, tissuename = "lung", model = 'gpt-4o') # 这里基于上述给定的markers对肺(lung)进行注释
res

示例过程(注意2处红线指出的地方，代表成功调用了函数)

关于 GPTCelltypeSXY 包，这里有几个使用时的注意事项：

基于标记基因（Markers）注释 GPTCelltypeSXY 包是基于标记基因（Markers）来进行细胞类型注释的。

因此选择标记基因时要小心，不要提供过于冗余或重复的标记基因(特别是FindAllMarkers的结果要先进行人工过滤再投入gptcelltype模型)。冗余的标记基因可能会导致模型过拟合，影响注释的准确性。

确保标记基因的可靠性和特异性，应当尽量选择已经在文献中验证过的标记基因，并且能够明确区分不同细胞类型的基因。

精简标记基因集，提供少量但高特异性的标记基因集，能提高模型的性能，避免信息过载。

细胞类型库的选择 GPTCelltypeSXY 包基于特定的细胞类型数据库进行注释。

使用时要确保选择适合你的数据集的细胞类型库。例如，不同物种、组织或实验条件下，可能需要不同的标注系统。确保数据集中的细胞类型与所使用的库相匹配，以避免误注释。

Name		Name	Last commit message	Last commit date
Latest commit History 98 Commits
R		R
man		man
vignettes		vignettes
.DS_Store		.DS_Store
DESCRIPTION		DESCRIPTION
LICENSE		LICENSE
NAMESPACE		NAMESPACE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GPTCelltypeSXY:

安装数信院GPT注释的两个包

导入安装的R包，并设置GPT令牌

🚀 使用GPT进行自动注释

示例过程(注意2处红线指出的地方，代表成功调用了函数)

关于 GPTCelltypeSXY 包，这里有几个使用时的注意事项：

个人令牌购买渠道(一般情况下50w token足够完成至少30次自动注释)

一定要对FindAllMarkers的结果进行人工过滤后，再开始自动注释，否则令牌额度将快速耗尽(如每个cluster保留数百个genes作为模型的输入)

⚠️Warning: avoid sharing your API key with others or uploading it to public spaces.

⚠️警告:不要把你的个人令牌分享给别人

About

Releases

Packages

Languages

License

EddieLv/GPTCelltypeSXY

Folders and files

Latest commit

History

Repository files navigation

GPTCelltypeSXY:

安装数信院GPT注释的两个包

导入安装的R包，并设置GPT令牌

🚀 使用GPT进行自动注释

示例过程(注意2处红线指出的地方，代表成功调用了函数)

关于 GPTCelltypeSXY 包，这里有几个使用时的注意事项：

个人令牌购买渠道(一般情况下50w token足够完成至少30次自动注释)

一定要对FindAllMarkers的结果进行人工过滤后，再开始自动注释，否则令牌额度将快速耗尽(如每个cluster保留数百个genes作为模型的输入)

⚠️Warning: avoid sharing your API key with others or uploading it to public spaces.

⚠️警告:不要把你的个人令牌分享给别人

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages