首页 快讯内容详情
Sòng bài online:中国科学家训练语言模型用于单细胞测序技术,助力破译肿瘤微环境

Sòng bài online:中国科学家训练语言模型用于单细胞测序技术,助力破译肿瘤微环境

分类:快讯

标签: # 新2手机管理端网址

网址:

SEO查询: 爱站网 站长工具

点击直达

telegram中文群组www.tg888.vip)是一个Telegram群组分享平台,飞机群组内容包括telegram群组索引、Telegram群组导航、新加坡telegram群组、telegram中文群组、telegram群组(其他)、Telegram 美国 群组、telegram群组爬虫、电报群 科学上网、小飞机 怎么 加 群、tg群等内容,为广大电报用户提供各种电报群组/电报频道/电报机器人导航服务。

单细胞测序技术是生物医学领域一颗冉冉的新星技术,是指通过测序技术从单个细胞中得到有关遗传的信息。

在人体内,不同组织的细胞有着多种多样的类型、状态以及相互作用方式。而单细胞 RNA 测序(single-cell RNA sequencing/ scRNA-seq)技术,则为科学家们提供了一种在单细胞水平实现基因表达观测的方法。

这一技术将有助于了解在不同条件下各种细胞的基因表达的差异等,其中包括肿瘤细胞,进而从细胞层面对肿瘤微环境、以及疾病进展进行阐释,甚至将助力实现“精准医疗”。

在单细胞 RNA 测序技术中, 准确的细胞类型注释十分重要。目前,细胞类型注释的方法主要有三类:通过标记基因注释;通过基于相关性的方法进行注释;以及通过监督分类进行注释。

在这三种方法中,通过监督分类进行注释的方法类似于 AI 领域机器学习的经典方法,即先通过基因表达谱进行模式学习和训练,并且在经过标记的数据集得到充分训练之后,转移到未标记的数据集进行训练。

,

allbet欧博真人客户端www.aLLbet8.vip}是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

,

这种方法由于对噪点和数据可变性而有着良好的鲁棒性,再加上其具备独立于人工选择的标记基因,故在最近得到了广泛使用。

不过,该方法由于模型容量有限、且不可避免地会引入人为偏差,目前这类方法存在的对大规模数据集的欠拟合问题,不利于其广泛推广。

而最近,一组中国科研团队受大规模预训练模型 BERT 的通过预训练和微调范式来提高 AI 模型泛化性的启发,开发出了用于对 scRNA-seq 数据进行细胞注释的 scBERT(single-cell BERT)模型。

研究人员通过让 scBERT 模型在大规模未标记 scRNA-seq 数据集上进行自我监督学习来提高其泛化性,来对 scBERT 模型进行验证。通过一系列基准测试,证明 scBERT 在细胞类型注释方面,有着良好的稳健性和准确性。

相关论文以《 基于大规模预训练深度语言模型用于单细胞 RNA 测序中进行细胞类型注释的模型:scBERT》(scBERT as a large-scale pretrained deep language model for cell type annotation of single-cell RNA-seq data)为题,发表在 Nature Machine Intelligence。论文作者分别来自腾讯 AI 实验室和上海交通大学-耶鲁大学生物统计学与数据科学联合中心。

展开全文

简单来说,scBERT 模型会对数百万个各种细胞类型的未标记 scRNA-seq 数据进行预训练,来学习有关 scRNA-seq 的基本知识。然后,通过简单地插入分类器、以及对由参考数据集监督的参数进行微调,来进行细胞类型的分配。

下图为 scBERT 的简图:首先,在自我监督的预训练阶段,也就是图中上部蓝绿色的 Self-supervised learning 部分,系统从 PanglaoDB 中收集尚未标记的数据。

,

Sòng bài online(www.vng.app):Sòng bài online(www.vng.app) cổng Chơi tài xỉu uy tín nhất việt nam。Sòng bài online(www.vng.app)game tài Xỉu đánh bạc online công bằng nhất,Sòng bài online(www.vng.app)cổng game không thể dự đoán can thiệp,mở thưởng bằng blockchain ,đảm bảo kết quả công bằng.

发布评论