版权说明 操作指南
首页 > 成果 > 详情

RNA 二级结构预测:基于半监督学习的随机文法模型方法

认领
导出
Link by 中国知网学术期刊 Link by 万方学术期刊
反馈
分享
QQ微信 微博
成果类型:
期刊论文
作者:
唐四薪;赵辉煌;周勇
作者机构:
[唐四薪; 赵辉煌] 衡阳师范学院计算机科学系
[周勇] 衡阳师范学院数学与计算科学系
语种:
中文
关键词:
半监督学习;二级结构;随机文法模型
关键词(英文):
RNA
期刊:
计算机与应用化学
ISSN:
1001-4160
年:
2013
卷:
30
期:
9
页码:
1038-1042
基金类别:
湖南省自然科学基金项目(12JJ4058) 衡阳师范学院科研基金项目(09A36)
机构署名:
本校为第一机构
院系归属:
数学与统计学院
摘要:
传统随机文法模型预测RNA 二级结构需要寻找足够多的相关序列样本,这限制了该方法的实际应用。为有效利用大量未标注的RNA 序列进行结构预测,将半监督学习方法融入到随机文法模型中,采用少量已标注的RNA 样本和大量未标注样本作为预测模型的训练集。设计了基于EM 算法的半监督学习预测模型,该模型将基于产生式方法的SCFG 模型作为分类器,通过训练对未标记的RNA 序列进行标注,再将已标注的序列逐步合并到已标记样本集中,并能够调节已标记样本和未标记样本所占的比例,最后输出结构标签序列。实验结果表明,通过对多种混合了已标注和未标注RNA 序列集的测试,验证了该方法可有效地利用未标...
摘要(英文):
To predict RNA secondary structures, traditional stochastic grammar models need to collect plenty of related RNA sequences, which limits the practical application of this method. In order to use a large number of unlabeled RNA sequences effectively for structure prediction, the Semi-supervised method has been applied to stochastic grammar models. We use a small amount of labeled RNA samples and a large number of unlabeled samples as a training set of prediction model. Designing a semi-supervised learning model based on EM algorithm, using a SCFG model based on generative method as classifier, ...

反馈

验证码:
看不清楚,换一个
确定
取消

成果认领

标题:
用户 作者 通讯作者
请选择
请选择
确定
取消

提示

该栏目需要登录且有访问权限才可以访问

如果您有访问权限,请直接 登录访问

如果您没有访问权限,请联系管理员申请开通

管理员联系邮箱:yun@hnwdkj.com