传统随机文法模型预测RNA 二级结构需要寻找足够多的相关序列样本,这限制了该方法的实际应用。为有效利用大量未标注的RNA 序列进行结构预测,将半监督学习方法融入到随机文法模型中,采用少量已标注的RNA 样本和大量未标注样本作为预测模型的训练集。设计了基于EM 算法的半监督学习预测模型,该模型将基于产生式方法的SCFG 模型作为分类器,通过训练对未标记的RNA 序列进行标注,再将已标注的序列逐步合并到已标记样本集中,并能够调节已标记样本和未标记样本所占的比例,最后输出结构标签序列。实验结果表明,通过对多种混合了已标注和未标注RNA 序列集的测试,验证了该方法可有效地利用未标...