2958-4272
基于PSO优化孪生支持向量机的自然语言处理
吴倍斯
四川托普信息技术职业学院 四川 成都 610000
[摘 要]在自然语言处理(NLP)中,文本分类、命名实体识别和机器翻译等任务是通过使用文本特征向量来进行训练和预测。然而,训练样本的数量通常相对较少,并且随着文本长度的增加,计算时间也会变得越来越昂贵。因此,在实际应用中,需要构建大量的训练集。但是,由于目前所使用的词向量和词袋模型(Bag of Words, BOW)无法捕获单词之间的关系和上下文信息,因此难以预测新的单词或词组。同时,对于自然语言处理中的许多问题(例如命名实体识别、机器翻译等),传统的支持向量机(Support Vector Machine, SVM)方法通常是最小化分类错误率。然而, SVM存在一个明显的缺陷:如果参数设置不当,将导致过拟合。 粒子群优化(PSO)算法是一种基于群体智能原理的随机优化算法。其基本思想是通过调整种群中每一代个体的位置和速度来获得全局最优解。在本文中,我们提出了一种基于 PSO优化孪生支持向量机(Twin Support Vector Machine, SWSVM)的方法。
[关键词]自然语言处理;孪生支持向量机;粒子群算法;惩罚因子