天津光电通信技术有限公司 访客留言 申请认证

信用网址: 10702636.11315.com   

有限责任公司 成立历史第27 

一种基于不平衡数据的情感分类方法【异议或纠错】

档案编号: CQ-615-6894-6480
档案文号:
专利权人: 申请人 
发布时间: 发布时间 
档案分类: 专利权 
分 类 号: 第G06K9/62;G06F40/284类
授权状态: 已授权
档案内容: 本发明涉及自然语言处理技术领域,具体涉及一种基于不平衡数据的情感分类方法,包括:对文本集合中的所有文本进行预处理,形成无噪音的若干正、负类文本集合,设定文本数量多于一设定数量值的正类文本集合或者负类文本集合为多类文本集合,设定文本数量少于该设定数量值的正类文本集合或者负类文本集合为少类文本集合;对若干多类文本集合进行聚类,使得若干多类文本集合聚合后生成若干个子类文本集合,从每个子类文本集合中选取一定数量的文本集合,然后与全部少类文本集合融合,生成另一子类文本集合;采用Tensorflow2.0和Bert模型,所有子类文本集合作为训练样本进行训练,得到最优的文本分类模型。该方法可以解决数据样本分布的不平衡的问题。
附件下载:  (原始资料备查)

相关专利信息信息

评论

您需要登录后才可以发表评论,请 登录注册

打分

说明:
一、所有信息力求客观、真实:以上信息由全国各级政府职能部门、各行业协会(社团组织)、金融机构、主流媒体、信息主体或实名制下的广大消费者(包括交易对方、员工等)客观提供,不含有本征信平台的任何主观评价;
二、信息异议机制:欢迎大家对有异议的信息及时提出,我们将按照《绿盾全国企业征信管理办法》规定对异议进行核实、修正,确保客观、公平;
三、尊重发布者权益,永不"删贴":对于符合国家法律、法规和本征信平台规定的每一条信息,都将客观记录于企业信用档案,参与信用分值计算,并长期保存。

分享到:
绿盾在线
×
=合作留言=
绿盾业务合作
×
  • 马先生
    15652211315
  • 黄先生
    15652011315