当前位置:网站首页>【机器学习】实验6布置:基于集成学习的Amazon用户评论质量预测
【机器学习】实验6布置:基于集成学习的Amazon用户评论质量预测
2022-08-02 06:36:00 【Can__er】
ML_class
学堂在线《机器学习》实验课代码+报告(其中实验1和实验6有配套PPT),授课老师为张敏老师。课程链接:https://www.xuetangx.com/training/ML080910036802/1048372?channel=i.area.page_course_ad。
持续更新中。
所有代码为作者所写,并非最后的“标准答案”,只有课程设计被扣了1分,其余皆是满分。仓库链接:https://github.com/W-caner/ML_class。 此外,欢迎关注我的CSDN:https://blog.csdn.net/Can__er?type=blog。
部分数据集由于过大无法上传,我会在博客中给出下载链接。如果对代码有疑问,有更好的思路等,也非常欢迎在评论区与我交流~
EXP6 基于集成学习的Amazon用户评论质量预测
一、案例简介
随着电商平台的兴起,以及疫情的持续影响,线上购物在我们的日常生活中扮演着越来越重要的角色。在进行线上商品挑选时,评论往往是我们十分关注的一个方面。然而目前电商网站的评论质量参差不齐,甚至有水军刷好评或者恶意差评的情况出现,严重影响了顾客的购物体验。因此,对于评论质量的预测成为电商平台越来越关注的话题,如果能自动对评论质量进行评估,就能根据预测结果避免展现低质量的评论。本案例中我们将基于集成学习的方法对 Amazon 现实场景中的评论质量进行预测。
二、作业说明
本案例中需要大家完成两种集成学习算法的实现(Bagging、AdaBoost.M1),其中基分类器要求使用 SVM 和决策树两种,因此,一共需要对比四组结果(AUC 作为评价指标):
- Bagging + SVM
- Bagging + 决策树
- AdaBoost.M1 + SVM
- AdaBoost.M1 + 决策树
注意集成学习的核心算法需要手动进行实现,基分类器可以调库。
基本要求
- 根据数据格式设计特征的表示
- 汇报不同组合下得到的 AUC
- 结合不同集成学习算法的特点分析结果之间的差异
- (使用 sklearn 等第三方库的集成学习算法会酌情扣分)
扩展要求
- 尝试其他基分类器(如 k-NN、朴素贝叶斯)
- 分析不同特征的影响
- 分析集成学习算法参数的影响
边栏推荐
猜你喜欢

DNS resolution process

MQ带来的一些问题、及解决方案

数据库概论之MySQL表的增删改查2

Kind of weird!Access the destination URL, the host can container but not

HCIP day 3 experiment
![[npm install error report collection] - npm ERR! code ENOTEMPTY npm ERR! syscall rmdir](/img/c5/2c42e26e577506573985b30669ca6c.png)
[npm install error report collection] - npm ERR! code ENOTEMPTY npm ERR! syscall rmdir

2022.07.31(LC_6133_分组的最大数量)

Clapper that can interact with the audience in real time

【图像隐藏】基于matlab混合DWT-HD-SVD数字图像水印方法技术【含Matlab源码 2007期】

堡垒机、堡垒机的原理
随机推荐
【暑期每日一题】洛谷 P1255 数楼梯
Vscode连接远程服务器出现‘Acquiring lock on/home/~’问题
docker 安装mysql
File upload vulnerability (2)
【论文精读】Geometric Structure Preserving Warp for Natural Image Stitching
request.getSession(),的故事
2022.07.31(LC_6133_分组的最大数量)
Detailed explanation of 9 common reasons for MySQL index failure
See the picture to understand | How to choose sales indicators to measure the health of business growth
love
实例027:递归输出
The nacos source code can not find the istio package
张驰课堂:六西格玛测量系统的误差分析与判定
实验7 MPLS实验
C# FileInfo类
MPLS的相关技术
[21天学习挑战赛——内核笔记](一)——设备树的概述(硬件、目标、效果、文件类型)
速看!PMP新考纲、PMBOK第七版解读
Understand C operators in one article
数据库概论-MySQL的数据表的基本操作