当前位置:网站首页>李宏毅机器学习2022-HW1
李宏毅机器学习2022-HW1
2022-07-23 04:23:00 【鱼树(◔◡◔)】
文章目录
前言
文章仅起到一个记录作用,当然有参考大佬的思路ヾ(•ω•`)o
作业介绍
kaggle链接: link1
Google Colab链接:link2
根据美国各个州前4天提供的疫情相关数据,预测第5天的确诊率
评分标准
提示
Feature selection
这一部分可以先在 jupyter 或 pycharm中的python 控制台中做会比较方便
读入训练集和测试集,查看一下列数
当然了,训练集要比测试集多出一列,这一列就是需要预测的信息,找出这一列的列名 ‘tested_positive.4’,对应列索引为117,也就是最后一列
通过介绍我们知道前37列数据是所处州的相关信息,这部分是用独热编码表示的,这里使用pandas的corr函数分析一下从第38列之后的数据与‘tested_positive.4’之间的相关性
这里我将相关性大于0.8的特征选择出来,注意最后一个‘tested_positive.4’不能选择进去,在训练阶段这个是要用来算loss的
进一步得到它们的索引
对select_feat部分的代码进行修改
Different model architectures and optimizers
由于算不上大数据,增加模型的深度可能导致过拟合、泛化性差等问题(我猜的),这里只改变了一下模型的宽度
优化器由原本的SGD改成了Adam,沐神说过可以带来减小学习率带来的影响等,李宏毅老师之后的课程中也有相关的讲解
L2 regularization and try more parameters
L2 regularization还不是很了解,稍微调一下参数
提交结果
做完以上的步骤过个strong baseline应该是没问题的,再调调参数可能会更好?不过不建议通过反复调参来达到更好的结果,这样可能导致模型的泛化性变差
边栏推荐
- [learning notes] graph theory thinking problem
- [c #] IEnumerable enumerable type interface analysis yield
- mysql通过sql查询数据库所有表名称及列信息
- The safe distance between you and personal information leakage may be decided by a laptop!
- Seektiger's okaleido has a big move. Will the STI of ecological pass break out?
- 无套路、无陷阱、无广告 | 这个免费的即时通讯软件确定不用吗?
- Redis installation
- 千亿营收之后,阿里云生态有了新打法
- 8 < tag dynamic programming and LCS problems > lt.300. Longest increasing subsequence + lt.674. Longest continuous increasing sequence
- Special training - linked list
猜你喜欢

LeetCode刷题--点滴记录022

百度沈抖:聚焦场景深耕行业,为企业数字化带来实际成效

禅道的甘特图功能是什么

Operator usage and scheduling process of 31 spark

【Qt5.12】Qt5.12安装教程

7.< tag-动态规划和买卖股票合集>lt.121. 买卖股票的最佳时机 + lt.122.买卖股票的最佳时机 II+ lt.123. 买卖股票的最佳时机 III dbc

【Delphi】制作控件面板安装图标的简单方法(译)

比你老师详细系列————结构体

Response对象

What is file management software? Why do you need it?
随机推荐
LeetCode每日一题(1946. Largest Number After Mutating Substring)
Chrome selenium uses the default profile without emptying it every time
AI性能拉满的“广和通AI智能模组SCA825-W”加速推进电商直播2.0时代
Introduction to partition operators, broadcast variables and accumulators of 32 spark
Sequence model (III) - sequence model and attention mechanism
How does VirtualBox set up port forwarding?
Cache penetration, cache breakdown, cache avalanche
After 100 billion of revenue, Alibaba cloud ecosystem has a new way to play
比你老师详细系列————结构体
RTC 性能自动化工具在内存优化场景下的实践
有关字符串的题目总结
8 < tag dynamic programming and LCS problems > lt.300. Longest increasing subsequence + lt.674. Longest continuous increasing sequence
What is the core essence of smart parks?
mysql通过sql查询数据库所有表名称及列信息
数据湖:Delta Lake介绍
注册树模式
Sequence model (2) - natural language processing and word nesting
【Qt5.12】Qt5.12安装教程
Kingbasees SQL language reference manual of Jincang database (8. Function (4))
Advantages and disadvantages of RDB and AOF