当前位置:网站首页>对pandas 数据进行数据打乱并选取训练机与测试机集
对pandas 数据进行数据打乱并选取训练机与测试机集
2020-11-06 01:27:00 【IT界的小小小学生】
描述
在机器学习中,拿到一堆训练数据一般会需要将数据切分成训练集和测试集,或者切分成训练集、交叉验证集和测试集,为了避免切分之后的数据集在特征分布上出现偏倚,我们需要先将数据打乱,使数据随机排序,然后在进行切分。
需要用的方法如下:
注:df代表一个pd.DataFrame
df = df.sample(frac=1.0): 按100%的比例抽样即达到打乱数据的效果
df = df.reset_index():打乱数据之后index也是乱的,如果你的index没有特征意义的话,直接重置就可以了,否则就在打乱之前把index加进新的一列,再生成无意义的index
train = df.loc[0:a]: 进行切分操作,切分比例看情况定
cv = df.loc[a+1:b]:
test = df.loc[b+1:-1]:
版权声明
本文为[IT界的小小小学生]所创,转载请带上原文链接,感谢
https://vip01.blog.csdn.net/article/details/93796160
边栏推荐
- python 保存list数据
- (1) ASP.NET Introduction to core3.1 Ocelot
- Flink on paasta: yelp's new stream processing platform running on kubernetes
- Cos start source code and creator
- How long does it take you to work out an object-oriented programming interview question from Ali school?
- PHP应用对接Justswap专用开发包【JustSwap.PHP】
- Every day we say we need to do performance optimization. What are we optimizing?
- Listening to silent words: hand in hand teaching you sign language recognition with modelarts
- 3分钟读懂Wi-Fi 6于Wi-Fi 5的优势
- Vue 3 responsive Foundation
猜你喜欢
PHPSHE 短信插件说明
GUI 引擎评价指标
How long does it take you to work out an object-oriented programming interview question from Ali school?
DRF JWT authentication module and self customization
Kitty中的动态线程池支持Nacos,Apollo多配置中心了
GBDT与xgb区别,以及梯度下降法和牛顿法的数学推导
恕我直言,我也是才知道ElasticSearch条件更新是这么玩的
快快使用ModelArts,零基礎小白也能玩轉AI!
采购供应商系统是什么?采购供应商管理平台解决方案
Didi elasticsearch cluster cross version upgrade and platform reconfiguration
随机推荐
不吹不黑,跨平臺框架AspNetCore開發實踐雜談
Working principle of gradient descent algorithm in machine learning
drf JWT認證模組與自定製
《Google軟體測試之道》 第一章google軟體測試介紹
Pattern matching: The gestalt approach一种序列的文本相似度方法
PLC模拟量输入和数字量输入是什么
连肝三个通宵,JVM77道高频面试题详细分析,就这?
PHPSHE 短信插件说明
Top 10 best big data analysis tools in 2020
Existence judgment in structured data
Why do private enterprises do party building? ——Special subject study of geek state holding Party branch
深度揭祕垃圾回收底層,這次讓你徹底弄懂她
01 . Go语言的SSH远程终端及WebSocket
自然语言处理之命名实体识别-tanfordcorenlp-NER(一)
如何在Windows Server 2012及更高版本中將域控制器降級
直播预告 | 微服务架构学习系列直播第三期
PHP应用对接Justswap专用开发包【JustSwap.PHP】
How long does it take you to work out an object-oriented programming interview question from Ali school?
至联云分享:IPFS/Filecoin值不值得投资?
html