当前位置:网站首页>对pandas 数据进行数据打乱并选取训练机与测试机集
对pandas 数据进行数据打乱并选取训练机与测试机集
2020-11-06 01:27:00 【IT界的小小小学生】
描述
在机器学习中,拿到一堆训练数据一般会需要将数据切分成训练集和测试集,或者切分成训练集、交叉验证集和测试集,为了避免切分之后的数据集在特征分布上出现偏倚,我们需要先将数据打乱,使数据随机排序,然后在进行切分。
需要用的方法如下:
注:df代表一个pd.DataFrame
df = df.sample(frac=1.0): 按100%的比例抽样即达到打乱数据的效果
df = df.reset_index():打乱数据之后index也是乱的,如果你的index没有特征意义的话,直接重置就可以了,否则就在打乱之前把index加进新的一列,再生成无意义的index
train = df.loc[0:a]: 进行切分操作,切分比例看情况定
cv = df.loc[a+1:b]:
test = df.loc[b+1:-1]:
版权声明
本文为[IT界的小小小学生]所创,转载请带上原文链接,感谢
https://vip01.blog.csdn.net/article/details/93796160
边栏推荐
- The difference between Es5 class and ES6 class
- 做外包真的很难,身为外包的我也无奈叹息。
- 嘗試從零開始構建我的商城 (二) :使用JWT保護我們的資訊保安,完善Swagger配置
- PHP应用对接Justswap专用开发包【JustSwap.PHP】
- 数字城市响应相关国家政策大力发展数字孪生平台的建设
- Flink on paasta: yelp's new stream processing platform running on kubernetes
- 網路程式設計NIO:BIO和NIO
- xmppmini 專案詳解:一步一步從原理跟我學實用 xmpp 技術開發 4.字串解碼祕笈與訊息包
- TensorFlow2.0 问世,Pytorch还能否撼动老大哥地位?
- 文本去重的技术方案讨论(一)
猜你喜欢

How do the general bottom buried points do?

How long does it take you to work out an object-oriented programming interview question from Ali school?

哇,ElasticSearch多字段权重排序居然可以这么玩

快快使用ModelArts,零基礎小白也能玩轉AI!

业内首发车道级导航背后——详解高精定位技术演进与场景应用

条码生成软件如何隐藏部分条码文字

C++和C++程序员快要被市场淘汰了

大数据应用的重要性体现在方方面面

人工智能学什么课程?它将替代人类工作?

Pattern matching: The gestalt approach一种序列的文本相似度方法
随机推荐
微服務 - 如何解決鏈路追蹤問題
网络安全工程师演示:原来***是这样获取你的计算机管理员权限的!【维持】
如何将数据变成资产?吸引数据科学家
Didi elasticsearch cluster cross version upgrade and platform reconfiguration
《Google軟體測試之道》 第一章google軟體測試介紹
【新閣教育】窮學上位機系列——搭建STEP7模擬環境
DRF JWT authentication module and self customization
分布式ID生成服务,真的有必要搞一个
Pattern matching: The gestalt approach一种序列的文本相似度方法
In depth understanding of the construction of Intelligent Recommendation System
嘘!异步事件这样用真的好么?
Don't go! Here is a note: picture and text to explain AQS, let's have a look at the source code of AQS (long text)
Vue 3 responsive Foundation
Ubuntu18.04上安裝NS-3
Analysis of ThreadLocal principle
快快使用ModelArts,零基礎小白也能玩轉AI!
TensorFlow2.0 问世,Pytorch还能否撼动老大哥地位?
多机器人行情共享解决方案
小白量化投资交易入门课(python入门金融分析)
事半功倍:在没有机柜的情况下实现自动化