当前位置:网站首页>CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
CPU、内存、显卡等硬件因素也影响着你的深度学习模型性能
2022-08-04 21:25:00 【愚昧之山绝望之谷开悟之坡】
参考:https://posts.careerengine.us/p/5dcb5f53bb8d8844ea19cd0f
数据流动路径
假设我们现在有一批图片集放在硬盘当中,待读取进内存送入GPU运算,那么一般会经历以下流程:
cpu发出读取指令,从硬盘中找到图片数据,并存到内存中;
cpu从内存中取出一批数据,转化为numpy array,并作数据预处理/增强操作,如翻转、平移、颜色变换等。处理完毕后送回内存。
cpu内存(后面简称内存)和gpu内存(后面简称显存)各开辟一块缓冲区,内存中的一个batch的数据通过PCIe通道传输到显存当中。
GPU核心从显存中获取数据进行并行计算,计算结果返回至显存中。
计算好的结果将从显存经过PCIe通道返回到内存。
这5个步骤涉及到几个影响数据传输速度的环节:
硬盘读取速度;
PCIe传输速度;
内存读写速度;
cpu频率。
我们首先来说说硬盘。
硬件的瓶颈之后就是软件层面的多线程
边栏推荐
猜你喜欢

JdbcTemplate概述和测试

数电快速入门(五)(编码器的介绍以及通用编码器74LS148和74LS147的介绍)

LayaBox---TypeScript---首次接触遇到的问题

开发deepstram的自定义插件,使用gst-dseaxmple插件进行扩充,实现deepstream图像输出前的预处理,实现图像自定义绘制图(精四)

3、IO流之字节流和字符流

PowerCLi batch configuration of NTP

【ubuntu20.04安装MySQL以及MySQL-workbench可视化工具】

Spss-系统聚类手算实操

Re24:读论文 IOT-Match Explainable Legal Case Matching via Inverse Optimal Transport-based Rationale Ext

27.降维
随机推荐
动手学深度学习_NiN
【PCBA program design】Grip dynamometer program
Hands-on Deep Learning_NiN
【手把手教你使用STM32HAL库的串口空闲中断】
结构体小结
ini怎么使用? C#教程
[2022 Hangzhou Electric Multi-School 5 1003 Slipper] Multiple Super Source Points + Shortest Path
基于 Milvus 和 ResNet50 的图像搜索(部署及应用)
链队
如何一键重装win7系统?重装win7系统详细教程
立方度量(Cubic Metric)
Re24:读论文 IOT-Match Explainable Legal Case Matching via Inverse Optimal Transport-based Rationale Ext
Some problems with passing parameters of meta and params in routing (can be passed but not passed, empty, collocation, click to pass multiple parameters to report an error)
命名路由、组件中name的作用
【Programming Ideas】
Spss-系统聚类软件实操
dotnet compress Stream or file using lz4net
【2022牛客多校5 A题 Don‘t Starve】DP
使用堡塔应用管理器配置laravel队列方法
LayaBox---TypeScript---举例