当前位置:网站首页>只有1个字节的文件实际占用多少磁盘空间
只有1个字节的文件实际占用多少磁盘空间
2020-11-06 21:04:00 【张彦飞allen】
在前文《新建一个空文件是否占用磁盘空间?占用多少》中我们了解到了一个空文件的磁盘开销。 今天我们再思考另外一个问题,假如我们给文件里只写入1个字节,那么这个文件实际的磁盘占用也是1个字节吗?
查看1个字节的文件
和前文一样,先不谈原理,直接动手操作。
# mkdir tempDir
# cd tempDir
# du -h
0 .
# touch test
# du -h
0 .
在一个目录中创建了一个空的文件以后,通过du命令看到的该文件夹的占用空间并没有发生变化。这倒是符合我们之前的认识,因为空文件只占用inode。好,那让我们修改文件,添加一个字母
echo "a" > test
# du -h
4.0K .
保存后再次查看该目录的空间占用。我们发现由原来的0增加到了4K。 所以说,文件里的内容不论多小,哪怕是一个字节,其实操作系统也会给你分配4K的。哦,当然了还得再算前文中说到的inode和文件夹数据结构中存储的文件名等所用的空间。 所以,不要在你的系统里维护一大堆的碎文件。文件再小,占用磁盘其实一点都不少!
注意我的实验环境是在ext文件系统下进行的。如果是xfs可能表现会有些许出入。
继续讨论这个4K
再把linux源代码文件fs/ext2/ext2.h里关于inode的定义翻出来,我们找到结构体中定义的指向数据节点用的block数组:
struct ext2_inode {
......
__le32 i_block[EXT2_N_BLOCKS]; # 指向存储文件数据的块的数组
......
当文件没有数据需要存储的时候,这个数组都是空值。而当我们写入了1个字节以后,文件系统就需要申请block去存储了,申请完后,指针放在这个数组里。哪怕文件内容只有一个字节,仍然会分配一个整的Block,因为这是文件系统的最小工作单位。那么这个block大小是多大呢,ext下可以通过dumpe2fs查看。
#dumpe2fs -h /dev/mapper/vgroot-lvroot
......
Block size: 4096
在我的机器上,一个Block是4KB。
文件内容再大了怎么办
不知道你留意没,inode中定义的block数组大小呢,只有EXT2_N_BLOCKS个。我们再查看一下这个常量的定义,发现它是15,相关内核中定义如下:
#define EXT2_NDIR_BLOCKS 12
#define EXT2_IND_BLOCK EXT2_NDIR_BLOCKS
#define EXT2_DIND_BLOCK (EXT2_IND_BLOCK + 1)
#define EXT2_TIND_BLOCK (EXT2_DIND_BLOCK + 1)
#define EXT2_N_BLOCKS (EXT2_TIND_BLOCK + 1)
就按4K的block size来看,15个block只够存的下15*4=60K的文件。 这个文件大小相信你一定不满意,你存一个avi大片都得上G了。那Linux是怎么实现大文件存储的呢?嗯,其实上面宏的定义过程已经告诉你了,就是只有12个数组直接存block指针,其余的用来做间接索引(EXT2_IND_BLOCK),二级间接索引(EXT2_DIND_BLOCK)和三级索引(EXT2_TIND_BLOCK)。

这样,一个文件可以使用的空间就指数倍的扩展了。 文件小的时候,都用直接索引,磁盘IO少,性能好。文件大的时候,访问一个block可能得先进行三次的IO,性能略慢,不过有OS层面的页缓存、目录项缓存的加持,也还好。
结论
文件系统是按照块来管理的,所以不管你的文件多小,哪怕只有一个字节,都会消耗掉整整一个块。这个块大小可以通过dumpe2fs等命令来查看。如果想改变这个块大小怎么办?对不起,只能重新格式化。

开发内功修炼之硬盘篇专辑:
- 1.磁盘开篇:扒开机械硬盘坚硬的外衣!
- 2.磁盘分区也是隐含了技术技巧的
- 3.我们怎么解决机械硬盘既慢又容易坏的问题?
- 4.拆解固态硬盘结构
- 5.新建一个空文件占用多少磁盘空间?
- 6.只有1个字节的文件实际占用多少磁盘空间
- 7.文件过多时ls命令为什么会卡住?
- 8.理解格式化原理
- 9.read文件一个字节实际会发生多大的磁盘IO?
- 10.write文件一个字节后何时发起写磁盘IO?
- 11.机械硬盘随机IO慢的超乎你的想象
- 12.搭载固态硬盘的服务器究竟比搭机械硬盘快多少?
我的公众号是「开发内功修炼」,在这里我不是单纯介绍技术理论,也不只介绍实践经验。而是把理论与实践结合起来,用实践加深对理论的理解、用理论提高你的技术实践能力。欢迎你来关注我的公众号,也请分享给你的好友~~~
版权声明
本文为[张彦飞allen]所创,转载请带上原文链接,感谢
https://my.oschina.net/u/4746202/blog/4703266
边栏推荐
- It's so embarrassing, fans broke ten thousand, used for a year!
- Simple summary of front end modularization
- What problems can clean architecture solve? - jbogard
- Arrangement of basic knowledge points
- I'm afraid that the spread sequence calculation of arbitrage strategy is not as simple as you think
- It is really necessary to build a distributed ID generation service
- 仅用六种字符来完成Hello World,你能做到吗?
- [actual combat of flutter] pubspec.yaml Configuration file details
- 前端都应懂的入门基础-github基础
- Nodejs crawler captures ancient books and records, a total of 16000 pages, experience summary and project sharing
猜你喜欢

一篇文章带你了解CSS对齐方式

Flink的DataSource三部曲之一:直接API

NLP model Bert: from introduction to mastery (2)

It's so embarrassing, fans broke ten thousand, used for a year!

Jetcache buried some of the operation, you can't accept it

In order to save money, I learned PHP in one day!

Lane change detection
![[C / C + + 1] clion configuration and running C language](/img/5b/ba96ff4447b150f50560e5d47cb8d1.jpg)
[C / C + + 1] clion configuration and running C language

Python saves the list data

vue任意关系组件通信与跨组件监听状态 vue-communication
随机推荐
Python filtering sensitive word records
6.1.2 handlermapping mapping processor (2) (in-depth analysis of SSM and project practice)
教你轻松搞懂vue-codemirror的基本用法:主要实现代码编辑、验证提示、代码格式化
Free patent download tutorial (HowNet, Espacenet)
一篇文章带你了解CSS 渐变知识
IPFS/Filecoin合法性:保护个人隐私不被泄露
前端都应懂的入门基础-github基础
Python crawler actual combat details: crawling home of pictures
Installing ns-3 on ubuntu18.04
一篇文章带你了解CSS3圆角知识
I've been rejected by the product manager. Why don't you know
NLP model Bert: from introduction to mastery (1)
Mac installation hanlp, and win installation and use
Linked blocking Queue Analysis of blocking queue
I think it is necessary to write a general idempotent component
Jmeter——ForEach Controller&Loop Controller
零基础打造一款属于自己的网页搜索引擎
Let the front-end siege division develop independently from the back-end: Mock.js
Not long after graduation, he earned 20000 yuan from private work!
Construction of encoder decoder model with keras LSTM