где нужно смотреть размер файлов

Файлы на диске хранятся кластерами. Размер кластера определяется при создании раздела диска. Файл может занимать только целое число кластеров. Отсюда разница.
Например, если размер кластера 4096 байт, а размер файла 1 байт, то на диске он будет занимать 4096 байт. Если размер файла 4097 байт, то на диске он занимает 8192 байта.
Противоположный пример — разреженные (sparsed) файлы. Это файлы с пустым содержимым. Например, в файле может быть заполнены только первые 10 байт, потом с 3000 до 3200 и и с 102410241024 до 102410241024 + 10 байт. Тогда размер файла будет 102410241024 + 10 байт, а на диске он будет занимать 30 байт (если не ошибаюсь, то разреженные файлы не выравниваются на размер кластера)
Третий случай: на NTFS файлы могут состоять из набора потоков (Alternate Data Stream — ADS). Так вот, файловые менеджеры показывают только один главный поток, а место занимают все.
Четвертый случай — это символические ссылки. Когда физически файл лежит в одном месте, а из разных мест на него указывают ссылки. Тогда для каждой ссылки будет указан размер реального файла, но на диске он будет занимать место только один раз.
Пятый случай — это сжатые NTFS папки. Когда физически вся папка упаковывается в один zip архив. Тогда во-первых физический размер файла уменьшается из-за сжатия, а во-вторых выравнивание по кластеру работает уже не для каждого отдельного файла, а для всего архива
P.S. Как оказалось, альтернативные потоки Explorer тоже не видит и показывает размер на диске только для основного потока
P.S.2 Похоже в современных системах с выравниванием на размер кластера все не так просто. На скриншоте обычный файл размером 10 байт в Windows 10

Такое ощущение, что маленькие файлы теперь хранятся в каком-то общем кластере
В чем разница между размером и размером на диске?
Глядя на свойства файла Windows, я получаю два атрибута: «Размер» и «Размер на диске», а «Размер на диске» всегда больше.
Что означают эти две метрики?
4 ответа 4
Размер — это фактический размер файла в байтах.
Размер на диске — это фактический объем места, занимаемого на диске. Они отличаются тем, что диск разделен на дорожки и сектора, и может выделять блоки дискретного размера.
редактирование
Для более подробного объяснения см. Этот текст, который я скопировал с другого сайта:
Мы знаем, что диск состоит из треков и секторов. В Windows это означает, что ОС выделяет пространство для файлов в «кластерах» или «единицах выделения».
Размер кластера может варьироваться, но типичные диапазоны составляют от 512 байт до 32 КБ и более. Например, на моем диске C:\ единица выделения составляет 4096 байт. Это означает, что Windows выделит 4096 байт для любого файла или части файла длиной от 1 до 4096 байт.
Если у меня есть файл размером 17 КБ (килобайт), то размер на диске будет 20,48 КБ (или 20480 байт). Расчет будет 4096 (1 единица выделения) x 5 = 20480 байт. Требуется 5 единиц размещения для хранения файла 17 КБ.
Другой пример: если у меня есть файл размером 2000 байт. Размер файла на диске будет 4096 байт. Причина в том, что, хотя весь файл может уместиться в одной единице выделения, он все равно занимает 4096 места (одну единицу выделения) на диске (только один файл может использовать единицу выделения и не может использоваться совместно с другими файлами).
Таким образом, размер на диске — это пространство всех тех секторов, в которых сохранен файл. Это означает, что обычно размер на диске всегда больше, чем фактический размер.
Таким образом, фактический размер файла (ов) или папки (ов) всегда должен быть взят из значения « Размер» при просмотре окна свойств.
Это связано с размерами единиц размещения, которые использовались на вашем диске при первом его форматировании.
Представьте, что у вас в машине две канистры по 2 галлона по 10 галлонов. Каждый баллон с газом является единицей распределения. Вам нужно получить 12 галлонов газа, поэтому вам нужно использовать обе банки. В основном, используя 20 галлонов выделенного пространства — но только заполняя 12 галлонов.
Вот размер по умолчанию для Windows XP
Если вы думаете о размере кластера как о каждой из ваших канистр с газом: держите по 4 КБ «газа» в каждой. Но ваш файл имеет размер 2 КБ, тогда размер заливки равен 2 КБ, а размер на диске — 4 КБ.
Пространство кластера
Вы не можете получить доступ к каждому отдельному байту на носителе отдельно. Это было бы ужасно неэффективно, потому что системе нужен какой-то способ отслеживать, какие из них используются, а какие свободны (т. Е. Список), поэтому выполнение этого для каждого байта в отдельности создаст слишком много слышимости (для каждого отдельного байта, то есть 1 к 1, список будет таким же большим, как и сам носитель!)
Вместо этого носитель разбивается на куски, блоки, блоки, группы, как вы хотите их называть (технический термин — кластеры), каждый из которых содержит — согласованное — количество байтов (обычно вы можете указать размер кластеры, так как различные виды использования требуют разных размеров для сокращения отходов).
При сохранении файла на диск, размер файла делится он размером кластера и округляется в случае необходимости. Это означает, что, если размер файла не делится точно на размер кластера, некоторые из кластеров в конечном итоге не используются и, следовательно, теряются.
Когда вы просматриваете свойства файла, вы видите истинный размер файла, а также размер, который он занимает на диске, включая любые « слабые места », то есть «советы кластера», которые не используются. Обычно это не так много для каждого файла, и размер на диске , как правило, почти равен фактическому размеру, но когда вы добавляете потраченное впустую пространство из всех тысяч файлов на диске, они могут сложиться. Поэтому при просмотре размера большой папки, особенно той, в которой много мелких файлов, которые меньше кластера, размер на диске (т. Е. Объем дискового пространства, помеченный как использованный) может оказаться значительно больше фактического размер (т. е. объем пространства, который требуется файлам).
В случае, подобном описанному выше, вы можете уменьшить размер кластера, чтобы каждый файл занимал меньше места. Как правило, диск с большей частью потерянных небольших файлов должен использовать наименьший возможный размер кластера (для уменьшения потерь), а диск с большей частью больших файлов должен использовать наибольший возможный размер кластера (таким образом, структуры бухгалтерского учета в конечном итоге становятся меньше).
Даже на более низком уровне, если каждый кластер представляет собой только один сектор, если файл не является точным кратным размеру секторов на диске (обычно 512 байт традиционно, теперь часто 4096 с дисками расширенного формата ), тогда все равно будет Неиспользуемое пространство между концом файла и концом сектора.
компрессия
Другой сценарий, в котором вы можете увидеть разницу между фактическим размером файла и размером на диске, связан со сжатием. Когда диск сжимается (например, с помощью DriveSpace, NTFS-сжатия и т.д.), Тогда будет разница между размером фактического файла (который необходимо знать) и фактическим размером, который файл занимает (т. Е. Использует или «занимает») на диске.
Ярлыки и жесткие ссылки
Еще один сценарий, который может привести к разнице, связан с жесткими ссылками. В файловых системах, которые поддерживают жесткие ссылки, при создании дубликата файла вместо создания целого нового файла, который занимает место для себя, файловая система создает ярлык для файла, чтобы оба (или все три, и т.д.) копии указывают на один и тот же физический файл на диске. Поэтому, когда два файла указывают на одни и те же данные, они имеют одинаковый размер, но занимают лишь немного больше места, чтобы хранить одну копию.
Размер vs Размер на диске

Многие люди были смущены при просмотре свойств файла, папки или диска, поскольку размер и размер свойств на диске обычно не совпадают друг с другом. Значение размера на странице свойств указывает фактический размер файла, а размер на диске указывает количество байтов, которое он фактически занимает на жестком диске.
Расхождение происходит из того, как файловая система хранит файл на диске. Файловые системы обрабатывают несколько байтов как один кластер, чтобы уменьшить количество адресов, которые используются. В зависимости от файловой системы общие размеры кластера могут варьироваться от 2 КБ до 32 КБ. Файл, записанный на диск, принимает дискретное число кластеров независимо от каждого фактического размера. Таким образом, файл 1 КБ при сохранении в файловой системе с кластерами 2 КБ займет 2 КБ, но в файловой системе с кластерами 32 КБ это займет 32 КБ. Кроме того, файл размером 33 КБ будет занимать 17 кластеров 2 КБ (34 КБ) или 2 кластера в 32 КБ файловой системе (64 КБ). Объем потерянного пространства для каждого файла не должен превышать размер кластера.
Основываясь на приведенных выше аргументах, вы ожидаете, что размер на диске будет больше фактического размера не более, чем размер кластера. Хотя это часто верно, некоторые факторы могут влиять на эти ценности. Когда вы просматриваете папку с большим количеством файлов внутри, расхождение может быть намного больше, потому что каждый отдельный файл может иметь впустую пространство, и все это может подвести итог для папки.
Иногда размер на диске может быть меньше фактического размера файла. Это кажется невозможным, но это может произойти, когда вы используете определенные функции, такие как автоматическое сжатие файлов, предлагаемое операционной системой. Отображаемый размер — это фактический размер файла, но, поскольку операционная система сжимает его, занимаемое пространство часто будет значительно меньше.
Резюме: 1.Size — это фактическое количество байтов файла, а размер на диске — это фактический байт, который он занимает на диске. 2. Размер на диске обычно больше фактического размера файла. 3. Размер на диске может быть меньше фактического размера для дисков, использующих сжатие.
Общий размер и Размер на диске — в чем разница

Многих интересует почему в свойствах файла или каталога отображается разница между размером файла и занимаемым местом на диске.
Кликнув на файле или каталоге правой кнопкой «мыши» и выбрав пункт «Свойства» можно увидеть разницу между «Размер» и «На диске». Например в файловом менеджере SpaceFM эта информация представлена как «Общий размер» и «Размер на диске«.
Почему «Размер на диске» больше чем «Общий размер»
Причина в разнице между реальным размером файла и фактически занимаемым местом на жестком диске кроется в размере блока, который автоматически или вручную был выбран при форматировании диска.
Большинство современных файловых систем могут работать с размерами блока от 1 КБ (1024 байта) до 64 КБ (65536 байт). При создании файла для его хранения на диске ему отводится определённое количество блоков.
Например, если в файловой системе, которая отформатирована с размером блока в 4 КБ (4096 байт), создать пустой текстовый файл, то его «Размер» (Общий размер) будет 0 байт, а фактически «На диске» (Размер на диске) он будет занимать 4 КБ (4096 байт).
Другими словами, под хранение файла отводится минимум один блок файловой системы, а если файл не помещается в один блок, то ему отводится ещё один, и так далее пока файл не поместится полностью. Когда файл не помещается в один блок, то в таком случае мы получаем его фрагментацию — т.е. файл разбивается на фрагменты размером в 4 КБ (4096 байт) и помещается в отдельные ячейки (блоки) файловой системы.
Почему «Общий размер» больше чем «Размер на диске»
Бывают также и такие, казалось бы парадоксальные, случаи, когда файловый менеджер может выдать результат в котором «Размер» (Общий размер) окажется больше, чем фактически «На диске» (Размер на диске).
Например «Общий размер:» корневого раздела / 281,0 Г ( 1071898461 байт ), а «Размер на диске:» 274,5 Г ( 2703195136 байт ). Так может произойти, например, из-за использования NTFS сжатия на разделе.
В данном случае так и произошло, ОС Linux, анализировался корневой раздел / в структуре которого в точку /mnt/BACKUP был смонтирован NTFS раздел с размером блока в 64 кб и активированным на нём NTFS сжатием.
Какой размер блока выбирать при форматировании диска
Для операционной системы, включая домашние каталоги пользователей, вполне оптимальным размером является стандартный размер блока в 4 КБ.
А вот для хранения больших мультимедиа (аудио, видео) файлов, минимальный размер каждого из которых всегда больше 1-3 МБ, лучше конечно выделить отдельный раздел и отформатировать его с максимальным размером блока в 64 КБ.
Что касается виртуальных серверов используемых под обычные веб-сайты, то в этом случае возможно будет лучше снизить размер блока до 2, а то и до 1 КБ — ведь от общего числа файлов хорошо оптимизированного сайта может быть около половины файлов не превышающий даже 1 КБ (80, 500, 800 байт).