Как определить расширение файла если его нет
Перейти к содержимому

Как определить расширение файла если его нет

  • автор:

Определение расширения файла в Windows 10

Как узнать расширение файла в Windows 10

Самый простой метод определить формат файла в операционной системе Windows 10 — перейти в его свойства через контекстное меню и там просмотреть интересующую информацию. Для этого понадобится выполнить всего пару кликов.

  1. Найдите необходимый объект и нажмите по нему правой кнопкой мыши. Вызов контекстного меню файла для определения формата в Windows 10
  2. В появившемся меню вам нужен последний пункт «Свойства». Переход к свойствам файла для определения его формата в Windows 10
  3. Оказавшись на вкладке «Общие», посмотрите на надпись «Тип файла». После двоеточия как раз указывается формат объекта. Определение формата файла через его свойства в Windows 10

Способ 2: Настройка «Параметры папок»

Если вы уже обратили внимание на предыдущие скриншоты, то заметили, что после названия файла идет точка и указывается его формат. Это второй метод узнать расширение, но для этого его отображение придется включить через настройку «Параметры папок», что осуществляется так:

  1. В шапке «Проводника» нажмите по расположенной справа стрелке вниз, чтобы открыть дополнительную панель инструментов. Вызов дополнительной панели проводника Windows 10 для настройки отображения расширения файлов
  2. Переместитесь на вкладку «Вид». Переход на вкладку Вид меню проводника для настройки отображения расширения файлов в Windows 10
  3. Щелкните по блоку «Параметры» и перейдите в «Изменить параметры папок и поиска». Переход к настройке Параметров папок в Windows 10 для отображения расширения файлов
  4. В появившемся меню переключитесь на центральную вкладку «Вид». Переход на вкладку Вид для настройки отображения расширения файлов в Windows 10

Способ 3: LocateOpener

Определить расширение файла и получить дополнительную информацию по нему можно не только при помощи стандартных средств операционной системы, но и через решения от сторонних разработчиков, которые иногда даже оказываются полезнее, поскольку позволят распознать тип неизвестного ОС объекта. Первая такая программа называется LocateOpener.

  1. Загрузите софт LocateOpener с официального сайта, перейдя по ссылке выше, а затем запустите исполняемый файл, находящийся в архиве. Запуск исполняемого файла для установки программы LocateOpener в Windows 10
  2. Подтвердите установку и закройте окно. Сразу же можно переходить к следующему шагу, поскольку информации об успешной инсталляции на экран выведено не будет. Установка программы LocateOpener в Windows 10 для дальнейшего определения формата файла
  3. Найдите требуемый объект и кликните по нему ПКМ. Вызов контекстного меню файла для определения формата через программу LocateOpener в Windows 10
  4. В контекстное меню «Проводника» будет добавлена программа LocateOpener, поэтому ее пункт и следует выбрать для запуска. Запуск программы LocateOpener в Windows 10 для определения формата файла
  5. Если у нее сразу не получилось определить расширение, нажмите «Scan with TrID». Определение формата файла через программу LocateOpener в ОС Windows 10
  6. Вы получите сводку о том, сколько процентов дает LocateOpener на то, что этот файл имеет указанное расширение. Конечно, этот вариант не самый надежный, но, повторимся, что он пригодится, когда тип файла остается неизвестным для стандартных средств ОС. Дополнительная информация о формате файла через программу LocateOpener в Windows 10

Способ 4: Analyze It!

Analyze It! — полноценное программное обеспечение с графическим интерфейсом, которое позволяет узнать абсолютно всю доступную информацию о выбранном файле, включая его расширение. Для использования софта потребуется выполнить такие действия:

  1. После установки Analyze It! нажмите «Browse» справа от верхнего поля, чтобы перейти к добавлению файла. Переход к выбору файла для определения расширения через программу Analyze It! в Windows 10
  2. Отыщите его в «Проводнике» и откройте. Выбор файла для определения его расширения через программу Analyze It! в Windows 10
  3. Вы сразу же получите искомые сведения о расширении и программе, в которой был создан данный объект. Определение расширения файла через программу Analyze It! в Windows 10
  4. Затем вы можете перейти на вкладку «Content Info». Здесь отображается более детальная сводка об объекте, например, его первые байты, размер, дата создания и последнего изменения, а также установленные атрибуты. Переход к ознакомлению с подробной информацией о файле через программу Analyze It! в Windows 10

Способ 5: Identify

Если нет желания устанавливать программы для определения расширения файла, можно воспользоваться портативной версией Identify, которая не требует инсталляции и сразу же работает после скачивания. Сама функциональность этого софта сосредоточена исключительно на распознании формата выбранного объекта.

  1. Загрузите архив Identify, откуда сразу же запустите ПО или распакуйте его в любое удобное место на компьютере. Запуск программы Identify в Windows 10 для определения расширения файла
  2. Через раздел «File» выберите пункт «Open and Identify». Переход к выбору файла для определения расширения через программу Identify в Windows 10
  3. После добавления объекта приложение тут же выведет в отдельной строке информацию о его расширении. Определение расширения файла через программу Identify в Windows 10
  4. В Identify присутствует библиотека, благодаря которой она и определяет формат. Просмотреть ее можно через «Library». Переход к просмотру библиотеки форматов файлов в программе Identify в Windows 10
  5. Там можно поменять дополнительные сведения или посмотреть все доступные форматы. Просмотр библиотеки форматов файлов в программе Identify в Windows 10

Если вдруг оказалось, что истинное расширение файла не соответствует тому, которое отображается в операционной системе, его придется поменять вручную, чтобы корректно открыть через требуемую программу или стандартное средство. Развернутую инструкцию по выполнению поставленной задачи вы найдете в материале от другого нашего автора ниже.

Уточним, что если узнать формат файла не получилось никакими средствами, скорее всего, он поврежден. Однако случаются такие ситуации, когда под подобными элементами маскируются вирусы, поэтому в целях безопасности рекомендуется запустить сканирование через любую удобную программу и проверить, не заражен ли ПК. Детальнее об этом читайте в статье далее.

Как определить тип файла без расширения

Представьте, что вы получаете почту от своих друзей или коллег, а во вложении они отправили вам какой-то документ в виде прикреплённого к письму файла, в котором есть нужная вам информация. Вы сохраняете этот файл на свой компьютер, но видите, что вместо привычных значков какой-либо программы (Word, Excel, PDF и т.д.) никакого значка нет, а Windows считает, что это какой-то файл с неизвестным форматом. Зачастую это происходит из-за того, что файл в процессе прикрепления к письму отправителем (или при сохранении файла на компьютер получателем) теряет своё расширение, и операционная система Windows перестаёт понимать, что за тип файла перед ней, и соответственно не знает, какой программой нужно открывать такой файл. Что такое расширение файла, и как их отображать и скрывать в различных версиях Windows, вы можете прочитать в этой статье.

Второй наиболее частой причиной потери расширения файла является неаккуратное переименование файла, когда у вас в Windows задан режим отображения расширений всех известных типов файлов, и вы при попытке переименовать файл случайно стираете расширение файла и получаете в итоге документ неизвестного происхождения, который уже не сможете открыть двойным щелчком мышки. Например, файл у вас назывался «Письмо.doc», который раньше легко открывался с помощью программы Word, а после переименования он стал называться «Письмо по работе». Обратите внимание, что у файла теперь нет расширения «.doc», которое было случайно стёрто при изменении имени файла, и теперь этот файл не будет открываться двойным щелчком мышки, а попытается спросить у вас, какой именно программой нужно открывать этот файл.

Хорошо, если вы точно знаете, какой тип файла перед вами, и можете просто добавить ему нужное расширение, например, doc или xls, чтобы он автоматически открывался с помощью двойного щелчка мышки по нему. В отдельной статье вы можете прочитать о наиболее популярных форматах файлов Windows и их расширениях. Но что делать, если перед вами файл, тип которого вы не знаете? Есть как минимум два способа узнать, какой перед вами тип файла, и задать ему правильное расширение.

В этой статье мы с вами проведём эксперимент — возьмём несколько готовых файлов разных форматов, которые рассматривали в вышеуказанной статье, сотрём им расширения, как будто они были утеряны или случайно удалены, и попытаемся узнать, какой тип имеет каждый файл, и какое ему нужно добавить расширение, чтобы легко открыть его.

В нашем эксперименте будут участвовать несколько файлов:

  1. Bonnie Tyler — Turn around.mp3 — песня в формате mp3
  2. bonus.mp4 — небольшое видео в формате mp4
  3. KeePass-2.28.exe — установочный файл программы KeePass (об этой замечательной программе я расскажу вам в одной из следующих статей)
  4. math.zip — архив zip
  5. Point Break.avi — небольшое видео формата avi
  6. Tulips.jpg — картинка с тюльпанами
  7. Доклад.ppt — презентация, сделанная в MS PowerPoint 2003
  8. Материалы к совещанию.pptx — презентация, сделанная в MS PowerPoint 2007
  9. Письмо.doc — текстовый файл, сделанный в редакторе MS Word 2003
  10. Приказ.docx — текстовый файл, сделанный в редакторе MS Word 2007
  11. Приложение 4.rar — архив rar
  12. резолюция.pdf — файл в формате pdf
  13. Таблица соответствия.xlsx — файл с данным, сделанный в табличном редакторе MS Excel 2007
  14. Табличные данные.xls — файл с данным, сделанный в табличном редакторе MS Excel 2003

На картинке ниже у всех файлов стоят свои расширения (выделены рамочками с красными краями):

Удаляем все расширения файлов, и после этого пропадают все значки программ, с помощью которых можно открывать эти файлы. В Windows XP это выглядит так:

В Windows 7 это выглядит немного по-другому, но смысл тот же — операционная система не знает, какой программой открывать эти файлы.

Теперь при попытке открыть любой файл Windows предложит нам сначала выбрать программу, которой нужно открывать этот файл:

И здесь надо быть аккуратным, поскольку неправильный выбор программы для данного типа файла приведёт к тому, что файл не откроется, и программа выдаст ошибку, а за данным файлом закрепится неправильная ассоциация программы его открытия.

Иногда о том, какой перед нами тип файла и какое расширение у должно быть, можно догадаться и по названию файла. Но мы возьмём тот случай, когда это сделать невозможно.

Итак, перед нами куча файлов с неизвестными форматами и расширениями, и нам надо понять, что это за файлы.

Первый способ узнать, что за тип файла перед нами — это посмотреть содержимое этих файлов с помощью простых текстовых редакторов, например, Блокнота, а лучше — либо с помощью встроенных программ просмотра различных файловых менеджеров, таких, как Total Commander или Far, либо с помощью бесплатного усовершенствованного текстового редактора Notepad++. Рекомендую вам скачать и установить его, поскольку у него есть множество преимуществ перед обычным блокнотом.

Берём первый файл «Bonnie Tyler — Turn around», в списке программ для открытия выбираем Notepad++ (если не установили его — используйте обычный Блокнот, но лучше всё-таки Notepad++, поскольку при открытии больших файлов Блокнот просто зависает), и видим какие-то кракозябры:

Смущать это не должно, поскольку для определения типа файла достаточно посмотреть первую строчку содержимого файла. Здесь видно, что файл начинается с букв «ID3″.

Итак, запоминаем, что если внутри файла его содержимое начинается на «ID3«, то это музыкальный файл формата mp3, и именно это расширение необходимо ему прописать. После указания расширения файл будет распознан системой как музыкальный, и вы сможете его прослушать.

Открываем второй файл «bonus» той же программой Notepad++ и смотрим его содержимое:

Как видим в первой строчке содержимого файла, в ней неоднократно упоминается, что это видеофайл формата mp4 (выделил красным на скриншоте выше). Да и в целом, если вы видите внутри файла текст вроде «ftypmp42«, то, как правило, это видеофайл формата mp4.

Проделывая ту же самую операцию по просмотру содержимого со всеми остальными файлами, получаем следующую информацию:

  1. При открытии содержимого файла KeePass-2.28 видно, что файл начинается с букв MZ — это признак того, что перед нами исполняемый файл exe.
  2. При открытии содержимого файла math.zip видно, что файл начинается с букв PK — это говорит нам о том, что данный файл представляет собой архив. Учитывая, что архивы Rar имеют другую запись в содержимом файла, скорее всего это архив Zip, но при этом будьте внимательны и обратите внимание на пункт 6 ниже.
  3. При открытии содержимого файла Point Break в первой же строчке видим подсказку, что перед нами видеофайл формата avi.
  1. При открытии содержимого файла Tulips видим два определяющих формат файла слова — в начале строки «яШя» и затем — «Exif». Эти слова определяют графический формат файла, в частности jpg, и в данном случае мы точно уверены, что перед нами файл-картинка.
  1. Касательно файлов MS Office 2003 «Доклад», «Письмо» и «Табличные данные» — все они во внутреннем содержании начинаются с «РП», поэтому определить сразу, какой из них сделан в Word, Excel или PowerPoint, достаточно сложно. Единственное, в чём можно быть точно уверенным — это то, что данные файлы относятся к одному из приложений MS Office версии 2003 и ниже. Поэтому для открытия таких типов файлов можно использовать перебор трёх расширений, начиная с «doc», затем «xls», затем «ppt». Как правило, одно из них подойдёт.
  2. С файлами «Материалы к совещанию», «Приказ», «Таблица соответствия» немного сложнее — поскольку они сделаны в приложениях MS Office 2007, то по сути они представляют собой архивы, и поэтому в начале их содержимого вы увидите те же буквы, что и в архиве Zip — это буквы «PK». Тем не менее, далее в этой же строке можно увидеть строчку [Content_Types].xml, именно она нам подскажет, что перед нами не просто архив, а документ из серии MS Office Так же, как и в предыдущем пункте, можно использовать последовательный перебор трёх расширений «docx», затем «xlsx», затем «pptx». Одно из них должно подойти.
  1. При открытии содержимого файла «Приложение 4″ видим, что он начинается со слова «Rar» — это самое простое указание на то, что перед нами архив формата rar.
  2. При открытии содержимого файла «резолюция» с самого начала видно указание, что это за файл, поскольку он начинается со строчки «%PDF-1.3″. Цифры могут меняться, но тем не менее аббревиатура pdf обычно присутствует, и указывает на формат файла.

Второй способ определения типа файла требует наличия интернет-соединения, а также желательно, чтобы размер файла был небольшим, поскольку мы будем использовать интернет-сервис для определения формата файла.

Переходим по ссылке выше и видим в центре меню, в котором нам предлагается выбрать файл для анализа:

Нажимаем мышкой на кнопку «выберите файл», указываем наш файл для анализа (я попробую проанализировать один из сложных файлов «Материалы к совещанию», чтобы увидеть, сможет ли этот анализатор справиться и понять, что этот файл был создан в MS PowerPoint 2007 (у него было расширение pptx, и мы его удалили при нашем эксперименте). После выбора файла нажимаем кнопку «Analize» и получаем следующий результат:

Как видим, сервис с 97%-ой вероятностью определил, что это файл PowerPoint с расширением pptx. И поскольку этот файл также является архивом-контейнером, содержащим внутри себя другие файлы, анализатор также указал трёхпроцентную вероятность, что это может быть архив zip.

Попробуем также проверить, сможет ли этот сервис определить тип нашего файла «резолюция», у которого мы стёрли расширение pdf. Загружаем файл на сервис, нажимаем кнопку «Analize» и видим, что сервис отлично справился с поставленной задачей:

Как я уже говорил, недостатком данного сервиса может быть то, что для анализа файла ему необходимо его полностью загрузить, и если у вас файл большого размера, то этот процесс может затянуться надолго, а то и вовсе не дойти до конца. Поэтому при больших размерах неопознанных файлов попробуйте сначала воспользоваться первым способом определения его типа, а именно — просмотр содержимого файла через файловый менеджер или редактор Notepad++.

Можно конечно воспользоваться специальными программами для определения типа файла, например, File Type Verificator, но на мой взгляд, гораздо проще и быстрее будет воспользоваться одним из двух предложенных выше способов.

Итак, уважаемые посетители сайта, сегодня мы с вами разобрали, как можно определить формат (тип) файла, если было утеряно его расширение. Если у вас появятся какие-либо вопросы, прошу задавать их в комментариях к этой статье.

HackWare.ru

Этичный хакинг и тестирование на проникновение, информационная безопасность

Как узнать тип файла без расширения (в Windows и Linux)

Если вы попали сюда из поиска и вам нужно просто быстро узнать расширение файла, то к ваших услугам онлайн сервис «Определение типа файла без расширения»: https://suip.biz/ru/?act=file-type. Благодаря ему вам не понадобится устанавливать какие-либо программы, онлайн сервис за секунду определит тип файла, который вы прислали, причём покажет результаты сканирования сразу четырьмя программами, рассмотренными в этой статье. Заодно выведет найденную в файле метаинформацию — часто там есть что-то интересное.

Если вы из тех, кто хочет узнать как работают инструменты указанного сервиса, а также как ими пользоваться на своём компьютере, то продолжайте читать.

Если вам кажется, что проблема с определением типов файлов без расширений надуманная, то это далеко не так! Во-первых, если подумать, это не такая уж простая задача. А с файлом без расширения вы можете столкнуть, например, при декодировании строки из Base64 кодировки.

Во-вторых, у этой статьи будет продолжение, в которой эти же самые инструменты, которые вы изучите на этой странице, будут использоваться для:

1) разбора прошивок (например, роутеров, IP камер) на составные части (первый этап обратной инженерии либо анализа работы устройств для поиска уязвимостей и бэкдоров)

2) поиска файловых систем на дисках и их образах (первый этап криминалистической IT экспертизы)

3) поиска удалённых файлов

Как определить тип данных, если у файла нет расширения

Если у файла нет расширения, то единственным вариантом определения его типа остаётся содержимое этого файла. Можно попробовать добавлять различные расширения к имени файла и пытаться открыть соответствующими для этого расширения программами — этот вариант медленные и неэффективный.

Определённые типы бинарных файлов могут иметь одинаковый набор байтов — по этим байтам можно сопоставить тип файлов. И именно данный метод и применяется программами, предназначенными для определения типа данных. Специфичные байты как правило располагаются не в самом начале файла, поэтому кроме самих байтов, нужно знать смещение от начала, где эти байты должны находиться. Некоторые программы в дополнении к байтам для идентификации ещё имеют список для проверки на ложное срабатывание.

Такие паттерны на английском часто называют magic — это пошло от «magic number» в исполнимых файлах. Эти файлы имеют «магическое число», хранящееся в определённом месте рядом с началом файла, которое сообщает операционной системе UNIX, что файл является двоичным исполняемым файлом и каким именно из нескольких типов. Концепция «магического числа» была применена к другим бинарным файлам. То есть файлы одинакового типа имеют одинаковую последовательность байтов в определённом месте от начала файлов.

Файл с сигнатурами, описывающими какие именно байты, на каком расстоянии от начала файла характерны для файлов того или иного типа, обычно называют magic file.

Чтобы понять количество проделанного труда при поиске уникальных байтов, обязательно присутствующих в тех или иных файлах, посмотрите на магический файл для определения файловых систем https://github.com/file/file/blob/master/magic/Magdir/filesystems

Это только один файл из перечня различных типов файлов: https://github.com/file/file/tree/master/magic/Magdir

Кроме магических чисел могут применяться и другие техники, например, программа file для проведения тестов файловых систем также может использовать системный вызов stat. Тип текстовых файлов определяется по содержащимся в них строкам (например, это может быть PHP код, файл в XML или HTML разметке, JSON и так далее).

Команда file — мгновенное определение типа любого файла

В Linux есть команда file с огромной базой сигнатур, которая очень быстро определяет тип файла:

Чтобы узнать, что за файл без расширения, выполните команду вида:

То есть это текстовый файл офисного пакета Microsoft Office.

Можно указать сразу несколько файлов для проверки или использовать подстановочные символы. Например, следующая команда проверит типы всех файлов в текущей папке:

У программы file имеются опции, подробности о них смотрите в отдельной статье «Инструкция по использованию команды file».

Аналог команды file для Windows

file — это утилита командной строки для Linux, поэтому пользователям Windows нужна какая-то альтернатива. Рассмотрим несколько способов использования file в Windows.

1. Утилита file в Cygwin

Данный способ, на мой взгляд, самый простой. Достаточно скачать Cygwin и вы можете пользоваться большинством утилит Linux. Подробности, в том числе как указывать пути в файловой системе, смотрите в ветке «Как начать знакомство с командами Linux: Cygwin».

2. file в WSL

Подсистема Windows для Linux (WSL) это ещё один способ использовать утилиты Linux в Windows. Подробности о работе с WSL смотрите в справочном материале «WSL (подсистема Windows для Linux): подсказки, инструкции, решения проблем».

3. Скомпилированный file для Windows

На странице https://github.com/julian-r/file-windows/releases вы можете скачать скомпилированные файлы утилиты file (ещё один источник https://github.com/nscaife/file-windows/releases, но там более старая версия).

Файлы различаются архитектурой (64- и 32-битные), а также компилятором.

Скачайте файл, например, file_5.38-build49-vs2019-x64.zip.

Распакуйте скаченный архив. Например, я поместил скаченные файлы в папку C:\Users\MiAl\Downloads\file\.

Откройте командную строку, для этого нажмите Win+x, выберите «Windows PowerShell».

Перейдите в папку с программой:

Для определения расширения файла используйте команду вида:

Вы можете проверить сразу много файлов, для этого перейдите в папку с утилитой file и выполните команду вида:

Например, я хочу проверить все файлы в папке Z:\testfiles\, тогда команда следующая:

4. TrID — кроссплатформенная альтернатива file для Windows и Linux

В утилите TrID довольно много сигнатур и база данных постоянно пополняется новыми образцами. Программа является кроссплатформенной, подробную инструкцию по установке и использованию в Windows и Linux вы найдёте на этой странице: https://kali.tools/?p=2887

Пример анализа файла — обратите внимание, что выведено несколько вариантов с указанием процентной вероятности каждого из них:

Если указать несколько файлов для идентификации, то будет выведен только самый вероятный вариант типа файла:

Установка TrID в Windows

Перейдите на официальный сайт, скачайте архив с исполнимым файлом (mark0.net/download/trid_w32.zip) для Windows, а также архив с базой данных сигнатур (mark0.net/download/triddefs.zip).

Распакуйте оба файла в одну папку.

Распакуйте скаченный архив. Например, я поместил скаченные файлы в папку C:\Users\MiAl\Downloads\trid\.

Откройте командную строку, для этого нажмите Win+x, выберите «Windows PowerShell».

Перейдите в папку с программой:

Для определения расширения файла используйте команду вида:

Подстановочные знаки могут использоваться для сканирования групп файлов, целых папок и так далее.

Кроме того, использование ключа -ae даст команду TrID добавить предполагаемые расширения к именам файлов. Это удобно, например, при работе с файлами, восстановленными программами для восстановления данных. Например:

На этом этапе файлы в папке c:\temp будут выглядеть так:

  • FILE0001.CHK.bav
  • FILE0002.CHK.ogg
  • FILE0003.CHK.doc
  • FILE0004.CHK.exe

Вместо предыдущей опции можно использовать -ce, которая изменит расширение файла на новое; если у файла нет расширения, будет добавлено новыъое. Например:

  • IAmASoundFile.dat -> IAmASoundFile.wav
  • IAmABitmap -> IAmABitmap.bmp

TrID может получить список файлов со стандартного ввода с помощью переключателя -@.

Таким образом, можно работать со всем деревом папок или определенным подмножеством файлов, просто используя вывод какой-либо другой команды через конвейер. Что-то вроде:

Можно указать TrID показывать дополнительную информацию о каждом совпадении (например, тип mime, кто создал эту сигнатуру, сколько файлов было просканировано и так далее); а также можно ограничить количество отображаемых результатов.

Ключ -v активирует подробный режим, а -r:nn указывает максимальное количество совпадений, которое будет отображать TrID. По умолчанию 5 для обычного режима, 2 для подробного, 1 для многофайлового анализа.

Программа TrID обновляется нечасто, но база данных регулярно получает новые сигнатуры, поэтому время от времени обновляйте базу данных.

5. fil — ещё одна кроссплатформенная альтернатива file

Программа fil написана на Go и является кроссплатформенной. Но в программе настолько мало сигнатур, что, на мой взгляд, утилита fil практически бесполезна.

Альтернативы file

Для большинства нужд по определению типа файла без расширения достаточно утилиты file, но есть утилиты со смежным функционалам, которые могут заменить или уточнить информацию от file. Более подробно каждая из этих программ будет рассмотрена в следующей части, сейчас только краткий обзор.

Detect It Easy

Detect It Easy — это кроссплатформенная программа для определения типов файлов. Имеется вариант с графическим интерфейсом, а также интерфейсом командной строки.

Инструкцию по установке программы вы найдёте на её странице https://kali.tools/?p=6788.

Анализ файла /mnt/disk_d/Share/testfiles/file1 с показом результатов в графическом интерфейсе:

Анализ файла без расширения, расположенного по пути /mnt/disk_d/Share/testfiles/file1 для определения типа файла:

Detect It Easy в первую очередь нацелена на анализ исполнимых файлов, поэтому её функции в большей степени относятся к файлам программ, например, определение архитектуры. Но также имеется поддержка других бинарных файлов.

Binwalk

Binwalk это программа для анализа прошивок, но в ней собрано много сигнатур бинарных файлов, поэтому она подходит для определения типа файла. Особенность Binwalk в том, что она нацелена на работу с составными файлами (которыми обычно и являются прошивки), поэтому она может определять тип файла даже если файл находится не в начале.

Использование такое же, как и file, достаточно указать путь до одного или нескольких файлов:

Detect It Easy и Binwalk не столько конкуренты утилиты file, сколько «последний шанс» определить тип данных, если команда file не помогла.

Что такое HEX и ASCII-дескрипторы или как определить формат файла без расширения

К ак известно любая информация будь то текст, изображение или видео, по сути, является ничем иным как набором двоичного кода — последовательности нулей и единиц. Именно в таком виде на жёстком диске хранятся данные. Понятие двоичный код едва ли не абстрактное, это не запись в привычном понимании этого слова, двоичный или машинный код это скорее состояние микроскопических ячеек на магнитной поверхности жесткого диска. Положительный заряд такой ячейки имеет знак плюс или 1, отрицательный — минус или 0.

Логически объединенные последовательности нулей и единиц как раз и составляют то, что мы называем файлами. Но ведь мы знаем и то, что типов файлов очень много. Есть текстовые файлы, мультимедийные, архивные, системные, исполняемые и так далее. Каким же образом операционная система определяет как читать или обрабатывать тот или иной файл? Прикладные программы распознают тип файла по его расширению — набору символов следующих после имени файла и отделенных от него точкой.

Но что будет, если расширение удалить? Всё правильно, операционная система не сможет открыть такой файл, так как не будет знать какую программу для этого использовать. Однако ни логическая структура, ни содержимое переименованного файла от этого не изменится. Вы и сами в этом можете убедиться удалив расширение какого-нибудь файла, а затем попробовав его открыть соответствующей программой. Уверены, с этим у вас проблем не возникнет.

Следовательно, вовсе не расширение определяет тип файла. Тогда что же? Тип файла определяет его формат или иначе спецификация структуры данных. Расширение и формат очень часто путают, хотя на деле это совершенно разные понятия. Тут возникает вполне закономерный вопрос, а как определить формат файла, если его расширение по какой-то причине оказалось утрачено? Оказывается очень просто.

Грубо говоря, все файлы состоят из двух частей. Первая часть это заголовок, содержащий различную метаинформацию включая те данные, которые позволяют прикладным программам этот самый файл идентифицировать. Вторая часть это «тело» файла. Отвечающая за определение типа файла часть заголовка файла именуется дескриптором или описанием. Наиболее распространёнными типами дескрипторов являются HEX и ASCII. Первый тип заголовков можно просмотреть только с помощью специальных утилит — шестнадцатеричных редакторов.

Для просмотра дескрипторов второго типа можно обойтись обычным текстовым редактором, тем же Блокнотом или Notepad++. Однако следует учитывать, что далеко не все последовательности байтов можно перевести в ASCII-код, поэтому для определения формата всё-таки лучше использовать HEX-редакторы. Открытый в HEX-редакторе файл отображается в виде матрицы из последовательности байтов. Каждая ячейка соответствует одному байту. Данные дескриптора содержатся как раз в первых трёх ячейках (реже двух или четырех), расположенных по горизонтали. Представляют они из себя шесть символов в шестнадцатеричном счислении, например 49 44 33 или ff d8 e0.

Открытый в HEX-редакторе файл

Естественно они нуждаются в расшифровке. А расшифровать их можно на специальных сайтах с описаниями форматов. Одним из лучших сайтов, где можно определить формат по HEX-дескриптору является open-file.ru. Есть и другие подобные ресурсы, но они не настолько удобны. На open-file.ru же имеется специальная поисковая форма, куда можно вставить HEX или ASCII дескриптор и пробить его по базе данных. Система быстро найдёт соответствующий формат и предоставит вам его полное описание.

Open-file.ru поиск по HEX

С HEX-редакторами всё более или менее понятно, но как мы сказали для определения ASCII-заголовков также можно использовать редакторы текстовые. Принцип здесь тот же самый, открываем файл Блокнотом или Notepad++, копируем первые символы и вставляем их в поисковое поле того же open-file или другого сайта с поддержкой поиска по заголовкам.

Казалось бы всё очень просто, но есть в деле идентификации форматов и свои сложности. Иногда ASCII-заголовки совпадают с расширением файла (RAR и PDF), но может быть и такое, что заголовок оказывается принадлежащим сразу нескольким форматам. Это можно видеть на примере офисного формата DOCX (PK и 50 4b 03 04). В таких случаях точно определить формат проблематично.

ASCII

Но круг поиска можно сузить. Для этого рекомендуется просматривать первую, вторую и третью строку заголовка в текстовом редакторе, так как содержащиеся в них элементы также могут косвенно указывать на принадлежность к тому или иному типу файлов.

Файл является размеченным текстовым документом

Так, строка [Content_Types].xml в DOCX явно указывает на то, что исследуемый файл является размеченным текстовым документом.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *