Что делать если в файле непонятные символы
Перейти к содержимому

Что делать если в файле непонятные символы

  • автор:

Sublime Text — смена кодировки открытого файла

Иногда при открытии файла в редакторе Sublime Text вместо читаемых символов можно увидеть абракадабру.

Это связано с тем, что открытый файл был создан в другом редакторе и сохранен в кодировке, отличной от той, которая по умолчанию установлена в настройках Sublime Text. Например, откроем файл , как показано на рисунке.

Это шаблон, с помощью которого создаются html-странички для одного сайта. Файл был создан (или отредактирован) в Adobe Dreamweaver и сохранен в кодировке . Об этом также говорит и строка в заголовке документа — charset=”KOI8-R”.

Если этот файл открыть в Sublime Text, то увидим следующую картину:

Открытый файл с неверной кодировкой в Sublime Text 2

Что нужно сделать в редакторе Sublime Text, чтобы этот документ открылся правильно и был удобочитаем? Все просто!

Для этого переходим в меню “File — Reopen with Encoding”. Стрелка справа от этой записи говорит, что за ней “скрывается” подменю.

Наводим мышью на эту надпись и видим открывшееся подменю с длинным списком доступных кодировок. Так как я заранее знаю, что файл был создан в кодировке , то выбираю ее из списка:

Выбор кодировки для открытого файла в Sublime Text 2

Редактор заново откроет этот файл, но уже в указанной мною кодировке. Результат именно тот, который мне и хотелось получить. Теперь можно работать с этим шаблоном:

Открытый файл в правильной кодировке в Sublime Text 2

На этом краткую статью о смене кодировки открытого файла в Sublime Text можно считать завершенной.

Macos + Webstorm — горячие клавиши

## Сочетания клавиш для быстрой работы в MacosНиже представлен неполный список сочетания клавиш в Macos, позволяющие быстро вести разрабо. … Continue reading

Неверная кодировка при чтении файла

Что делать, если при чтении файла (текста в формате .txt) и выводе с помощью функции print(), кириллица превращается в непонятные символы?

Пример

Если в "Блокноте" кодировка показывается правильная, значит у файла родная кодировка Windows — cp1251 , эту кодировку и нужно указать при открытии файла:

Когда открываете файл — делайте это с правильной кодировкой. Если у вас входной файл в кодировке utf8 , то вот так:

Что делать, если вместо текста иероглифы (в Word, браузере или текстовом документе)

Наверное, каждый пользователь ПК сталкивался с подобной проблемой: открываешь интернет-страничку или документ Microsoft Word — а вместо текста видишь иероглифы (различные «крякозабры», незнакомые буквы, цифры и т.д. (как на картинке слева…)).

Хорошо, если вам этот документ (с иероглифами) не особо важен, а если нужно обязательно его прочитать?! Довольно часто подобные вопросы и просьбы помочь с открытием подобных текстов задают и мне. В этой небольшой статье я хочу рассмотреть самые популярные причины появления иероглифов (разумеется, и устранить их).

Иероглифы в текстовых файлах (.txt)

Самая популярная проблема. Дело в том, что текстовый файл (обычно в формате txt, но так же ими являются форматы: php, css, info и т.д.) может быть сохранен в различных кодировках .

Кодировка — это набор символов, необходимый для того, чтобы полностью обеспечить написание текста на определенном алфавите (в том числе цифры и специальные знаки). Более подробно об этом здесь: https://ru.wikipedia.org/wiki/Набор_символов

Чаще всего происходит одна вещь: документ открывается просто не в той кодировке из-за чего происходит путаница, и вместо кода одних символов, будут вызваны другие. На экране появляются различные непонятные символы (см. рис. 1)…

Что делать, если вместо текста иероглифы

Рис. 1. Блокнот — проблема с кодировкой

Как с этим бороться?

На мой взгляд лучший вариант — это установить продвинутый блокнот, например Notepad++ или Bred 3. Рассмотрим более подробно каждую из них.

Notepad++

Один из лучших блокнотов как для начинающих пользователей, так и для профессионалов. Плюсы: бесплатная программа, поддерживает русский язык, работает очень быстро, подсветка кода, открытие всех распространенных форматов файлов, огромное количество опций позволяют подстроить ее под себя.

В плане кодировок здесь вообще полный порядок: есть отдельный раздел «Кодировки» (см. рис. 2). Просто попробуйте сменить ANSI на UTF-8 (например).

Рис. 2. Смена кодировки в Notepad++

Рис. 2. Смена кодировки в Notepad++

После смены кодировки мой текстовый документ стал нормальным и читаемым — иероглифы пропали (см. рис. 3)!

Рис. 3. Текст стал читаемый. Notepad++

Рис. 3. Текст стал читаемый… Notepad++

Bred 3

Еще одна замечательная программа, призванная полностью заменить стандартный блокнот в Windows. Она так же «легко» работает со множеством кодировок, легко их меняет, поддерживает огромное число форматов файлов, поддерживает новые ОС Windows (8, 10).

Кстати, Bred 3 очень помогает при работе со «старыми» файлами, сохраненных в MS DOS форматах. Когда другие программы показывают только иероглифы — Bred 3 легко их открывает и позволяет спокойно работать с ними (см. рис. 4).

Рис. 4. BRED3.0.3U

Если вместо текста иероглифы в Microsoft Word

Самое первое, на что нужно обратить внимание — это на формат файла. Дело в том, что начиная с Word 2007 появился новый формат — « docx » (раньше был просто « doc «). Обычно, в «старом» Word нельзя открыть новые форматы файлов, но случается иногда так, что эти «новые» файлы открываются в старой программе.

Просто откройте свойства файла, а затем посмотрите вкладку « Подробно » (как на рис. 5). Так вы узнаете формат файла (на рис. 5 — формат файла «txt»).

Если формат файла docx — а у вас старый Word (ниже 2007 версии) — то просто обновите Word до 2007 или выше (2010, 2013, 2016).

Рис. 5. Свойства файла

Рис. 5. Свойства файла

Далее при открытии файла обратите внимание (по умолчанию данная опция всегда включена, если у вас, конечно, не «не пойми какая сборка») — Word вас переспросит: в какой кодировке открыть файл (это сообщение появляется при любом «намеке» на проблемы при открытии файла, см. рис. 5).

Рис. 5. Word - преобразование файла

Рис. 6. Word — преобразование файла

Чаще всего Word определяет сам автоматически нужную кодировку, но не всегда текст получается читаемым. Вам нужно установить ползунок на нужную кодировку, когда текст станет читаемым. Иногда, приходится буквально угадывать, в как был сохранен файл, чтобы его прочитать.

Рис. 7. Word - файл в норме!

Рис. 7. Word — файл в норме (кодировка выбрана верно)!

Смена кодировки в браузере

Когда браузер ошибочно определяет кодировку интернет-странички — вы увидите точно такие же иероглифы (см. рис 8).

Рис. 8. браузер определил неверно кодировку

Рис. 8. браузер определил неверно кодировку

Чтобы исправить отображение сайта: измените кодировку. Делается это в настройках браузера:

  1. Google chrome: параметры (значок в правом верхнем углу)/дополнительные параметры/кодировка/Windows-1251 (или UTF-8);
  2. Firefox: левая кнопка ALT (если у вас выключена верхняя панелька), затем вид/кодировка страницы/выбрать нужную (чаще всего Windows-1251 или UTF-8) ;
  3. Opera: Opera (красный значок в верхнем левом углу)/страница/кодировка/выбрать нужное.

PS

Таким образом в этой статье были разобраны самые частые случаи появления иероглифов, связанных с неправильно определенной кодировкой. При помощи выше приведенных способов — можно решить все основные проблемы с неверной кодировкой.

Вместо текста иероглифы, квадратики и крякозабры (в браузере, Word, тексте, окне Windows)

Вопрос пользователя

Здравствуйте.

Подскажите пожалуйста, почему у меня некоторые странички в браузере отображают вместо текста иероглифы, квадратики и не пойми что (ничего нельзя прочесть). Раньше такого не было.

Заранее спасибо.

Доброго времени суток!

Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные «крякозабры» (как я их называю), и прочитать это нереально.

Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из Википедии ), а браузер пытается открыть его в другой. Из-за такого рассогласования, вместо текста — непонятный набор символов.

Попробуем исправить это.

Исправляем иероглифы на текст

Браузер

Вообще, раньше Internet Explorer часто выдавал подобные крякозабры, 👉 современные же браузеры (Chrome, Яндекс-браузер, Opera, Firefox) — довольно неплохо определяют кодировку, и ошибаются очень редко. 👌

Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для «ручной» настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек.

Итак, предположим браузер неправильно определили кодировку и вы увидели следующее (как на скрине ниже 👇).

Вместо текста одни лишь крякозабры

Вместо текста одни лишь крякозабры // Браузер выставил кодировку неверно!

📌 Кстати!

Чаще всего путаница бывает между кодировками UTF (Юникод) и Windows-1251 (большинство русскоязычных сайтов выполнены в этих кодировках).

Поэтому, я рекомендую в ручном режиме попробовать их обе. Для этого нам понадобиться браузер MX5 (ссылка на офиц. сайт). Он один из немногих позволяет в ручном режиме выбирать кодировку (при необходимости):

  1. необходимо открыть нужный сайт;
  2. далее зайти в меню «Инструменты / кодировка» ;
  3. выбрать вручную UTF 8 или «Авто-определение» ;
  4. перезагрузить страницу. И, ву-а-ля, — иероглифы на страничке сразу же стали обычным текстом (скрин ниже 👇) !

📌 В помощь!

Если у вас иероглифы в браузере Chrome — ознакомьтесь с этим

Браузер MX5 — выбор кодировки UTF8 или авто-определение

Браузер MX5 — выбор кодировки UTF8 или авто-определение

Теперь отображается русский текст норм.

Теперь отображается русский текст норм.

📌 Еще один совет : если вы в своем браузере не можете найти, как сменить кодировку (а дать инструкцию для каждого браузера — вообще нереально!), я рекомендую попробовать открыть страничку в другом браузере (например, в MX5). Очень часто другая программа открывает страницу так, как нужно!

Текстовые документы

Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например, при чтении Readme в какой-нибудь программе прошлого века (скажем, к играм) .

Разумеется, что многие современные блокноты просто не могут прочитать DOS‘овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.

Bred 3

Сайт: http://www.astonshell.ru/freeware/bred3/

Простой и удобный текстовый блокнот. Незаменимая вещь, когда нужно работать со старыми текстовыми файлами.

Bred 3 за один клик мышкой позволяет менять кодировку и делать не читаемый текст читаемым! Поддерживает кроме текстовых файлов довольно большое разнообразие документов. В общем, рекомендую! ✌

Попробуйте открыть в Bred 3 свой тексто вый документ (с которым наблюдаются проблемы) . Пример показан у меня на скрине ниже. 👇

Иероглифы при открытии текстового документа

Далее в Bred 3 есть кнопка для смены кодировки: просто попробуйте поменять ANSI на OEM — и старый текстовый файл станет читаемым за 1 сек.!

Исправление иероглифов на текст

👉 Для работы с текстовыми файлами различных кодировок также подойдет еще один блокнот — Notepad++. Вообще, конечно, он больше подходит для программирования, т.к. поддерживает различные подсветки, для более удобного чтения кода.

Notepad++

Сайт: https://notepad-plus-plus.org/

Надежный, удобный, поддерживающий громадное число форматов файлов блокнот. Позволяет легко и быстро переключать различные кодировки.

Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.

Смена кодировки в блокноте Notepad++

Штирлиц

Сайт разработчика: http://www.shtirlitz.ru/

Эта программа специализируется на «расшифровке» текстов, написанных в разных кодировках: Win-1251, KOI-8r, DOS, ISO-8859-5, MAC и др.

Причем, программа нормально работает даже с текстами со смешанной кодировкой (что не могут др. аналоги). Пример см. на скрине ниже. 👇

Пример работы ПО

Пример работы ПО «Штирлиц»

BAT-файлы (скрипты)

Для начала простой пример о чем идет речь. 👇

На скрине видно, что вместо русского текста отображаются различные квадратики, буквы «г» перевернутые, и пр. иероглифы.

Как выглядит русский текст при выполнении BAT-файла

Как выглядит русский текст при выполнении BAT-файла

📌 Чтобы это исправить — можно прибегнуть к следующему:

  1. в начало BAT-файла добавить код @chcp 1251 ;
  2. установить программу Notepad++ и в меню выбрать OEM-866: «Кодировки/Кодировки/Кириллица/OEM-866» ;
  3. установить программу Akelpad, в разделе «Кодировки» выбрать «Сохранить в DOS-866» .

Документы MS WORD

Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx . Дело в том, что с 2007 года в Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).

Так вот, если у вас старый Word, который не поддерживает этот формат — то вы, при открытии документа в Docx, увидите иероглифы и ничего более.

  1. скачать на сайте Microsoft спец. дополнение, которое позволяет открывать в старом Word новые документы (с 2020г. дополнение с офиц. сайта удалено) . Только из личного опыта могу сказать, что открываются далеко не все документы, к тому же сильно страдает разметка документа (что в некоторых случаях очень критично) ;
  2. использовать 👉 аналоги Word (правда, тоже разметка в документе будет страдать);
  3. обновить Word до современной версии (2019+);
  4. если речь идет о документы TXT — открыть его в Notepad++.

Так же при открытии любого документа в Word (в кодировке которого он «сомневается»), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:

  1. Widows (по умолчанию);
  2. MS DOS;
  3. Другая.

Переключение кодировки в Word при открытии документа

Окна в различных приложениях Windows

Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать — нереально).

📌 Могу дать несколько рекомендаций:

  1. Русификатор. Довольно часто официальной поддержки русского языка в программе нет, но многие умельцы делают русификаторы. Скорее всего, на вашей системе — данный русификатор работать отказался. Поэтому, совет простой: попробовать поставить другой;
  2. Переключение языка. Многие программы можно использовать и без русского, переключив в настройках язык на английский. Ну в самом деле: зачем вам в какой-то утилите, вместо кнопки «Start» перевод «начать» ?
  3. Если у вас раньше текст отображался нормально, а сейчас нет — попробуйте 👉 восстановить Windows, если, конечно, у вас есть точки восстановления;
  4. Проверить настройки языков и региональных стандартов в Windows, часто причина кроется именно в них (👇).

Языки и региональные стандарты в Windows

Чтобы открыть меню настроек:

  • нажмите Win+R ;
  • введите intl.cpl , нажмите Enter.

intl.cpl — язык и регион. стандарты

Проверьте чтобы во вкладке «Форматы» стояло «Русский (Россия) / Использовать язык интерфейса Windows (рекомендуется)» (пример на скрине ниже 👇).

Формат — русский / Россия

Во вкладке «Местоположение» — укажите «Россия» .

И во вкладке «Дополнительно» установите язык системы «Русский (Россия)» .

После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.

Текущий язык программ

PS

И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF.

Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2016+ и Adobe Reader для примера выше).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *