Скопировать текст страницы сайта

Наш онлайн сервис поможет, если нужно получить контент страниц разных сайтов и проверить на соответствие параметрам. Вы можете мгновенно скопировать текст со страницы и использовать в своих целях.
Нередко людям нужно получить данные по ссылке в интернете. Но обычно для этого приходится выделять все руками, а это процесс небыстрый. С помощью нашего онлайн сервиса вы можете ввести адрес сайта и скопировать весь текст со страницы в браузере. Мы ценим ваше время и не внедряем бесполезные таймеры для замедления процесса.
11 фишек для извлечения и сохранения данных с сайтов
В закладки

БЕЗ скриптов, макросов, регулярных выражений и командной строки.
Эта статья пригодится студентам, которые хотят скачать все картинки с сайта разом, чтобы потом одним движением вставить их в Power Point и сразу получить готовую презентацию. Владельцам электронных библиотек, которые собирают новые книги по ресурсам конкурентов. Просто людям, которые хотят сохранить интересный сайт/страницу в соцсети, опасаясь, что те могут скоро исчезнуть, а также менеджерам, собирающим базы контактов для рассылок.
Есть три основные цели извлечения/сохранения данных с сайта на свой компьютер:
- Чтобы не пропали;
- Чтобы использовать чужие картинки, видео, музыку, книги в своих проектах (от школьной презентации до полноценного веб-сайта);
- Чтобы искать на сайте информацию средствами Spotlight, когда Google не справляется (к примеру поиск изображений по exif-данным или музыки по исполнителю).
Ситуации, когда неожиданно понадобится автоматизированно сохранить какую-ту информацию с сайта, могут случиться с каждым и надо быть к ним готовым. Если вы умеете писать скрипты для работы с утилитами wget/curl, то можете смело закрывать эту статью. А если нет, то сейчас вы узнаете о самых простых приемах сохранения/извлечения данных с сайтов.
1. Скачиваем сайт целиком для просмотра оффлайн

В OS X это можно сделать с помощью приложения HTTrack Website Copier, которая настраивается схожим образом.
Пользоваться Site Sucker очень просто. Открываем программу, выбираем пункт меню File -> New, указываем URL сайта, нажимаем кнопку Download и дожидаемся окончания скачивания.
Чтобы посмотреть сайт надо нажать на кнопку Folder, найти в ней файл index.html (главную страницу) и открыть его в браузере. SiteSucker скачивает только те данные, которые доступны по протоколу HTTP. Если вас интересуют исходники сайта (к примеру, PHP-скрипты), то для этого вам нужно в открытую попросить у его разработчика FTP-доступ.
2. Прикидываем сколько на сайте страниц

Перед тем как браться за скачивание сайта, необходимо приблизительно оценить его размер (не затянется ли процесс на долгие часы). Это можно сделать с помощью Google. Открываем поисковик и набираем команду site: адрес искомого сайта. После этого нам будет известно количество проиндексированных страниц. Эта цифра не соответствуют точному количеству страниц сайта, но она указывает на его порядок (сотни? тысячи? сотни тысяч?).
3. Устанавливаем ограничения на скачивание страниц сайта
![]()
Если вы обнаружили, что на сайте тысячи страниц, то можно ограничить число уровней глубины скачивания. К примеру, скачивать только те страницы, на которые есть ссылка с главной (уровень 2). Также можно ограничить размер загружаемых файлов, на случай, если владелец хранит на своем ресурсе tiff-файлы по 200 Мб и дистрибутивы Linux (и такое случается).
Сделать это можно в Settings -> Limits.
4. Скачиваем с сайта файлы определенного типа

В Settings -> File Types -> Filters можно указать какие типы файлов разрешено скачивать, либо какие типы файлов запрещено скачивать (Allow Specified Filetypes/Disallow Specifies Filetypes). Таким образом можно извлечь все картинки с сайта (либо наоборот игнорировать их, чтобы места на диске не занимали), а также видео, аудио, архивы и десятки других типов файлов (они доступны в блоке Custom Types) от документов MS Word до скриптов на Perl.
5. Скачиваем только определенные папки

Если на сайте есть книги, чертежи, карты и прочие уникальные и полезные материалы, то они, как правило, лежат в отдельном каталоге (его можно отследить через адресную строку браузера) и можно настроить SiteSucker так, чтобы скачивать только его. Это делается в Settings -> Paths -> Paths to Include. А если вы хотите наоборот, запретить скачивание каких-то папок, то их адреса надо указать в блоке Paths to Exclude
6. Решаем вопрос с кодировкой

Если вы обнаружили, что скачанные страницы вместо текста содержат кракозябры, там можно попробовать решить эту проблему, поменяв кодировку в Settings -> Advanced -> General. Если неполадки возникли с русским сайтом, то скорее всего нужно указать кодировку Cyrillic Windows. Если это не сработает, то попробуйте найти искомую кодировку с помощью декодера Лебедева (в него надо вставлять текст с отображающихся криво веб-страниц).
7. Делаем снимок веб-страницы

Сделать снимок экрана умеет каждый. А знаете ли как сделать снимок веб-страницы целиком? Один из способов — зайти на web-capture.net и ввести там ссылку на нужный сайт. Не торопитесь, для сложных страниц время создания снимка может занимать несколько десятков секунд. Еще это можно провернуть в Google Chrome, а также в других браузерах с помощью дополнения iMacros.
Это может пригодиться для сравнения разных версий дизайна сайта, запечатления на память длинных эпичных перепалок в комментариях или в качестве альтернативы способу сохранения сайтов, описанного в предыдущих шести пунктах.
8. Сохраняем картинки только с определенной страницы

Идем на owdig.com, указываем нужную ссылку, ждем когда отобразятся все картинки и кликаем на оранжевую полоску справа, чтобы скачать их в архиве.
9. Извлекаем HEX-коды цветов с веб-сайта

Идем на colorcombos.com и набираем адрес искомой страницы и получаем полный список цветов, которые использованы на ней.
10. Извлекаем из текста адреса электронной почты

Предположим, что вам надо сделать рассылку по сотрудникам компании, а их email-адреса есть только на странице корпоративного сайта и копировать их оттуда в ручную займет лишние 20-30 минут. В такой ситуации на помощь приходит сервис emailx.discoveryvip.com. Просто вставьте туда текст и через секунду вы получите список всех адресов электронной почты, которые в нем найдены.
11. Извлекаем из текста номера телефонов

Идем на convertcsv.com/phone-extractor.htm, копируем в форму текст/html-код, содержащий номера телефонов и нажимаем на кнопку Extract.
А если надо отфильтровать в тексте заголовки, даты и прочую информацию, то к вам на помощь придут регулярные выражения и Sublime Text.
Есть и другие способы извлечения данных с сайтов. Можно попросить какую-ту информацию непосредственно у владельца ресурса, cохранять части веб-страниц с помощью iMacros и парсить сайты с помощью Google Apps Script. Еще можно пойти традиционным путем и написать для парсинга bash-скрипт, но статей об этом на iPhones.ru пока нет.
В закладки
Как копировать текст с сайта, откуда нельзя копировать — 6 способов
Также расскажем, как быстро очистить текст от HTML-тегов.
Скопировать текст с сайта может понадобиться разработчикам, чтобы быстро вставить код в программу, студентам — сэкономить время на наборе текстов, копирайтерам — получить исходники для написания статей, вставить цитату или тезис в статью, либо в пост. А также для бытовых нужд — сохранить рецепт блюда, поделиться полезной заметкой. Расскажем, что делать, когда сайт запрещает копировать и клавиши Ctrl+C и Ctrl+V не работают.
Если нельзя копировать с сайта
Методов защиты от копирования данных несколько:
- нельзя выделить и вставить текст,
- блокировка правой кнопки мыши,
- текст можно выделить и скопировать, но нельзя вставить.
И вот методы обхода защиты, которые сработали у нас.
1. Отключить JavaScript
Заходим на сайт, с которого хотим скопировать текст.
- кликаем в адресной строке по замочку или треугольнику левой кнопкой мыши,
- попадем в меню настроек и щелкаем на раздел «Конфиденциальность и Безопасность»,
- выбираем опцию «Настройки сайтов»,
- активируем функцию «Запретить сайтам использовать JavaScript»,
- теперь вернитесь на нужный сайт и обновите страницу – настройки вступят в силу и у вас должно все получиться.

2. Отправить на печать
Чтобы воспользоваться версией для печати, не нужен принтер, и распечатывать документ тоже не понадобится.
- на нужной странице сайте жмите клавиши Ctrl+P или кликните правой кнопкой мыши по тексту и в появившемся окне выберете пункт «Печать»,
- в всплывающем окошке появится готовый текст, который остается только скопировать и вставить в Word, Блокнот или мессенджер,
- далее можно работать с текстом, выбрав из него нужные куски и так далее.

3. Открыть сайт через Word
Способ может занять чуть больше времени, так как скорость загрузки зависит от технических возможностей вашего ПК и «веса» страницы сайта. У нас это получилось за 5 секунд. Для этого зайдите на страницу, которую вам хочется или нужно скопировать.
- откройте документ Word, нажмите «Файл — Открыть — Обзор»,
- вставьте ссылку сайта в графе «Имя файла» в Word,
- нажмите «Открыть» и ждете,
- в результате текст оказывается в Word, и теперь его можно копировать и вставлять куда угодно.

4. Специальное расширение
Устанавливаем через браузер расширение, которое разблокируют скрипты, запрещающие копировать. Например, Absolute Enable Right Click & Copy. Доступно для Chrome, Mozilla, Opera. Добавим в Chrome:
- нужно нажать на три точки в верхнем правом углу браузера,
- выбрать вкладку «Дополнительные инструменты», далее — «Расширения»,
- в выпадающем меню внизу перейдите в раздел «Открыть интернет-магазин»,
- в поисковой строке вбить название расширения и установитьего.
После установки можно будет скопировать нужную страницу.

5. Режим чтения
Способ подойдет не для каждого браузера. К примеру, в Яндекс.Браузере значок режима чтения находится в конце адресной строки, а в Google Chrome его… нет. Для активации режима в Яндекс.Браузере нужно:
- вставить ссылку на нужную страницу сайта, текст с которой необходимо скопировать, в браузер Яндекса,
- щелкнуть на значок с буквой «А».
Полученный текст можно скопировать и вставить в документ Word.

6. Просмотр кода страницы
Данный способ может помочь, если вышеперечисленные оказались бессильными. Однако результат нужно будет очистить от лишнего мусора, что мы и сделаем.
- клавишей Ctrl+U переходим в режим разработчика,
- чтобы не запутаться в кодах и быстро найти нужный фрагмент (подсветится маркером), жмем в поисковой строке Ctrl+F, туда ручками вводим начала текста (буквально, пару слов),
- копируем найденный текст и прогоняем его через программы для очистки от лишних тегов (это, например, <p>, <strong> и так далее – о программах ниже будет отдельный раздел).

Валерий Кабисов, senior backend developer, FBS:
«На некоторых сайтах с помощью JS-скриптов заблокирована возможность скопировать текст, а также клик правой кнопкой мыши не работает. Если текст — не изображение, то его все равно можно скопировать. Для этого нужно выполнить несколько простых шагов: Нажать клавишу F12, для вызова меню разработчика. В меню выбрать пиктограмму стрелки [1]. На сайте кликнуть по тексту, который необходимо скопировать. В меню разработчика в области [2] выбрать блок, который содержит весь необходимый текст. При наведении курсора будет выделяться соответствующая область на странице. Кликнуть по нужному блоку и скопировать содержимое Ctrl+C или в выпадающем меню при правом клике. Вставить текст в сервис по очистке от HTML-тегов, который можно найти в поисковике по запросу «strip html tags online». Например, striphtml.com».

Денис Нечитайлов, создатель цифрового контента приложений и программ:
«Можно использовать “инспектор элементов” браузера. Найдите нужный текст на странице, щелкните правой кнопкой мыши и выберите “Инспектировать элемент”. Это открывает инструмент разработчика, где можно найти текст в HTML-коде и скопировать его оттуда. Установить браузерные расширения для копирования текста. Некоторые из них: CopyFish, Allow Copy, Enable Copy, Superior allow copy. Чтобы очистить скопированный текст от тегов, нужно вставить его в любой текстовый редактор, такой как Notepad, и затем нажать Ctrl+Shift+H (для Windows) или Command+Shift+H (для Mac), чтобы активировать функцию замены текста. Затем введите <.*?> в поле “Найти”, а затем оставьте поле “Заменить” пустым. Нажмите “Заменить все”, и эта команда удалит все HTML-теги из текста. Есть также автоматизированные сервисы: HTML Cleaner, TextTools, и другие.
Сервисы для очистки от тегов
Открываем меню разработчика (вы уже знаете, как), затем копируем нужный фрагмент текста правой кнопкой мыши и прогоняем его через онлайн-сервисы по очистке. Протестируем несколько самых популярных.
StripHTML
Исходный текст с тегами: «Защита от копирования текста сайта</strong> является на сегодняшний день одной из важнейших задач в интернете. Многие их создатели не затрудняют себя написание текстов для наполнения. Обычно они копируют интересные тексты с других сайтов.</p>».
Текст после очистки от тегов: «Защита от копирования текста сайта является на сегодняшний день одной из важнейших задач в интернете. Многие их создатели не затрудняют себя написание текстов для наполнения. Обычно они копируют интересные тексты с других сайтов».

HTML5css
Для очистки текста вставляем нужный фрагмент в окошко и нажимаем «Очистить». Результат аналогичный.

iBOX.Tools
Алгоритм действий тот же, как и результат — получается чистый текст, который можно использовать в дальнейшей работе.
Сохранение текста с защищенного от копирования сайта
Вам необходимо скопировать информацию с сайта, но у вас не получается ее сохранить? Скорее всего, это некопируемый или защищенный от копирования текст. Веб-ресурс запрещает его выделять в целях соблюдения авторских прав. Для того чтобы скачать не копирующийся текст, воспользуйтесь этим онлайн-сервисом. Все что вам потребуется сделать — это указать ссылку на web-страницу, где нельзя копировать материал, запустить сканирование содержимого, найти и выделить заблокированные строчки статьи.
Сервис для сохранения не копирующегося текста
Если текст на сайте не получается или невозможно копировать, то воспользуйтесь онлайн-сканером текста . Он поможет вам обойти блокировку и скопировать любой заблокированный от копирования материал. При этом, скачать содержимое вы сможете не только на компьютере или ноутбуке, но и на телефоне.
Сохраните текстовую информацию, как на Айфоне, так и на любом смартфоне с операционной системой Андроид. Для этого вам больше не потребуются специальные программы и приложения. Вам достаточно будет открыть стандартный браузер, скопировать ссылку на сайт и воспользоваться онлайн-сервисом.

«Почему на некоторых сайтах невозможно скопировать и сохранить текст?» — спросите вы. Все дело в том, что правообладатели этих интернет-ресурсов заботятся о сохранении авторских прав на свои статьи, новости и другие информационные материалы и поэтому всяческими способами защищают их от копирования.
Ознакомьтесь с простой инструкцией и воспользуйтесь быстрым онлайн-поиском содержимого , чтобы обойти защиту любого web-сайта и скачать не копирующийся текст с его web-страниц. После чего, вам останется выделить нужные строчки и сохранить их в Ворде, блокноте или любом другом текстовом документе.
Скопируйте текст по ссылке на сайт
Скачайте некопируемый текс с любого защищенного от копирования web-ресурса, где не получается выделить его содержимое. Для этого из адресной строки браузера скопируйте URL-ссылку на интернет-страницу сайта. Далее, вставьте гиперссылку в поле ниже и запустите копирование.
Выделите и скопируйте содержимое
В результате сканирования найден текст, который вы можете выделить и сохранить на компьютере или телефоне. Внимательно ознакомьтесь с найденным материалом, пролистав содержимое окна ниже.
Пожалуйста поддержите работу сервиса, если он оказался вам полезен.
Как скачать некопируемый материал

Копируем ссылку на защищенный web-сайт
Итак, чтобы скопировать защищенный текст вам, в первую очередь, потребуется открыть интернет-страницу сайта, где он содержится. Сделать это вы можете, как через компьютер, так и через телефон. При этом не играет роли iPhone у вас или смартфон с Android. При открытии веб-страницы, в адресной строке вашего браузера появится ссылка. Скопируйте ее, она вам в дальнейшем потребуется для того, чтобы сохранить необходимый материал.

Ищем весь текст на интернет-странице
После того, как ссылка на интернет-ресурс скопирована, вам необходимо будет воспользоваться онлайн-сканером текста . Вставьте адрес web-страницы в поле для ссылки и запустите копирование, нажав на кнопку «Скопировать». В результате этих действий начнется сканирование страницы сайта и поиск всей текстовой информации, содержащейся на ней. Это не займет у вас много времени.

Выделяем и сохраняем содержимое
По завершению сканирования, в специальном окне будет выведен весь текст, найденный на веб-странице сайта. Вам останется совершить последнее действие — это скачать необходимую текстовую информацию себе на ПК или мобильный. Для этого, сначала внимательно ознакомьтесь с содержимым окна. Далее, найдите необходимые строчки текста. После чего, выделите их, скопируйте и сохраните в Ворде, блокноте или любом другом текстовом документе.
Самые популярные вопросы
Почему нельзя скопировать текстовую информацию на сайте?
Если у вас не получается сохранить текст на сайте, то не стоит думать, что это сбой в работе вашего браузера. Возможно вы удивитесь, но это достаточно распространены мера защиты авторских прав. Дело в том, что с помощью такого рода защиты, владелец интернет-ресурса борется с копированием информационных материалов, содержащихся на веб-странице. Чаще всего, за это отвечают специально написанный код, который и не дает вам скопировать содержимое.
Этот онлайн-сервис позволяет копировать материалы бесплатно?
Да, конечно, с помощью этого онлайн-сервиса вы сможете разблокировать текст не только быстро, но и бесплатно. По статистике скачать некопируемый материал можно на 99% web-ресурсах. При этом, не важно какой у них протокол, HTTP или защищенный HTTPS. Кроме того, сохранить необходимую текстовую информацию вы сможете не только на компьютере, но на любом мобильном устройстве, где есть браузер и выход в Интернет.
Как выгрузить некопируемую информацию на компьютер?
Если сайт не даёт скачать информацию, а вам необходимо сохранить ее у себя на компьютере, то следуйте простой инструкции. Для этого вам не потребуется устанавливать специальные программы на ваш ПК и дополнительные расширения для браузера. Просто откройте необходимую интернет-страницу, скопируйте ссылку на нее и воспользуйтесь поиском текста .
Можно ли скачать не копирующийся текст на телефон?
Да, разумеется. Вы можете обойти запрет копирования текста не только на компьютере, но и на любом телефоне. Для того чтобы это сделать, вам не нужно будет устанавливать специальные приложения на ваш смартфон. Обход блокировки защищённого текста на мобильном абсолютно идентично процедуре на ПК. Для этого вам потребуется всего лишь запустить браузер и воспользоваться этим онлайн-сервисом.
Возможно ли сохранить защищённую статью на Айфоне и Андроиде?
Конечно можно! Нет никакой разницы в том через какое устройство вы пытаетесь сохранить некопируемый текст. Будь то iPhone или смартфоне с операционной системой Android. Вам больше не потребуются специальные приложения для этой цели. Скачать заблокированный текст можно абсолютно на любом мобильном устройстве, где есть браузер. Просто скопируйте адрес web-страницы и воспользуйтесь онлайн-поиском для того, чтобы сохранить текст, которой ранее было невозможно копировать.
Получится ли скопировать содержимое без фона?
Да, разумеется. Весь найденный текст будет доступен в исходном, стандартном формате. В том виде, если бы вы набирали его в текстовом документе. Все дело в том, что фон, шрифты и другие стили сайта, при копировании текста, сбрасываются до значений по умолчанию. Поэтому при сохранении текстовой информации, например в Ворде, у вас не появится лишнего оформления и случайно скопированного дизайна веб-страницы.
Запрещённые строчки текста можно сохранить в Word?
Да, безусловно. При этом, вам не потребуется самостоятельно искать текстовую информацию в коде. Любой текст, находящийся на веб-странице, вы можете не только разблокировать, но сохранить в Ворде, блокноте или обычном текстовом документе. Для этого вам сначала потребуется воспользоваться онлайн-сканером , а затем выделить и скопировать необходимые строчки текста. После чего нужно будет вставить и сохранить их в текстовом файле.
Что будет, если я скопирую статью на чужом web-ресурсе?
Вам стоит знать, что копирование чужих материалов не совсем хорошая идея, если вы хотите выкладывать их на своем сайте. Дело в том, что не только закон, но и поисковики борются за соблюдение авторских прав и крайне негативно относятся к копиям. Поэтому, если вы не хотите, чтобы ваш ресурс был понижен в поисковой выдаче или попал в бан, то вам не следует скачивать чужую информацию и размещать ее на своем ресурсе. Другое дело будет, если вы перепишите скопированные статьи, тем самым сделав их уникальными. В этом случае можно будет не беспокоится за продвигаемый web-сайт и избежать санкций от поисковиков. Если же копирование не подразумевает размещение информации в интернете, то можете не беспокоиться и пользоваться онлайн-сервисом.