Уникальность текста и сервисы для проверки уникальности
Краткое содержание статьи:
Уникальный контент в SEO – это отсутствие его дубликатов в индексе поисковых систем. Зачастую поисковые системы пессимизируют сайты с ворованными текстами, хотя бывают исключения. Уникальность может быть технической и смысловой. В первой оценивается структура; порядок слов, фраз и предложений; изменение падежей, времен и пр. Смысловая уникальность отражает оригинальность содержания контента. Рассмотрим их подробно.
Смысловая уникальность
Поисковые системы уже давно научились оценивать качество текста с точки зрения новизны информации. Основная идея смысловой уникальности – новизна для читателя. Пессимизация может произойти в том случае, если контент не обладает добавочной ценностью относительно других сайтов – т.е. содержит точно такой же смысл. В большей степени риску подвержены информационные статьи, так как именно в них читатель хочет получить полезную информацию. На коммерческих сайтах, пользователя обычно интересует товар или услуга, текстовая составляющая – реже.
Смысловая уникальность может быть оценена следующими способами:
- Асессорская оценка – происходит путем оценивая человеком выдачи поисковой системы на авторитетность, наличие дополнительной информации и полезности.
- Лингвистический анализ – это смысловое сопоставление текстов на основе часто встречающихся значимых слов. Если находится контент с добавочной информацией, значит он уникальный, если наоборот – могут быть санкции в виде попадания под фильтры Баден-Баден, АГС-40 и «Панда».
Программных средств по оценке смысловой уникальности у веб-мастеров, копирайтеров нет, но есть ряд приёмов, которые позволят повысить смысловую составляющую:
- Добавляйте уникальную информацию: проводите исследования, наблюдения по теме, возьмите интервью у эксперта.
- Сформулируйте УТП: бесплатная доставка по всей России; доставка на следующий день; скидка на второй заказ, круглосуточная техническая поддержка и пр.
- Используйте больше профессиональных терминов, аббревиатур с расшифровкой и пояснениями.
- Структурируйте текст таблицами, списками.
- Разнообразьте контент изображениями, видео, графиками и пр.
- Добавляйте отзывы клиентов о товаре или услуге.
- Разрабатывайте новый и полезный функционал сайта: калькуляторы, формы, интерактивные элементы (напр. просмотр панорам), видео товара, его 3D модели и пр.
- Расширяйте сортировку и фильтры.
- Пишите больше технической информации о товаре: размеры, характеристики, применение, комплектация и пр.
- Публикуйте примеры работ компании с описанием, например, с этапами стройки дома клиента.
Техническая уникальность
Техническая уникальность чаще всего рассчитывается с помощью шинглов – от 3 до 10 последовательных слов, на которые разбивается текст. Частицы, союзы и предлоги исключаются. Далее происходит поиск на совпадение отобранных слов. Именно таким образом работает большинство сервисов по проверке текстов. С помощью них можно определить неоригинальные куски, что позволит доработать контент до 100% уникальности. В целом сервисы оценивают её примерно одинаково, поэтому можно опираться на следующие данные:
- до 79% – низкая,
- от 80 до 90% – средняя,
- от 90 до 100% – высокая.
К высоким показателям нужно стремиться, но это не всегда выходит. Так, например, может потеряться смысл и появиться нелогичность текста. Для некоторых тематик, например, юридической или медицинской, сложно добиться 100% уникальности. В таких случаях копирайтер должен, не доводя текст до абсурда, стремиться к максимально возможному показателю уникальности.
В текстах товаров можно оставить изначальное описание, взятое у производителя, так как технические характеристики сложно сделать уникальными, к тому же поисковые системы к этому относятся нормально.
Рассмотрим некоторые приёмы, которые позволят добиться уникальности:
- Поменяйте структуру текста: добавьте абзацы, подзаголовки;
- Используйте синонимы;
- Подавайте ту же информацию новыми словами;
- Переводите статьи из иностранных источников;
- Превратите перечисления в маркированный список;
- Уберите воду: штампы, вводные слова, эвфемизмы, распространенные речевые обороты и пр.;
- Не используйте цитаты, лучше перефразируйте их.
И наконец, неоригинальные предложения можно просто удалить, если они не вредят полноте и полезности текста.
Как проверить уникальность?
Онлайн-сервисы и программы оценивают уникальность текста по-разному, в одном может получиться, что контент уникален на 100%, в другом – на 80%. Иногда даже оценка в разные дни может показывать неодинаковые результаты. В таких случаях поддержка рекомендует:
- почистить кэша браузера;
- вставить текст из блокнота;
- провести проверку в разных браузерах;
- сделать несколько проверок подряд, чтобы удостовериться, что уникальность одинаковая.
При этом всегда нужно понимать, что все слова уже были когда-то использованы в различных статьях. Например, в одной узкой тематике может быть сложным употребление распространенных в ней терминов. Поэтому результаты работы антиплагиат-программ не следует принимать как подробное руководство к действию для бездумного переписывания до 100% показателя.
Программы и сервисы
Рассмотрим наиболее популярные онлайн-сервисы и программы по проверке уникальности текста.
Text.ru – популярный онлайн-сервис, алгоритм которого основан не на шинглах, а на распознавании заимствований с учетом смены слов, фраз, предложений местами и изменении грамматики форм слов. Бесплатно можно проверить уникальность от маленького до большого текста (до 15 000 знаков ежесуточно), сайта, а также документа, но можно приобрести и платные пакеты для снятия лимита. Подсвечивает неоригинальные куски и отображает источники. Можно исключить проверяемый домен.
Из минусов: встречается несовпадение результатов одного и того же текста у разных пользователей или в разное время.
Content-watch.ru – онлайн-сервис, определяющий страницы с копиями для выявления совпадений на предоставленном тексте. Можно посмотреть, какие части контента были найдены на каждой из проанализированных страниц. Бесплатно доступно 3 анализа текстов до 10 000 знаков. Есть возможность регулярной проверки добавленных страниц, но только на платной основе.
Результат появляется быстро. Можно проверить текст, страницу, сайт или сделать пакетную проверку по ссылкам. Есть функция игнорирования домена.
Advego.com – биржа копирайтинга с онлайн-версией антиплагиата. Лимит 3 000 символов, можно купить дополнительные пакеты проверки. Выявляет неоригинальность с помощью лексической схожести, шинглов и псевдоуникализации. Для полностью бесплатных проверок без ограничений можно установить программу (см. Advego Plagiatus). В процентах отобразит не только уникальность, но и долю рерайта. Для анализа можно задать только текст. Есть возможность исключения учёта адреса сайта.
Инструмент находит разные методы обхода проверки, например, замену букв в словах на другую раскладку, изменение времен и падежей, синонимы, перестановки и пр.
Advego Plagiatus – бесплатная программа без ограничений, работающая по алгоритму аналогично сервису. Отображает степень уникальности текста, источники, процент совпадения. Умеет анализировать оригинальность указанной страницы, можно добавить текст вручную или документом. Из полезного функционала еще можно: удалять теги; тонко настраивать шинглы, задавать процент совпадения и пр. Можно включать и выключать проверки в определенных поисковых системах: Яндекс, Google, Рамблер, Yahoo, Bing и пр. Есть добавление игнорирования домена.
Есть два варианта проверки – быстрая и полная. Вторая является наиболее долгой и точной – с предоставлением более детальной информации. Результаты одного и того же текста будут отличаться.
Из минусов – необходимость введения капчи для продолжения работы.
Быстрая проверка
Полная проверка
Etxt.ru – биржа, среди инструментов которой есть онлайн-сервис по проверке уникальности. Без регистрации позволяет загрузить до 3 000 символов, после – 5 000, далее уже платно. Работает на основе шинглов и с помощью проверки на рерайт. Таким образом при анализе можно выбрать режим:
- обнаружение копий – для поиска дословных совпадений.
- обнаружение рерайтинга – для поиска фрагментов с перестановками слов, изменениями словоформы.
Из минусов сервиса – нельзя задать исключаемый домен, есть очередь на проверку.
AntiPlagiarism.NET – бесплатная антиплагиат-программа от etxt.ru с большим количеством настроек, работает по такому же алгоритму, как и сервис. Есть три режима: обнаружение копий, обнаружение рерайтинга и одновременно первые два. Здесь вы сможете сделать проверку 4-х видов: стандартная, экспресс, глубокая, на рерайт (они определены настройками, которые можно изменять).
Есть функции пакетного анализа из загруженных файлов. Из дополнительного: можно сделать SEO-проверку, где определится сколько страниц в индексе Яндекс и Google, Икс и пр., а также проанализировать изображения на уникальность.
В отличие от онлайн-сервиса, есть функции игнорирования домена, сравнения двух текстов между собой.
Из минусов – необходимо вводить капчу.
Pr-cy.ru – онлайн-сервис для вебмастеров, среди инструмента которого есть антиплагиат. Без регистрации позволяет проверить только до 1000 символов (5 раз в сутки), после – до 5 000 символов (20 раз в сутки). Уникальность текста проверяется путём разделения на фрагменты с анализом каждого из них – ищутся совпадения с другими проиндексированными ПС текстами. Можно задать игнорирование домена.
Из минусов: алгоритм полностью отличается от других сервисов, так как в нашем примере неуникальный текст был оценен в 93% уникальности.
Пиксель Тулс – сервис для автоматизации рутинных задач, имеет бесплатный онлайн-инструмент, который позволяет проверить уникальность как введенного вручную текста, так и текста по ссылке. Работает на основе анализа отрезков с определенным шагом на наличие сходства в других текстах в поисковой выдаче.
Можно включить глубокую проверку текста, которая проверяет отрезки друг за другом без пропуска текстового содержимого – функция позволяет получить более точные данные. Есть возможность исключить домен и выгрузить результаты в формате CSV.
Antiplagiat.ru – онлайн-сервис по проверке заимствований используется как частными лицами, так и ВУЗами, библиотеками, министерствами и пр. Алгоритм работает на основе фрагментов, которые сравниваются с фрагментами из других источников. Находит перефразированные тексты, а также контент, полученный при помощи перевода с английского языка.
Для начала работы нужна регистрация. Бесплатно можно проанализировать 1 документ раз в 6 минут, в платном доступе широкий вариант тарифов. Проверка может происходить по различным источникам: интернет, нормативно-правовые, научные статьи, патенты и пр. Можно загрузить как документ, так и вручную вставить текст. Нельзя исключить домен. Больше подходит для проверки учебных работ, научных публикаций и пр.
Из минусов бесплатной версии: не отображает источники заимствований и неоригинальные фрагменты.
Мы рассмотрели 9 рабочих инструментов, с помощью которых можно проверить уникальность контента сайта. Представленные сервисы и программы являются наиболее популярными, многие, которые не вошли в данный список, либо устарели, либо перестали поддерживаться.
Как защитить тексты от копирования?
После того, как уникальность достигла необходимого значения, возникает вопрос о защите контента от копирования. На 100% рабочих вариантов не существует, но мы можем дать рекомендации.
- Добавить текст в «Оригинальные Тексты» в Яндекс.Вебмастере. Это позволит сообщить Яндексу, где впервые появился текст, для определения первоисточника. Но обратите внимание, что Яндекс не гарантирует, что учтет это в работе своих алгоритмов.
- Использовать скрипт, чтобы запретить копирование контента. Выделение текста становится невозможным.
- Второй вариант скрипта – дописывание к скопированному контенту ссылки на источник.
- Запретить выделение текста с помощью CSS-стилей.
- Чаще упоминать в тексте название компании, делать перелинковку, так как невнимательные «воры» могут не заметить и не убрать эти данные.