Перед созданием блога или сайта перед автором всегда встаёт вопрос об источниках контента для своего проекта. Хорошо, если вы делаете какой-нибудь сервис, сделали описание целей, основных функций, заполнили странички о проекте и об авторе — и дело в шляпе. Или вариант с сайтом визиткой… Наняли специалиста, он написал 5-10 страниц красивого текста, и можно отправлять сайт в плавание по просторам Сети. А что делать, если вы работаете над большим контентным проектом, и вам требуется несколько тысяч статей? Нужно выбрать подходящий источник контента для своего сайта. При этом стоит помнить, что для разных типов сайтов можно и нужно использовать различные типы контента. В некоторых случаях выгоднее будет использовать копипаст вместо дорогого копирайта, например, в итернет-магазины, который владельцы не планируют продвигать в ПС, а трафик получают, например, из соц.сетей или контекста.
Основные источники контента для сайта:
- Авторские статьи. Создатель блога сам пишет свои тексты, например, рассказывает новые рецепты пирожков с капустой или делится с читателями впечатлениями от путешествия в Париж. Или профессиональный фотограф может разместить в Сети своё портфолио и лучшие кадры. В общем что-то в таком духе сам делаю и сам пишу. Качество контента полностью зависит от навыков и способностей автора.
- Биржи контента. На биржах или специальных форумах можно найти человека, который будет за определённую плату писать статьи для вашего сайта. Кроме копирайта, который будет сравним по качеству с авторскими статьями можно заказать рерайт или перевод с других языков. Биржи контента позволяют экономить время, это удобно, когда вы хотите заниматься, например, именно продвижением сайта или маркетингом, а не написанием постов. В некоторых случаях требуется большое количество текста в единицу времени. Один человек написать такой объём физически не сможет, тогда вам поможет биржа рерайта, на которой вы можете нанять несколько исполнителей, и они вам будут наполнять новостную ленту или новый форум.
- Сканирование и переработка оффлайн источников. К настоящему времени много книг переведено в электронный вид и выложено в Интернете. Но я этот вариант выделил в отдельный пункт. Он отличается от простого копипаста. В эру печатных машин было сделано немало, а многие труды лежат забытыми в библиотеках на пыльных полках. Возможно потомки вам скажут большое спасибо за то, что вы потрудитесь и переведете в цифровой вид ту или иную ценную рукопись. Такой тип контента часто используется для сателлитов и создания сборников страниц под биржи ссылок. Особенно хорошо подходят старые методички и пособия, данные в них рекомендации можно переписать с учётом современных реалий и получится полноценный копирайт. Только надо учитывать, что за последние годы поисковики поумнели и хорошо различают скан, поэтому его перед размещением нужно обязательно обрабатывать руками.
- Ручной копипаст (от анг. copy & paste). Понятно, где-то скопировали материал и разместили на своём сайте с ссылкой или без таковой на исходник. Поисковики стараются бороться с копипастом. Но в некоторых случаях можно им пользоваться. Например, когда вам не нужны посетители из поисковиков: развлекательный контент для участников соц.сетей, описания товаров в магазине, основная доля покупателей на который идёт из контекста и других видов рекламы. В некоторых случаях копипаст пытаются уникализировать с помощью синонимайза, перестановок, разбавления и других приёмов.
- Автоматический парсинг. Контент автоматически с помощью скриптов собирается из разных источников и выкладывается на сайт. Парсить могут RSS ленты блогов и новостных порталов, контент с сайтов под АГС или из неиндексируемых источников, например переписку с закрытых групп в соц.сетях и т.п. Бывают сайты, которые закрыты от индексации в какой-либо ПС, в этом случае можно скопировать с них контент и продвигать его в нужном поисковике. Потом собранные тексты обрабатываются, чистятся от лишних тегов и размещаются на генерируемом ресурсе. Так делают сателлиты и дорвеи. Сами скрипты называют грабберы — они умеют только парсить, а если ещё и создавать полноценные сайты, то их называют доргены. Кроме текста можно парсить фото и видео контент. Есть генераторы текстовок, которые создают бредотекст, другие могут автоматически спарсить поисковую выдачу по заданным ключам и на основе полученных данных сформировать статьи с помощью замен, перестановок и синонимайзинга. Для оживления блога и аккаунтов в социальных сетях могут применяться искусственные комментаторы-боты. Иногда получается высокое качество выходного продукта и реальные пользователи могут сразу не заметить подмены и включится в дискуссию.
- UGC (User Generated Content) — контент генерируемый пользователями. Яркими примерами могут служить форумы, блоговые платформы, wiki-сообщества и соц.сети. Казалось бы сделал форум и радуйся жизни пока посетители самостоятельно пишут статьи и комментарии. Красота! Но не всё так просто. Пользователи просто так писать не будут. Нужно их заинтересовать, собрать сообщество единомышленников, постоянно подкидывать информационные поводы для обсуждения и споров. В общем работа довольно сложная, а если к этому прибавить необходимость контроля и модерации, то становится совсем грустно. Также нужно следить за количеством копипаста, из-за ограниченных возможностей управления контентом трудно соблюдать основные требования seo, например, может возникнуть переспам ключевых слов. Кроме текста люди могут размещать свои фотографии, стихотворения, отзывы, обзоры, демотиваторы.
Часто на сайте приходится совмещать все источники и типы контента. Например, написали пост в нем использовали частично копипаст (разместили чужую картинку), рерайт, копирайт, возможно перевод и получили статью, которою потом прокомментировали ваши читатели. Основные типы контента: текст, фото (графика), аудио, видео и смешанный контент. Если все виды контента объединить и добавить навигацию внутри и между документами, то получится мультимедийный продукт. Поэтому сайт или блог кроме всего прочего можно называть мультимедийным продуктом.
— На чём зарабатываешь?
— Да так, мультимедийные продукты в Интернете делаю :-).
С тематикой для блога мы ранее определились, теперь разобрались с источниками контента. Далее поговорим как и о чём писать на блог. Чтобы не пропустить выход новых статей, подпишитесь на получение обновлений блога удобным для вас способом.
Далее по содержанию. Поскольку современные требования SEO написания статей — это не менее 3000 знаков, я бы расшифровал понятие «доргены» и увеличил бы массу контента с 893 слов, у Вас до 1036, за что поисковики расцеловали бы вашу статью (надеюсь):).
«Генераторы дорвеев — это программы для автоматического создания дорвеев на жаргоне поисковых оптимизаторов известны как «доргены».
Часто они используют такие статистические методы, как марковские цепи, для создания множества страниц с бессмысленным текстом на основе списка ключевых слов и коллекции тематических текстов. Такой подход позволяет без участия человека (что было бы трудозатратно) создавать страницы с уникальным содержимым, не определяющиеся поисковыми системами как дубликаты других страниц. Тексты получаются локально, на уровне соседних слов, похожими на естественный текст, что затрудняет их обнаружение поисковыми системами, но в последнее время успешно разрабатываются методы для их обнаружения.»
К тому же «Дорвеи, как и другие виды поискового спама, относятся к так называемой «чёрной оптимизации», и поэтому поисковые системы стремятся автоматически и вручную исключать их из своих индексов, как сайты, не имеющие никакой смысловой нагрузки для людей, а используемые исключительно для обмана поисковых роботов и, в большинстве случаев, для извлечения прибыли.»
Вообще статья тянет на научное изыскание и я рад за Вас!
Кстати, согласен с Вами, что в последнее время грамотные копирайтеры преподносят свои творения как мультимедийный продукт. А что нас ждет дальше, при такой скорости развития технологий?
С уважением
Спасибо за ценные замечания. Да проблемы с грамотностью и опечатками у меня есть. Иной раз трудно заставить себя перечитать то, что только что было написано :-). Но я борюсь с собой :-). А во время написания за ошибками сложно уследить, потому что стараешься больше думать над тем как доступно изложить свои мысли.
Опечатки бросаются в глаза, и я их как читатель тоже не люблю. Вообще, когда начал писать на блог, стал всё больше и больше обращать внимание на безграмотность в Интернете. Сейчас читаю много блогов, и их безграмотность передаётся мне, от печатных книг такого эффекта нет, там предварительная вычитка проводится.
Так у меня в статье более 5 000 символов без пробелов, нормально всё. Термины стараюсь расшифровывать по-минимуму, так как это весьма трудоёмко. В дальнейшем планирую написать ряд статей-словариков, чтобы разговаривать со своими читателями на одном языке. Но на самом деле это сложная задача, под неё нужно выделять отдельный сайт. И он, кстати, имеется, Википедией называется :-). А вообще при встрече с незнакомыми терминами лучше воспользоваться Гуглом, нужно просто приучать себя так действовать. Тогда не будет сплошного копипаста в Сети. Но это так, мысли о том, как я сам поступаю в таких случаях.
До научного труда этой статье далеко… Попытался кратко высказаться по теме. Скоро напишу о том, зачем вообще появился этот цикл статей в рубрике «Разработка сайтов». Казалось бы, писано переписано столько на эту тему, но зачем-то Seorubl взялся снова за неё…
Что нас ждёт впереди… Лично я надеюсь, что нас ждёт расцвет Интернет-коммерции, увеличится доля онлайн покупок, и это будут реальные товары, а не только лохотроны. В данный момент я делаю на это ставку, при чём на кон у меня поставлено довольно много…
…До научного труда этой статье далеко…
Во всякомслучае чувствуется искренность в изложении, что и заставляет читать статью до конца.
…нас ждёт расцвет Интернет-коммерции,…
Согласен, осталось лишь изобрести востребованный продукт:-)