Что-то мне стало немного скучновато, решил заняться своим любимым делом — парсингом данных и генерацией из них говносайтов. Давненько я ими уже не занимался, еще с прошлогодней пачки новостных сайтов) Не заработаем, так развлечемся, а то в последние АПдейты даже не мониторю индексацию, сеошник называется…
Контент
Для начала, откуда брать контент? Там, докуда Яндекс не добирается. К чему синонимизировать тонны контента, приводя его в нечитаемый вид, когда можно брать тексты с забаненых сайтов? Пока что я выбрал два источника:
1. YouTube
Да, там дохренища контента, и ежедневно добавляется свежий. API довольно простой, можно получить дополнительные и весьма полезные данные. Сайтик с таким контентом у меня успешно индексируется (а что еще делать, на тизерах копейки получаются — придется опять идти в сторону продажи ссылок), в Яндексе можно найти и другие примеры сайтов с видео с большим числом страниц. Хотя точно так же можно найти кучу забаненых сайтов)) Как повезет, короче. Но если не наглеть, да применить пару фишек для очеловечивания сайта — думаю все будет отлично.
2. Два-ч
Где еще можно найти столько людей, ежедневно добавляющих контент, при том что в Яндексе сайт успешно забанен? Конечно, большая часть материала — полный мусор, однако ищущий да найдет. Не забываем о том, что на имиджбордах нет архивов — старые треды просто удаляются при добавлении новых. UPDATE: Ошибочка вышла, двач в индексе. Однако это не отменяет того, что посты со временем удаляются, к тому же можно добиться более быстрой индексацией (RSS + ping).
Ну и у меня где-то валяется старый парсер новостей, его тоже можно попробовать, может еще работает.
Зачем я вам пишу про источники контента, которые многие так тщательно скрывают? Очень просто — большинство людей пальцем не пошевелят, чтобы разобраться в чем-то новом (в том же дваче нет ни RSS, ни паблик граберов — все нужно писать самому). Те, кто занимается подобным — и так знают всё это, и давно продвинулись куда дальше чем я. Ну а та малая часть людей, которые заинтересуются и что-то сделает.. что ж, мне не жалко, контента много)
Движок
Самописный, без вариантов. Опять мучится с ручной установкой и настройкой всяких вордпрессов, тратой кучи места, подгонкой контента под движок.. Буэээ. Все равно плюсов не так много, распространенность движка уже играет отрицательную роль. Хочу попробовать централизовать базу данных — то есть развернуть общую БД на VDS, с других шаред хостингов удаленно подключаться уже к ней, обновление данных тоже в одном месте (естественно, сайты никак не статичные, а постоянно обновляющиеся). Правда, придется поработать над шаблонами 🙂
Домены
С одной стороны, куда выгодней использовать домены уже с тиц. Однако не всегда получается вытащить их из бана, в отличии от свежих… Попробую 50 на 50 — использовать свои старые домены (которые без бана), поискать домены с тицем и основную часть — на новых (ru естественно). Конечно, было бы куда лучше использовать отлежавшиеся хотя бы полгода домены с одной страницей в индексе, но у меня таких к сожалению не осталось 🙁
тИЦ
Так-как на нулевиках особо не заработаешь (все те же ~7.6 рублей в день, выборка с 800 сайтов), после попадания в индекс буду накачивать тиц сапой. Фильтры уже давно опробованы (да нет, не тот шлак на plati.ru, о результативности которого что-то никто не отписывается), за 10р/д можно получить 10-30 тИЦ, а большего и не нужно (это уже ~30р в день).
—————————
Вот только не надо начинать «Спрут, неужели опять говносайты, подумай о людях!» и т.д. и т.п. Свои проекты я успешно развиваю, о новых контентных сайтах тоже не забываю (блджад, как же я задолбался искать исполнителей). Деньги на пару десятков доменов у меня есть, время на написание всей этой системы — тоже (скилл кодинга таки увеличивается — на тот же парсер двача ушло всего полчаса).
В любом случае я получу ценный опыт, несколько готовых функций в мою коллекцию, опробую использование единой базы, развлекусь малость. Каждый день сидеть над сайтами все равно не нужно, автоматизация. Я вполне готов к тому, что все мои сайты не доживут даже до индексации, не то что до получения дохода 🙂 Но вот если проиндексируются, да еще и надолго, да еще и с тицем…