Откуда брать контент

Вход в жилище =)
Как я уже писал, с сателлитами в частности и рунетом вообще покончено. Поэтому теперь можно с чистой совестью расписать, откуда же я брал контент) На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.

Контент штука тонкая.. Где то его тонны, но мало кто использует, а где то мало, но его все парсят и парсят.. Вот я и обнаружил (почти случайно), что копипасты новостей прекрасно индексируются. Обычные новости, которых за день появляются тысячи. Соль в том, чтобы использовать тематичные новости (например, новости интернета), а так же копать в архивах. В итоге на моих многостраничниках были новости по определенному кейворду за последние 10 лет. И Яндекс их прекрасно индексировал (особенно после добавления в сервис), сапа принимала, и ссылки продавались =) Крупные многостраничники (>2к страниц) я не делал — рисковано, да и смысла нет. Вполне хватало 400-700 страниц. А самих новостей, как я же писал, огромное количество, и каждое СМИ рерайтит его по своему. Я, к примеру, с легкостью отпарсил себе 200к новостей, и это только с одного издания.

А обнаружил я это довольно случайно) Купил свободный домен с тИЦ10, повесил туда вордпресс. Надо же откуда то контент брать, не самому же писать?) Вот я и скопипастил последние 10 новостей по этой тематике, да и забыл про сайт (было это ровно год назад). А он успешно проиндексировался) Потом еще один эксперимент, с написанием парсера, уже на 500 сраниц. Потом еще и еще, ну и летом я уже начал их делать потоком. Не знаю, как сейчас они индексируются, последний подобный сайт я сделал еще в июле.

Вот так и надо искать идеи. Небольшой эксперимент, проверка, чуток программисткой магии для автоматизации (не будете же вы вручную 500 новостей копипастить), и в поток. Парсить, кстати говоря, пришлось HTML-код, а не столь популярный RSS, так-как СМИ редко выпускают в рсс полный текст новости.

Не знаю, актуален ли сейчас этот скрипт (на вход — кейворд и адрес WP-блога со включеным XML-RPC, на выходе — в блог сыпятся все новости по этому кейворду, расставленные по времени). Если кому нужен — пишите на мыло, договоримся.

————————

Потихоньку двигаюсь в буржунете. Первый проект создал, нужно его потихоньку наполнять контентом. Блог еще не создал, все еще не выбрал шаблон )

Так же создал личный блог Гиацинтов.ru. Хотел ЖЖ, но там занят мой логин (мной же), для его восстановления надо что-то платить и т.д., в итоге забил и поставил привычный вордпресс. Напомню, что там ничего не будет о заработке в интернете (для этого есть этот блог), ни о бурженете (для этого будет следующий блог), зато там будет много фоток окружающего меня мира, и мое мнение насчет него, рецензии на фильмы и сериалы, размышления о смысле жизни (то, что помечено в этом блоге как Бред), лытдыбры и советы о том, как надо жить =) Если вам это интересно — подписывайтесь.

Продолжаю мобилизацию.. Купил симку, подключил безлимитный тариф за 1800 рублей в месяц (максимальная скорость — 24кБ/с, после 2Гб трафика — 8кБ/с). В планах так же замена всего компьютерного барахла (зачем мне, к примеру, WiFi роутер? Или ноутбук, который работает всего 10 минут на аккуме?), но на это конечно нужны деньги.

PS. Возникла мысль о продаже TopSape..

54 комментария к “Откуда брать контент”

  1. Я работаю в приличном издательстве (модные новости), наблюдаю порядка 50 сайтов, которые парсят новости с моего портала, и ничего, живут! Только ссылки ставят на источник — никаких фильтров у них. Для меня только плюсы, как сквозняки…

      цитировать →

  2. Так я что-то не совсем понял, т.е ты когда-то парсил пачками новости с новостных порталов, новости получается чисто копи-паст, но тематические. А сейчас все это добро ушло в баню и под фильтр. Я правильно понимаю?

      цитировать →

  3. Надо-же… Оказывается, мы занимались похожими вещами =))). Но я не стал делать на поток, для пробы сделал 2 сайта и продал их. Оба отлично живут в Яше. У одного 5000 страниц, у второго 7000. Оба на автообновлении 😉

      цитировать →

  4. Сори за второй комент, теперь прочитал пост. ))
    НЕ надо продавать топсап)) Его завешают банерами, поставят «веб20» дизайн, чтобы все блестело. Щас все ок, даже если не развивать 🙂

      цитировать →

  5. Мне кажется, что многие еще будут использовать скан книжек, пока они не закончатся совсем) Потом начнут искать другие способы поиска контента

      цитировать →

  6. да, узкотематичный копипейст рулил 🙂 сейчас фз, тоже сайты в бане. я наверно попробую сначала рутраф з гугла гнать, и только потом буржуйнет. в рунете проще ссылки брать, да и алгоритмы яндекс\рамблер легче раскусить 🙂

      цитировать →

  7. HenzO, почти. Сейчас это ушло не из-за контента, а из-за фильтра, у меня почти все сателлиты (не только на этом контенте) ушли под него, и несколько СДЛ.

    aktuba, тоже есть сайт на автообновлении, 800 страниц кажется набрал, но под фильтром — 9 страниц в индексе…

      цитировать →

  8. Ну теперь понятно почему практически все твои говносайты забанили, АГС-17 с копипастом расправляется не на шутку быстро 🙂

      цитировать →

  9. Есть пару методов по контенту, еси че могу поделиться. Кстати на чем собираешься зарабатывать в буржунете? Тож туда перехожу… Вобщем еси че выходи на контакт…

      цитировать →

  10. Спрут, если цена за topsape адекватная, я возьму, сразу говорю, что переделаю дизайн там и приведу в человеческий вид, цену на мыло mgkirovсобакмайлтчкру

      цитировать →

  11. min, практик 😉 Старые сайты, которые делал давным давно как Спрут вылетели практически полностью, поэтому информация из личного опыта 🙂

      цитировать →

  12. aktuba, да нет, уже неактуально)

    George Kennedy, ага, топсапе и алаякс офигенные копипастные сателлиты…

    БезМозгоFF, поэтому я и говорю, что я еще думаю.. Плюс не собираюсь продавать неизвестно кому.

    KIW, ага)

      цитировать →

  13. Спрут, что за оператор предоставляет безлимитный мобильный интернет в Сочи?
    Я когда искал в качестве резервного канала — безлимит не нашел.

    Совсем скоро Yota 4G будет в Сочи работать, советую узнать подробнее, полезная, говорят штука.

      цитировать →

  14. Андрей, ты сайт для буржунета на каком хостинге создал? На российском или на буржуйском соответственно?

      цитировать →

  15. Я тоже заметил, что копипаст на моем ресурсе некоторых тех.спецификаций на определенную продукцию с сайта, которому уже почти 10 лет, спокойно живет в индексе вот уже без малого год, собирая траф и являясь хорошим донором

      цитировать →

  16. Возникали точно такие же мысли по контенту, стоит только взглянуть на одни и те же новости на инопорталах.

    По топсейпу: цена вопроса?

      цитировать →

  17. С продажей TopSape пока не определился (я написал, что думаю об этом, а не планирую). Но цена ориентировочно хххх$

    maxum, обычный мегафон-модем. Стоимость и скорость, конечно, печальны (60 рублей в день, скорость максимум 25 КБ/c, обычно 10-20), но без безлимита я трачу только больше, а так хоть по ночам сериальчики качаю.

    Алексей, у меня и этот блог на буржуйском хостинге висит. Но для буржуинов взял наш хостинг, но с размещением в штатах. Не охота заморчаиваться с покупкой виртуал-виз для оплаты хостинга (у годадди неплохие тарифы).

      цитировать →

  18. ТОже обратила внимание, что живут копипастные сайты. Только я полностью новость не выкладываю, а только часть и ссылку на источник.

      цитировать →

  19. хм, а как тебе удавалось скормить этот много тысячник сапе, учитыая ее ограничение на количество индексируемых урлов со страницы?

      цитировать →

  20. jabacrack, главное грамотная перелинковка кто-то из бомже ленты из бомжей не помню, кто засунули в сапу 60к+ страниц тертьего уровня.

      цитировать →

  21. Fewal, учитывая что с главной индексируется 500 ссылок, сотворого уровня 150, а максимальный уроаень вложенности 3, то получаем максимум сколько можно проиндексировать в сапе за раз страниц 500*150=75000 но придется все страницы забить ссылками, что не очень красиво. И что-то я подозреваю, что для индексации 60к+ эту кучу ссылок таки пришлось разместить на страницах, может скрытно, но пришлось.
    Пока что я добавляю страницы просто обновляя карту сайта и переиндексируя ее, но это достаточно долго.

      цитировать →

  22. Блин, палевно теперь находиться в ТопСапе. Вот продашь его, а потом поломают все аки в Сапе. Проект обречен на смерть после продажи. Это точно.

      цитировать →

  23. сделай пожалуйста возможность самоудаляться из топсапе. напрмиер вводя логин и md5 хеш пароля.
    спасибо 🙂

      цитировать →

  24. ну акки не поломают, вряд ли по хешкоду это можно сделать, но доступ по API конечно позволяет много чего натворить в аккаунте, вплоть до снятия или покупки ссылок.

    А продавать надо все таки ради чего то действительно срочного 🙂 А если просто кончились идеи по его развитию — думаю стоит подождать.

      цитировать →

  25. jabacrack, не зря же я генератор сайтмапов создал..

    sergynchik, сомневаюсь, что ему интересен подобный проект) У меня нет цели просто продать сайт и срубить денег, я хочу чтобы сайт развивался.. Но пара идей уже появилась)

    KIW, это меня и пугает..

      цитировать →

  26. Путешественник, я тебе завидую!

    Нам всем будет ужасно интересно как ты начнешь новое дело, новое начало! Как будешь продвигатся к топу начиная с самого низа. Как ты не будешь никогда отчаиватся. Как ты докажешь что главное мозги надо иметь, остальное приложится. Как надо искать пути, выбирать, или идти по всем фронтам (?)!

    Я ошарашен что ты никак не отреагировал на вылет всех сатов. Молодец, чувак. Буду брать пример.

    На наших глазах человек растет так сказать 🙂

    Помню еще твой первый блог…)))

      цитировать →

  27. Ты так здорово ведешь блог, что я тебе хочу предложить записать подкаст. Чтобы ты писал подкасты. Хотя бы так, мимоходом, потому что очень интересно слушать интересных людей.
    Я думаю это было бы шикарно! Тем более что на rpod.ru просто нету все еще чела который бы рассказывал о своих заработках в SEO.
    Были пару раз, читали хрень всякую, а у тебя получиться, примешать надо о тебе самом еще и будет вообще УРА.

      цитировать →

  28. Рейтинг яндекса щас у всех работает? У меня такое впчетление что на него не влияет щас ни что вообще, сколько ссылок не появлялось он только в низ падает.

      цитировать →

  29. По поводу продажи топсапы, за сколько думаешь продавать?
    Вообще, конечно, не мне тебе советовать, но я бы этот проект так рано не продавал. Думаю, раскрутить его можно за пол-годика еще очень даже. Сделать какие-нибудь плюшки для вновь зареганных. Тиц подрастить до сотни-другой. И цена его вырастет через полгодика на порядок.

      цитировать →

  30. Насчет копипаста, Яша не трогает неуник текст например словарей, сонников или справочников. Такие сайты вполне себе годами живут в индексе и приносят деньги несмотря на полный неуник.

      цитировать →

  31. Хорошо когда шариш в программировании, я заказывал покупал как-то прсер, так он парсит через пень колоду, только некоторые сайты, и то те которые на wp. Вывод нужно учить программирование или заводить белый ресурс, чтоб у тебя воровали и ставили на тебя ссылки )

      цитировать →

  32. «На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.»

    Они были перелинкованы?
    Хочу понять причину бана. Или же это из за не уникального контента?

      цитировать →

Оставьте комментарий