Откуда брать контент

Вход в жилище =)
Как я уже писал, с сателлитами в частности и рунетом вообще покончено. Поэтому теперь можно с чистой совестью расписать, откуда же я брал контент) На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.

Контент штука тонкая.. Где то его тонны, но мало кто использует, а где то мало, но его все парсят и парсят.. Вот я и обнаружил (почти случайно), что копипасты новостей прекрасно индексируются. Обычные новости, которых за день появляются тысячи. Соль в том, чтобы использовать тематичные новости (например, новости интернета), а так же копать в архивах. В итоге на моих многостраничниках были новости по определенному кейворду за последние 10 лет. И Яндекс их прекрасно индексировал (особенно после добавления в сервис), сапа принимала, и ссылки продавались =) Крупные многостраничники (>2к страниц) я не делал — рисковано, да и смысла нет. Вполне хватало 400-700 страниц. А самих новостей, как я же писал, огромное количество, и каждое СМИ рерайтит его по своему. Я, к примеру, с легкостью отпарсил себе 200к новостей, и это только с одного издания.

А обнаружил я это довольно случайно) Купил свободный домен с тИЦ10, повесил туда вордпресс. Надо же откуда то контент брать, не самому же писать?) Вот я и скопипастил последние 10 новостей по этой тематике, да и забыл про сайт (было это ровно год назад). А он успешно проиндексировался) Потом еще один эксперимент, с написанием парсера, уже на 500 сраниц. Потом еще и еще, ну и летом я уже начал их делать потоком. Не знаю, как сейчас они индексируются, последний подобный сайт я сделал еще в июле.

Вот так и надо искать идеи. Небольшой эксперимент, проверка, чуток программисткой магии для автоматизации (не будете же вы вручную 500 новостей копипастить), и в поток. Парсить, кстати говоря, пришлось HTML-код, а не столь популярный RSS, так-как СМИ редко выпускают в рсс полный текст новости.

Не знаю, актуален ли сейчас этот скрипт (на вход — кейворд и адрес WP-блога со включеным XML-RPC, на выходе — в блог сыпятся все новости по этому кейворду, расставленные по времени). Если кому нужен — пишите на мыло, договоримся.

————————

Потихоньку двигаюсь в буржунете. Первый проект создал, нужно его потихоньку наполнять контентом. Блог еще не создал, все еще не выбрал шаблон )

Так же создал личный блог Гиацинтов.ru. Хотел ЖЖ, но там занят мой логин (мной же), для его восстановления надо что-то платить и т.д., в итоге забил и поставил привычный вордпресс. Напомню, что там ничего не будет о заработке в интернете (для этого есть этот блог), ни о бурженете (для этого будет следующий блог), зато там будет много фоток окружающего меня мира, и мое мнение насчет него, рецензии на фильмы и сериалы, размышления о смысле жизни (то, что помечено в этом блоге как Бред), лытдыбры и советы о том, как надо жить =) Если вам это интересно — подписывайтесь.

Продолжаю мобилизацию.. Купил симку, подключил безлимитный тариф за 1800 рублей в месяц (максимальная скорость — 24кБ/с, после 2Гб трафика — 8кБ/с). В планах так же замена всего компьютерного барахла (зачем мне, к примеру, WiFi роутер? Или ноутбук, который работает всего 10 минут на аккуме?), но на это конечно нужны деньги.

PS. Возникла мысль о продаже TopSape..

54 комментария к “Откуда брать контент”

  1. Я работаю в приличном издательстве (модные новости), наблюдаю порядка 50 сайтов, которые парсят новости с моего портала, и ничего, живут! Только ссылки ставят на источник — никаких фильтров у них. Для меня только плюсы, как сквозняки…

  2. Так я что-то не совсем понял, т.е ты когда-то парсил пачками новости с новостных порталов, новости получается чисто копи-паст, но тематические. А сейчас все это добро ушло в баню и под фильтр. Я правильно понимаю?

  3. Из твоего поста можно сделать вывод, что брать контент там, где его брал ты, не стоит 🙂

  4. Надо-же… Оказывается, мы занимались похожими вещами =))). Но я не стал делать на поток, для пробы сделал 2 сайта и продал их. Оба отлично живут в Яше. У одного 5000 страниц, у второго 7000. Оба на автообновлении 😉

  5. Андрей, я тебе адрес того миниотеля отправил на почту, удачи с поисками)

  6. Сори за второй комент, теперь прочитал пост. ))
    НЕ надо продавать топсап)) Его завешают банерами, поставят «веб20» дизайн, чтобы все блестело. Щас все ок, даже если не развивать 🙂

  7. Мне кажется, что многие еще будут использовать скан книжек, пока они не закончатся совсем) Потом начнут искать другие способы поиска контента

  8. да, узкотематичный копипейст рулил 🙂 сейчас фз, тоже сайты в бане. я наверно попробую сначала рутраф з гугла гнать, и только потом буржуйнет. в рунете проще ссылки брать, да и алгоритмы яндекс\рамблер легче раскусить 🙂

  9. HenzO, почти. Сейчас это ушло не из-за контента, а из-за фильтра, у меня почти все сателлиты (не только на этом контенте) ушли под него, и несколько СДЛ.

    aktuba, тоже есть сайт на автообновлении, 800 страниц кажется набрал, но под фильтром — 9 страниц в индексе…

  10. Ну теперь понятно почему практически все твои говносайты забанили, АГС-17 с копипастом расправляется не на шутку быстро 🙂

  11. Я надеюсь ты не забросишь этот блог, а то мне тебя интересно читать ))))

  12. Есть пару методов по контенту, еси че могу поделиться. Кстати на чем собираешься зарабатывать в буржунете? Тож туда перехожу… Вобщем еси че выходи на контакт…

  13. Красиво получится с продажей топсапе так, что все хеш коды паролей участников будут разом проданы неизвестно кому 🙂

  14. Спрут, если цена за topsape адекватная, я возьму, сразу говорю, что переделаю дизайн там и приведу в человеческий вид, цену на мыло mgkirovсобакмайлтчкру

  15. min, практик 😉 Старые сайты, которые делал давным давно как Спрут вылетели практически полностью, поэтому информация из личного опыта 🙂

  16. aktuba, да нет, уже неактуально)

    George Kennedy, ага, топсапе и алаякс офигенные копипастные сателлиты…

    БезМозгоFF, поэтому я и говорю, что я еще думаю.. Плюс не собираюсь продавать неизвестно кому.

    KIW, ага)

  17. Спрут, что за оператор предоставляет безлимитный мобильный интернет в Сочи?
    Я когда искал в качестве резервного канала — безлимит не нашел.

    Совсем скоро Yota 4G будет в Сочи работать, советую узнать подробнее, полезная, говорят штука.

  18. Андрей, ты сайт для буржунета на каком хостинге создал? На российском или на буржуйском соответственно?

  19. Я тоже заметил, что копипаст на моем ресурсе некоторых тех.спецификаций на определенную продукцию с сайта, которому уже почти 10 лет, спокойно живет в индексе вот уже без малого год, собирая траф и являясь хорошим донором

  20. Возникали точно такие же мысли по контенту, стоит только взглянуть на одни и те же новости на инопорталах.

    По топсейпу: цена вопроса?

  21. > особенно после добавления в сервис

    Спали плиз сервис на мыло, все равно с рунетом покончил =)

  22. С продажей TopSape пока не определился (я написал, что думаю об этом, а не планирую). Но цена ориентировочно хххх$

    maxum, обычный мегафон-модем. Стоимость и скорость, конечно, печальны (60 рублей в день, скорость максимум 25 КБ/c, обычно 10-20), но без безлимита я трачу только больше, а так хоть по ночам сериальчики качаю.

    Алексей, у меня и этот блог на буржуйском хостинге висит. Но для буржуинов взял наш хостинг, но с размещением в штатах. Не охота заморчаиваться с покупкой виртуал-виз для оплаты хостинга (у годадди неплохие тарифы).

  23. Андрей, ты почту вообще смотришь? Написал тебе уже пару писем — ответа нет.

  24. ТОже обратила внимание, что живут копипастные сайты. Только я полностью новость не выкладываю, а только часть и ссылку на источник.

  25. хм, а как тебе удавалось скормить этот много тысячник сапе, учитыая ее ограничение на количество индексируемых урлов со страницы?

  26. jabacrack, главное грамотная перелинковка кто-то из бомже ленты из бомжей не помню, кто засунули в сапу 60к+ страниц тертьего уровня.

  27. Fewal, учитывая что с главной индексируется 500 ссылок, сотворого уровня 150, а максимальный уроаень вложенности 3, то получаем максимум сколько можно проиндексировать в сапе за раз страниц 500*150=75000 но придется все страницы забить ссылками, что не очень красиво. И что-то я подозреваю, что для индексации 60к+ эту кучу ссылок таки пришлось разместить на страницах, может скрытно, но пришлось.
    Пока что я добавляю страницы просто обновляя карту сайта и переиндексируя ее, но это достаточно долго.

  28. jabacrack, специально нашел:
    хттп bo33.ru/114_60000-realnost
    почитай следующие посты, что из этого получилось.

  29. 2jabacrack, только я перпутал цель в 60к с кол-вом страниц, страниц 40к+ но суть не изменна если постараться.

  30. Блин, палевно теперь находиться в ТопСапе. Вот продашь его, а потом поломают все аки в Сапе. Проект обречен на смерть после продажи. Это точно.

  31. Ничего не мешает людям сменить пароли, но ТопСапе действительно после продажи загнется

  32. сделай пожалуйста возможность самоудаляться из топсапе. напрмиер вводя логин и md5 хеш пароля.
    спасибо 🙂

  33. ну акки не поломают, вряд ли по хешкоду это можно сделать, но доступ по API конечно позволяет много чего натворить в аккаунте, вплоть до снятия или покупки ссылок.

    А продавать надо все таки ради чего то действительно срочного 🙂 А если просто кончились идеи по его развитию — думаю стоит подождать.

  34. jabacrack, не зря же я генератор сайтмапов создал..

    sergynchik, сомневаюсь, что ему интересен подобный проект) У меня нет цели просто продать сайт и срубить денег, я хочу чтобы сайт развивался.. Но пара идей уже появилась)

    KIW, это меня и пугает..

  35. Путешественник, я тебе завидую!

    Нам всем будет ужасно интересно как ты начнешь новое дело, новое начало! Как будешь продвигатся к топу начиная с самого низа. Как ты не будешь никогда отчаиватся. Как ты докажешь что главное мозги надо иметь, остальное приложится. Как надо искать пути, выбирать, или идти по всем фронтам (?)!

    Я ошарашен что ты никак не отреагировал на вылет всех сатов. Молодец, чувак. Буду брать пример.

    На наших глазах человек растет так сказать 🙂

    Помню еще твой первый блог…)))

  36. Ты так здорово ведешь блог, что я тебе хочу предложить записать подкаст. Чтобы ты писал подкасты. Хотя бы так, мимоходом, потому что очень интересно слушать интересных людей.
    Я думаю это было бы шикарно! Тем более что на rpod.ru просто нету все еще чела который бы рассказывал о своих заработках в SEO.
    Были пару раз, читали хрень всякую, а у тебя получиться, примешать надо о тебе самом еще и будет вообще УРА.

  37. яндекс вебмастер глючит? у меня по всем сайтам число внешних ссылок на мой сайт — нолик (

  38. Рейтинг яндекса щас у всех работает? У меня такое впчетление что на него не влияет щас ни что вообще, сколько ссылок не появлялось он только в низ падает.

  39. По поводу продажи топсапы, за сколько думаешь продавать?
    Вообще, конечно, не мне тебе советовать, но я бы этот проект так рано не продавал. Думаю, раскрутить его можно за пол-годика еще очень даже. Сделать какие-нибудь плюшки для вновь зареганных. Тиц подрастить до сотни-другой. И цена его вырастет через полгодика на порядок.

  40. Насчет копипаста, Яша не трогает неуник текст например словарей, сонников или справочников. Такие сайты вполне себе годами живут в индексе и приносят деньги несмотря на полный неуник.

  41. Хорошо когда шариш в программировании, я заказывал покупал как-то прсер, так он парсит через пень колоду, только некоторые сайты, и то те которые на wp. Вывод нужно учить программирование или заводить белый ресурс, чтоб у тебя воровали и ставили на тебя ссылки )

  42. «На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.»

    Они были перелинкованы?
    Хочу понять причину бана. Или же это из за не уникального контента?

Обсуждение закрыто.