spryt: странствующий вебмастер об авторе | контакты | реклама на блоге

Откуда брать контент

Октябрь 13, 2009

Вход в жилище =)
Как я уже писал, с сателлитами в частности и рунетом вообще покончено. Поэтому теперь можно с чистой совестью расписать, откуда же я брал контент) На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.

Контент штука тонкая.. Где то его тонны, но мало кто использует, а где то мало, но его все парсят и парсят.. Вот я и обнаружил (почти случайно), что копипасты новостей прекрасно индексируются. Обычные новости, которых за день появляются тысячи. Соль в том, чтобы использовать тематичные новости (например, новости интернета), а так же копать в архивах. В итоге на моих многостраничниках были новости по определенному кейворду за последние 10 лет. И Яндекс их прекрасно индексировал (особенно после добавления в сервис), сапа принимала, и ссылки продавались =) Крупные многостраничники (>2к страниц) я не делал — рисковано, да и смысла нет. Вполне хватало 400-700 страниц. А самих новостей, как я же писал, огромное количество, и каждое СМИ рерайтит его по своему. Я, к примеру, с легкостью отпарсил себе 200к новостей, и это только с одного издания.

А обнаружил я это довольно случайно) Купил свободный домен с тИЦ10, повесил туда вордпресс. Надо же откуда то контент брать, не самому же писать?) Вот я и скопипастил последние 10 новостей по этой тематике, да и забыл про сайт (было это ровно год назад). А он успешно проиндексировался) Потом еще один эксперимент, с написанием парсера, уже на 500 сраниц. Потом еще и еще, ну и летом я уже начал их делать потоком. Не знаю, как сейчас они индексируются, последний подобный сайт я сделал еще в июле.

Вот так и надо искать идеи. Небольшой эксперимент, проверка, чуток программисткой магии для автоматизации (не будете же вы вручную 500 новостей копипастить), и в поток. Парсить, кстати говоря, пришлось HTML-код, а не столь популярный RSS, так-как СМИ редко выпускают в рсс полный текст новости.

Не знаю, актуален ли сейчас этот скрипт (на вход — кейворд и адрес WP-блога со включеным XML-RPC, на выходе — в блог сыпятся все новости по этому кейворду, расставленные по времени). Если кому нужен — пишите на мыло, договоримся.

————————

Потихоньку двигаюсь в буржунете. Первый проект создал, нужно его потихоньку наполнять контентом. Блог еще не создал, все еще не выбрал шаблон )

Так же создал личный блог Гиацинтов.ru. Хотел ЖЖ, но там занят мой логин (мной же), для его восстановления надо что-то платить и т.д., в итоге забил и поставил привычный вордпресс. Напомню, что там ничего не будет о заработке в интернете (для этого есть этот блог), ни о бурженете (для этого будет следующий блог), зато там будет много фоток окружающего меня мира, и мое мнение насчет него, рецензии на фильмы и сериалы, размышления о смысле жизни (то, что помечено в этом блоге как Бред), лытдыбры и советы о том, как надо жить =) Если вам это интересно — подписывайтесь.

Продолжаю мобилизацию.. Купил симку, подключил безлимитный тариф за 1800 рублей в месяц (максимальная скорость — 24кБ/с, после 2Гб трафика — 8кБ/с). В планах так же замена всего компьютерного барахла (зачем мне, к примеру, WiFi роутер? Или ноутбук, который работает всего 10 минут на аккуме?), но на это конечно нужны деньги.

PS. Возникла мысль о продаже TopSape..

Порекомендуй друзьям →

54 комментария

  1. Максиим

    Я работаю в приличном издательстве (модные новости), наблюдаю порядка 50 сайтов, которые парсят новости с моего портала, и ничего, живут! Только ссылки ставят на источник — никаких фильтров у них. Для меня только плюсы, как сквозняки…

  2. HenzO

    Так я что-то не совсем понял, т.е ты когда-то парсил пачками новости с новостных порталов, новости получается чисто копи-паст, но тематические. А сейчас все это добро ушло в баню и под фильтр. Я правильно понимаю?

  3. Korew

    Из твоего поста можно сделать вывод, что брать контент там, где его брал ты, не стоит 🙂

  4. aktuba

    Надо-же… Оказывается, мы занимались похожими вещами =))). Но я не стал делать на поток, для пробы сделал 2 сайта и продал их. Оба отлично живут в Яше. У одного 5000 страниц, у второго 7000. Оба на автообновлении 😉

  5. Rigor

    Андрей, я тебе адрес того миниотеля отправил на почту, удачи с поисками)

  6. Rigor

    Сори за второй комент, теперь прочитал пост. ))
    НЕ надо продавать топсап)) Его завешают банерами, поставят «веб20» дизайн, чтобы все блестело. Щас все ок, даже если не развивать 🙂

  7. pawka

    заинтересован скриптом, пиши на мыло плиз

  8. kolua

    За сколько готов отдать топсапе? можно на е-мейл.

  9. karapuzz

    Мне кажется, что многие еще будут использовать скан книжек, пока они не закончатся совсем) Потом начнут искать другие способы поиска контента

  10. CarlessInLvov

    да, узкотематичный копипейст рулил 🙂 сейчас фз, тоже сайты в бане. я наверно попробую сначала рутраф з гугла гнать, и только потом буржуйнет. в рунете проще ссылки брать, да и алгоритмы яндекс\рамблер легче раскусить 🙂

  11. Spryt

    HenzO, почти. Сейчас это ушло не из-за контента, а из-за фильтра, у меня почти все сателлиты (не только на этом контенте) ушли под него, и несколько СДЛ.

    aktuba, тоже есть сайт на автообновлении, 800 страниц кажется набрал, но под фильтром — 9 страниц в индексе…

  12. aktuba

    Если интересно, как этого избежать — стучи в асю 😉

  13. George Kennedy

    Ну теперь понятно почему практически все твои говносайты забанили, АГС-17 с копипастом расправляется не на шутку быстро 🙂

  14. Kras

    Я надеюсь ты не забросишь этот блог, а то мне тебя интересно читать ))))

  15. vad

    Есть пару методов по контенту, еси че могу поделиться. Кстати на чем собираешься зарабатывать в буржунете? Тож туда перехожу… Вобщем еси че выходи на контакт…

  16. min

    George Kennedy, теоретик? 🙂

  17. БезМозгоFF

    Красиво получится с продажей топсапе так, что все хеш коды паролей участников будут разом проданы неизвестно кому 🙂

  18. KIW

    Красиво, живешь в этом доме? 🙂

  19. Арнольд

    Прошу удалить себя с topsape.ru

  20. Khlyupin

    Спрут, если цена за topsape адекватная, я возьму, сразу говорю, что переделаю дизайн там и приведу в человеческий вид, цену на мыло mgkirovсобакмайлтчкру

  21. George Kennedy

    min, практик 😉 Старые сайты, которые делал давным давно как Спрут вылетели практически полностью, поэтому информация из личного опыта 🙂

  22. Spryt

    aktuba, да нет, уже неактуально)

    George Kennedy, ага, топсапе и алаякс офигенные копипастные сателлиты…

    БезМозгоFF, поэтому я и говорю, что я еще думаю.. Плюс не собираюсь продавать неизвестно кому.

    KIW, ага)

  23. Сергей

    За сколько хочешь продать топсапе?

  24. maxum

    Спрут, что за оператор предоставляет безлимитный мобильный интернет в Сочи?
    Я когда искал в качестве резервного канала — безлимит не нашел.

    Совсем скоро Yota 4G будет в Сочи работать, советую узнать подробнее, полезная, говорят штука.

  25. Алексей

    Андрей, ты сайт для буржунета на каком хостинге создал? На российском или на буржуйском соответственно?

  26. ispro

    Я тоже заметил, что копипаст на моем ресурсе некоторых тех.спецификаций на определенную продукцию с сайта, которому уже почти 10 лет, спокойно живет в индексе вот уже без малого год, собирая траф и являясь хорошим донором

  27. TraderMax

    Возникали точно такие же мысли по контенту, стоит только взглянуть на одни и те же новости на инопорталах.

    По топсейпу: цена вопроса?

  28. TraderMax

    > особенно после добавления в сервис

    Спали плиз сервис на мыло, все равно с рунетом покончил =)

  29. Spryt

    С продажей TopSape пока не определился (я написал, что думаю об этом, а не планирую). Но цена ориентировочно хххх$

    maxum, обычный мегафон-модем. Стоимость и скорость, конечно, печальны (60 рублей в день, скорость максимум 25 КБ/c, обычно 10-20), но без безлимита я трачу только больше, а так хоть по ночам сериальчики качаю.

    Алексей, у меня и этот блог на буржуйском хостинге висит. Но для буржуинов взял наш хостинг, но с размещением в штатах. Не охота заморчаиваться с покупкой виртуал-виз для оплаты хостинга (у годадди неплохие тарифы).

  30. SpeedMoney

    Андрей, ты почту вообще смотришь? Написал тебе уже пару писем — ответа нет.

  31. Натулька

    ТОже обратила внимание, что живут копипастные сайты. Только я полностью новость не выкладываю, а только часть и ссылку на источник.

  32. jabacrack

    хм, а как тебе удавалось скормить этот много тысячник сапе, учитыая ее ограничение на количество индексируемых урлов со страницы?

  33. sergynchik

    Предложи Маулу.

  34. Fewal

    jabacrack, главное грамотная перелинковка кто-то из бомже ленты из бомжей не помню, кто засунули в сапу 60к+ страниц тертьего уровня.

  35. jabacrack

    Fewal, учитывая что с главной индексируется 500 ссылок, сотворого уровня 150, а максимальный уроаень вложенности 3, то получаем максимум сколько можно проиндексировать в сапе за раз страниц 500*150=75000 но придется все страницы забить ссылками, что не очень красиво. И что-то я подозреваю, что для индексации 60к+ эту кучу ссылок таки пришлось разместить на страницах, может скрытно, но пришлось.
    Пока что я добавляю страницы просто обновляя карту сайта и переиндексируя ее, но это достаточно долго.

  36. Fewal

    jabacrack, специально нашел:
    хттп bo33.ru/114_60000-realnost
    почитай следующие посты, что из этого получилось.

  37. Fewal

    2jabacrack, только я перпутал цель в 60к с кол-вом страниц, страниц 40к+ но суть не изменна если постараться.

  38. FDriver

    Блин, палевно теперь находиться в ТопСапе. Вот продашь его, а потом поломают все аки в Сапе. Проект обречен на смерть после продажи. Это точно.

  39. KIW

    Ничего не мешает людям сменить пароли, но ТопСапе действительно после продажи загнется

  40. евгений

    сделай пожалуйста возможность самоудаляться из топсапе. напрмиер вводя логин и md5 хеш пароля.
    спасибо 🙂

  41. БезМозгоFF

    ну акки не поломают, вряд ли по хешкоду это можно сделать, но доступ по API конечно позволяет много чего натворить в аккаунте, вплоть до снятия или покупки ссылок.

    А продавать надо все таки ради чего то действительно срочного 🙂 А если просто кончились идеи по его развитию — думаю стоит подождать.

  42. Spryt

    jabacrack, не зря же я генератор сайтмапов создал..

    sergynchik, сомневаюсь, что ему интересен подобный проект) У меня нет цели просто продать сайт и срубить денег, я хочу чтобы сайт развивался.. Но пара идей уже появилась)

    KIW, это меня и пугает..

  43. Михалыч

    Прикол — яндекс ТИЦ апдейтнул. У меня показатели не очень

  44. TraderMax

    Spryt, а чего так долго топсейп не обновляется?

  45. Aspiring

    Путешественник, я тебе завидую!

    Нам всем будет ужасно интересно как ты начнешь новое дело, новое начало! Как будешь продвигатся к топу начиная с самого низа. Как ты не будешь никогда отчаиватся. Как ты докажешь что главное мозги надо иметь, остальное приложится. Как надо искать пути, выбирать, или идти по всем фронтам (?)!

    Я ошарашен что ты никак не отреагировал на вылет всех сатов. Молодец, чувак. Буду брать пример.

    На наших глазах человек растет так сказать 🙂

    Помню еще твой первый блог…)))

  46. jkeks

    Ты так здорово ведешь блог, что я тебе хочу предложить записать подкаст. Чтобы ты писал подкасты. Хотя бы так, мимоходом, потому что очень интересно слушать интересных людей.
    Я думаю это было бы шикарно! Тем более что на rpod.ru просто нету все еще чела который бы рассказывал о своих заработках в SEO.
    Были пару раз, читали хрень всякую, а у тебя получиться, примешать надо о тебе самом еще и будет вообще УРА.

  47. Михалыч

    яндекс вебмастер глючит? у меня по всем сайтам число внешних ссылок на мой сайт — нолик (

  48. KIW

    Та же хрень, думал ссылки обвалились 😀

  49. Fewal

    Рейтинг яндекса щас у всех работает? У меня такое впчетление что на него не влияет щас ни что вообще, сколько ссылок не появлялось он только в низ падает.

  50. Сплогатор

    По поводу продажи топсапы, за сколько думаешь продавать?
    Вообще, конечно, не мне тебе советовать, но я бы этот проект так рано не продавал. Думаю, раскрутить его можно за пол-годика еще очень даже. Сделать какие-нибудь плюшки для вновь зареганных. Тиц подрастить до сотни-другой. И цена его вырастет через полгодика на порядок.

  51. Andrew

    Насчет копипаста, Яша не трогает неуник текст например словарей, сонников или справочников. Такие сайты вполне себе годами живут в индексе и приносят деньги несмотря на полный неуник.

  52. STROGOS

    ну как там буржуйнет??????

  53. Китайское Сео

    Хорошо когда шариш в программировании, я заказывал покупал как-то прсер, так он парсит через пень колоду, только некоторые сайты, и то те которые на wp. Вывод нужно учить программирование или заводить белый ресурс, чтоб у тебя воровали и ставили на тебя ссылки )

  54. Саша

    «На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.»

    Они были перелинкованы?
    Хочу понять причину бана. Или же это из за не уникального контента?

Комментарий:

Андрей «Spryt» Гиацинтов (VK)
Email: me@spryt.ru

Путешествия:

Сейчас: Самара, Россия
Посещенные страны:
открыть все | закрыть все

Посмотреть на Google.Maps

Как дешево путешествовать по Азии

Как найти идею для сайта

Я зарабатываю:

Рубрики:

Итоги(137) Я(61) Блоггинг(48) Таиланд(44) Заработок(40) Философия(37) Бред(35) Путешествия(32) Georgy(21) Сателлиты(17) Малайзия(16) Колумбия(15) SEO(14) вебдев(14) Непал(13) Мои проекты(12) Чианг Май(10) Филиппины(8) Индонезия(8) Бангкок(7) Ява(7) Шри-Ланка(7) Домены(6) Краби(6) Борнео(6) Эквадор(6) скрипты(5) Паттайя(5) Лаос(5) Самуи(5) Камбоджа(5) Кордильеры(4) Каталоги(3) Обзоры блогов(3) Буржунет(3) Cameron Highlands(3) Вокруг Аннапурны(3) Покхара(3) Helambu trek(3) Гонконг(3) Велотрип(3) Вьетнам(3) Россия(3) Гаджеты(2) Бредовые идеи(2) Визы(2) Куала-Лумпур(2) Катманду(2) Сингапур(2) деревня(2)

Архив:

Поиск по блогу:

SEO анализ сайта:

Версия для компьютера | Переключить на мобильную версию