Откуда брать контент
13 октября, 2009
Как я уже писал, с сателлитами в частности и рунетом вообще покончено. Поэтому теперь можно с чистой совестью расписать, откуда же я брал контент) На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.
Контент штука тонкая.. Где то его тонны, но мало кто использует, а где то мало, но его все парсят и парсят.. Вот я и обнаружил (почти случайно), что копипасты новостей прекрасно индексируются. Обычные новости, которых за день появляются тысячи. Соль в том, чтобы использовать тематичные новости (например, новости интернета), а так же копать в архивах. В итоге на моих многостраничниках были новости по определенному кейворду за последние 10 лет. И Яндекс их прекрасно индексировал (особенно после добавления в сервис), сапа принимала, и ссылки продавались =) Крупные многостраничники (>2к страниц) я не делал — рисковано, да и смысла нет. Вполне хватало 400-700 страниц. А самих новостей, как я же писал, огромное количество, и каждое СМИ рерайтит его по своему. Я, к примеру, с легкостью отпарсил себе 200к новостей, и это только с одного издания.
А обнаружил я это довольно случайно) Купил свободный домен с тИЦ10, повесил туда вордпресс. Надо же откуда то контент брать, не самому же писать?) Вот я и скопипастил последние 10 новостей по этой тематике, да и забыл про сайт (было это ровно год назад). А он успешно проиндексировался) Потом еще один эксперимент, с написанием парсера, уже на 500 сраниц. Потом еще и еще, ну и летом я уже начал их делать потоком. Не знаю, как сейчас они индексируются, последний подобный сайт я сделал еще в июле.
Вот так и надо искать идеи. Небольшой эксперимент, проверка, чуток программисткой магии для автоматизации (не будете же вы вручную 500 новостей копипастить), и в поток. Парсить, кстати говоря, пришлось HTML-код, а не столь популярный RSS, так-как СМИ редко выпускают в рсс полный текст новости.
Не знаю, актуален ли сейчас этот скрипт (на вход — кейворд и адрес WP-блога со включеным XML-RPC, на выходе — в блог сыпятся все новости по этому кейворду, расставленные по времени). Если кому нужен — пишите на мыло, договоримся.
————————
Потихоньку двигаюсь в буржунете. Первый проект создал, нужно его потихоньку наполнять контентом. Блог еще не создал, все еще не выбрал шаблон )
Так же создал личный блог Гиацинтов.ru. Хотел ЖЖ, но там занят мой логин (мной же), для его восстановления надо что-то платить и т.д., в итоге забил и поставил привычный вордпресс. Напомню, что там ничего не будет о заработке в интернете (для этого есть этот блог), ни о бурженете (для этого будет следующий блог), зато там будет много фоток окружающего меня мира, и мое мнение насчет него, рецензии на фильмы и сериалы, размышления о смысле жизни (то, что помечено в этом блоге как Бред), лытдыбры и советы о том, как надо жить =) Если вам это интересно — подписывайтесь.
Продолжаю мобилизацию.. Купил симку, подключил безлимитный тариф за 1800 рублей в месяц (максимальная скорость — 24кБ/с, после 2Гб трафика — 8кБ/с). В планах так же замена всего компьютерного барахла (зачем мне, к примеру, WiFi роутер? Или ноутбук, который работает всего 10 минут на аккуме?), но на это конечно нужны деньги.
PS. Возникла мысль о продаже TopSape..
Я работаю в приличном издательстве (модные новости), наблюдаю порядка 50 сайтов, которые парсят новости с моего портала, и ничего, живут! Только ссылки ставят на источник — никаких фильтров у них. Для меня только плюсы, как сквозняки…
Так я что-то не совсем понял, т.е ты когда-то парсил пачками новости с новостных порталов, новости получается чисто копи-паст, но тематические. А сейчас все это добро ушло в баню и под фильтр. Я правильно понимаю?
Из твоего поста можно сделать вывод, что брать контент там, где его брал ты, не стоит 🙂
Надо-же… Оказывается, мы занимались похожими вещами =))). Но я не стал делать на поток, для пробы сделал 2 сайта и продал их. Оба отлично живут в Яше. У одного 5000 страниц, у второго 7000. Оба на автообновлении 😉
Андрей, я тебе адрес того миниотеля отправил на почту, удачи с поисками)
Сори за второй комент, теперь прочитал пост. ))
НЕ надо продавать топсап)) Его завешают банерами, поставят «веб20» дизайн, чтобы все блестело. Щас все ок, даже если не развивать 🙂
заинтересован скриптом, пиши на мыло плиз
За сколько готов отдать топсапе? можно на е-мейл.
Мне кажется, что многие еще будут использовать скан книжек, пока они не закончатся совсем) Потом начнут искать другие способы поиска контента
да, узкотематичный копипейст рулил 🙂 сейчас фз, тоже сайты в бане. я наверно попробую сначала рутраф з гугла гнать, и только потом буржуйнет. в рунете проще ссылки брать, да и алгоритмы яндекс\рамблер легче раскусить 🙂
HenzO, почти. Сейчас это ушло не из-за контента, а из-за фильтра, у меня почти все сателлиты (не только на этом контенте) ушли под него, и несколько СДЛ.
aktuba, тоже есть сайт на автообновлении, 800 страниц кажется набрал, но под фильтром — 9 страниц в индексе…
Если интересно, как этого избежать — стучи в асю 😉
Ну теперь понятно почему практически все твои говносайты забанили, АГС-17 с копипастом расправляется не на шутку быстро 🙂
Я надеюсь ты не забросишь этот блог, а то мне тебя интересно читать ))))
Есть пару методов по контенту, еси че могу поделиться. Кстати на чем собираешься зарабатывать в буржунете? Тож туда перехожу… Вобщем еси че выходи на контакт…
George Kennedy, теоретик? 🙂
Красиво получится с продажей топсапе так, что все хеш коды паролей участников будут разом проданы неизвестно кому 🙂
Красиво, живешь в этом доме? 🙂
Прошу удалить себя с topsape.ru
Спрут, если цена за topsape адекватная, я возьму, сразу говорю, что переделаю дизайн там и приведу в человеческий вид, цену на мыло mgkirovсобакмайлтчкру
min, практик 😉 Старые сайты, которые делал давным давно как Спрут вылетели практически полностью, поэтому информация из личного опыта 🙂
aktuba, да нет, уже неактуально)
George Kennedy, ага, топсапе и алаякс офигенные копипастные сателлиты…
БезМозгоFF, поэтому я и говорю, что я еще думаю.. Плюс не собираюсь продавать неизвестно кому.
KIW, ага)
За сколько хочешь продать топсапе?
Спрут, что за оператор предоставляет безлимитный мобильный интернет в Сочи?
Я когда искал в качестве резервного канала — безлимит не нашел.
Совсем скоро Yota 4G будет в Сочи работать, советую узнать подробнее, полезная, говорят штука.
Андрей, ты сайт для буржунета на каком хостинге создал? На российском или на буржуйском соответственно?
Я тоже заметил, что копипаст на моем ресурсе некоторых тех.спецификаций на определенную продукцию с сайта, которому уже почти 10 лет, спокойно живет в индексе вот уже без малого год, собирая траф и являясь хорошим донором
Возникали точно такие же мысли по контенту, стоит только взглянуть на одни и те же новости на инопорталах.
По топсейпу: цена вопроса?
> особенно после добавления в сервис
Спали плиз сервис на мыло, все равно с рунетом покончил =)
С продажей TopSape пока не определился (я написал, что думаю об этом, а не планирую). Но цена ориентировочно хххх$
maxum, обычный мегафон-модем. Стоимость и скорость, конечно, печальны (60 рублей в день, скорость максимум 25 КБ/c, обычно 10-20), но без безлимита я трачу только больше, а так хоть по ночам сериальчики качаю.
Алексей, у меня и этот блог на буржуйском хостинге висит. Но для буржуинов взял наш хостинг, но с размещением в штатах. Не охота заморчаиваться с покупкой виртуал-виз для оплаты хостинга (у годадди неплохие тарифы).
Андрей, ты почту вообще смотришь? Написал тебе уже пару писем — ответа нет.
ТОже обратила внимание, что живут копипастные сайты. Только я полностью новость не выкладываю, а только часть и ссылку на источник.
хм, а как тебе удавалось скормить этот много тысячник сапе, учитыая ее ограничение на количество индексируемых урлов со страницы?
Предложи Маулу.
jabacrack, главное грамотная перелинковка кто-то из бомже ленты из бомжей не помню, кто засунули в сапу 60к+ страниц тертьего уровня.
Fewal, учитывая что с главной индексируется 500 ссылок, сотворого уровня 150, а максимальный уроаень вложенности 3, то получаем максимум сколько можно проиндексировать в сапе за раз страниц 500*150=75000 но придется все страницы забить ссылками, что не очень красиво. И что-то я подозреваю, что для индексации 60к+ эту кучу ссылок таки пришлось разместить на страницах, может скрытно, но пришлось.
Пока что я добавляю страницы просто обновляя карту сайта и переиндексируя ее, но это достаточно долго.
jabacrack, специально нашел:
хттп bo33.ru/114_60000-realnost
почитай следующие посты, что из этого получилось.
2jabacrack, только я перпутал цель в 60к с кол-вом страниц, страниц 40к+ но суть не изменна если постараться.
Блин, палевно теперь находиться в ТопСапе. Вот продашь его, а потом поломают все аки в Сапе. Проект обречен на смерть после продажи. Это точно.
Ничего не мешает людям сменить пароли, но ТопСапе действительно после продажи загнется
сделай пожалуйста возможность самоудаляться из топсапе. напрмиер вводя логин и md5 хеш пароля.
спасибо 🙂
ну акки не поломают, вряд ли по хешкоду это можно сделать, но доступ по API конечно позволяет много чего натворить в аккаунте, вплоть до снятия или покупки ссылок.
А продавать надо все таки ради чего то действительно срочного 🙂 А если просто кончились идеи по его развитию — думаю стоит подождать.
jabacrack, не зря же я генератор сайтмапов создал..
sergynchik, сомневаюсь, что ему интересен подобный проект) У меня нет цели просто продать сайт и срубить денег, я хочу чтобы сайт развивался.. Но пара идей уже появилась)
KIW, это меня и пугает..
Прикол — яндекс ТИЦ апдейтнул. У меня показатели не очень
Spryt, а чего так долго топсейп не обновляется?
Путешественник, я тебе завидую!
Нам всем будет ужасно интересно как ты начнешь новое дело, новое начало! Как будешь продвигатся к топу начиная с самого низа. Как ты не будешь никогда отчаиватся. Как ты докажешь что главное мозги надо иметь, остальное приложится. Как надо искать пути, выбирать, или идти по всем фронтам (?)!
Я ошарашен что ты никак не отреагировал на вылет всех сатов. Молодец, чувак. Буду брать пример.
На наших глазах человек растет так сказать 🙂
Помню еще твой первый блог…)))
Ты так здорово ведешь блог, что я тебе хочу предложить записать подкаст. Чтобы ты писал подкасты. Хотя бы так, мимоходом, потому что очень интересно слушать интересных людей.
Я думаю это было бы шикарно! Тем более что на rpod.ru просто нету все еще чела который бы рассказывал о своих заработках в SEO.
Были пару раз, читали хрень всякую, а у тебя получиться, примешать надо о тебе самом еще и будет вообще УРА.
яндекс вебмастер глючит? у меня по всем сайтам число внешних ссылок на мой сайт — нолик (
Та же хрень, думал ссылки обвалились 😀
Рейтинг яндекса щас у всех работает? У меня такое впчетление что на него не влияет щас ни что вообще, сколько ссылок не появлялось он только в низ падает.
По поводу продажи топсапы, за сколько думаешь продавать?
Вообще, конечно, не мне тебе советовать, но я бы этот проект так рано не продавал. Думаю, раскрутить его можно за пол-годика еще очень даже. Сделать какие-нибудь плюшки для вновь зареганных. Тиц подрастить до сотни-другой. И цена его вырастет через полгодика на порядок.
Насчет копипаста, Яша не трогает неуник текст например словарей, сонников или справочников. Такие сайты вполне себе годами живут в индексе и приносят деньги несмотря на полный неуник.
ну как там буржуйнет??????
Хорошо когда шариш в программировании, я заказывал покупал как-то прсер, так он парсит через пень колоду, только некоторые сайты, и то те которые на wp. Вывод нужно учить программирование или заводить белый ресурс, чтоб у тебя воровали и ставили на тебя ссылки )
«На данный момент кстати из всех сателлитов в живых осталось всего пять, остальные либо под фильтром (в том числе 4 СДЛ), либо забанены.»
Они были перелинкованы?
Хочу понять причину бана. Или же это из за не уникального контента?