Августа 13, 2009 | by Макс | Допустим, есть сайт по нужной… | Павел Воронович о SEO, продвижении, блогинге и заработке в сети интернет.

08.07 2008

Августа 13, 2009 | by Макс | Допустим, есть сайт по нужной…

Автор: admin | Категории: Статьи

Августа 13, 2009 | by Макс | Допустим, есть сайт по нужной...

августа 13, 2009 | by Макс | Допустим, есть сайт по нужной нам тематике на 1000 страничек. Нужно сдереть с него всю инфу. Делаем вот что: с помощью телепорта качаем весь сайт себе в одну папочку. С помощью скрипта, который ниже, мы обрабатываем эту папочку. Прописываете папочку на сервере, где лежат нужные нам странички с инфой. И запускаете скрипт. После этого он аккуратненько пройдется по страничкам и выдерет оттуда всю инфу без всякого там хтмл-форматирования. И положит ее в файлик. Код скрипта, который дёргает инфу:

$dir=”dir”; $indexfile=”data. txt”; function text_2_base($url, &$baza) { $fd = fopen (’http://phpdirtobase/dir/’.$url, “r”); while (!feof($fd)) { $htmltotext = fgetss($fd, 1000); fwrite($baza, $htmltotext); } fclose ($fd); } $fp = fopen($indexfile, “w+”); if (is_dir($dir)) { if ($dh = opendir($dir)) { $i = -2; while ((($file = readdir($dh)) !== false)) {$i++; if ( $file!= “.” && $file!= “..”) { echo $i.’ obrabotan : ‘.$file. ‘ ‘; text_2_base($file, $fp); } } closedir($dh); } } fclose($fp);

Все. Инфа по тематике дора у нас есть. Есть конечно некоторые проблемы – не все хтмл форматирование убивается. Но ничего, можно и ручками немножко поработать Совсем немножко. h++p://doorwaycreation. jino-net. ru/info/kak-zagnat-vsyu-infu-s-nuzhnogo-sayta-sebe-v-bazu Теги: Black SEO, Doorway

Понравилась статья? Получай обновления и будь всегда в курсе событий!

blog comments powered by Disqus

RSS RSS-подписка
Что такое RSS?

Twitter-подписка

Donation Bar
Рубрики
Популярные посты

Попасть в Donation

Что я использую
Показатели

Webice.Ru - самая лучшая социальная сеть для блогеров и веб-мастеров. Постоянно публикую туда анонсы своих постов и получаю дополнительный трафик и подписчиков на свой блог..
Sape - самая популярная биржа ссылок в Рунете. Заработок для веб-мастеров, мощный инструмент для оптимизаторов.
GoGetLinks - Покупка и продажа вечных ссылок в виде картинок, обзоров (абзац текста) и контекстных ссылок. Берём качеством!
SEO пульт - Лучший помощник SEO оптимизатора! Выводим сайты в ТОП автоматом!
8 копеек - Сливаем свой трафик сюда! Куча разных платников с классными дизайнами. Платят за отправленные смс.
Jin кэш - Сливаем свой трафик и сюда тоже! Заработок на подписках и псевдоподписках. Куча разных платников, которых нет в "8 копеек" с классными дизайнами.
Хрум! - Покупаем хрумер со скидочкой через меня. Самый мощный софт, который только есть! Подходит для всего...
BlogBot - Покупаем Blogbot со скидочкой через меня. С помощью Blogbot вы можете создавать просто огромные сети саттелитов и с лёгкостью их контролировать!
OnlinerCMS - Покупаем OnlinerCMS со скидочкой через меня. С помощью этого софта Вы легко создатите сети онлайн-кинотеатров. Втроенные модули сбора контента + куча рекламных модулей.
SEO24pro CMS - Самая лучшая CMS для сайтов визиток, интернет-магазинов, а так же саттелитов. Не нужна база данных. Лучшая внутренняя оптимизация и автоматический пинг!

Пару ссылочек

Последние комментарии

Твиттер

Последние записи

Об авторе | Реклама в блоге | Контакты | Карта блога | Donation.

© 2010, Seogramota.ru. Все права защищены авторским правом.
Все тексты принадлежат владельцу seogramota.ru. Все картинки в записях блога не нарушают лицензию и авторское право, куплены здесь.
Копирование или перепечатка (даже глубокий рерайт) записей и картинок с блога без согласия автора и указания активной гиперссылки на источник строго запрещена!
Дизайн от студии «Блогоарт»

SEOgramota.Ru блог о SEO, продвижении, заработке в интернете