1. камеры
  2. Аудио & Электроника автомобиля
  3. Главная Аудио
  4. Личная Аудио
  5. телевизоры
  6. Умный дом
  >> Россия Электронный Технологии >  >> Умный дом >> Умная жизнь

Как создать веб-бота

Поисковые системы, такие как Google или Yahoo!, втягивают веб-страницы в свои результаты поиска с помощью веб-ботов (также иногда называемых поисковыми роботами или поисковыми роботами), которые представляют собой программы, сканирующие Интернет и индексирующие веб-сайты в базе данных. Веб-боты могут быть созданы с использованием большинства языков программирования, включая C, Perl, Python и PHP, каждый из которых позволяет разработчикам программного обеспечения писать сценарии, выполняющие процедурные задачи, такие как веб-сканирование и индексирование.

Шаг 1

Откройте приложение для редактирования обычного текста, например Блокнот, входящий в состав Microsoft Windows, или TextEdit в Mac OS X, где вы создадите приложение веб-бота Python.

Шаг 2

Запустите сценарий Python, включив следующие строки кода и заменив URL-адрес примера на URL-адрес веб-сайта, который вы хотите сканировать, и имя базы данных-образца на базу данных, в которой будут храниться результаты:

импортировать urllib2, re, string enter_point ='http://www.exampleurl.com' db_name ='example.sql'

Шаг 3

Включите следующие строки кода, чтобы определить последовательность операций, которым будет следовать веб-бот:

def uniq(seq):set ={} map(set.setitem , seq, []) вернуть set.keys()

Шаг 4

Получите URL-адреса в структуре веб-сайта, используя следующие строки кода:

def geturls(url):items =[] request =urllib2.Request(url) request.add.header('User', 'Bot_name;)') content =urllib2.urlopen(request).read() items =re. findall('href="http://.?"', content) urls =[] вернуть URL

Шаг 5

Определите базу данных, которую будет использовать веб-бот, и укажите, какую информацию он должен хранить для завершения создания веб-бота:

db =open(db_name, 'a') allurls =uniq(geturls(enter_point))

Шаг 6

Сохраните текстовый документ и загрузите его на сервер или компьютер с подключением к Интернету, где вы сможете выполнить сценарий и начать сканирование веб-страниц.


  1. Как сделать картинки Букмарклеты
  2. Как сделать копию рентгеновского снимка
  3. Как использовать веб-браузер
  4. Как создать собственный веб-сервер
  5. Как сделать тире в InDesign