def Python():: Extraindo HTML de uma página

terça-feira, janeiro 09, 2007

Extraindo HTML de uma página

Aproveitando a dica anterior sobre manipulação de arquivos, vou aprensentar uma biblioteca do Python usada pra extrair o codigo HTML de uma pagina web, a urllib.

É bem parecido como a abertura de um aquivo texto, o metodo mais basico é o urlopen:

import urllib
pagina = urllib.urlopen('http://www.v2windcenter.com')
codigo = pagina.read()
pagina.close()
print codigo

Para mais informações sobre o modulo urllib.

Nenhum comentário:

Postar um comentário

def Python():

terça-feira, janeiro 09, 2007

Extraindo HTML de uma página

Nenhum comentário:

Perfil

Marcadores

Arquivo do blog

Links