Aproveitando a dica anterior sobre manipulação de arquivos, vou aprensentar uma biblioteca do Python usada pra extrair o codigo HTML de uma pagina web, a urllib.
É bem parecido como a abertura de um aquivo texto, o metodo mais basico é o urlopen:
import urllib
pagina = urllib.urlopen('http://www.v2windcenter.com')
codigo = pagina.read()
pagina.close()
print codigo
Para mais informações sobre o modulo urllib.
terça-feira, janeiro 09, 2007
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário