Extraire les liens d’un site web et enregistrer les dans un fichier XML

Author:

 fichier, url, url
{filelink=16798}

import xml.dom.minidom
import urllib
 
f = urllib.urlopen('http://fr.yahoo.com')
doc = xml.dom.minidom.parse(f)
as = doc.getElementsByTagName('a')
for a in as:
    valeur= a.getAttribute('href')
    if value:
        newtext = doc.createTextNode(' (((%s)))'%value)
        a.parentNode.insertBefore(newtext,a)
 
doc.writexml("liens.xml", 'utf-8')

Livres Sur ce Sujet

Apprendre à programmer avec Python 3 Apprenez à programmer en Python Python : Petit guide à l’usage du développeur agile Apprendre à programmer avec Python 3 : Avec plus de 50 pages de corigés d’exercices !

Leave a Reply

Your email address will not be published. Required fields are marked *


eight × = 32