HtmlToText
codemark # ! / world / codemark / env blog ” we do just developing ! “ home a propos contact juin 25 parser un fichier rss/atom en python python aucun commentaire » sûrement vous avez déjà eu besoin de parser un document xml avec python , cela va être facile avec l’api dom ou sax fournis comme librairies standards avec python , mais si vous voulez parser un fichier rss/atom c’est plus la peine de passer par dom ou sax , il existe un module python qui est fait pour ça et qui facilite bien les choses le module s’appel feedparser écrit par mark pilgrim l’auteur de ‘dive into python’ lui même , ce module utilise l’api sax mais si elle n’est pas disponible chez vous , il va parcourir le flux en utilisant des expressions régulières donc ça marche toujours. feedparser est très facile à utiliser voici un exemple d’utilisation basique : >>> from feedparser import parse >>> myfeed = parse(”http://codemark.tuxfamily.org/feed”) pour avoir des informations relatives au feed lui même >>> print myfeed[’feed’][’title’] codemark >>> myfeed[’feed’][’title’] #le résultat est toujours en unicode u’codemark’ >>> myfeed.feed.title u’codemark’ >>> myfeed.feed.link u’http://codemark.tuxfamily.org’ et on peut facilement parcourir tout les entrés existants >>> for item in myfeed[’entries’]: print item.title un autre module netvibes : tinyurl ! soap en python librairie de validation javascript < 1ko présentation de cookiecrumbler sous zope le module est disponible en téléchargement ici , avec une documentation complète partager cet article : ces icônes sont des liens vers des sites de partage de signet sociaux où les lecteurs peuvent partager et découvrir de nouveaux liens. juin 12 un autre module netvibes : tinyurl ! netvibes aucun commentaire » une autre création !, voici un module netvibes simple mais très efficace . si vous avez des liens url longs (http://site.tld/page.php?id=kidnjnduiokndgvgfsgsgt&pg=10255odoejiejeoojeedkj…) que vous voulez poster dans un forum ,ou bien les envoyer dans un email , parfois ces paramètres sont mélangés avec les balises html , enfin c’est pas très pratique , ce module va donc vous faciliter la vie , grace au service fourni gratuitement par tinyurl.com. un url long devient donc un url de 15 caractères environ (exemple : http://tinyurl.com/ikod5) personnellement j’utilise ce genre d’url quand je veux ajouter mon site dans une annuaire qui n’a pas un bon pagerank donc ça va influencer sur le mien, comme ça j’ai toujours des visiteurs , et google ne vois pas mon url dans l’annuaire module tiny url dans netvibes partager cet article : ces icônes sont des liens vers des sites de partage de signet sociaux où les lecteurs peuvent partager et découvrir de nouveaux liens. juin 07 soap en python python , tutoriels 5 commentaires » soap ? le soap (simple object access protocol) est un protocole d’échange d’information entre deux objets distants en format xml, il permet d’appeler une fonction distante et de récupérer son résultat . plusieurs sites publient leurs services pour qu’il soit accessible à tout le monde par exemple : altavista (service de traduction) , google (recherche ..) … donc l’utilisation du soap réside dans le faite d’appeler une ou plusieurs fonctions et d’en récupérer le résultat , mais le problème c’est que pour un service quelconque on connais pas les fonctions disponibles et même si on les connais , il nous faut bien savoir les paramètres qu’on doit passer à cette fonction , le typage etc , c’est pourquoi chaque service web utilisant soap, publie un fichier xml qui contient touts les fonctions disponibles et leur paramètres , leur type et l’objet en retour , ce fichier xml est structuré de manière que tout les clients soap puissent comprendre son contenu , c’est une normalisation standard appelé wsdl (web services description language). dans ces lignes qui vont venir je vais illustrer l’utilisation de soap en python à l’aide du module soappy . comme vous le savez déjà python rend la programmation un jeux d’enfant , pour interroger un servce web rien de plus facile , plusieurs modules sont disponible pour atteindre notre but , (soappy , zsi ..) , j’ai choisi d’utiliser soappy . soappy est disponible en téléchargement ici , et n’oublier pas d’installer pyxml et fpconst avant de procéder à l’installation de soappy , maintenant passant au code : pour démarrer un service web rudimentaire : le serveur >>> import soappy >>> def helloworld(): return “hello world !” >>> server = soappy.soapserver((”127.0.0.1″, 80)) >>> server.registerfunction(helloworld) >>> server.serve_forever() le client : >>> import soappy >>> server = soappy.soapproxy(”http://127.0.0.1:80/”) >>> print server.helloworld() simple non ? maintenant on va faire quelque chose de plus intéressant altavista possède un service web soap , qui va nous permettre de faire une traduction sur un texte , donc on a besoin de connaître la fonction qu’on doit appeler et les paramètres à passer non ? on a besoin donc besoin du fameux fichier wsdl . on a donc notre fichier wsdl , il contient tout ce qu’on veux savoir il contient aussi l’adresse le service web soap de babelfish . on va commencer par récupérer toutes les fonctions fournis dans ce fichier >>> from soappy import wsdl >>> fichier_wsdl = ‘http://www.xmethods.net/sd/2001/babelfishservice.wsdl’ >>> wsdl = wsdl.proxy(fichier_wsdl) >>> print wsdl.methods.keys() [u’babelfish’] >>> l’objet wsdl nous fourni une liste nommée methodes , qui contient toutes les fonctions trouvés dans le fichier de définition wsdl voici le code si on veux connaître comment utiliser cette fonction : >>> info = wsdl.methods[’babelfish’] >>> for param in info.inparams: print param.name , ‘:’ , param.type translationmode : (u’http://www.w3.org/2001/xmlschema’, u’string’) sourcedata : (u’http://www.w3.org/2001/xmlschema’, u’string’) >>> for param in info.outparams: print param.name , ‘:’ , param.type return : (u’http://www.w3.org/2001/xmlschema’, u’string’) donc d’après le fichier wsdl , altavista nous fournis une seule fonction nommée babelfish qui reçoit deux paramètres le premier translationmode (le mode de traduction) et le deuxième sourcedata (le texte à traduire) . on va appeler cette fonction pour traduire un texte en français vers l’anglais >>> resultat = wsdl.babelfish(’fr_en’,'oui , non , quoi , comment ?’) >>> print resultat yes, not, what, how? voilà donc notre texte traduit ressources : xmethodes et programmableweb : pour une liste de services web http://www.xmethods.net/tryit.html?url=votre_fichier_wsdl : pour tester un service web directement soapui : un utilitaire open source pour développer et tester votre service web partager cet article : ces icônes sont des liens vers des sites de partage de signet sociaux où les lecteurs peuvent partager et découvrir de nouveaux liens. juin 04 librairie de validation javascript < 1ko javascript 3 commentaires » si vous créer souvent des formulaires vous aurez sûrement besoin de valider ses champs , quand je cherche dans le net je trouve des librairies très complète et de grande taille , ce qui ralenti le chargement de la page , et dans la plupart des temps j’ai pas besoin de toutes ces fonctionnalités . voici donc une librairie qui fait 817 octets de taille et 663 octets compressé !! , mais qui contient tout ce dont j’ai besoin dans la plupart du temps. description des fonction qu’elle contient : toutes les fonctions retournent un boolean sauf la fonction o() et v() la fonction o() retourne un objet existant dans la page , au lieu d’utiliser document.getelementbyid(’id_elem’) la fonction v() retourne la valeur d’un champ la fonction isempty() : test si un champ est vide ou non la fonction ismail() : test la validité d’un adresse mail la fonction isip() : test la validité d’u
Informations Whois
Whois est un protocole qui permet d'accéder aux informations d'enregistrement.Vous pouvez atteindre quand le site Web a été enregistré, quand il va expirer, quelles sont les coordonnées du site avec les informations suivantes. En un mot, il comprend ces informations;
WHOIS LIMIT EXCEEDED - SEE WWW.PIR.ORG/WHOIS FOR DETAILS
REFERRER http://www.pir.org/
REGISTRAR Public Interest Registry
SERVERS
SERVER org.whois-servers.net
ARGS tuxfamily.org
PORT 43
TYPE domain
RegrInfo
REGISTERED unknown
DOMAIN
NAME tuxfamily.org
NSERVER
NS2.STAFF.TUXFAMILY.NET 212.85.158.2
NS1.STAFF.TUXFAMILY.NET 188.121.227.54
Go to top