Programmation » Récupérer des infos sur un site ouaib
Catégorie:  
   
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 21:36:04,
Par Jean-Christophe
Hey,

J'ai un petit projet en cours et dans le lot des trucs à faire, il y aurait la récupération d'info sur internet.

En gros, il y a deux process diférents.
1. Une page contient des infos. Régulièrement, elles sont mises à jour et je dois les réimporter dans une petite DB.
Il y a une page par record. L'adresse de la page ne change pas. Au pire, on en ajoute une à la main.
2. Une page contient toute une série de record. Le formatage est le même, ce sont des "paragraphes" avec la même construction, les un derrières les autres.

Dans les deux cas, je ne sais pas comment m'y prendre.

Le but est d'allimenter et/ou de mettre à jour une petite DB access.

Voilà, si vous avez une piste, je suis preneur.

Il n'existe pas des trucs tout fait pour ce genre de chose?
Il y aurait une petite dizaine de sources différentes.

Merci pour vos précieux conseils :smile:
   
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 21:43:13,
Par didix
Le "régulièrement" est défini ?
Enfin ca change pas grand chose, mais en gros il faudrait par exemple un script qui charge le fichier html, qui parse le code et récupère les infos pour les injecter dans la BD.
Et lancer ce script tout les X temps.

A première vue j'aurais proposé un script en Rebol, qui charge et parse facilement les fichiers html, mais comme je n'ai jamais fais qu'un exemple comme exercice, je saurais même pas t'aider plus que la théorie :ohwell:

Je cherche si je trouve rien d'autre :wink:
   
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 21:54:35,
Par Jean-Christophe
Le régulièrement, c'est pas si souvent que ca, c'est une fois toutes les X semaines, on ne parle pas d'un poling toute les X secondes!
   
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 22:29:12,
Par antp
Dans n'importe quel langage tu dois pouvoir télécharger la page sous forme de chaîne de texte, puis pour en récupérer les infos tu peux très bien aller chercher les infos comme une brute avec des fonctions de recherche et copie de chaînes (ce qui est fait pour les scripts de mon soft qui vont chercher les infos de films sur les sites)
En Delphi ça doit pouvoir se faire en peu de lignes, et dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.
mes programmes ·· les voitures dans les films ·· champion des excuses bidons
   
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 22:35:57,
Par philfr
dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.


En python c'est trivial... (en perl aussi d'ailleurs)
Mais mes solutions n'intéressent personne en général :spamafote:
   
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 08:22:20,
Par Altar


En python c'est trivial... (en perl aussi d'ailleurs)
Mais mes solutions n'intéressent personne en général :spamafote:


en c++(flex/bison rlz :ddr555: ),c#,php,ruby,bash (pour les maso),...

Et si c'était de l'xhtml strict ça irait encore plus vite :ocube:

On t'aime philfr :sweat:

Dernière édition: 24/01/2008 @ 08:25:39
   
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 08:57:48,
Par Jean-Christophe
Dans n'importe quel langage tu dois pouvoir télécharger la page sous forme de chaîne de texte, puis pour en récupérer les infos tu peux très bien aller chercher les infos comme une brute avec des fonctions de recherche et copie de chaînes (ce qui est fait pour les scripts de mon soft qui vont chercher les infos de films sur les sites)
En Delphi ça doit pouvoir se faire en peu de lignes, et dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.


C'est ce que je fais en vbs pour le moment.
Je récupère la page entière puis je charcute la chaîne de caractère.
mais bon, si il y a moyen de faire mieux et plus vite, je ne suis pas contre...
   
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 09:14:40,
Par max
un peu de manipulation de DOM ?
Trololo
   
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 10:24:31,
Par Jean-Christophe
je ne sais pas ce que c'est :kiki:
   
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 10:36:19,
Par Dr_Dan

Mais mes solutions n'intéressent personne en général :spamafote:

:calin:
Se tromper est humain ; Vraiment foutre la merde necessite le mot de passe de root. :petrus:
   
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 10:36:49,
Par gizmo
Si tu as un peu de temps, je te dirais de regarder du cote de Hpricot, une lib en ruby tres simple a utiliser pour recuperer des infos d'une page web. Je n'ai encore rien vu qui soit plus facile a utiliser que cela, quelque soit le language (sauf peut-etre en JS cote serveur...)
Concept vivant.
Répondre - Catégorie:  
Informaticien.be - © 2002-2024 AkretioSPRL  - Generated via Kelare
The Akretio Network: Akretio - Freedelity - KelCommerce - Votre publicité sur informaticien.be ?