Programmation » Récupérer des infos sur un site ouaib
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 21:36:04,
Par Jean-ChristopheHey,
J'ai un petit projet en cours et dans le lot des trucs à faire, il y aurait la récupération d'info sur internet.
En gros, il y a deux process diférents.
1. Une page contient des infos. Régulièrement, elles sont mises à jour et je dois les réimporter dans une petite DB.
Il y a une page par record. L'adresse de la page ne change pas. Au pire, on en ajoute une à la main.
2. Une page contient toute une série de record. Le formatage est le même, ce sont des "paragraphes" avec la même construction, les un derrières les autres.
Dans les deux cas, je ne sais pas comment m'y prendre.
Le but est d'allimenter et/ou de mettre à jour une petite DB access.
Voilà , si vous avez une piste, je suis preneur.
Il n'existe pas des trucs tout fait pour ce genre de chose?
Il y aurait une petite dizaine de sources différentes.
Merci pour vos précieux conseils
J'ai un petit projet en cours et dans le lot des trucs à faire, il y aurait la récupération d'info sur internet.
En gros, il y a deux process diférents.
1. Une page contient des infos. Régulièrement, elles sont mises à jour et je dois les réimporter dans une petite DB.
Il y a une page par record. L'adresse de la page ne change pas. Au pire, on en ajoute une à la main.
2. Une page contient toute une série de record. Le formatage est le même, ce sont des "paragraphes" avec la même construction, les un derrières les autres.
Dans les deux cas, je ne sais pas comment m'y prendre.
Le but est d'allimenter et/ou de mettre à jour une petite DB access.
Voilà , si vous avez une piste, je suis preneur.
Il n'existe pas des trucs tout fait pour ce genre de chose?
Il y aurait une petite dizaine de sources différentes.
Merci pour vos précieux conseils
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 21:43:13,
Par didixLe "régulièrement" est défini ?
Enfin ca change pas grand chose, mais en gros il faudrait par exemple un script qui charge le fichier html, qui parse le code et récupère les infos pour les injecter dans la BD.
Et lancer ce script tout les X temps.
A première vue j'aurais proposé un script en Rebol, qui charge et parse facilement les fichiers html, mais comme je n'ai jamais fais qu'un exemple comme exercice, je saurais même pas t'aider plus que la théorie
Je cherche si je trouve rien d'autre
Enfin ca change pas grand chose, mais en gros il faudrait par exemple un script qui charge le fichier html, qui parse le code et récupère les infos pour les injecter dans la BD.
Et lancer ce script tout les X temps.
A première vue j'aurais proposé un script en Rebol, qui charge et parse facilement les fichiers html, mais comme je n'ai jamais fais qu'un exemple comme exercice, je saurais même pas t'aider plus que la théorie
Je cherche si je trouve rien d'autre
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 21:54:35,
Par Jean-ChristopheLe régulièrement, c'est pas si souvent que ca, c'est une fois toutes les X semaines, on ne parle pas d'un poling toute les X secondes!
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 22:29:12,
Par antpDans n'importe quel langage tu dois pouvoir télécharger la page sous forme de chaîne de texte, puis pour en récupérer les infos tu peux très bien aller chercher les infos comme une brute avec des fonctions de recherche et copie de chaînes (ce qui est fait pour les scripts de mon soft qui vont chercher les infos de films sur les sites)
En Delphi ça doit pouvoir se faire en peu de lignes, et dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.
En Delphi ça doit pouvoir se faire en peu de lignes, et dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.
mes programmes ·· les voitures dans les films ·· champion des excuses bidons
Récupérer des infos sur un site ouaib
Publié le 23/01/2008 @ 22:35:57,
Par philfrdans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.
En python c'est trivial... (en perl aussi d'ailleurs)
Mais mes solutions n'intéressent personne en général
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 08:22:20,
Par AltarEn python c'est trivial... (en perl aussi d'ailleurs)
Mais mes solutions n'intéressent personne en général
en c++(flex/bison rlz ),c#,php,ruby,bash (pour les maso),...
Et si c'était de l'xhtml strict ça irait encore plus vite
On t'aime philfr
Dernière édition: 24/01/2008 @ 08:25:39
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 08:57:48,
Par Jean-ChristopheDans n'importe quel langage tu dois pouvoir télécharger la page sous forme de chaîne de texte, puis pour en récupérer les infos tu peux très bien aller chercher les infos comme une brute avec des fonctions de recherche et copie de chaînes (ce qui est fait pour les scripts de mon soft qui vont chercher les infos de films sur les sites)
En Delphi ça doit pouvoir se faire en peu de lignes, et dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.
En Delphi ça doit pouvoir se faire en peu de lignes, et dans certains langages plus prévus pour ça on doit pouvoir le faire encore plus court.
C'est ce que je fais en vbs pour le moment.
Je récupère la page entière puis je charcute la chaîne de caractère.
mais bon, si il y a moyen de faire mieux et plus vite, je ne suis pas contre...
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 09:14:40,
Par maxun peu de manipulation de DOM ?
Trololo
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 10:24:31,
Par Jean-Christopheje ne sais pas ce que c'est
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 10:36:19,
Par Dr_DanMais mes solutions n'intéressent personne en général
Se tromper est humain ; Vraiment foutre la merde necessite le mot de passe de root.
Récupérer des infos sur un site ouaib
Publié le 24/01/2008 @ 10:36:49,
Par gizmoSi tu as un peu de temps, je te dirais de regarder du cote de Hpricot, une lib en ruby tres simple a utiliser pour recuperer des infos d'une page web. Je n'ai encore rien vu qui soit plus facile a utiliser que cela, quelque soit le language (sauf peut-etre en JS cote serveur...)
Concept vivant.