Buongiorno,
Ultimamente sto chiedendo spesso il vostro aiuto per chiudere un problema riguardo estrazione di dati riguardo farmaci per il completamento di un indice per una organizzazione benevole (io lavoro a scopo no profit) e per questo apprezzo moltissimo il vostro contributo prezioso. Detto ciò, il problema dovrebbe essere molto simile ad un post in precedenza soltanto con una piccola differenza. Vi ho chiesto un aiuto nell'estrarre dati da una pagina web riguardo dei farmaci, problema risolto alla perfezione in questo post http://www.pc-facile.com/forum/viewtopic.php?f=26&t=109381, adesso però la componente di estrazione dati rimane più o meno la stessa ma mentre prima le pagine erano poche, e quindi le cambiavo a mano, ora sono diventato molte di più.
Nello specifico io ho una lista di circa 1000 termini per i quali dovrei trovare i farmaci associati tramite questo motore di ricerca:
https://www.torrinomedica.it/farmaci/ricercadbfarmaci/formIN.asp
Per ogni termine è possibile che ci siano dei farmaci associati come ad esempio per Diabete come possiamo visualizzare qui:
https://www.torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=diabete&IN2=&IN3=
Oppure è possibile che non ci sia alcun farmaco associato come ad esempio per Acalasia:
https://www.torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=acalasia&IN2=&IN3=
Ho notato che l'URL è esettamente lo stesso, ma cambia solo in una parte finale come evidenziato qui sotto:
https://www. torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=acalasia&IN2=&IN3=
https://www. torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=acetonemia&IN2=&IN3=
https://www. torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=acne&IN2=&IN3=
https://www. torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=acidosi+metabolica&IN2=&IN3=
Quindi pensavo che con un codice basti sostituire quella parte dell'URL con una lista di parole che do come input, e poi procedere con il download dei farmaci, se presenti (da notare che acidosi metabolica, una parola composta da più parole, genera il link con il + e non so se questo sia un problema). Fatemi inoltre sapere se è necessario che vi dia il file con i termini di input, oppure queste informazioni sono sufficienti.
Il risultato sperato sarebbe avere coppie di associazioni per riga semplicemente con l'input ed il nome dei farmaci se presenti, ad esempio per Ciglia:
Ciglia | Azzalure
Ciglia | Blefarolin
Ciglia | Bocouture
Ciglia | Oftasteril
Ciglia | Vistabex
Ecco la pagina web per la conferma https://www.torrinomedica.it/farmaci/ricercadbfarmaci/RisultatiIN.asp?IN1=ciglia&IN2=&IN3=
Mi rendo conto che cosi la lista potrebbe essere estremamente lunga e quindi non so se conviene dividere il download delle informazioni (diabete ha oltre 600 medicinali associati ad esempio, anche se probabilmente è un caso limite).
Spero di essere stato chiaro e per qualsiasi considerazione scrivete pure.
Grazie ancora per il vostro tempo e buona serata.