0

目標

エクセルの検索リストがあり

検索ワード1つにつき、検索結果上位5件のURLを取得したい

条件

・環境の都合上ソフト等の使用ができない

・ブラウザはEdge、検索エンジンはGoogle

実行済み方法

①検索ワードをGoogleで検索

②検索結果画面でXpathを用いて「属性値の取得」からhrefに含まれるURLを取得

③エクセルに取得URLを入力

 使用Xpath //*[@id="rso"]/div[n]//a (n=1~5、上位5件取得するため、1単語につき②~③を5回繰り返している)

問題点

多くのワードの場合このXpathで問題なく取得できるが

しばしば取得できないワードがある(検索結果画面の要素構成によるものと思われる)

例:禁酒法(検索結果上部に特殊構成があるため阻害されたものと想定)

  アルマゲドン(上記と同様、キャスト等の表示も要因の一つか?)

  セントラリア(画像表示が阻害と想定)

  ジャニーズ(ニュースリンク多数が要因と想定)

  ラノベ(関連する質問が阻害と想定)
(例はランダム単語ガチャというサイトから抜き出したものなので業務と関係なし)

これらを回避できるXpathの指定方法(場合分け含む)

あるいは何か別のURL取得方法、解決策等ありますでしょうか。

教えていただけますと幸いです。

この質問は解決済みのためクローズされています。
ああああ ベストアンサーとして選択しました
回答とコメントは、会員登録(無料)で閲覧できるようになります。