※ この募集は締め切られました。
Webスクレイピングによるデータ収集方法について
2021年12月1日
単発
予算
5,000円 〜
10,000円
提案数
5人が提案中
応募期限
終了
現在、独学でPythonを学習中。
競馬関係の仕事につき、データ収集を自動化したい。
目的は、競馬情報サイト数ページからデータを取り出し、Googleスプレッドシートにまとめる。
悩みは、データを特定するクラスの指定ができないこと。
目的はGoogleスプレッドシートに表としてまとめることなので、方法はスクレイピングにこだわらないことも考えています。
データの収集に最適な方法があればご教授願いたいです。
以下、詳細となります。
競馬情報サイト
JRA:https://www.jra.go.jp/
ネット競馬:https://www.netkeiba.com/?rf=navi
ウマニティ:https://umanity.jp/
いずれかのサイトから、
・レース毎の騎手名と馬番のみ抽出。(例.ルメール 14 2 3 9 - 10 10 - 12 15 15 16)
・同様に調教師名と馬番を週出。
それらをGoogleスプレッドシートにまとめ表・テーブル表示
一覧で〇〇騎手が〇レースの何番に乗っているのかを知りたいです。