ユーザー登録で「300円クーポン」プレゼント!まずは無料登録から!
募集をシェアしてメンターを探そう
シェア
エンジニア スクレイピング Python Google

Webスクレイピングによるデータ収集方法について

2021年12月1日
単発
予算
5,000円 〜 10,000円
提案数
5人が提案中
応募期限
あと 4
01月27日まで

現在、独学でPythonを学習中。
競馬関係の仕事につき、データ収集を自動化したい。
目的は、競馬情報サイト数ページからデータを取り出し、Googleスプレッドシートにまとめる。
悩みは、データを特定するクラスの指定ができないこと。
目的はGoogleスプレッドシートに表としてまとめることなので、方法はスクレイピングにこだわらないことも考えています。
データの収集に最適な方法があればご教授願いたいです。
以下、詳細となります。

競馬情報サイト
JRA:https://www.jra.go.jp/
ネット競馬:https://www.netkeiba.com/?rf=navi
ウマニティ:https://umanity.jp/

いずれかのサイトから、
・レース毎の騎手名と馬番のみ抽出。(例.ルメール 14 2 3 9 - 10 10 - 12 15 15 16)
・同様に調教師名と馬番を週出。

それらをGoogleスプレッドシートにまとめ表・テーブル表示
一覧で〇〇騎手が〇レースの何番に乗っているのかを知りたいです。

メンティーに提案してみましょう
募集をシェアしてメンターを探そう
シェア