※ この募集は締め切られました。
Pandasについて質問がございます
【概要】
Pandasについて教えていただきたいです
【目的】
csvを目的のアウトプットで出力する
【募集背景】
かなりピンポイントの質問となりますが、下記を解決するコードについてご教授願いたいです。
下記CSVからnameごとにグルーピングして、その中で一番古い日付の行を抽出したいです。
ただし、一つ条件があり、直近のcareerで一番古い日付行を抽出したいです。
例えば、taroは2018/02/01ではなく2022/03/01の行を抽出したいです。
下記のようなコードを書いてみたのですが、taroは2018/02/01が抽出されてしまうので
他に方法がないか、、という次第でございます。
import pandas as pd
df = pd.read_csv('test.csv')
df["date"] = pd.to_datetime(df["date"])
df.loc[df.groupby('name')['date'].idxmin()]
test.csv
date,name,career,cost
2022/05/01,taro,rakuten,1000
2022/04/15,jiro,au,2000
2022/04/01,taro,rakuten,1000
2022/03/01,taro,rakuten,1000
2022/01/10,jiro,line,2000
2022/03/10,hanako,docomo,8000
2021/03/01,taro,line,2000
2018/02/01,taro,rakuten,3000
2018/05/01,jiro,au,2000
【コミュニケーション方法】
チャットのみ
解決できるコードを提示いただければ大丈夫です。
その際、不明点がある場合は多少聞くかもしれませんが、1,2往復にする想定です。
【ご提案時のお願い】
今回始めての利用となり、色々と不備があるかもしれませんがその点ご容赦いただければと思います。
当方、python初学者となります。