学習方法

メンター情報

料金

対応時間帯

返信スピード

学習方法

メンター情報

料金

対応時間帯

返信スピード

mog

python初学者です
プロフィールをもっとみる

--

募集をシェアしてメンターを探そう
シェア

※ この募集は締め切られました。

ビジネス Python pandas

Pandasについて質問がございます

2022年5月26日
単発
予算
1,500円 〜 1,500円
提案数
4人が提案中
応募期限
終了

【概要】
Pandasについて教えていただきたいです

【目的】
csvを目的のアウトプットで出力する

【募集背景】
かなりピンポイントの質問となりますが、下記を解決するコードについてご教授願いたいです。

下記CSVからnameごとにグルーピングして、その中で一番古い日付の行を抽出したいです。
ただし、一つ条件があり、直近のcareerで一番古い日付行を抽出したいです。
例えば、taroは2018/02/01ではなく2022/03/01の行を抽出したいです。

下記のようなコードを書いてみたのですが、taroは2018/02/01が抽出されてしまうので
他に方法がないか、、という次第でございます。
import pandas as pd
df = pd.read_csv('test.csv')
df["date"] = pd.to_datetime(df["date"])
df.loc[df.groupby('name')['date'].idxmin()]


test.csv
date,name,career,cost
2022/05/01,taro,rakuten,1000
2022/04/15,jiro,au,2000
2022/04/01,taro,rakuten,1000
2022/03/01,taro,rakuten,1000
2022/01/10,jiro,line,2000
2022/03/10,hanako,docomo,8000
2021/03/01,taro,line,2000
2018/02/01,taro,rakuten,3000
2018/05/01,jiro,au,2000


【コミュニケーション方法】
チャットのみ

解決できるコードを提示いただければ大丈夫です。
その際、不明点がある場合は多少聞くかもしれませんが、1,2往復にする想定です。

【ご提案時のお願い】
今回始めての利用となり、色々と不備があるかもしれませんがその点ご容赦いただければと思います。
当方、python初学者となります。

mog

プロフィール

python初学者です

--

募集をシェアしてメンターを探そう
シェア