学習方法

メンター情報

料金

対応時間帯

返信スピード

学習方法

メンター情報

料金

対応時間帯

返信スピード

募集をシェアしてメンターを探そう
シェア

※ この募集は締め切られました。

AI・機械学習 Python XGB 自然言語処理

XGBを教えてください。

2022年7月1日
単発
予算
1,000円 〜 2,500円
提案数
1人が提案中
応募期限
終了

秘密保持がお願いできる方

【概要】
XGBoostに関する以下2点を教えてくださる方を募集します。

①カテゴリカルデータ(性別・年齢層など)と自然言語データ(自由記述文章)を用いて、XGBoostで二値分類をしたい。
②特徴量も確認したい(が、現在はF1985など別ラベルが貼られており、人間が可読可能な状態に戻したい。)

【目的】
カテゴリカルデータと自然言語からXGBを回すことを目指しております。
特徴量も確認したいです。

【募集背景】
①カテゴリカルデータと自然言語からXGBを回すことを目指しております。
・ワンホットエンコードしたカテゴリカルデータ、
・Vectorizerを用いた自然言語、
それぞれ単体であれば回るのですが、これら二つを同時に用いてXGBを回すことができず困っています。
エラー対処をしても次から次へ、という感じでしたので、理由も含めどなたかにご教授いただきたいと思いました。
(エラー例)
#ValueError: feature_names may not contain [, ] or <
#ValueError: feature_names must be unique
#ValueError: DataFrame.dtypes for data must be int, float or bool.
Did not expect the data types in fields words


②特徴量も確認したい(が、現在はF1985など別ラベルが貼られており、人間が可読可能な状態に戻したい。)こうなる原理も教えていただけると幸いです。

・from sklearn.feature_extraction.text import CountVectorizer を単語のベクトル化に使用
・import xgboost as xgb
・xgb.plot_importance こちらでプロットしたところF 1985〜などの数値になってしまった

k

プロフィール

学生です

--

募集をシェアしてメンターを探そう
シェア