※ この募集は締め切られました。
[機械学習:回帰モデル] deap 遺伝的アルゴリズムを用いた特徴量選択、特徴量生成の実装がしたいです!
<募集例>
deap 遺伝的アルゴリズムを用いた特徴量選択、特徴量生成の実装をサポートしていただける方を募集しています
【概要】
下記回帰モデルの実装がしたいです。
https://datachemeng.com/gaplsgasvr/
https://qiita.com/overlap/items/e7f1077ef8239f454602
【目的】
食品素材のポテンシャルを評価するため、回帰モデルを作成し、未知機能の推定を行いたい
【募集背景】
素材の機能探索に機械学習を用いることができないか検討を行っています。
方法としてChEMBL(https://www.ebi.ac.uk/chembl/)にて落としたデータセットcsv をpandas にて読み込み
↓
RDkit の分子記述子計算で特徴量を計算
↓
目的変数との回帰モデルを作成、評価
という流れで検討を行っています。
しかし、クロスバリデーションスコア(以下スコア)が0.6以上に向上しないことに課題を感じています。
回帰モデルのチョイスやグリッドサーチをいじってみてもスコアが改善しないので、特徴量をいじってみようかと思い、遺伝的アルゴリズムを使用した検討を行っています。
https://datachemeng.com/gaplsgasvr/
https://qiita.com/overlap/items/e7f1077ef8239f454602
上記のコードを参考に遺伝的アルゴリズムの作成を行っています。コードに記載されているデータセット(sklearn datasets.make_regressionで作成されたデータセット)上では動作の確認ができたのですが、自身で用意したデータセットを読み込ませてコードを実行するとエラーが出てきてしまいます。
pythonを始めて日が浅く、このエラーが何により生じているのかがわかりません。ご教授いただける幸いです。
【コミュニケーション方法】
チャットのみ or チャットとビデオ通話の両方希望
【参考URL】
作成したコードをgithub に掲示しました
https://github.com/takasashi/Regression_addGA