※ この募集は締め切られました。
【AI・機械学習 / 機械学習】音声解析による性格診断の疑問点に答えてくださる方を探しています
【教えてもらいたいこと】
AI・機械学習/機械学習
【具体的な相談内容】
募集概要
AWS上で、会話音声からBig Five(ビッグファイブ)性格特性を推定するPoCを進めています。オープンソース優先で、設計・実装・評価についてメンタリングいただける方を募集します。Big Five(ビッグファイブ)とは:人の性格を5つの連続的な特性で表す心理学モデルです。開放性(O)=新しい体験や発想を好む傾向、誠実性(C)=計画性・自己管理、外向性(E)=社交性・活動性、協調性(A)=思いやり・利他性、神経症傾向(N)=ストレスや不安の感じやすさ。今回は会話の内容(テキスト)と話し方(話速・抑揚・間などの音声特徴)から、各特性を連続値で推定する仕組みを目指します。
想定タスク(現時点では相談ベース)
・全体アーキテクチャの方針検討・レビュー(OSS優先、必要に応じてAWSサービス併用)
・前処理パイプラインの設計相談(話者分離・ロール付与・匿名化・セグメント化)
・テキストおよび音声特徴の抽出・結合方法(late fusion 等)の選定支援
・学習・評価設計(学生単位分割、相関・MAE、保留ルール、不確実性推定)
歓迎スキル
・音声処理:WhisperやWhisperX、NeMo もしくは PyAnnote の実装経験
・NLP:日本語BERTや多言語モデルの微調整、文章回帰または多出力回帰の経験
・音声表現:wav2vec2、HuBERT、WavLM、プロソディ特徴抽出(torchaudio、Praat Parselmouth 等)
・ML評価設計:GroupKFoldやLOSO 等のリーク防止設計、相関・MAEの運用
・データ倫理:同意取得・匿名化・利用制限の設計経験
作業環境
・AWS:S3、EC2(必要に応じて Transcribe は任意)
・言語・ツール:Python、PyTorch、Docker(任意)