--
※ この募集は締め切られました。
MeCab(の C#版 NMeCab)について教えてほしいです。
【概要】
MeCabのC#版NMeCabの辞書ファイルを自作(またはデフォルトに追記が尚良し)したいのですが、
当方この分野の知識が少なく、詳細の読解を手伝っていただける方を募集しています。
【 NMeCab 】
https://github.com/komutan/NMeCab#%E8%BE%9E%E6%9B%B8%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%81%AB%E3%81%A4%E3%81%84%E3%81%A6
【 辞書ファイル 】
「辞書ファイルについて」の項目に、
「MeCabのサイトなどを参照してください。」
とあり、MeCabのリンクは下記になります。
https://taku910.github.io/mecab/
【 ゴール 】
ゴールは段階ごとに考えています。(①のみでも構いません。)
①上記の内容読解について補助、私の疑問点、質問に回答
②上記辞書ファイルの作成方法について手順を解説
③下記、【 目的 】について詳細な考察・アドバイスを解説
④具体的に、辞書ファイル作成について完成(plamのテスト確認)までフォロー(継続契約)
【 目的 】
SNSアプリ(ミニゲーム)を作成するにあたり、
連絡先の交換がされることをなるべく防ぎたいです。
連絡先の交換が下記機能により(ゼロにはできないとしても)減らせれば、
それによる犯罪・事件へ発展してしまうことを減らせるのではないかと考えます。
もちろんアプリのポリシーによって、迷惑行為や上記を禁止します。
そして、ポリシーだけでなく防止機能も合わせて搭載します。
ミニゲームなので、このフィルタが厳重で、
ユーザーの体験が損なわれることがあっても、構いませんし、
もしどちらかであれば、体験より安全性を選びます。
そのためAIによるテキストフィルターで、
連絡先と判別されたテキストを
「●●●●」など黒塗りなどにしたいので、
(AIの知識はゼロですが)
これからAIに関して知識習得し、実装へと進みたいです。
日本語のテキストフィルターには、形態素解析が関わるとのことで、
MeCab(NMeCab)に行きつきましたが、
テストコードでは、たとえば
「ぜろはちぜろよんよんさんに」などの(電話番号を例とする)数字を示唆するワードが、
デフォルト辞書では感知できないので、
上記サイトの説明を読み、辞書ファイルを作成したいと思いました。
それについて解説フォローをしていただける方を探しています。
私が考える連絡先は、以下になります。
・電話番号
・メールアドレス
・その他のSNSアカウント
(・住所?)
【コミュニケーション方法】
Zoom 顔出しなし ※復習のため録画させていただけるとありがたいです。
【 ご料金 】下記ご対応可能なものをご提案ください。
①上記の内容読解について補助、私の疑問点、質問に回答
→3,000円/単発
②上記辞書ファイルの作成方法について手順を解説
→4,000円~5,000/単発
③下記、【 目的 】について詳細な考察・アドバイスを解説
→4,000円~5,000/単発
④具体的に、辞書ファイル作成について完成(plamのテスト確認)までフォロー(継続契約)
→ご相談
以上です。
どうぞよろしくお願いいたします。
プロフィール
2021年の9月ごろからMentaに登録しました。
プログラミングで分からないことを、
教えていただく方で利用しています。
プログラム経験は浅いですが、
Excelの資格を取ってみてから、今の職につけ、
仕事ではGASなどを使い業務効率化ツールを作成したりしています。
趣味でUnityをマイペースで使っていて、
最近はWordpressを始めました。
自分の力で解決したいと思い、
何日も時間を費やしてしまうことがありますが、
先生に聞いた方が全然いいですね。
大切なことは、今ある課題をクリアすることです。
問題を解決して先へ進むために、
どんどんこちらを利用していきたいと思っていますので、どうぞよろしくお願いいたします。
--