2024年5月6日月曜日

日常雑記2024年5月6日

 機械学習用データの生成を検討しているが日本語のもの関しては

著作権の問題から随分と少ない。まぁ仕方ないかな。加えて加工

の手間も問題となる。狙った学習をさせる為にはデータ加工精度

は非常に重要です。この辺りは悩ましい問題だ。今のところ簡単

に思いつくのは官公庁のホームページデータを素材とする事かな。

問題は加工精度と狙いだよなぁ。悩むねぇ。

0 件のコメント:

コメントを投稿