2023年8月11日金曜日

日常雑記2023年8月11日

「 tensorflow」の「transformer」翻訳モデルでトレーニングさせたら

一バッチだけで訓練に一時間以上掛かる事が判明。思わず「無理」だべ

と計算を止めたが世間での訓練方法には興味がある。GPUを使ったとし

ても相応の時間は掛かる。計算サービスの利用を真剣に考えたいと思う

出来事でした。そもそも「ファインチューニング」は元となるモデルが

あれば成立するが無ければ自分で訓練する必要がある。マイナー言語で

あれば尚更です。

0 件のコメント:

コメントを投稿