Skip to content

Train the model which was uploaded to Huggingface  #8

@OzoneAsai

Description

@OzoneAsai

I want to train the model which was uploaded to Huggingface.
https://huggingface.co/Tanrei/GPTSAN-japanese
Could you make a code to train and model it?

簡潔にまとめると以下のようになります。
Huggingface のpyTorch なGPTSAN をファインチューニングしたいのでレイヤー操作と追加層のトレーニングを行うコードをどこかにお願いします。

  1. pyTorch なモデルのファインチューニングを行うコード
  2. pyTorch なモデルのレイヤー等の操作を行うコード
  3. 置き場所の決定

多分以上のような工程になるかなと思います。(しらんけど)
恐れ入りますが、よろしくお願いします...

ついでに、Spaceも作りました。(性能と生成文字数の都合で時間がかかります。)
https://huggingface.co/spaces/OzoneAsai/GPTsan2

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions