dolly - 这使用 Databricks 笔记本微调了alpaca数据集上的GPT-J 6B模型。

Created at: 2023-03-25 00:15:53
Language: Python
License: Apache-2.0

洋娃娃

这使用 Databricks 笔记本微调了 Alpaca 数据集上的 GPT-J 6B 模型。请注意,虽然 GPT-J 6B 已获得 Apache 2.0 许可,但 Alpaca 数据集根据知识共享非商业性 (CC BY-NC 4.0) 授权。

入门培训

  • 将存储库添加到数据砖(在存储库下单击添加存储库,输入 ,然后单击创建存储库)。
    dolly
    https://github.com/databrickslabs/dolly.git
  • 启动具有 8 个 A100 GPU 的节点类型的单节点群集(例如 或 )。
    12.2 LTS ML (includes Apache Spark 3.3.2, GPU, Scala 2.12)
    Standard_ND96asr_v4
    p4d.24xlarge
  • 在存储库中打开笔记本,附加到 GPU 群集,然后运行所有单元。训练完成后,笔记本会将模型保存在 .
    train_dolly
    dolly
    /dbfs/dolly_training

在本地运行单元测试

pyenv local 3.8.13
python -m venv .venv
. .venv/bin/activate
pip install -r requirements_dev.txt
./run_pytest.sh