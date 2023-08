Numpy (Utilise des opérations mathématiques matricielles)

(Utilise des opérations mathématiques matricielles) PyTorch (Construit des modèles de Deep Learning)

(Construit des modèles de Deep Learning) Datasets (Accéde aux datasets du hub huggingface)

(Accéde aux datasets du hub huggingface) Huggingface_hub (accès aux données et modèles de huggingface)

(accès aux données et modèles de huggingface) Transformers (Accès aux modèles du hub HuggingFace)

(Accès aux modèles du hub HuggingFace) Trl (Transformer Reinforcement Learning. Et fine-tuning.)

(Transformer Reinforcement Learning. Et fine-tuning.) Bitsandbytes (rend les modèles plus petits, alias " quantization ")

(rend les modèles plus petits, alias " ") Sentencepiece (schéma de codage par paires d'octets, alias " tokenization ")

(schéma de codage par paires d'octets, alias " ") OpenAI (Création de données de modèles synthétiques de réglage fin et de récompense)

(Création de données de modèles synthétiques de réglage fin et de récompense) TVM (Tensor Virtual Machine, convertit le modèle onnx pour une utilisation multiplateforme efficace)

(Tensor Virtual Machine, convertit le modèle onnx pour une utilisation multiplateforme efficace) Peft (Parameter Efficient Fine Tuning, utilisation de l'adaptation de rang faible (LoRa) pour le réglage fin)

(Parameter Efficient Fine Tuning, utilisation de l'adaptation de rang faible (LoRa) pour le réglage fin) Onnx (Conversion du modèle entraîné au format universel)

Code : Sélectionner tout pip install numpy torch datasets huggingface_hub transformers trl bitsandbytes sentencepiece openai tvm peft onnx

git clone https: //github.com/llSourcell/DoctorGPT.git jupyter training.ipynb

Installez toutes les dépendances en une seule ligne à l'aide de pipAfin d'entraîner le modèle, vous pouvez exécuter le notebook training.ipynb localement ou à distance via un service cloud comme Google Colab Pro. Le processus d'entraînement nécessite un GPU, et si vous n'en avez pas, l'option la plus accessible que j'ai trouvée est d'utiliser Google Colab Pro qui coûte 10$/mois. La durée totale de l'entraînement pour DoctorGPT, y compris l'ajustement supervisé du modèle LLama initial sur des données médicales personnalisées, ainsi que son amélioration via l'apprentissage par renforcement à partir du feedback de l'IA conditionnelle, a pris 24 heures sur une instance payante de Google Colab.