Дообучение ruGPT-3 5 13B с LoRA Хабр
В противном случае получится лонгрид, так что я буду разбавлять текст левыми пикчами, просто держу в курсе. В результате в директории output появится файл pytorch_model.bin, и будет весить примерно 56Гб, по времени процедура слияния занимает примерно минут. Как я упомянул ранее, на Хабре мелькала публикация о проекте rulm, автор данной публикации подробно рассказал о том, […]
Дообучение ruGPT-3 5 13B с LoRA Хабр Read More »