- 2023.4.21: Mozzipa님께서 🤗KoVicuna7B 기반 ko_vicuna_7b_ggml_q4 모델 을 공개해주셨습니다. 🙏🏻
- 2023.4.20: 🤗LLAMA 7B 기반 KoVicuna 모델 을 공개합니다.
Vicuna 모델을 학습한 방식과 동일한 방식과 모델셋으로 학습을 진행한, 한국어 Vicuna 모델입니다.
데이터셋은 기본적으로 ShareGPT에서 제공한 62만 대화문 데이터셋을 기반으로 합니다.
해당 대화문을 DeepL 을 통해 모두 번역했습니다. 번역본 링크
- 번역된 62만 대화문과 Vicuna 7B 를 준비
- A100 * 8 개로 15시간 동안 학습 진행
- 자세한 학습 내역은 이곳을 참고해주세요.
코랩프로일 경우 코랩에서 바로 사용해 보실수 있습니다.
이 주소를 통해 코랩에 들어간후 자세한 가이드를 따라해주세요.
해당 모델은 비쿠나1.1v으로 학습되었으므로 우바부가를 사용할경우 Character 탭 에서 다음을 설정해주세요.
- Your name -> USER:
- Character's name -> ASSISTANT:
- 준의 허깅페이스에서 가중치 를 확인할 수 있습니다.
- JUNE LEE - 송도 인공지능 스터디와 GDG송도에서 활동하고 있습니다.