본문 바로가기 주메뉴 바로가기

누구나 온디바이스에서 생성 AI 구현하는 시대로...메타 ·구글·미스트랄에 이어 MS, sLLM ‘파이 2‘ 완전 오픈 소스화!

등록일 2024-01-11 작성자 권서연 조회수 2677

 

 

매개변수(Parameter)를 기존 대형언어모델(Large language models. 이하, LLM)에 비해 변수의 수가 60억(6B) 내지 100억(10B) 개로 줄여 학습을 위한 소요 비용이나 시간을 절감할 수 있으며, 미세조정(Fine-Tuning)으로 정확도를 높이고 다른 애플리케이션과 통합하기도 쉬운 모델을 '경량화 대형언어모델(smaller Large Language Model. 이하, sLLM)'이라고 한다.
 

마이크로소프트는 지난해 12월 12일 ‘파이 2(Phi-2)’를 오픈 소스로 출시하고 이 모델은 ‘라마 2 모노’, ‘미스트랄 7B’, 구글 ‘제미나이 나노' 등 다른 모델과 추론, 언어 이해, 수학, 코딩 및 상식 능력을 비교하는 벤치마크에서 더 뛰어난 성능을 제공한다고 밝혔다. 

 

출시 당시 파이-2는 상업적 사용이 아닌 연구 목적으로만 사용할 수 있어 사용에 제약이 따랐으나 마이크로소프트 리서치(Microsoft Research)의 대규모 언어 모델의 새로운 인텔리전스 이해 및 개선을 위한 과학자 그룹 'AGI의 물리학(Physics of AGI)'의 구스타보 데 로사(Gustavo de Rosa) 박사는 6일(현지시간), 허깅 페이스(Hugging Face)를 통해 파이-2는 기존 'MS 라이센스'가 'MIT 라이센스'로 변경됐다며, 이제 누구나 등록을 통해 무료(다운)로 사용할 있다고 밝혔다. 



출처 : 정한영, 인공지능신문(https://www.aitimes.kr)
뉴스바로가기https://www.aitimes.kr/news/articleView.html?idxno=29937