KULLM: Korea University Large Language Model


KULLM(구름)은 고려대학교 NLP & AI 연구실과 HIAI 연구원이 개발한 한국어 Large Language Model (LLM) 입니다.
KULLM(구름)에 대한 더 자세한 내용은 kullm.ai에서 확인하실 수 있습니다.

연구배경

  • Leaderboard 순위 및 벤치마크 점수가 ‘말을 잘 하는’ 것을 보장하지 못함
  • OpenKo-LLM Leaderboard 순위 = 좋은 모델 순위
  • 리더보드용 모델을 제작, 두 평가항목에서 1위
    (2024년 2월 19일 기준, 등록된 모델 약 900개)
  • 하지만 벤치마크형 리더보드가 모델을 잘 평가하지 못한다는 것이 주류 의견

License

  • Apache License 2.0

Base Model

  • Upstage/SOLAR-10.7B-v1.0

• Empathetic KULLM

• KULLM v3


• 기술 이전 실적

Uracle
(주)유라클


Athena sLLM의 LLM에 KULLM 기술 이전

Athena sLLM: 고성능 한국어 sLLM을 기반으로 한 RAG 기술, 그리고 모바일 플랫폼 구축/운영 경험에서 비롯된 운영 자동화 역량을 결합하여 고객 맞춤형 AI 솔루션을 제공

O2O
(주)에이아이오투오


KULLM 기술 이전 및 이를 이용한 의료 상담 서비스 개발

카멜챗봇: 외부 데이터를 활용하여 정확한 정보를 제공하며 지속적인 데이터 품질 관리가 가능한 AI 챗봇

GaonPlatform
(주)가온플랫폼


KULLM 기술 이전 및 수자원관리 영역 예지보전 상업화 시스템 개발

프로세스 플랜트: 4차 산업혁명 인공지능 기술을 기반으로 에너지 플랜트의 설비 상태감시 및 설비 고장예방 솔루션 가치를 제공하여 플랜트의 비계획 정지를 예방하고 지능형 예지보전을 위한 의사결정 정보를 제공

Hyundai Motor Company
(주)현대자동차


KULLM 기술 이전

EASE: 질의와 관련이 없는 테이블 정보가 포함된 Noisy multi-table QA 상황에서도 강건하게 답변을 생성하는 LLM기반 다중 테이블 질의응답 프레임워크

• Open Ko-LLM LeaderBoard

한국지능정보사회진흥원(NIA)와 업스테이지에 참여하여 한국어 언어 모델의 성능을 평가하고 비교할 수 있는 리더보드에서 KULLM이 개발한 리더보드용 모델이 2개 평가항목에서 1위를 차지하였습니다.

• KULLM3 대화 성능 평가 결과

  • 평가
    • 모델: GPT-4 Turbo(gpt-4-0125-preview) 사용
    • 데이터셋: yizhongw/self-instruct의 휴먼 평가 데이터셋인 user_oriented_instruction.json을 Deepl로 번역한 데이터 셋을 사용
  • 주어진 Prompt 데이터에 대한 모델이 응답을 생성하고, 그 응답을 Open AI API를 사용하여 평가하는 방식
  • 해당 평가 결과는 Repo에서 재현 가능

• KULLM3 대화 예시