|스마트투데이=김윤진 기자| 피오유엘의 AI기술 브랜드 라미에서 AI 한국어 전용 고퀄리티의 데이터셋 수십만개의 오픈소스를 공개했다고 14일 밝혔다.
해당 데이터셋은 단순한 AI 모델 제공을 넘어, 모델을 학습시키기 위한 한국어 데이터셋도 함께 포함되어 있다. 그와 동시에 라미팀은 ‘열린생각’이라는 70억, 140억 파라미터의 한국 최적화 화이트 박스 AI를 출범시켰다.
해당 AI솔루션인 ‘열린생각’은 API와 SDK를 통해 사용이 용이하며, 사고 과정이 투명하게 들어나 AI의 답변이 최적화된 응답을 제공한다.
기존 영어를 중점으로 특화한 SLM과는 다르게 한국어를 특화, 메인으로 하는 언어 모델을 학습중이다. 소형언어 모델들의 한계로 여겨졌던 한국어 성능을 Deep Seek와 같은 생성형 언어 모델을 토대로 생성한 사고 과정이 더해졌다.
라미팀은 "수많은 AI 개발자 및 관계자들이 이제는 쉽고 간편한 한국어 형태의 고퀄리티 데이터셋을 사용함으로써, 앞으로 AI 개발의 시대는 더 빨리 다가올 것"이라며, "해당 데이터셋은 한국어 AI 모델의 발전에 중요한 역할을 할 것으로 예상된다"고 말했다.
또한 "라미의 데이터셋은 특히 한국어 처리에 최적화가 되어 있기에 한국어 기반의 AI 연구 및 개발에 큰 도움이 되고, AI 한국어 생태계에 긍정적인 영향을 미칠 것이라고 믿고 있다"라며 "AI 기술이 발전함에 따라, 한국어 데이터셋의 필요성이 더욱 커지고 있는 상황"이라고 덧붙였다.

댓글 (0)
댓글 작성