도메인에 대한 LLM 사용자 정의
홈페이지홈페이지 > 블로그 > 도메인에 대한 LLM 사용자 정의

도메인에 대한 LLM 사용자 정의

Mar 31, 2024

Predibase에 따르면 최근 LLM(대형 언어 모델)의 확장은 기계 학습 프로세스에 혁명적인 변화를 가져왔고 AI의 잠재력에 대한 새로운 관점을 제시했습니다.

연구원들은 LLM을 실험하는 조직의 설문 조사 데이터를 기반으로 기업이 상용 공급업체에 독점 데이터에 대한 액세스 권한을 부여하지 않고 오픈 소스 LLM을 사용자 정의하고 배포하는 방법을 찾고 있으며 생성 AI 기능 이상의 다른 사용 사례를 탐색하고 있음을 발견했습니다.

“이제 LLM을 위한 오픈 시즌이 왔습니다. OpenAI의 ChatGPT에 대한 광범위한 인식 덕분에 기업은 최신 AI 기능을 사용하여 경쟁 우위를 확보하기 위해 경쟁하고 있습니다. 그럼에도 불구하고 도메인별 사용 사례를 충족하려면 더 많은 맞춤형 LLM이 필요합니다.”라고 Predibase의 CEO인 Piero Molino는 말했습니다.

Molino는 “이 보고서는 업계가 맹목적으로 과대 광고를 따르는 것이 아니라 실제 기회와 과제에 집중해야 할 필요성을 강조합니다.”라고 덧붙였습니다.

상업용 LLM을 편안하게 사용하는 기업은 4분의 1 미만입니다. 33%는 민감한 데이터나 독점 데이터를 상업용 LLM 공급업체와 공유하는 것에 대한 우려를 언급했으며, 이로 인해 비공개로 호스팅되는 오픈 소스 대안에 대한 관심이 높아졌습니다.

오픈 소스 LLM이 추진력을 얻고 있습니다. 거의 77%의 응답자가 개인 정보 보호, 비용, 사용자 정의 부족에 대한 우려를 이유로 프로덕션 시 프로토타입 이상의 상업용 LLM을 사용하지 않거나 사용할 계획이 없으며 오픈 소스 대안이 증가하게 됩니다. 예를 들어 Meta는 LLaMA-1과 같은 폐쇄 소스 LLM 구축에서 벗어나 오픈 소스로 제공되고 상업용 및 연구 응용 프로그램에 무료로 제공되는 LLaMA-2로 대체되었습니다.

생성적 AI 사용 사례가 여전히 인기를 끌고 있는 반면, 기업에서는 비즈니스 가치를 제공할 수 있는 다른 애플리케이션의 잠재력을 확인하고 있습니다. 정보 추출은 두 번째로 많이 사용되는 사용 사례입니다(응답자의 32.6%가 선택).

여기에는 LLM을 활용하여 PDF 문서나 고객 이메일과 같은 구조화되지 않은 데이터를 집계 분석을 위해 구조화된 테이블로 변환하는 작업이 포함됩니다. 다음으로 사용자 쿼리에 실시간으로 정확하고 관련성 있는 응답을 제공하는 챗봇의 두뇌인 Q&A 및 검색(응답자의 15.2%)이었습니다.

조직에서는 보다 정확하고 맞춤형 결과를 얻기 위해 맞춤형 LLM으로 전환하고 있습니다. 대부분의 팀은 미세 조정(32.4%) 또는 인간 피드백을 통한 강화 학습(27%)을 통해 LLM을 맞춤화할 계획입니다. 미세 조정 시 팀이 직면한 장애물은 계속해서 데이터 부족(21%)과 인프라 관리와 같은 프로세스의 전반적인 복잡성(46%)입니다.

World Wildlife Fund의 글로벌 데이터 및 기술 수석 과학자인 Dave Thau는 "우리 팀이 대규모 프로젝트 보고서에서 통찰력과 학습을 생성할 수 있도록 맞춤형 오픈 소스 LLM을 사용하여 보존 노력의 결과를 개선할 수 있는 분명한 잠재력을 확인했습니다."라고 말했습니다. .

“물론 비결은 이러한 결과를 구축하는 것이 아니라 일관되고 안전하며 책임감 있는 결과를 제공하도록 보장하는 것입니다. 오픈 소스 모델을 맞춤화하고 배포하려는 욕구가 증가함에 따라 기업은 오픈 소스 커뮤니티의 빠른 혁신 속도를 따라잡을 수 있는 운영 도구 및 인프라에 투자해야 합니다.”라고 심민은 결론지었습니다.