Fine-tuning LLMs

Fine-tuning LLMs Tasks to finetune Before Fine-tuning (base or pretrained model) Fine-turning 지도 학습 과정은 지시 프롬프트(instruction prompts)를 사용하여 언어 모델(LLM)을 미세 조정하는 것을 포함합니다. 지도 학습(supervised learning)은 머신 러닝의 한 분야로, 모델이 레이블이 지정된 데이터 세트에서 학습하는 방법입니다. 이러한 과정에서 모델은 입력 데이터와 해당 레이블 사이의 관계를 학습하려고 시도합니다. “언어 모델(LLM)”은 텍스트 데이터를 처리하고…

Read More

Generative AI 모델의 훈련 과정과 선택 가이드

생성적 AI 프로젝트 라이프 사이클에서는 기존 모델을 활용하거나 새로운 모델을 훈련시키는 선택 사이에서 시작합니다. 여러 기반 모델을 이용할 수 있고, Hugging Face와 PyTorch 같은 플랫폼에서 모델 선택을 돕는 허브를 제공합니다. 이 글은 언어 모델 훈련 방법에 대해 이야기하며, 특정 작업에 어떤 모델을 선택할지에 대한 가이드를 제공합니다. 대형 모델 훈련에 연관된 도전과 어려움도 짚고 넘어갑니다.

Read More

Flux 모델 미세 조정: 무궁무진한 활용 예제

Flux 모델은 텍스트-이미지 변환 AI 모델로, 강력한 성능과 맞춤화 가능성을 제공합니다. 특히, 미세 조정(Fine-Tuning)을 통해 사용자는 자신의 목적에 맞는 고품질 AI 이미지를 생성할 수 있습니다. 이 글에서는 Flux 모델을 미세 조정하여 활용할 수 있는 다양한 사례를 살펴보고, 창의적이고 실용적인 아이디어를 공유합니다. 1. 개인 맞춤 이미지 생성 나만의 초상화 제작 • Flux를 자신의 사진으로 학습시켜 다양한…

Read More

AI 기반 자기소개서 작성 프로그램

1) 포트폴리오 소개:AI 기반 자기소개서 작성 지원 서비스로, 주 타깃은 구직자입니다. ChatGPT를 활용하여 맞춤형 자기소개서 작성, 면접 준비, 채용 정보 제공 등을 지원합니다. 2) 작업 범위:– 기존 서비스의 고도화– 프론트엔드 (React.js) 및 백엔드 (FastAPI, Python) 개발– 데이터베이스 (PostgreSQL) 관리– AWS 클라우드 환경에서의 서비스 운영 3) 주요 업무:– 구직자 및 구인업체 정보 입력 기능 개선– 자기소개서…

Read More

[논문]ReAct 프롬프팅: LLMs로부터 고품질 결과를 얻기 위한 프롬프팅 방법

ReAct Prompting: How We Prompt for High-Quality Results from LLMs | Chatbots & Summarization ReAct Prompting 프롬프트 엔지니어링은 대규모 언어 모델(LLMs)로부터의 결과의 품질과 정확성을 향상시키는 방법을 찾는 것에 관한 것입니다. 최근 몇 개월 동안, 생각의 연쇄(chain-of-thought) 프롬프팅과 같은 발전은 프롬프트 엔지니어가 그들의 결과의 품질을 향상시키는 데 도움을 주었습니다. 이 글에서는 우리의 목표 상태 출력에 도달하는…

Read More

Microsoft의 AutoGen 프레임워크는 AI 에이전트가 서로 대화하고 작업을 완료할 수 있게 합니다.

자율 에이전트는 현재 생성형 AI의 가장 핫한 트렌드 중 하나로 빠르게 부상하고 있습니다. 그것이 완전히 해결된 문제나 주류 트렌드는 아니지만, 자율 에이전트는 기반 모델 영역에서의 새로운 전선으로 널리 인정받고 있습니다. 이 영역에서의 연구와 프레임워크가 계속해서 등장하고 있고, 그 중에서도 최근에 발표된 가장 주목할만한 작업은 Microsoft Research의 AutoGen 프로젝트입니다.

Read More

ChatGPT 프롬프트를 어떻게 미세조정하나요?

*How to fine tune your ChatGPT prompts? ChatGPT 상호작용의 결과가 프롬프트 미세조정에 크게 의존합니다. 이 글은 프롬프트를 미세조정하여 ChatGPT의 잠재력을 활용할 수 있도록 복잡한 부분을 해결하는 것을 목표로 합니다. 기본적으로 ChatGPT는 인간의 피드백으로 강화 학습을 통해 훈련된 transformer 아키텍처를 기반으로 하는 언어 모델을 사용합니다. 이런 고급 모델은 엄청난 양의 텍스트 데이터를 통해 학습하고, 연속된 단어…

Read More

🖥️ Vultr(벌처) — 사용하기 쉽고 빠른 클라우드 서버

국내에서 웹사이트나 서비스를 운영할 때, 대부분은 국내 호스팅 업체를 떠올립니다.저 역시 여러 국내 업체를 써봤지만, 5년 전부터는 **Vultr(벌처)**를 주력으로 사용하고 있습니다. 이유는 간단합니다.가격은 비슷하지만, 훨씬 쉽고 빠르게 서버를 만들고 관리할 수 있기 때문입니다. 💡 제가 5년째 쓰는 클라우드: Vultr 저는 Vultr를 5년째 사용하고 있고, 이 블로그(jiniai.biz)도 지난 2년간 단 한 번의 서버 정지나 문제 없이…

Read More

생성형 AI 드림팀을 구성하는 방법

생성적 인공지능(AI) 꿈의 팀 구성에는 프로젝트 매니저, 데이터 과학자, 머신러닝 엔지니어, AI 연구원, 소프트웨어 개발자, UX/UI 디자이너, 도메인 전문가, 윤리 전문가 등 다양한 역할이 포함됩니다. 각 역할은 프로젝트의 성공을 위해 중요하며, 전문 지식과 기술을 바탕으로 팀 내에서 협력합니다. 이들은 AI 솔루션의 개발과 배포 과정에서 윤리적 가이드라인을 준수하며, 사용자 중심의 접근 방식으로 문제를 해결하는 데 기여합니다.

Read More

SQL 없이 만드는 대시보드: 데이터 접근의 새로운 시대

한 번쯤 이런 경험이 있지 않으신가요? 데이터는 이미 우리 손에 있지만, 접근 방식이 너무 복잡해 의사결정은 늦어지고 분석가는 단순 작업에 매몰됩니다. 결국 데이터는 기업의 자산이 아니라 답답한 블랙박스가 되어버립니다. 문제: 데이터는 있는데, 왜 활용은 어려운가? 기업 내 많은 부서는 데이터를 필요로 하지만, 대부분 SQL을 다룰 줄 모릅니다. 그래서 요청은 분석가에게 몰리고, 분석가는 티켓 처리하느라 본연의…

Read More